Skript zur Vorlesung Mathematik II für Informationswirtschaft

Werbung
Skript zur Vorlesung
Mathematik II für Informationswirtschaft
Markus Richter
Institut für Angewandte und Numerische Mathematik
Karlsruher Institut für Technologie (KIT)
Sommersemester 2011
Dieses Skript unterliegt dem Urheberrecht und ist ausschließlich für den privaten
Gebrauch bestimmt. Vervielfältigungen jeder Art, auch auszugsweise, sind nur mit
Erlaubnis des Autors gestattet.
Inhaltsverzeichnis
1 Normen und Skalarprodukte
1.1 Normen . . . . . . . . . . . . . . .
1.2 Skalarprodukte . . . . . . . . . . .
1.3 Induzierte Normen . . . . . . . . .
1.4 Orthonormalbasen . . . . . . . . .
1.5 Definitheit symmetrischer Matrizen
2 Grundbegriffe der Analysis
2.1 Folgen und Familien . . . . . .
2.2 Algebren . . . . . . . . . . . . .
2.3 Infimum, Supremum, Minimum
2.4 Monotonie . . . . . . . . . . . .
2.5 Grenzwerte von Folgen . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . . .
. . . . . . . . .
und Maximum
. . . . . . . . .
. . . . . . . . .
3 Topologische Begriffe
3.1 Inneres, Rand und Abschluss von Mengen
3.2 Offene und abgeschlossene Mengen . . . .
3.3 Beschränktheit . . . . . . . . . . . . . . .
3.4 Kompakte Mengen . . . . . . . . . . . . .
3.5 Vollständigkeit . . . . . . . . . . . . . . .
3.6 Zusammenhängende Mengen . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
14
17
20
25
.
.
.
.
.
30
30
34
37
44
47
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
53
53
56
59
62
65
67
4 Konvergenzbegriffe und Konvergenzkriterien
4.1 Konvergenz reeller Zahlenfolgen . . . . . . . . .
4.2 Konvergenz von Reihen . . . . . . . . . . . . .
4.3 Absolute Konvergenz von Reihen . . . . . . . .
4.4 Punktweise Konvergenz von Funktionenfolgen .
4.5 Gleichmäßige Konvergenz von Funktionenfolgen
4.6 Konvergenz von Potenzreihen . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
70
70
75
82
87
90
93
.
.
.
.
.
99
99
105
111
114
115
5 Stetige Funktionen
5.1 Grenzwerte von Funktionen . . . . . . .
5.2 Stetigkeit . . . . . . . . . . . . . . . . .
5.3 Der Zwischenwertsatz . . . . . . . . . .
5.4 Der Satz vom Minimum und Maximum
5.5 Äquivalenz von Normen . . . . . . . . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
INHALTSVERZEICHNIS
6 Differentialrechnung
6.1 Differenzierbarkeit . . . . .
6.2 Der Mittelwertsatz . . . . .
6.3 Stetige Differenzierbarkeit .
6.4 Der Satz von Taylor . . . .
6.5 Partielle Differenzierbarkeit
6.6 Gradient und Hesse–Matrix
6.7 Totale Differenzierbarkeit .
7 Integralrechnung
7.1 Das Lebesgue–Maß . . . . .
7.2 Das Lebesgue–Integral . . .
7.3 Berechnung von Integralen .
7.4 Der Transformationssatz . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
. 119
. 127
. 131
. 134
. 139
. 147
. 154
.
.
.
.
159
. 159
. 168
. 177
. 186
A Wichtige Resultate
193
Symbolverzeichnis
198
Index
200
4
INHALTSVERZEICHNIS
Vorbemerkungen
Zahlenmengen
Mit N bezeichnen wir die Menge der natürlichen Zahlen. Die Menge N enthält die Zahl
1 und mit jeder Zahl n auch die Zahl n + 1, d.h. N = {1, 2, 3, . . . }. Die Zahl 0 ist in der
Menge N nicht enthalten. Wir definieren daher die Menge N0 := N ∪ {0}.
Mit Z bezeichnen wir die Menge der ganzen Zahlen, mit Q die Menge der rationalen
Zahlen und mit R die Menge der reellen Zahlen. Mit C bezeichnen wir schließlich die
Menge der komplexen Zahlen. Für jede komplexe Zahl z ∈ C existieren zwei eindeutig
bestimmte reelle Zahlen x = <(z) ∈ R und y = =(z) ∈ R, so dass z = x + yi gilt, wobei i
die imaginäre Einheit bezeichnet. Die imaginäre Einheit erfüllt die Gleichung i2 = −1.
In den folgenden Kapiteln verwenden wir das Symbol K als Platzhalter für R oder C.
Der Ausdruck α ∈ K besagt also, dass α entweder eine reelle oder eine komplexe Zahl ist.
Betrags- und Signumfunktion
Die reelle Betragsfunktion R → R, x 7→ |x| ist durch
(
x falls x ≥ 0,
|x| :=
−x falls x < 0
für alle x ∈ R definiert.
Ist x ∈ R eine reelle Zahl, so heißt |x| der Betrag von x. Man kann
√
2
zeigen, dass |x| = x für alle x ∈ R gilt.
Die Signum- oder Vorzeichenfunktion sgn : R → R ist durch


 1 falls x > 0,
sgn(x) :=
0 falls x = 0,


−1 falls x < 0
für alle x ∈ R definiert. Ist x ∈ R eine reelle Zahl, so heißt sgn(x) das Vorzeichen von x.
Für jede reelle Zahl x ∈ R gilt x = sgn(x)|x|.
Die komplexe Betragsfunktion C → R, z 7→ |z| ist durch
p
|z| := <(z)2 + =(z)2
für alle z ∈ C definiert.
Man rechnet leicht nach, dass für jede komplexe Zahl z ∈ C die
√
Identität |z| = zz gilt, wobei z := <(z) − =(z)i die konjugierte komplexe Zahl zu z
bezeichnet.
Intervalle
Seien a, b ∈ R zwei reelle Zahlen. Dann nennt man die Mengen
(a, b) := {x ∈ R | a < x < b},
[a, b] := {x ∈ R | a ≤ x ≤ b},
(a, b] := {x ∈ R | a < x ≤ b},
[a, b) := {x ∈ R | a ≤ x < b},
(−∞, b) := {x ∈ R | x < b},
INHALTSVERZEICHNIS
5
(−∞, b] := {x ∈ R | x ≤ b},
(a, ∞) := {x ∈ R | a < x},
[a, ∞) := {x ∈ R | a ≤ x}
(reelle) Intervalle. Insbesondere wird die Menge (a, b) ein offenes Intervall und die Menge
[a, b] ein abgeschlossenes Intervall genannt. Die Intervalle (a, b), (a, b] und [a, b) sind genau
dann nichtleere Mengen, wenn a < b gilt. Ein abgeschlossenes Intervall [a, b] ist genau
dann nichtleer, wenn a ≤ b gilt. Im Fall a = b gilt [a, b] := {a}. Die Zahlen a und b werden
auch als Intervallgrenzen bezeichnet. Gelegentlich wird auch die Menge der reellen Zahlen
R durch (−∞, ∞) als Intervall dargestellt.
Vektoren und Matrizen
Ist n ∈ N eine natürliche Zahl und x ∈ Kn ein Vektor, dann bezeichnen wir mit xi oder mit
(x)i die i-te Komponente von x, wobei i ∈ {1, 2, . . . , n} gelte. Es gilt also ganz allgemein
 
x1
 x2 
 
x =  . .
 .. 
xn
Für einen Vektor x mit den Komponenten x1 , x2 , . . . , xn wählen wir gelegentlich auch die
etwas kompaktere Darstellung (x1 , x2 , . . . , xn )T .
Sind m ∈ N und n ∈ N zwei natürliche Zahlen, und ist A ∈ Km×n eine Matrix mit m
Zeilen und n Spalten über K, dann bezeichnen wir mit Aij oder (A)ij die Komponente in
der i-ten Zeile und der j-ten Spalte von A, wobei i ∈ {1, 2, . . . , m} und j ∈ {1, 2, . . . , n}
gelte. Es gilt also ganz allgemein


A11 A12 . . . A1n
 A21 A22 . . . A2n 


A= .
..
..  .
 ..
.
. 
Am1 Am2 . . . Amn
Mit AT bezeichnen wir die transponierte Matrix zu einer Matrix A ∈ Rm×n . Es gilt dann
AT ∈ Rn×m und (AT )ij = Aji für alle i = 1, 2, . . . , n und alle j = 1, 2, . . . , m.
Vektorwertige Funktionen
Sei X eine nichtleere Menge und m ∈ N eine natürliche Zahl. Dann heißt eine Funktion
f : X → Km eine vektorwertige Funktion. Für jeden Index i ∈ {1, 2, . . . , m} bezeichnen
wir dann mit fi oder (f )i die i-te Komponente von f . Die i-te Komponente von f ist dabei
die Funktion fi : X → K, welche durch fi (x) := (f (x))i für alle x ∈ X definiert ist. Man
betrachte hierzu folgendes Beispiel: Die vektorwertige Funktion γ : [0, 2π] → R2 sei durch
cos(t)
γ(t) :=
sin(t)
für alle t ∈ [0, 2π] definiert. Die beiden Komponenten γ1 : [0, 2π] → R und γ2 : [0, 2π] → R
sind dann durch γ1 (t) = cos(t) und γ2 (t) = sin(t) für alle t ∈ [0, 2π] gegeben.
6
INHALTSVERZEICHNIS
Gruppen
Sei G eine nichtleere Menge. Unter einer Verknüpfung auf G versteht man eine Funktion
G × G → G, (g, h) 7→ g ∗ h, welche man mit ∗ bezeichnet. Ein Element e ∈ G heißt
neutrales Element bezüglich ∗, wenn g ∗ e = e ∗ g = g für alle g ∈ G gilt. Sind ferner g ∈ G
und h ∈ G zwei Elemente für die g ∗ h = h ∗ g = e gilt, so heißt h das inverse Element
zu g bezüglich ∗. Man bezeichnet das Element h dann mit g −1 . Die Verknüpfung ∗ wird
assoziativ genannt, wenn (g ∗ h) ∗ i = g ∗ (h ∗ i) für alle g, h, i ∈ G gilt. Falls g ∗ h = h ∗ g
für alle g, h ∈ G gilt, nennt man die Verknüpfung kommutativ.
Eine nichtleere Menge G wird eine Gruppe bezüglich einer Verknüfung ∗ auf G genannt, wenn die Verknüpfung ∗ assoziativ ist, wenn ein neutrales Element bezüglich der
Verknüpfung ∗ existiert, und wenn für jedes Element von G ein inverses Element bezüglich
der Verknüpfung ∗ existiert. Ist die Verknüpfung ∗ zusätzlich kommutativ, so spricht man
von einer kommutativen Gruppe.
Die Mengen Z, Q, R und C sind beispielsweise kommutative Gruppen bezüglich der
Addition. Das neutrale Element ist dabei die Zahl 0, und zu jeder Zahl z ist −z das inverse
Element. Für jede natürliche Zahl n ∈ N mit n ≥ 2 ist die Menge der regulären (n × n)Matrizen über R eine nichtkommutative Gruppe bezüglich der Matrixmultiplikation. Das
neutrale Element ist hierbei die n-zeilige Einheitsmatrix 1n . Das zu einer regulären Matrix
A ∈ Rn×n inverse Element ist die so genannte inverse Matrix A−1 .
Körper
Sei K eine Menge, auf der zwei Verknüpfungen K × K → K, (k, l) 7→ k ⊕ l und K × K →
K, (k, l) 7→ k l definiert sind, so dass K und K \ {0} kommutative Gruppen bezüglich
⊕ bzw. sind. Hierbei bezeichne 0 das neutrale Element bezüglich der Verknüpfung ⊕.
Die Menge K wird ein Körper bezüglich ⊕ und genannt, wenn außerdem k (l ⊕ m) =
(k l) ⊕ (k m) für alle k, l, m ∈ K gilt. Die Verknüpfung ⊕ nennt man üblicherweise die
Addition auf K, und die Verknüpfung nennt man die Multiplikation auf K.
Die Mengen Q, R und C sind Körper bezüglich der gewöhnlichen Addition + und der
gewöhnlichen Multiplikation · .
Vektorräume
Sei K ein Körper. Eine nichtleere Menge V heißt ein Vektorraum über K, wenn zwei
Verknüpfungen V × V → V, (v, w) 7→ v + w und K × V → V, (α, v) 7→ α · v existieren, so
dass V bezüglich der Verknüpfung + eine kommutative Gruppe ist, und sowohl α·(v+w) =
(α · v) + (α · w) als auch α · (β · v) = (αβ) · v für alle v, w ∈ V und alle α, β ∈ K gilt.
Die Verknüpfung + nennt man dann die Addition oder Vektoraddition auf V , und die
Verknüpfung · nennt man die skalare Multiplikation auf V . Die Elemente von V werden
ganz allgemein als Vektoren bezeichnet. Die Elemente des Körpers K nennt man auch
Skalare. Eine Menge U ⊆ V wird Untervektorraum von V genannt, wenn U selbst ein
Vektorraum ist.
Man nennt eine endliche Anzahl von Vektoren v1 , v2 , . . . , vn ∈ V linear unabhängig,
wenn für alle α1 , α2 , . . . , αn ∈ K aus α1 v1 + α2 v2 + · · · + αn vn = 0 stets α1 = α2 = · · · =
αn = 0 folgt. Andernfalls werden die Vektoren linear abhängig genannt.
Eine Menge linear unabhängiger Vektoren {v1 , v2 , . . . , vn } wird eine Basis von V genannt, wenn für jeden Vektor v ∈ V eindeutig bestimmte Skalare α1 , α2 , . . . , αn ∈ K
existieren, so dass v = α1 v1 + α2 v2 + . . . + αn vn gilt. Existiert für einen Vektorraum V eine
solche Basis {v1 , v2 , . . . , vn }, so heißt der Vektorraum endlichdimensional. Die natürliche
INHALTSVERZEICHNIS
7
Zahl n ∈ N nennt man dann auch die Dimension von V , und bezeichnet sie mit dim(V ).
Ein endlichdimensionaler Vektorraum der Dimension n wird auch n-dimensional genannt.
Für jede natürliche Zahl n ∈ N ist die Menge Rn ein n-dimensionaler Vektorraum
über R. Die Menge Cn ist ein n-dimensionaler Vektorraum über C. Jeweils zwei Vektoren
x, y ∈ Kn sind genau dann linear abhängig, wenn ein α ∈ K existiert, so dass y = αx gilt.
Lineare Funktionen
Seien V und W zwei Vektorräume über demselben Körper K. Eine Funktion f : V → W
wird linear genannt, wenn f (v+w) = f (v)+f (w) und f (αv) = αf (v) für alle v, w ∈ V und
alle α ∈ K gilt. Das Bild Bild(f ) := {w ∈ W | ∃v ∈ V : f (v) = w} einer linearen Funktion
f : V → W ist ein Untervektorraum von W , und der Kern Kern(f ) := {v ∈ V | f (v) = 0}
ist ein Untervektorraum von V . Sind die Vektorräume V und W endlichdimensional, so
gilt darüber hinaus die Gleichung dim(Bild(f )) + dim(Kern(f )) = dim(V ). Eine lineare
Funktion f ist genau dann injektiv, wenn Kern(f ) = {0} gilt.
Für je zwei natürliche Zahlen m ∈ N und n ∈ N ist eine Funktion f : Rn → Rm genau
dann linear, wenn eine Matrix A ∈ Rm×n existiert, so dass f (x) = Ax für alle x ∈ Rn gilt.
Äquivalenz- und Ordnungsrelationen
Sei X eine nichtleere Menge. Unter einer (zweistelligen) Relation auf X versteht man eine
Teilmenge R von X × X. Sind x, y ∈ X zwei Elemente, für die (x, y) ∈ R gilt, so sagt
man, dass zwischen x und y die Relation R besteht und schreibt x R y. Eine Relation
R auf X wird reflexiv genannt, wenn x R x für alle x ∈ X gilt. Die Relation R heißt
symmetrisch, wenn für alle x, y ∈ X aus x R y stets auch y R x folgt. Die Relation heißt
antisymmetrisch, wenn für alle x, y ∈ X aus x R y und y R x stets x = y folgt. Schließlich
wird eine Relation R auf X transitiv genannt, wenn für alle x, y, z ∈ X aus x R y und
y R z stets auch x R z folgt.
Eine Relation reflexive, symmetrische und transitive Relation heißt Äquivalenzrelation.
Ist ∼ eine Äquivalenzrelation auf einer nichtleeren Menge X, so nennt man für jedes
Element x ∈ X die Menge [x]∼ := {y ∈ X | x ∼ y} die Äquivalenzklasse von x bezüglich
∼. Die Menge aller Äquivalenzklassen wird die Faktormenge bezüglich ∼ genannt und mit
X/ ∼ bezeichnet.
Auf jeder nichtleeren Menge ist die Relation = ( ist gleich“) eine Äquivalenzrelation.
”
Die Relation k ( ist parallel zu“) ist eine Äquivalenzrelation auf der Menge aller Geraden
”
in R2 .
Eine reflexive, antisymmetrische und transitive Relation heißt Ordnungsrelation. Eine
Ordnungsrelation auf einer nichtleeren Menge X wird Totalordnung genannt, wenn für
je zwei Elemente x, y ∈ X stets x y oder y x gilt.
Die Relation ≤ ( ist kleiner oder gleich“) ist eine Totalordnung auf N, Z, Q und R. Die
”
Relation ⊆ ( ist Teilmenge von“) ist eine Ordnungsrelation, jedoch keine Totalordnung auf
”
P(R), der Potenzmenge von R. Die Potenzmenge P(X) zu einer Menge X ist dabei als
die Menge aller Teilmengen von X definiert.
Kapitel 1
Normen und Skalarprodukte
1.1
Normen
Definition (Norm). Sei V ein Vektorraum über K. Eine Funktion
V → R,
v 7→ kvk
heißt eine Norm auf V , wenn sie die nachfolgenden vier Eigenschaften erfüllt:
(1) Nichtnegativität: Für alle v ∈ V gilt kvk ≥ 0.
(2) Definitheit: Für alle v ∈ V gilt kvk = 0 ⇐⇒ v = 0.
(3) Homogenität: Für alle v ∈ V und alle α ∈ K gilt
kαvk = |α| kvk.
(4) Dreiecksungleichung: Für alle v, w ∈ V gilt
kv + wk ≤ kvk + kwk.
Es ist allgemein üblich, eine Norm V → R, v 7→ kvk vereinfachend mit k · k zu bezeichnen.
Da eine solche Norm eine Funktion von V nach R ist, kann man sie auch als
k·k : V → R
in Funktionsschreibweise darstellen. Der Punkt deutet hierbei die Stelle der Variable an.
Ist v ∈ V ein beliebiger Vektor, so nennt man die reelle Zahl kvk üblichweise die Norm
von v. Der Begriff Norm“ wird also sowohl als Bezeichnung für die Funktion k · k als auch
”
für einzelne Funktionswerte von k · k verwendet. Nachfolgend geben wir einige wichtige
Beispiele für Normen an.
Beispiele.
(a) Die reelle Betragsfunktion R → R, a 7→ |a| ist eine Norm auf R.
(b) Die komplexe Betragsfunktion C → R, z 7→ |z| ist eine Norm auf C.
8
1.1. NORMEN
9
(c) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Rn die so genannte
euklidische Norm | · | : Rn → R durch
n
X
|x| :=
!1/2
x2i
=
q
x21 + x22 + . . . + x2n
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn . Die euklidische Norm auf Rn wird gelegentlich
auch als die Standardnorm auf Rn bezeichnet.
Man beachte, dass für n√= 1 die euklidische Norm genau der Betragsfunktion auf
R = R1 entspricht, da x2 = |x| für alle x ∈ R gilt. Die euklidische Norm kann
also als Verallgemeinerung der Betragsfunktion angesehen werden, weshalb wir auch
Betragsstriche zur Kennzeichnung dieser Norm verwenden. Im Mathematikunterricht
der Oberstufe wird die euklidische Norm eines Vektors im R3 als der Betrag des
”
Vektors“ eingeführt.
(d) Für jede natürliche Zahl n ∈ N definiert man auf dem Vektorraum Cn die so genannte
Standardnorm | · | : Cn → R durch
|x| :=
n
X
!1/2
2
|xi |
=
p
|x1 |2 + |x2 |2 + . . . + |xn |2
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Cn .
Für n = 1 entspricht die Standardnorm auf Cn genau der komplexen Betragsfunktion.
(e) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Betragssummennorm k · k1 : Kn → R durch
kxk1 :=
n
X
|xi | = |x1 | + |x2 | + . . . + |xn |
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Kn . Die Betragssummennorm wird gelegentlich auch
als Einsnorm bezeichnet.
(f) Für jede natürliche Zahl n ∈ N definiert man auf Kn die so genannte Maximumnorm
k · k∞ : Kn → R durch
kxk∞ := max |xi | = max |x1 |, |x2 |, . . . , |xn |
i=1,...,n
für alle x = (x1 , x2 , . . . , xn)T ∈ Kn . Hierbei bezeichnet
max |x1 |, |x2 |, . . . , |xn | das
größte Element der Menge |x1 |, |x2 |, . . . , |xn | . Die Maximumnorm wird gelegentlich
auch als Tschebyschev–Norm oder als Unendlichnorm bezeichnet.
(g) Für jede natürliche Zahl n ∈ N und jede reelle Zahl p ≥ 1 definiert man auf dem
Vektorraum Rn die so genannte p-Norm k · kp : Kn → R durch
kxkp :=
n
X
!1/p
|xi |p
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Kn .
=
q
p
|x1 |p + |x2 |p + . . . + |xn |p
10
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Abbildung 1.1: Die Bedeutung der Dreiecksungleichung: Der Abstand zwischen v und
w ist stets kleiner oder gleich der Summe der Abstände zwischen v und u sowie zwischen
u und w.
Für p = 1 entspricht die p-Norm genau der Betragssummennorm, und für p = 2
genau der euklidischen Norm auf Rn bzw. der Standardnorm auf Cn . Die Betragssummennorm, die euklidische Norm auf Rn und die Standardnorm auf Cn sind also
spezielle p-Normen.
(h) Sei n ∈ N eine natürliche Zahl, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit
positiven Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die
Abbildung k · kw : Rn → R, definiert durch
!1/2 q
n
X
kxkw :=
wi x2i
= w1 x21 + w2 x22 + . . . + wn x2n
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn , eine Norm auf Rn .
Man beachte, dass für w = (1, 1, . . . , 1)T die Norm k · kw genau der euklidischen
Norm entspricht.
♦
Definition (normierter Raum). Sei V ein Vektorraum über K, und sei k · k eine Norm
auf V . Dann heißt das Paar (V, k · k) ein normierter Raum über K.
Der Begriff normierter Raum“ ist ähnlich allgemein wie der Begriff Gruppe“ oder der
”
”
Begriff Vektorraum“. Die Aussage, dass ein Paar (V, k · k) ein normierter Raum über K
”
ist, bedeutet nicht mehr und nicht weniger als dass V ein Vektorraum über K ist, und
dass k · k eine Norm auf V ist. Man sagt auch, dass der Vektorraum V mit der Norm k · k
versehen und so zum normierten Raum (V, k · k) wird.
In der Regel gibt es eine Vielzahl unterschiedlicher Normen, mit denen ein gegebener
Vektorraum versehen werden kann. Man betrachte dazu etwa die zuvor genannten Beispiele. Für manche Vektorräume ist es jedoch in gewisser Weise natürlich“, diese mit einer
”
ganz bestimmten Norm zu versehen. Das gilt auch für die Vektorräume Rn , n ∈ N, für die
man die folgende Vereinbarung trifft.
Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum
Rn mit der euklidischen Norm versehen.
Wir wenden uns nun einigen Begriffen zu, die man in einem normierten Raum definieren
kann. Ist (V, k · k) ein normierter Raum über K, so kann man auf V den Abstand d(v, w)
zwischen je zwei Vektoren v, w ∈ V gemäß
d(v, w) := kw − vk
1.1. NORMEN
(a)
11
(b)
(c)
Abbildung 1.2: (a) Die offene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (b)
Die abgeschlossene Kugel Br (v) in R2 bezüglich der euklidischen Norm. (c) Die Sphäre
Sr (v) in R2 bezüglich der euklidischen Norm.
definieren. Aufgrund der Nichtnegativität der Norm k · k, ist der Abstand zwischen zwei
beliebigen Vektoren stets größer oder gleich Null. Aufgrund der Definitheit von k · k beträgt
der Abstand zwischen zwei Vektoren genau dann Null, wenn die beiden Vektoren identisch
sind. Die Homogenität von k · k garantiert außerdem, dass d(v, w) = d(w, v) für alle v, w ∈
V gilt. Die Dreiecksungleichung impliziert schließlich, dass
d(v, w) ≤ d(v, u) + d(u, w)
für alle Vektoren u, v, w ∈ V gilt. Anschaulich bedeutet dies, dass die Länge der Verbindungsstrecke zwischen den Punkten“ v und w stets kleiner oder gleich groß ist wie die
”
Summe der Längen zweier Verbindungsstrecken, welche den Punkt v bzw. den Punkt w
mit einem beliebigen dritten Punkt u verbinden. Die Verbindungsstreck zwischen v und
w gibt also den kürzesten Weg zwischen beiden Punkten an.
Man beachte, dass die hier diskutierten Eigenschaften des Abstandes zwischen zwei
Vektoren oder Punkten unabhängig von der Norm gelten, durch die der Abstand definiert
ist. Die Norm bestimmt lediglich die Größe des Abstandes zwischen zwei gegebenen Vektoren. Es zeigt sich, dass in den Vektorräumen R1 , R2 und R3 der Abstand, welchen man
für die euklidische Norm erhält, genau dem geometrischen Abstand entspricht. Dies ist mit
ein Grund dafür, weshalb man zu gegebenem n ∈ N den Vektorraum Rn standardmäßig
mit der euklidischen Norm versieht.
Betrachtet man zu einem vorgegebenen Punkt x ∈ R2 sowie zu einer vorgegebenen
Zahl r > 0 die Menge aller Punkte, deren Abstand (bezüglich der euklidischen Norm) zum
Punkt x kleiner oder gleich r ist, so stellt man fest, dass diese Menge eine Kreisscheibe
mit Mittelpunkt x und Radius r ist. Im Vektorraum R3 ist eine solche Menge eine Kugel
mit Mittelpunkt x und Radius r. Man kann also Kreisscheiben und Kugeln anhand von
Abständen zwischen Punkten in R2 und R3 definieren. In gleicher Weise kann man auch
in beliebigen normierten Räumen so genannte Kugeln definieren.
Definition (offene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V
und jeder positiven Zahl r > 0 definiert man die Menge
Br (v) := w ∈ V kw − vk < r .
Diese Menge heißt die offene Kugel in V mit Mittelpunkt v und Radius r.
Definition (abgeschlossene Kugel). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und jeder positiven Zahl r > 0 definiert man die Menge
Br (v) := w ∈ V kw − vk ≤ r .
12
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(a)
(b)
(c)
Abbildung 1.3: Offene Einheitskugeln um den Ursprung in R2 bezüglich (a) der Betragssummennorm k · k1 , (b) der euklidische Norm | · | und (c) der Maximumnorm k · k∞ .
Diese Menge heißt die abgeschlossene Kugel in V mit Mittelpunkt v und Radius r.
Die Menge aller Punkte im Vektorraum R2 , welche denselben Abstand r > 0 (bezüglich der
euklidischen Norm) zu einem vorgegebenen Punkt x haben, ist bekanntlich ein Kreis mit
Radius r und Mittelpunkt x. Im Vektorraum R3 ist bildet eine solche Menge die Oberfläche
einer Kugel. Eine solche Menge wird auch Sphäre genannt. Solche Sphären kann man auch
in allgemeinen normierten Räumen definieren.
Definition (Sphäre). Sei (V, k · k) ein normierter Raum. Zu jedem Vektor v ∈ V und
jeder positiven Zahl r > 0 definiert man die Menge
Sr (v) := w ∈ V kw − vk = r .
Man nennt diese Menge die Sphäre in V mit Mittelpunkt v und Radius r.
Offenbar gilt
Br (v) = Br (v) \ Sr (v),
Br (v) = Br (v) ∪ Sr (v),
Sr (v) = Br (v) \ Br (v)
für alle positiven Radien r > 0 und für alle Vektoren v eines normierten Raums.
Von besonderer Bedeutung sind oft Kugeln und Sphären mit dem Radius 1. Solche
Kugeln und Sphären werden als Einheitskugeln bzw. als Einheitssphären bezeichnet. Ist
der Mittelpunkt einer Kugel oder einer Sphäre der Nullvektor, so spricht man von einer
Kugel bzw. einer Sphäre um den Ursprung.
Man sollte sich klar machen, dass die geometrische Gestalt einer Kugel oder einer
Sphäre stets von der Norm abhängt, mit der ein Vektorraum versehen wurde. So sind
beispielsweise alle in Abbildung 1.3 skizzierten Mengen offene Kugeln in R2 , jede jedoch
bezüglich einer anderen Norm auf R2 . Man erkennt, dass die nur die offene Kugel bezüglich
der euklidischen Norm die geometrische Gestalt einer Kreisscheibe besitzt.
Am Ende dieses Abschnitts geben wir noch ein nützliches Resultat an, welches als
umgekehrte Dreieckungleichung bekannt ist.
Satz 1.1 (Umgekehrte Dreiecksungleichung). Sei (V, k · k) ein normierter Raum.
Dann gilt
kvk − kwk ≤ kv − wk
für alle Vektoren v, w ∈ V .
1.1. NORMEN
13
Da bekanntlich x ≤ |x| für alle x ∈ R gilt, folgt aus der umgekehrten Dreiecksungleichung
auch, dass für alle Vektoren v und w eines mit einer Norm k · k versehenden Vektorraums
die Ungleichung kvk − kwk ≤ kv − wk gilt. Ersetzt man w durch −w, so erhält man
außerdem die Ungleichung kvk − kwk ≤ kv + wk. Da jede Norm die Dreiecksungleichung
erfüllt, erhält man somit die Ungleichungskette
kvk − kwk ≤ kv ± wk ≤ kvk + kwk
für alle Vektoren v, w ∈ V .
Übungsaufgaben
1. Berechnen Sie die euklidische Norm, die Maximumnorm und die Betragssummennorm der
folgenden Vektoren:
 
 
 
 
2
1
1
0
a := −1 , b := 0 , c := 1 , d := −4 .
5
0
1
3
2. Skizzieren Sie die Einheitssphären S1 (0) in R2 bezüglich der Betragssummennorm, der euklidischen Norm und der Maximumnorm.
3. Sei V ein reeller Vektorraum, und sei k · k eine Norm auf V . Zeigen Sie, dass die nachfolgenden
Gleichung und Ungleichungen für alle Vektoren u, v, w ∈ V und alle nichtnegativen Zahlen
α, β ≥ 0 gelten.
• k−vk = kvk.
• kv − wk ≤ kv − uk + ku − wk.
• kαv + βwk ≤ αkvk + βkwk.
4. Berechnen Sie (evtl. unter Zuhilfenahme eines Rechners) die p-Norm des Vektors
1
x=
2
für p = 1, p = 2, p = 4, p = 8 und p = 16, sowie dessen Maximumnorm. Was fällt Ihnen
auf?
5. Sei (V, k · k) ein normierter Raum. Zeigen Sie, dass für alle Vektoren v, w ∈ V und alle
positiven Zahlen r, s > 0 die folgenden Aussagen gelten:
• kv − wk ≤ s − r =⇒ Br (v) ⊆ Bs (w).
• kv − wk ≥ r + s =⇒ Br (v) ∩ Bs (w) = ∅.
Hierbei bezeichnen Br (v) und Bs (w) die offenen Kugeln in V mit den Mittelpunkten v bzw.
w und den Radien r bzw. s.
6. Weisen Sie nach, dass die Betragsfunktion eine Norm auf R ist.
7. Weisen Sie nach, dass die Betragssummennorm für alle n ∈ N eine Norm auf Rn ist.
14
1.2
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Skalarprodukte
Definition (Skalarprodukt, inneres Produkt). Sei V ein reeller Vektorraum. Eine
Funktion
V × V → R, (v, w) 7→ hv , wi
heißt ein Skalarprodukt oder ein inneres Produkt auf V , wenn die nachfolgenden vier Eigenschaften gelten:
(1) Bilinearität: Für alle v, v1 , v2 , w, w1 , w2 ∈ V und alle α, β ∈ R gilt
hv1 + v2 , wi = hv1 , wi + hv2 , wi,
hαv , wi = αhv , wi,
hv , w1 + w2 i = hv , w1 i + hv , w2 i,
hv , βwi = βhv , wi.
(2) Nichtnegativität: Für alle v ∈ V gilt hv , vi ≥ 0.
(3) Definitheit: Für alle v ∈ V gilt hv , vi = 0 ⇐⇒ v = 0.
(4) Symmetrie: Für alle v, w ∈ V gilt hv , wi = hw , vi.
Gemäß obiger Definition ist ein Skalarprodukt auf einem reellen Vektorraum eine Funktion,
welche von zwei Variablen (oder Argumenten) abhängt, und welche bilinear, nichtnegativ,
definit und symmetrisch ist. Bilinear“ bedeutet hierbei, dass die Funktion linear bezüglich
”
der ersten wie auch bezüglich der zweiten Variable ist. Symmetrisch“ bedeutet, dass sich
”
der Wert eines Skalarprodukts nicht ändert, wenn man beide Variablen vertauscht.
Es ist allgemein üblich, ein Skalarprodukt V × V → R, (v, w) 7→ hv , wi vereinfachend
mit h · , · i zu bezeichnen. Da ein solches Skalarprodukt eine Funktion von V × V nach R
ist, kann man es auch in Funktionsschreibweise gemäß
h· , ·i : V × V → R
darstellen. Die Punkte deuten hierbei die Stellen an, an denen die Variablen des Skalarprodukts stehen. Nachfolgend geben wir einige wichtige Beispiele für Skalarprodukte
an.
Beispiele.
(a) Die gewöhnliche Multiplikation R × R → R, (a, b) 7→ ab ist ein Skalarprodukt auf R.
(b) Für alle n ∈ N definiert man auf dem Vektorraum Rn das so genannte euklidische
Skalarprodukt Rn × Rn → R, (x, y) 7→ x · y durch
x · y :=
n
X
xi yi = x1 y1 + x2 y2 + · · · + xn yn
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn . Das euklidische Skalarprodukt auf Rn wird gelegentlich auch als das Standardskalarprodukt auf
Rn bezeichnet.
Man beachte, dass für n = 1 das euklidische Skalarprodukt genau der gewöhnlichen
Multiplikation auf R = R1 entspricht. Das euklidische Skalarprodukt kann also als
1.2. SKALARPRODUKTE
15
Verallgemeinerung der gewöhnlichen Multiplikation angesehen werden. Daher verwenden wir auch den Malpunkt · zur Kennzeichnung dieses Skalarprodukts. Im Mathematikunterricht der Oberstufe wird das euklidische Skalarprodukt auf R3 als das
”
Skalarprodukt“ eingeführt. Tatsächlich ist es aber eines von vielen Skalarprodukten,
die man auf dem Vektorraum R3 definieren kann.
(c) Sei n ∈ N vorgegeben, und sei w = (w1 , w2 , . . . , wn )T ∈ Rn ein Vektor mit positiven
Komponenten, d.h. es gelte wi > 0 für alle i = 1, 2, . . . , n. Dann ist die Abbildung
Rn × Rn → R, (x, y) 7→ hx , yiw , welche durch
hx , yiw :=
n
X
wi x i y i
i=1
für alle x = (x1 , x2 , . . . , xn )T ∈ Rn und alle y = (y1 , y2 , . . . , yn )T ∈ Rn definiert ist,
ein Skalarprodukt auf Rn .
Für w = (1, 1, . . . , 1)T entspricht das Skalarprodukt h · , · iw genau dem euklidischen
Skalarprodukt.
(d) Die Abbildung h · , · i# : R2 → R2 → R, welche durch
hx , yi# := 2x1 y1 − x1 y2 − x2 y1 + 2x2 y2
für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, ist ein Skalarprodukt auf R2 .
♦
Definition (Innenproduktraum). Sei V ein reeller Vektorraum und sei h · , · i ein Skalarprodukt auf V . Dann heißt das Paar (V, h · , · i) ein reeller Innenproduktraum.
Die Aussage, dass ein Paar (V, h · , · i) ein reeller Innenproduktraum ist, bedeutet nicht
mehr und nicht weniger als dass V ein Vektorraum über R ist, und dass h · , · i ein Skalarprodukt auf V ist. Man sagt auch, dass der Vektorraum V mit dem Skalarprodukt h · , · i
versehen und so zum Innenproduktraum (V, h · , · i) wird. Ähnlich wie bei den normierten
Räumen, ist es üblich gewisse Vektorräume mit ganz bestimmten Normen standardmäßig
zu versehen. Insbesondere trifft man die nachfolgende Vereinbarung.
Vereinbarung. Ist nichts gegenteiliges ausgesagt, so ist für alle n ∈ N der Vektorraum
Rn mit dem euklidischen Skalarprodukt versehen.
Abschließend erwähnen wir noch eine wichtige Eigenschaft transponierter Matrizen in
Bezug auf das euklidische Skalarprodukt.
Satz 1.2. Seien m, n ∈ N zwei natürliche Zahlen, sei A ∈ Rm×n eine beliebige Matrix,
und sei AT ∈ Rn×m die Transponierte zu A. Dann gilt
x · Ay = (AT x) · y
für alle x ∈ Rm und alle y ∈ Rn .
16
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Übungsaufgaben
1. Geben seien die Vektoren
 
−2
a := −5 ,
3
 
1
b := 2 ,
4


0
c :=  1 .
−1
Berechnen Sie a · b, a · c und b · c, sowie a · a, b · b und c · c.
2. Sei V ein reeller Vektorraum, und sei h · , · i ein Skalarprodukt auf V . Weisen Sie nach, dass
die nachfolgenden Rechenregeln für alle v, w, x, y ∈ V und alle α, β ∈ R gelten:
• hαv + βw , xi = αhv , xi + βhw , xi.
• hv , αx + βyi = αhv , xi + βhv , yi.
• hv + w , x + yi = hv , xi + hv , yi + hw , xi + hw , yi.
• h−v , −wi = hv , wi.
• h−v , wi = −hv , wi = hv , −wi.
• hv , 0i = h0 , wi = 0.
1.3. INDUZIERTE NORMEN
1.3
17
Induzierte Normen
Bislang wurden Innenprodukträume und normierte Räume separat eingeführt. In diesem
Abschnitt wird gezeigt, dass jeder Innenproduktraum auch als normierter Raum aufgefasst
werden kann.
Satz und Definition 1.3 (induzierte Norm). Sei (V, h · , · i) ein reeller Innenproduktraum. Dann kann man V mit einer Norm V → R, v 7→ kvk versehen, welche durch
p
kvk := hv , vi
für alle v ∈ V definiert ist. Diese Norm wird als die vom Skalarprodukt h · , · i induzierte
Norm auf V bezeichnet.
Da jedes Skalarprodukt auf einem Vektorraum gemäß Satz und Definition 1.3 auch eine
Norm auf dem Vektorraum induziert, ist jeder Innenproduktraum in natürlicher Weise
auch ein normierter Raum. Man versieht einen Innenproduktraum nämlich standardmäßig
mit der Norm, die vom jeweiligen Skalarprodukt induziert wird.
Beispiele.
(a) Die reelle Betragsfunktion wird als
√ Norm auf R von der gewöhnlichen Multiplikation
auf R induziert, da bekanntlich x2 = |x| für alle x ∈ R gilt.
(b) Die euklidische Norm wird vom euklidischen Skalarprodukt induziert, d.h. es gilt
|x| =
√
x·x
für alle x ∈ Rn und alle n ∈ N, wie man leicht nachrechnet.
(c) Für jedes fest gewählte n ∈ N und jeden fest gewählten Vektor w ∈ Rn mit positiven Komponenten, wird die Norm k · kw (siehe Beispiel (f) auf Seite 10) vom
Skalarprodukt h · , · iw (Beispiel (c) auf Seite 15) induziert.
♦
Für Normen, die von Skalarprodukten induziert werden, gelten eine Reihe wichtiger Gleichungen und Ungleichungen, die im nachfolgenden Satz zusammengetragen wurden.
Satz 1.4. Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die vom Skalarprodukt
h · , · i induzierte Norm auf V . Dann gelten die folgenden Resultate:
(1) Binomische Formeln: Für alle v, w ∈ V gilt
kv + wk2 = kvk2 + 2hv , wi + kwk2 ,
kv − wk2 = kvk2 − 2hv , wi + kwk2 ,
hv − w , v + wi = kvk2 − kwk2 .
(2) Für alle v, w ∈ V gilt
1
1
|hv , wi| ≤ kvk2 + kwk2 .
2
2
18
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(3) Cauchy–Schwarzsche Ungleichung: Für alle v, w ∈ V gilt
|hv , wi| ≤ kvk kwk.
(4) Dreiecksungleichung: Für alle v, w ∈ V gilt
kv + wk ≤ kvk + kwk.
(5) Parallelogrammgleichung: Für alle v, w ∈ V gilt
kv + wk2 + kv − wk2 = 2kvk2 + 2kwk2 .
(6) Für alle v, w ∈ V gilt
hv , wi =
1
kv + wk2 − kv − wk2 .
4
Die Cauchy–Schwarzsche Ungleichung und die Dreiecksungleichung sind wichtige Hilfsmittel der Analysis. Hinsichtlich der Frage, ob eine gegebene Norm auf einem Vektorraum
von einem Skalarprodukt induziert wird, kommt der Parallelogrammgleichung kommt eine
besondere Bedeutung zu. Man kann nämlich zeigen, dass eine Norm genau dann von einem
Skalarprodukt induziert wird, wenn sie die Parallelogrammgleichung erfüllt.
Auf reellen Innenprodukträumen kann man in der folgenden Weise Winkel zwischen
zwei Vektoren definieren.
Definition (Winkel). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von
h · , · i induzierte Norm auf V . Dann definiert man zu je zwei Vektoren v, w ∈ V \ {0} die
Zahl ∠(v, w) ∈ [0, π] durch
hv , wi
∠(v, w) := arccos
.
kvk kwk
Die Zahl ∠(v, w) heißt der Winkel zwischen v und w bezüglich h · , · i.
Es muss betont werden, dass der Winkel zwischen zwei gegebenen Vektoren eines reellen
Vektorraums V von dem Skalarprodukt abhängt, mit dem V versehen ist. Man betrachte
beispielsweise die Vektoren
1
1
x :=
, y := √
0
3
des R2 . Der Winkel zwischen beiden Vektoren bezüglich dem euklidischen Skalarprodukt
beträgt
x·y
1
π
= arccos
=
(= 60◦ ).
∠(x, y) = arccos
|x| |y|
2
3
Bezüglich dem Skalarprodukt h · , · iw auf R2 mit w := (3, 1)T (siehe Beispiel (c) auf
Seite 15) hingegen, gilt
√ hx , yiw
2
π
∠(x, y) = arccos
= arccos
=
(= 45◦ ).
kxkw kykw
2
4
Man stellt fest, dass der Winkel zwischen je zwei Vektoren des R2 bzw. des R3 bezüglich euklidischen Skalarprodukt genau dem geometrischen Winkel entspricht, den man
beispielsweise mit Hilfe eines Geodreiecks messen kann. Dies ist mit ein Grund dafür, weshalb man für jede natürliche Zahl n ∈ N den Vektorraum Rn standardmäßig mit dem
euklidische Skalarprodukt versieht.
1.3. INDUZIERTE NORMEN
19
Übungsaufgaben
1. Zeigen Sie mit Hilfe der Cauchy–Schwarzschen Ungleichung, dass
(x1 y1 + x2 y2 + · · · + xn yn )2 ≤ x21 + x22 + · · · + x2n y12 + y22 + · · · + yn2
für beliebige reelle Zahlen x1 , x2 , . . . , xn , y1 , y2 , . . . , yn ∈ R gilt.
2. Geben Sie die Norm k · k# : R2 → R an, die vom Skalarprodukt h · , · i# induziert wird (siehe
Beispiel (d) auf Seite 15). Berechnen Sie anschließend kak# , kbk# und kck# , wobei
√ 1
2
1
√2 .
a :=
, b :=
, c :=
−1
0
2
2
3. Berechnen Sie für die Vektoren
a :=
4
,
0
b :=
√ √2 ,
2
c :=
−1
1
die Winkel ∠(a, a), ∠(a, b), ∠(−a, b), ∠(a, c) und ∠(b, c). Der Vektorraum R2 sei hierbei mit
dem euklidischen Skalarprodukt versehen.
4. Sei (V, h · , · i) ein Innenproduktraum über R. Zeigen Sie, dass ∠(αv, βw) = ∠(v, w) für alle
Vektoren v, w ∈ V \ {0} und alle positiven reellen Zahlen α, β > 0 gilt.
20
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Abbildung 1.4: Die Vektoren v, w und v + w bzw. v − w bilden die Kanten eines
rechtwinkligen Dreiecks. Für die entsprechenden Kantenlängen
1.4
Orthonormalbasen
Ein wichtiger Begriff, den man in Innenprodukträumen definieren kann, ist der Begriff der
Orthogonalität.
Definition (Orthogonalität). Sei (V, h · , · i) ein Innenproduktraum über R. Man sagt
dass zwei Vektoren v, w ∈ V zueinander orthogonal sind, wenn
hv , wi = 0
gilt. In diesem Fall schreibt man v ⊥ w.
Bekanntlich gilt cos(π/2) = 0. Daher sind zwei von Null verschiedene Vektoren w und v
eines reellen Vektorraums V genau dann orthogonal zueinander bezüglich einem Skalarprodukt h · , · i auf V , wenn
hv , wi
π
∠(v, w) = arccos
=
(= 90◦ )
kvk kwk
2
gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Die Vektoren sind
also genau dann zueinander orthogonal, wenn sie im rechten Winkel zueinander stehen.
Man muss sich jedoch immer wieder klar machen, dass der Winkel zwischen zwei Vekoren
ebenso wie die Eigenschaft der Orthogonalität von dem Skalarprodukt abhängig sind, mit
dem ein reeller Vektorraum versehen ist. Bezüglich dem euklidischen Skalarprodukt gilt
beispielsweise, dass zwei von Null verschiedene Vektoren des R2 bzw. des R3 genau dann
zueinander orthogonal sind, wenn sie im geometrischen Sinne senkrecht zueinander stehen.
Versieht man die Räume R2 bzw. R3 mit anderen Skalarprodukten, gilt diese Aussage im
allgemeinen jedoch nicht.
Ein wichtiges Resultat, welches für orthogonale Vektoren gilt, ist der berühmte Satz
des Pythagoras. Man betrachte dazu auch die Abbildung 1.4.
Satz 1.5 (Pythagoras). Sei (V, h · , · i) ein Innenproduktraum über R, und sei k · k die von
h · , · i induzierte Norm. Seien außerdem v, w ∈ V zwei zueinander orthogonale Vektoren.
Dann gilt
kv + wk2 = kvk2 + kwk2 = kv − wk2 .
Mit dem Satz des Pythagoras kann man insbesondere das folgende Lemma beweisen.
1.4. ORTHONORMALBASEN
21
Lemma 1.6. Sei (V, h · , · i) ein Innenproduktraum über R, und seien v1 , v2 , . . . , vn ∈
V \ {0} von Null verschiedene Vektoren, die paarweise zueinander orthogonal sind, d.h. es
gelte hvi , vj i = 0 für alle i, j ∈ {1, 2, . . . , n} mit i 6= j. Dann sind diese Vektoren linear
unabhängig.
Als nächstes betrachten wir Basen von endlichdimensionalen Vektorräumen, die aus zueinander orthogonalen Vektoren bestehen.
Definition (Orthogonalbasis). Sei U ein Untervektorraum eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {p1 , p2 , . . . , pm } von
U heißt Orthogonalbasis bezüglich h · , · i, wenn hpi , pj i = 0 für alle i, j ∈ {1, 2, . . . , m}
mit i 6= j gilt, d.h. wenn die Basisvektoren paarweise orthogonal zueinander sind.
Im Rest dieses Abschnitts wenden wir uns eine speziellen Klasse von Orthogonalbasen,
den so genannten Orthonormalbasen, zu.
Definition (Orthonormalbasis). Sei U ein Untervektorraum eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist. Eine Basis {q1 , q2 , . . . , qm } von
U heißt Orthonormalbasis (abgekürzt ONB ) bezüglich h · , · i, wenn
(
1 falls i = j,
hqi , qj i =
für alle i, j = 1, 2, . . . , m
0 falls i 6= j
gilt.
Man vergegenwärtige sich noch einmal, dass für alle Vektoren v eines reellen Vektorraums
V , welcher mit einem Skalarprodukt h · , · i versehen ist, die Gleichung
hv , vi = kvk2
gilt, wobei k · k die von h · , · i induzierte Norm auf V bezeichnet. Daher ist die Basis
{q1 , q2 , . . . , qm } eines Untervektorraums genau dann eine Orthonormalbasis, wenn sie eine
Orthogonal basis ist, und wenn alle Basisvektoren bezüglich der induzierten Norm auf Eins
normiert sind, d.h. wenn
kqi k = 1
für alle i = 1, 2, . . . , m
gilt. Nachfolgend geben wir einige Beispiele für Orthonormalbasen endlichdimensionale
Vektorräume über R an.
Beispiele.
(a) Für jede natürliche Zahl n ∈ N ist die so genannte Standardbasis {e(1) , e(2) , . . . , e(n) }
des Rn , welche durch
 
 
 
0
1
0
1
0
0
 
 
 
 
 
 
e(1) := 0 , e(2) := 0 , . . . , e(n) :=  ... 
 
 .. 
 .. 
0
.
.
1
0
0
gegeben ist, eine Orthonormalbasis bezüglich dem euklidischen Skalarprodukt.
22
KAPITEL 1. NORMEN UND SKALARPRODUKTE
(b) Die Vektoren
√
v (1)


1
2 
−1 ,
:=
2
0
v (2)
 
√
1
3 
1 ,
:=
3
1
√
v (3)


1
6 
1
:=
6
−2
bilden eine Orthonormalbasis des R3 bezüglich dem euklidischen Skalarprodukt.
Für Orthonormalbasen gelten eine Reihe wichtiger Resultate, welche im folgenden Satz
zusammengefasst sind.
Satz 1.7. Sei (V, h · , · i) ein endlichdimensionaler, reeller Innenproduktraum, und sei k · k
die von h · , · i induzierte Norm. Sei außerdem {q1 , q2 , . . . , qn } eine Orthonormalbasis von
V . Dann gelten die folgenden Aussagen.
(1) Orthogonalentwicklung: Für alle v ∈ V gilt
v = hq1 , viq1 + hq2 , viq2 + · · · + hqn , viqn .
(2) Parsevalsche Gleichung: Für alle v ∈ V gilt
kvk2 = |hq1 , vi|2 + |hq2 , vi|2 + · · · + |hqn , vi|2 .
(3) Äquidistanz: Für alle i, j ∈ {1, 2, . . . , n} gilt
(
0
falls i = j,
kqi − qj k = √
2 falls i 6= j.
Abschließend soll hier noch diskutiert werden, wie man zu einem gegebenen Vektorraum
eine Orthonormalbasis konstruieren kann. Wichtigstes Hilfsmittel einer solchen Konstruktion ist das so genannte Gram–Schmidtsche Orthogonalsierungsverfahren, welches durch
das nachfolgende Lemma motiviert ist.
Lemma 1.8. Sei (V, h · , · i) ein reeller Innenproduktraum und {p1 , p2 , . . . , pm } ⊆ V \ {0}
eine Menge von Vektoren, die paarweise zueinander orthogonal sind. Sei außerdem v ∈ V
ein beliebiger Vektor. Dann ist der Vektor
p := v −
hp1 , vi
hp2 , vi
hpm , vi
p1 −
p2 − · · · −
pm
hp1 , p1 i
hp2 , p2 i
hpm , pm i
zu jedem Vektor der Menge {p1 , p2 , . . . , pm } orthogonal.
Algorithmus (Gram–Schmidtsches Orthogonalisierungsverfahren).
Sei (V, h · , · i) ein reeller Innenproduktraum, und seien v1 , v2 , . . . , vm ∈ V linear unabhängige Vektoren. Berechnet man die Vektoren p1 , p2 , . . . , pm ∈ V gemäß
p1 := v1 ,
p2 := v2 −
hp1 , v2 i
p1 ,
hp1 , p1 i
1.4. ORTHONORMALBASEN
p3 := v3 −
23
hp1 , v3 i
hp2 , v3 i
p1 −
p2 ,
hp1 , p1 i
hp2 , p2 i
..
.
pm := vm −
hp1 , vm i
hp2 , vm i
hpm−1 , vm i
p1 −
p2 − · · · −
pm−1 ,
hp1 , p1 i
hp2 , p2 i
hpm−1 , pm−1 i
dann ist {p1 , p2 , . . . , pm } eine Orthogonalbasis von span{v1 , v2 , . . . , vm }.
Mit Hilfe des Gram–Schmidtschen Orthogonalisierungsverfahrens kann man aus einer gegebenen Basis {v1 , v2 , . . . , vm } eines Vektorraums eine Orthogonalbasis {p1 , p2 , . . . , pm }
desselben Vektorraums konstruieren. Normiert man die Vektoren dieser Orthogonalbasis
auf Eins, so erhält man eine Orthonormalbasis des Vektorraums.
Beispiel. Gegeben seien die linear unabhängigen Vektoren
 
 
2
−1
v (1) :=  1 , v (2) :=  2 .
−1
2
Gesucht ist eine Orthonormalbasis {q (1) , q (2) } von span{v (1) , v (2) } bezüglich des euklidischen Skalarprodukts.
• Orthogonalisierung (Gram–Schmidtsches Orthogonalisierungsverfahren):
 
2
(1)
(1)

1 ,
p := v =
−1
  

 
 
2
−1/3
−1
−1
(1)
(2)
p ·v
1 
(−2)   
(2)
(2)
(1)



1 =
7/3 =
7 .
2 −
p := v − (1) (1) p =
6
3
p ·p
−1
5/3
5
2
• Normierung:
q (1) :=
q (2) :=
1
|p(1) |
1
|p(2) |
√
p(1)
p(2)


2
6 
1 ,
=
6
−1
 
 
√
√
−1
−1
3 1 
3 
7 =
7 .
=
·
5 3
15
5
5
♦
Zum Abschluss dieses Abschnitts wenden wird uns nun noch einer besonderen Klasse von
Funktionen zu, die eine besondere Rolle in vielen Teilbereichen der Mathematik spielen.
Definition (Funktional). Sei V ein Vektorraum über K. Eine Funktion f : V → K heißt
ein Funktional auf V .
Ein Funktional ist also eine Funktion, welche die Vektoren eines Vektorraums auf Elemente
des Körpers abbildet, über dem der Vektorraum definiert ist. Für lineare Funktionale auf
den Vektorräumen Rn gilt ein wichtiger Satz, der als Rieszscher Darstellungssatz bekannt
ist.
24
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Satz 1.9 (Rieszscher Darstellungssatz). Sei n ∈ N eine natürliche Zahl, f : Rn → R
ein lineares Funktional auf Rn und h · , · i ein Skalarprodukt auf Rn . Dann existiert ein
eindeutig bestimmter Vektor vf ∈ Rn , so dass
f (x) = hvf , xi
für alle x ∈ Rn gilt.
Der Rieszsche Darstellungssatz besagt, dass jedes lineare Funktional auf Rn durch ein
beliebig gewähltes Skalarprodukt dargestellt werden kann. Insbesondere existiert zu jedem
linearen Funktional f : Rn → R ein eindeutig bestimmter Vektor vf ∈ V , so dass f (x) =
vf · x für alle x ∈ Rn gilt.
Übungsaufgaben
1. Bestimmen Sie die Orthogonalentwicklungen der Vektoren
 
 
 
1
1
1
x := 2 , y := 0 , z := −1
3
0
0
bezüglich der Orthormalbasis {q (1) , q (2) , q (3) } des R3 , welche durch
 
 
 
√
√
√
1
1
1
3 
2 
6 
1 , q (2) :=
−1 , q (3) :=
1
q (1) :=
3
2
6
1
0
−2
gegeben ist.
2. Bestimmen Sie zwei Orthonormalbasen des R3 bezüglich dem euklidischen Skalarprodukt,
indem Sie die folgenden Basen unter Verwendung des Gram–Schmidtschen Orthogonalisierungsverfahrens orthonormalsieren:
     
     
1 
1
−1 
1
 −1
 2
 1 , 1 1 .
1 , 5 ,  1 ,




2
1
1
1
2
2
3. Bestimmen Sie eine Orthonormalbasis des R2 bezüglich h · , · i# (siehe Beispiel (d) auf
Seite 15), indem Sie die Standardbasis des R2 entsprechend orthonormalisieren.
4. Sei n ∈ N eine natürliche Zahl. Für jedes j = 1, 2, . . . , n sei das lineare Funktional pj :
Rn → R durch pj (x) = xj für alle x = (x1 , x2 , . . . , xn )T ∈ Rn definiert. Geben Sie für jedes
j = 1, 2, . . . , n einen Vektor vpj ∈ Rn an, so dass pj (x) = vpj · x für alle x ∈ Rn gilt.
1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN
1.5
25
Definitheit symmetrischer Matrizen
Definition (symmetrische Matrix). Zu einer gegebenen natürlichen Zahl n ∈ N heißt
eine Matrix A ∈ Rn×n symmetrisch, wenn AT = A gilt. Die Menge aller symmetrischen
n×n bezeichnet.
n × n-Matrizen mit reellen Matrixkomponenten wird gelegentlich mit Rsym
Beispiele.
(a) Die folgenden Matrizen

1
0
0
sind symmetrisch:



0 0
2 1 0
2 0 , 1 2 1 ,
0 3
0 1 2


1 2 3
2 4 5 .
3 5 6
(b) Die folgenden Matrizen sind nicht symmetrisch:




1 2 3
1 2 0
0 4 5 , 3 1 2 .
0 0 6
0 2 1
Ist n ∈ N eine natürliche Zahl und A ∈ Rn×n
sym eine symmetrische Matrix, so gilt nach
Satz 1.2 insbesondere
x · Ay = (Ax) · y
für alle Vektoren x, y ∈ Rn . Der folgende Satz macht weiterhin Aussagen darüber, welche
Matrixoperationen die Symmetrie einer Matrix erhalten.
Satz 1.10. Sei n ∈ N eine beliebige natürliche Zahl. Dann gelten für alle symmetrischen
Matrizen A, B ∈ Rn×n
sym und für alle reellen Zahlen α ∈ R die folgenden Aussagen
(1) A + B ∈ Rn×n
sym .
(2) αA ∈ Rn×n
sym .
(3) A−1 ∈ Rn×n
sym , falls A regulär ist.
(4) Ak ∈ Rn×n
sym für alle k ∈ N0 .
n×n ein
Die Aussagen in Teil (1) und (2) von Satz 1.10 implizieren, dass die Menge Rsym
n×n
n×n
Untervektorraum von R
ist. Die Menge Rsym ist jedoch keine Gruppe bezüglich der
Matrixmultiplikation, da das Produkt zweier symmetrischer Matrizen im allgemeinen keine
symmetrische Matrix ist. Man betrachte etwa die beiden Matrix A, B ∈ R2×2
sym , welche durch
0 0
2 1
A :=
, B :=
0 1
1 2
gegeben sind. Für das Produkt der beiden Matrizen gilt
0 0
0 1
AB =
6=
= (AB)T ,
1 2
0 2
was AB 6∈ R2×2
sym impliziert.
Als nächstes führen wir das Konzept der positiven bzw. negativen Definitheit für quadratische Matrizen ein. Dieses spielt eine wichtige Rolle bei der Identifikation lokaler Extrema von Funktionalen auf Rn (siehe Abschnitt 6.6).
26
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Definition (positiv definite Matrix). Sei n ∈ N eine natürliche Zahl. Eine quadratische
Matrix A ∈ Rn×n heißt positiv definit, wenn x · Ax > 0 für alle x ∈ Rn \ {0} gilt.
Definition (negativ definite Matrix). Sei n ∈ N eine beliebige natürliche Zahl. Eine
quadratische Matrix A ∈ Rn×n heißt negativ definit, wenn −A positiv definit ist, d.h. wenn
x · Ax < 0 für alle x ∈ Rn \ {0} gilt.
Im allgemeinen ist es nicht leicht zu erkennen, ob eine Matrix positiv bzw. negativ definit
ist. Für symmetrische Matrizen kann man jedoch ein hinreichendes Kriterium für die
positive Definitheit wie auch für die negative Definitheit angeben, welches auf den so
genannten Hauptminoren der Matrix beruht.
Definition (Hauptminor). Sei n ∈ N eine natürliche Zahl und A ∈ Rn×n eine quadratische Matrix. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} definiert man die reelle Zahl
A[k] ∈ R durch


A11 A12 . . . A1k
A21 A22 . . . A2k 


A[k] := det  .
..
..  .
.
 .
.
. 
Ak1 Ak2 . . . Akk
Die Zahl A[k] wird der k-te Hauptminor von A genannt.
Offenbar gilt A[1] = A11 und A[n] = det A für jede natürliche Zahl n ∈ N und jede quadratische Matrix A ∈ Rn×n . Alle übrigen Hauptminoren berechnet man, indem man die
Determinante einer quadratischen Teilmatrix“ von A berechnet, welche die Matrixkom”
ponente A11 enthält. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die beiden Hauptminoren der Matrix
−4
1
A :=
−2 −1
lauten
A[1]
= det −4 = −4,
A[2]
−4
1
= det
= 6.
−2 −1
(b) Die drei Hauptminoren der Matrix


2 1 0
B := −2 3 1
−1 0 2
sind durch
B[1] = det 2 = 2,
gegeben.
B[2] = det
2 1
−2 3

2 1 0
= det −2 3 1 = 15
−1 0 2

= 8,
B[3]
♦
1.5. DEFINITHEIT SYMMETRISCHER MATRIZEN
27
Es sollte noch erwähnt werden, dass in der mathematischen Fachliteratur keine einheitliche
Bezeichnungsweise für die Hauptminoren einer Matrix existiert. Auch die hier gewählte
Schreibweise A[k] ist keinesfalls allgemein üblich.
Als nächstes zeigen wir, wie man mit Hilfe von Hauptminoren die positive bzw. die
negative Definitheit einer symmetrischen Matrix nachweisen kann.
n×n
Satz 1.11 (Hauptminorenkriterium). Sei n ∈ N eine natürliche Zahl und A ∈ Rsym
eine symmetrische Matrix. Dann gelten die folgenden Aussagen.
(1) A ist genau dann positiv definit, wenn alle Hauptminoren von A positiv sind, d.h.
wenn
sgn(A[k] ) = 1
für alle k = 1, 2, . . . , n gilt.
(2) A ist genau dann negativ definit, wenn die Vorzeichen der Hauptminoren von A mit
Minus beginnend alternieren, d.h. wenn
sgn(A[k] ) = (−1)k
für alle k = 1, 2, . . . , n gilt.
In den nachfolgenden Beispielen wird gezeigt, wie man das Hauptminorenkriterium anwendet.
Beispiele.
(a) Für die Hauptminoren der symmetrischen Matrix


2 −1
0
2 −1
A := −1
0 −1
2
gilt A[1] = 2 > 0, A[2] = 3 > 0 und A[3] = 4 > 0. Daher ist A positiv definit.
(b) Für die Hauptminoren der symmetrischen Matrix


−4
0
1
0
B :=  0 −2
1
0 −3
gilt B[1] = −4 < 0, B[2] = 8 > 0 und B[3] = −22 < 0. Daher ist B negativ definit.
(c) Für die Hauptminoren der symmetrischen Matrix


3
2 3
C := 2 −2 0
3
0 1
gilt C[1] = 3 > 0, C[2] = −10 < 0 und C[3] = 8 > 0. Die Matrix C ist daher
weder positiv definit noch negativ definit. Tatsächlich gilt e(1) · Ce(1) = 3 > 0 und
e(2) · Ce(2) = −2 < 0, wobei e(1) = (1, 0, 0)T und e(2) = (0, 1, 0)T .
Der Vollständigkeit halber geben wir zum Abschluss diese Abschnitts noch das folgende
Resultat an, welches es einem erlaubt, auch nicht-symmetrische Matrizen mit dem Hauptminorenkriterium auf positive oder negative Definitheit hin zu untersuchen.
Lemma 1.12. Eine quadratische Matrix A ∈ Rn×n ist genau dann positiv definit bzw.
negativ definit, wenn die symmetrische Matrix A + AT positiv definit bzw. negativ definit
ist.
28
KAPITEL 1. NORMEN UND SKALARPRODUKTE
Übungsaufgaben
1. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine quadratische Matrix. Zeigen Sie, dass
die Matrizen AT A und AAT symmetrisch sind.
2. Zeigen Sie, dass für jede natürliche Zahl n ∈ N eine Matrix A ∈ Rn×n genau dann symmetrisch ist, wenn
1
A = A + AT
2
gilt.
3. Untersuchen Sie die folgenden symmetrischen Matrizen auf positive oder negative Definitheit.






−4
2
0
1
1
2
4 −1 −1
3 −1 , C := −1
4 −1 .
A :=  2 −3 −2 , B := 1
0 −2 −1
2 −1
5
−1 −1
4
4. Sei n ∈ N eine natürliche Zahl, und sei A ∈ Rn×n eine symmetrische und positiv definite
Matrix. Zeigen Sie, dass dann die Funktion h · , · iA : Rn × Rn → R, welche durch hx , yiA :=
x · Ay für alle x, y ∈ Rn definiert ist, ein Skalarprodukt auf Rn ist.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... die definierenden Eigenschaften von Normen und Skalarprodukten kennen.
... wissen, wie offene Kugeln, abgeschlossene Kugeln und Sphären in einem normierten
Raum definiert sind.
... wissen, auf welche Weise ein Skalarprodukt eine Norm induziert.
... wichtige Gleichungen und Ungleichungen für Normen und Skalarprodukte kennen.
Sie sollten insbesondere die Dreiecksungleichung, die umgekehrte Dreiecksungleichung
und die Cauchy–Schwarzsche Ungleichung kennen.
... das euklidische Skalarprodukt, die euklidische Norm, die Betragssummennorm und
die Maximumnorm kennen.
... wissen, dass die euklidische Norm vom euklidischen Skalarprodukt induziert wird.
... wissen, was eine Orthonormalbasis ist.
... das Gram–Schmidtsche Orthogonalisierungsverfahren anwenden können.
... wissen, was eine positiv definite und was eine negativ definite, symmetrische Matrix
ist.
... die Hauptminoren einer quadratischen Matrix berechnen können.
... das Hauptminorenkriterium für die positive bzw. die negative Definitheit einer symmetrischen Matrix kennen.
29
Kapitel 2
Grundbegriffe der Analysis
2.1
Folgen und Familien
Definition (Folge). Sei X eine nichtleere Menge. Unter einer Folge in X versteht man
eine Abbildung x : N → X. Üblicherweise nennt man für eine gegebene Zahl n ∈ N den
Funktionswert x(n) das n-te Glied der Folge und bezeichnet ihn mit xn oder x(n) . Die Zahl
n wird hierbei als der Index des Folgenglieds bezeichnet. Die Folge x : N → X selbst wird
üblichweise mit (xn )n∈N , (xn )∞
n=1 , (xn ) oder x bezeichnet. Es ist darüber hinaus üblich
eine Folge durch Angabe der ersten Folgenglieder in der Form (x1 , x2 , . . . ) darzustellen.
Die Menge aller Folgen in X wird mit X N bezeichnet.
Eine Folge ist tatsächlich nichts anderes als eine Funktion, deren Definitionsmenge die Menge der natürlichen Zahlen N ist. Mit einer Folge (xn )n∈N verbindet man oft die Vorstellung
einer Anordnung von abzählbar unendlich vielen Elementen einer gegebenen Menge X. Das
erste Folgenglied ist dabei das erste Element in der Anordnung, das zweite Folgenglied ist
das zweite Element usw.
Oft ist es sinnvoll, auch solche Funktionen als Folgen zu betrachten, deren Definitionsbereich die Menge N0 = N ∪ {0} oder eine Menge von der Form N ∪ {0, −1, −2, . . . , −m}
mit m ∈ N ist. Eine Folge mit einer solchen Indexmenge stellt man üblicherweise durch
(vn )∞
n=−m dar. Wir geben nun einige Beispiele für Folgen an.
Beispiele.
(a) Die Folge der ungeraden Zahlen (un )n∈N ist eine Folge in N, welche durch un := 2n−1
für alle n ∈ N definiert ist. Die ersten vier Folgenglieder lauten u1 = 1, u2 = 3, u3 = 5
und u4 = 7. Man stellt die Folge (un )n∈N darher gelegentlich auch als (1, 3, 5, 7, . . . )
dar.
(b) Ist X eine nichtleere Menge, so wird eine Folge (cn )n∈N , welche durch cn := x für
alle n ∈ N und ein fest gewähltes Element x ∈ X definiert ist, als eine konstante
Folge bezeichnet.
(c) Für jede natürliche Zahl k ∈ N definiert man die Folge e(k) ∈ {0, 1}N durch
(
1 falls n = k,
e(k)
n :=
0 falls n 6= k
für alle n ∈ N. Es gilt also e(1) = (1, 0, 0, 0, . . . ), e(2) = (0, 1, 0, 0, . . . ), e(3) =
(0, 0, 1, 0, . . . ) usw.
♦
30
2.1. FOLGEN UND FAMILIEN
31
Grundsätzlich gibt es zwei Möglichkeiten, eine Folge zu definieren. Die erste Möglichkeit
ist die so genannte explizite Definition oder explizite Darstellung, bei der jedes Folgenglied
unabhängig von allen übrigen Folgengliedern definiert wird. Eine explizite Definition einer
Folge (xn )n∈N ist dabei von der Form
xn := F (n)
für alle n ∈ N,
wobei F (n) ein Ausdruck ist, der lediglich vom Index n abhängig sein darf. Die Folgen in
den zuvor genannten Beispielen etwa wurden alle explizit definiert.
Die zweite Möglichkeit eine Folge zu definieren ist die so genannte rekursive Definition
oder rekursive Darstellung. Bei der rekursiven Darstellung gibt man die ersten Glieder
der Folge explizit an. Alle übrigen Folgenglieder werde in Abhängigkeit von anderen, bereits bekannten Folgengliedern definiert. Ist X eine nichtleere Menge, so ist eine rekursive
Definition einer Folge (xn )n∈N in X von der Form
x1 := y1 ,
x2 := y2 ,
..
.
xk := yk ,
für alle n ∈ N mit n ≥ k + 1,
xn := F (n, xn−1 , xn−2 , . . . , xn−k )
wobei k ∈ N eine natürliche Zahl und y1 , y2 , . . . , yk ∈ X vorgegebene Elemente sind. In der
rekursiven Definition bezeichnet F (n, xn−1 , xn−2 , . . . , xn−k+1 ) einen Ausdruck, der lediglich vom Index n des Folgenglieds sowie von den Folgendgliedern xn−1 , xn−2 , . . . , xn−k+1
abhängig sein darf. Im Fall k = 1 wird eine Folge (xn )n∈N in X oftmals auch in der Form
x1 := y1 ,
für alle n ∈ N
xn+1 := F (n, xn )
mit y1 ∈ X rekursiv definiert. Hierbei bezeichnet F (n, xn ) einen Ausdruck, der nur von n
und xn abhängen darf.
Oft ist es von Vorteil, wenn man die explizite Darstellung einer Folge kennt. Ist jedoch
nur eine rekursive Definition der Folge bekannt, so kann man versuchen, eine explizite Darstellung zu erraten. Dafür ist es oft hilfreich, einige Folgenglieder mit Hilfe der rekursiven
Definition auszurechnen. Die geratene explizite Darstellung kann dannn mittels vollständiger Induktion und unter Verwendung der rekursiven Definition bewiesen werden. Man
betrachte dazu auch die nachfolgenden Beispiele.
Beispiele.
(a) Gegeben sei die Folge (rn )n∈N in N, welche gemäß
r1 := 2,
rn := rn−1 + 2n
für alle n ∈ N mit n ≥ 2
rekursiv definiert ist. Die ersten Glieder dieser Folge lauten r1 = 2, r2 = 6, r3 = 12
und r4 = 20. Mit etwas Nachdenken erkennt man, dass r1 = 1 · 2, r2 = 2 · 3, r3 = 3 · 4
und r4 = 4 · 5 gilt. Die Vermutung ist also, dass
rn = n(n + 1)
für alle n ∈ N
32
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
gilt. Dies wäre eine explizite Darstellung der Folge (rn )n∈N . Wir beweisen diese Vermutung nun mittels vollständiger Induktion nach n. Für den Induktionsanfang erhält
man r1 = 1 · (1 + 1) = 2, was offenbar richtig ist. Für den Induktionsschritt von n − 1
nach n nehmen wir an, dass rn−1 = (n−1)n für irgendeine natürliche Zahl n ∈ N gilt.
Man erhält dann rn = rn−1 + 2n = (n − 1)n + 2n = n2 − n + 2n = n2 + n = n(n + 1).
Damit ist die Vermutung bewiesen.
(b) Gegeben sei die Folge (an )n∈N in Q, welche gemäß
a1 := 1,
an :=
an−1
an−1 + 2
für alle n ∈ N mit n ≥ 2
rekursiv definiert ist. Die ersten Glieder dieser Folge lauten a1 = 1, a2 = 1/3,
a3 = 1/7 und a4 = 1/15. Betrachtet man die Nenner der Brüche, so fällt auf, dass
3 = 4 − 1 = 22 − 1 sowie 7 = 8 − 1 = 23 − 1 und 15 = 16 − 1 = 24 − 1 gilt. Eine
naheliegende Vermutung ist also, dass
an =
1
2n − 1
für alle n ∈ N
gilt. Tatsächlich kann man dies mittels vollständiger Induktion nach n beweisen. Für
den Induktionsanfang erhält man a1 = 1/(21 − 1) = 1/1 = 1. Für den Induktionsschritt nimmt man an, dass an−1 = 1/(2n−1 −1) für irgendeine natürliche Zahl n ∈ N
gilt. Man erhält dann
an =
an−1
=
an−1 + 2
1
2n−1 −1
1
+
2n−1 −1
2
=
1
1+
2(2n−1
− 1)
=
1
1
= n
n
1+2 −2
2 −1
Damit ist die Vermutung bewiesen.
♦
Zum Abschluss dieses Kapitels führen wir noch den nützlichen Begriff der Familie ein.
Definition (Familie). Ist X eine nichtleere Menge, so versteht man unter einer Familie
in X eine Funktion x : I → X, wobei I eine nichtleere Menge ist. Die Menge I wird als die
Indexmenge der Familie bezeichnet. Es ist üblich, für jeden Index i ∈ I den zugehörigen
Funktionswert x(i) ∈ X mit xi oder x(i) zu bezeichnen und ihn das i-te Mitglied der Familie
zu nennen. Die Familie x : I → X selbst wird üblicherweise mit (xi )i∈I bezeichnet.
In der Regel stellt man sich eine Familie als Zusammenfassung einer beliebigen Anzahl von
gleichartigen Objekten (wie z.B. Zahlen, Mengen oder Funktionen) zu einem Ganzen vor.
Jedes Objekt wird dabei mit einem Index versehen, so dass es eindeutig identifiziert werden
kann. Im Unterschied zu Mengen können Familien ein und dasselbe Objekt mehrfach
enthalten. Wir wollen dies anhand einiger Beispiele verdeutlichen.
Beispiele.
(a) Sei I := {1, 2, 3} und F := {4, }. Dann ist (fi )i∈I mit f1 := 4, f2 := , f3 := 4
eine Familie in F , welche aus genau drei Mitgliedern besteht. Das Element 4 tritt
genau zweimal als Mitglied in dieser Familie auf, das Element genau einmal.
(b) Für jede ganze Zahl k ∈ Z sei σk := sgn(k) das Vorzeichen von k. Dann ist (σk )k∈Z
eine Familie in {−1, 0, 1}, welche aus abzählbar unendlich vielen Mitgliedern besteht.
Die Zahlen −1 und 1 treten jeweils abzählbar unendlich oft in dieser Familie auf, die
Zahl 0 jedoch nur genau einmal.
2.1. FOLGEN UND FAMILIEN
33
(c) Für jede natürliche Zahl k ∈ N definieren wir die Menge Nk := {1, 2, . . . , k}. Dann ist
(Nk )k∈N eine Familie bestehend aus Teilmengen von N. Die Mitglieder dieser Familie
sind paarweise verschieden, d.h. es gilt Ni 6= Nj für alle i, j ∈ N mit i 6= j.
(d) Für jede reelle Zahl α ∈ R sei die Funktion fα : R → R, x 7→ αx definiert. Dann
ist (fα )α∈R eine Familie bestehend aus linearen Funktionen von R nach R. Diese
Familie besteht aus überabzahlbar unendlich vielen Mitgliedern, welche paarweise
verschieden sind.
♦
Oft ist es sinnvoll, bestimmte Mitglieder einer gegebenen Familie zu einer neuen Familie
zusammenzufassen. Dies führt dann auf den Begriff der Teilfamilie.
Definition (Teilfamilie). Sei X eine nichtleere Menge und (xi )i∈I eine Familie in X. Sei
ferner J ⊆ I eine Teilmenge der Indexmenge von (xi )i∈I und (yj )j∈J eine Familie in X, so
dass für jeden Index j ∈ J ein Index i ∈ I mit yj = xi existiert. Dann heißt (yj )j∈J eine
Teilfamilie von (xi )i∈I . Man bezeichnet eine solche Teilfamilie in der Regel mit (xi )i∈J .
Übungsaufgaben
1. Geben Sie die ersten 10 Folgenglieder der so genannten Fibonacci–Folge (fn )n∈N an, die
folgendermaßen definiert ist
f1 := 1,
f2 := 1,
für alle n ∈ N mit n ≥ 3.
fn := fn−1 + fn−2
2. Geben Sie für die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N jeweils eine
explizite Darstellung an. Die Folgen sind gemäß
a1 := 1,
b1 := 2,
c1 := 1/2,
d1 := 1,
an := an−1 + 2n − 1,
bn−1
,
2
1
cn :=
cn−1 +
bn :=
2
n
,
dn := n2 − dn−1 − (n − 2)2
für alle n ≥ N mit n ≥ 2 rekursiv definiert. Beweisen Sie mittels vollständiger Induktion,
dass die jeweilige explizite Darstellung korrekt ist.
3. Sei (pα )α∈R eine Familie von Polynomen, welche gemäß pα (x) = x2 + (1 − α2 )x − 1 für alle
x ∈ R und alle α ∈ R definiert sind. Untersuchen Sie, ob die Polynome
f1 : R → R, x 7→ x2 ,
f2 : R → R, x 7→ x2 + x − 1,
f3 : R → R, x 7→ x2 + 2x − 1,
f4 : R → R, x 7→ (x − 1)(x + 1),
Mitglieder dieser Familie sind. Untersuchen Sie auch, wie oft das jeweilige Polynom als
Mitglied in der Familie (pα )α∈R auftritt.
34
2.2
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Algebren
Definition (Algebra). Ein Vektorraum V über K wird eine Algebra über K genannt,
wenn auf V eine bilineare Funktion
V × V → V, (v, w) 7→ vw
definiert ist, welche die Multiplikation auf V genannt wird.
Ist V eine Algebra über K, so folgt aus der Bilinearität der Multiplikation auf V , dass für
alle Vektoren v, v1 , v2 , w, w1 , w2 ∈ V und für alle Skalare α, β ∈ K die Gleichungen
(v1 + v2 )w = v1 w + v2 w,
(αv)w = α(vw),
v(w1 + w2 ) = vw1 + vw2 ,
v(βw) = β(vw)
gelten. Die Multiplikation auf einer Algebra erfüllt also insbesondere die Distributivgesetze.
Es wird jedoch nicht gefordert, dass die Multiplation assoziativ oder gar kommutativ ist.
Nachfolgend geben wir einige Beispiele für Algebren an.
Beispiele.
(a) Die Menge der reellen Zahlen ist eine Algebra über R.
(b) Die Menge der komplexen Zahlen ist sowohl eine Algebra über C als auch eine
Algebra über R.
(c) Für jede natürliche Zahl n ∈ N ist die Menge Rn×n eine Algebra über R. Die Multiplikation auf dieser Algebra ist die gewöhnliche Matrixmultiplikation. Diese ist
bekanntlich assoziativ, aber nicht kommutativ.
(d) Ist V eine Algebra über K, so ist auch die Menge V N aller Folgen in V eine Algebra
über K. Addition, skalare Multiplikation und Multiplikation auf V N werden dabei
folgengliedweise definiert, d.h. für je zwei Folgen (vn )n∈N und (wn )n∈N in V und jedes
Element α ∈ K definiert man
(vn )n∈N + (wn )n∈N := (vn + wn )n∈N ,
α(vn )n∈N := (αvn )n∈N ,
(vn )n∈N (wn )n∈N := (vn wn )n∈N .
(e) Ist V eine Algebra über K und X eine nichtleere Menge, so ist die Menge aller
Funktionen von X nach V eine Algebra über K. Addition, skalare Multiplikation
und Multiplikation werden dabei punktweise definiert, d.h. für je zwei Folgen f :
X → V und g : X → V und für jedes Element α ∈ K definiert man die Funktionen
f + g : X → V , αf : X → V und f g : X → V durch
(f + g)(x) := f (x) + g(x),
(αf )(x) := αf (x),
(f g)(x) := f (x)g(x)
für alle x ∈ X.
2.2. ALGEBREN
35
(f) Die Menge aller Polynome R → R, x 7→ α0 + α1 x + α2 x2 + · · · + αn xn mit reellen
Koeffizienten α1 , α2 , . . . , αn ∈ R ist eine Algebra über R. Die Multiplikation auf
dieser Algebra ist die punktweise Multiplikation, welche sowohl assoziativ als auch
kommutativ ist.
♦
Wie man anhand der obigen Beispiele sieht, gibt es zahlreiche Mengen, auf denen man eine
Addition, eine skalare Multiplikation und eine Multiplikation definieren kann, so dass die
Menge zu einer Algebra über K wird. Ist die Multiplikation eine assoziative Verknüpfung,
für die ein neutrales Element existiert, so kann man die Elemente der Algebra insbesondere
in Polynome einsetzen. Man betrachte etwa die Algebra R2 . Die Funktion p : R2×2 → R2×2 ,
welche durch
p(X) = X 2 + 2X − 3 := X 2 + 2X 1 − 3X 0
für alle X ∈ R2×2 definiert ist, ist ein Polynom vom Grad 2. Setzt man beispielsweise die
Matrix A ∈ R2×2 , welche durch
0 1
A :=
0 0
gegeben ist, in das Polynom ein, so erhält man die Matrix
−3
2
2
.
p(A) = A + 2A − 312 =
0 −3
Definition (submultiplikative Norm). Sei V eine Algebra über K. Eine k · k auf V ,
heißt submultiplikativ, wenn
kvwk ≤ kvk kwk
für alle v, w ∈ V gilt.
Wird ein Vektorraum über K mit einer Norm versehen, so erhält man einen normierten
Raum über K. Analog dazu kann man auch eine Algebra über K mit einer Norm versehen.
Ist diese submultiplikativ, so erhält man eine normierte Algebra.
Definition (normierte Algebra). Sei V eine Algebra über K und k · k eine submultiplikative Norm auf V . Dann heißt das Paar (V, k · k) eine normierte Algebra über K.
Die Submultiplikativität der Norm auf einer normierten Algebra ist quasi das multiplikative Pendant zur Dreiecksungleichung. Nachfolgend geben wir noch einige Beispiele für
normierte Algebren an.
Beispiele.
(a) Die Menge der reellen Zahlen R, versehen mit der Betragsfunktion | · | : R → R, ist
eine normierte Algebra über R.
(b) Die Menge der komplexen Zahlen C, versehen mit der komplexen Betragsfunktion
| · | : C → R, ist sowohl eine normierte Algebra über R als auch eine normierte
Algebra über C.
♦
36
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Übungsaufgabe
1. Zeigen Sie, dass der Vektorraum R2 zusammen mit der Funktion R2 × R2 → R2 , welche
durch
x1 y2 + x2 y1
x ~ y :=
x2 y2
für alle x = (x1 , x2 )T ∈ R2 und alle y = (y1 , y2 )T ∈ R2 definiert ist, eine Algebra über R ist.
2. Die Funktion k · kmax : R2×2 → R, welche durch
kAkmax := max |A11 |, |A12 |, |A21 |, |A22 |
für alle A ∈ R2×2 ist, ist eine Norm auf R2×2 . Zeigen Sie anhand eines Gegenbeispiels, dass
diese Norm nicht submultiplikativ ist.
3. Wir betrachten die Menge
a
M :=
b
−b
a
∈R
a,
b
∈
R
2×2 und die Funktion k · kM : M → R, welche durch kAk2M := a2 + b2 für alle A ∈ M mit
a −b
A=
b
a
definiert ist.
• Zeigen Sie, dass M eine Algebra auf R ist.
• Zeigen Sie, dass k · kM eine Norm auf M ist.
• Zeigen Sie, dass (M, k · kM ) eine normierte Algebra ist.
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
2.3
37
Infimum, Supremum, Minimum und Maximum
Definition (nach unten beschränke Menge). Sei M eine Teilmenge von R. Ein reelle
Zahl u ∈ R heißt eine untere Schranke von M , wenn u ≤ x für alle x ∈ M gilt. Existiert
eine solche untere Schranke, so nennt man die Menge M nach unten beschränkt.
Definition (nach oben beschränkte Menge). Sei M eine Teilmenge von R. Ein reelle
Zahl o ∈ R heißt eine obere Schranke von M , wenn x ≤ o für alle x ∈ M gilt. Existiert
eine solche obere Schranke, so nennt man die Menge M nach oben beschränkt.
Eine Menge M ⊆ R ist offenbar nicht nach unten beschränkt, wenn für jede reelle Zahl
y ∈ R ein Element x ∈ M existiert, so dass x < y gilt. Ebenso die Menge M nicht nach
oben beschränkt, wenn für jede reelle Zahl y ∈ R ein Element x ∈ M existiert, so dass
y < x gilt. Nachfolgend geben wir einige Beispiele für Teilmengen von R an, welche nach
unten oder nach oben beschränkt sind.
Beispiele.
(a) Offenbar gilt für jede reelle Zahl a ≤ 1 und jede natürliche Zahl n ∈ N die Ungleichung a ≤ 1. Daher ist jede reelle Zahl a ≤ 1 eine untere Schranke von N, und N ist
somit nach unten beschränkt. Die Menge N ist jedoch nicht nach oben beschränkt,
da man zu jeder reellen Zahl x ∈ R eine natürliche Zahl n ∈ N finden kann, so dass
n > x gilt. Daher existiert keine obere Schranke von N.
(b) Sei (a, b) ein nichtleeres, offenes Intervall mit Intervallgrenzen a, b ∈ R. Dann ist jede
reelle Zahl u ≤ a eine untere Schranke von (a, b). Ebenso ist jede reelle Zahl o ≥ b
eine obere Schranke für (a, b). Das Intervall (a, b) ist also eine nach unten und nach
oben beschränkte Menge. Dasselbe gilt für nichtleere, abgeschlossene Intervalle [a, b],
sowie für Intervalle der Form [a, b) und (a, b] mit a, b ∈ R.
(c) Intervalle der Form (−∞, b) und (−∞, b] mit b ∈ R sind durch jede reelle Zahl o ≥ b
nach oben, nicht aber nach unten beschränkt.
(d) Intervalle der Form (a, ∞) und [a, ∞) mit a ∈ R sind durch jede reelle Zahl u ≤ a
nach unten, nicht aber nach oben beschränkt.
Ist u ∈ R untere Schranke einer Menge M ⊂ R, so ist jede reelle Zahl v ≤ u ebenfalls eine
untere Schranke von M . Ebenso ist jede reelle Zahl p ≥ o obere Schranke einer Menge
M ⊂ R, wenn die Zahl o ∈ R eine obere Schranke von M ist. Daher macht es keinen Sinn,
von der oberen Schranke“ oder der unteren Schranke“ einer Menge zu sprechen. Sinnvoll
”
”
ist jedoch die Suche nach einer möglichst großen unteren Schranke bzw. einer möglichst
kleinen oberen Schranke.
Definition (Infimum). Sei M ⊂ R eine nach unten beschränkte Menge, und sei u∗ ∈ R
eine untere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die
Zahl u∗ + ε keine untere Schranke von M ist. Dann heißt u∗ das Infimum von M , und
man bezeichnet u∗ mit inf M .
Definition (Supremum). Sei M ⊂ R eine nach oben beschränkte Menge, und sei o∗ ∈ R
eine obere Schranke von M mit der Eigenschaft, dass für jede positive Zahl ε > 0 die Zahl
o∗ − ε keine obere Schranke von M ist. Dann heißt o∗ das Supremum von M , und man
bezeichnet o∗ mit sup M .
38
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Gemäß Definition ist das Infimum die größte untere Schranke einer Menge, und das Supremum die kleinste obere Schranke. Die Existenz eines Infimums und eines Supremums
wird für nichtleere, nach unten bzw. nach oben beschränkte Teilmengen der reellen Zahlen
axiomatisch festgelegt.
Axiom (Vollständigkeitsaxiom). Jede nichtleere, nach unten beschränkte Teilmenge
von R besitzt ein Infimum. Jede nichtleere, nach oben beschränkte Teilmenge von R besitzt
ein Supremum.
Es sollte hier noch erwähnt werden, dass man für eine Teilmenge M der reellen Zahlen oft
inf M = −∞
schreibt, falls M nicht nach unten beschränkt ist. Analog dazu schreibt man
sup M = ∞,
falls M nicht nach oben beschränkt ist.
Nachfolgend geben wir einige Beispiele für Infima und Suprema von Mengen an.
Beispiele.
(a) Betrachtet man die Menge der natürlichen Zahlen N als Teilmenge von R, so ist N
nach unten beschränkt. Genauer: Jede reelle Zahl u ≤ 1 ist eine untere Schranke von
N. Für jede positive Zahl ε > 0 hingegen existiert eine natürliche Zahl n ∈ N, so
dass 1 + ε > n gilt, nämlich n = 1. Also ist 1 die größte untere Schranke und damit
das Infimum von N, d.h. inf N = 1.
(b) Für jedes nichtleere, offene Intervall (a, b), für jedes nichtleere, abgeschlossene Intervall [a, b] und für alle nichtleeren Intervalle der Form [a, b) oder (a, b] mit Intervallgrenzen a, b ∈ R gilt
inf (a, b) = inf [a, b] = inf [a, b) = inf (a, b] = a,
sup (a, b) = sup [a, b] = sup [a, b) = sup (a, b] = b.
Man beachte, dass die Zahl a kein Element der Intervalle (a, b) und (a, b] ist, und
dass die Zahl b kein Element der Intervalle (a, b) und [a, b) ist.
♦
Anhand der zuletzt aufgeführten Beispiele erkennt man, dass das Infimum einer Menge
M ⊂ R nicht notwendigerweise ein Element von M sein muss. Dasselbe gilt für das Supremum von M . Es gibt jedoch auch Mengen M ⊆ R für die inf M ∈ M bzw. sup M ∈ M
gilt. In diesem Fall bezeichnet man das Infimum bzw. das Supremum als das Minimum“
”
bzw. das Maximum“ der Menge.
”
Definition (Minimum). Sei M ⊂ R eine nach unten beschränkte Menge. Eine reelle
Zahl x∗ ∈ R wird das Minimum von M genannt, wenn x∗ ∈ M und x∗ = inf M gilt. Das
Minimum von M wird mit min M bezeichnet.
Definition (Maximum). Sei M ⊂ R eine nach oben beschränkte Menge. Eine reelle
Zahl x∗ ∈ R wird das Maximum von M genannt, wenn x∗ ∈ M und x∗ = sup M gilt. Das
Maximum von M wird mit max M bezeichnet.
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
(a)
39
(b)
Abbildung 2.1: (a) Infimum und Supremum eines nichtleeren, offenen Intervalls (a, b).
(b) Minimum und Maximum eines nichtleeren, abgeschlossenen Intervalls [a, b]
Das Minimum einer nach unten beschränkten Menge M ⊆ R ist also ein Element von
M , welches gleichzeitig eine untere Schranke von M ist. Es folgt daher, dass min M das
kleinste Element von M ist. Ebenso ist max M das größte Element von M . Es muss betont
werden, dass eine nach unten bzw. nach oben beschränkte Menge M ⊂ R nicht notwendigerweise ein kleinstes bzw. größtes Element besitzt. Es existiert lediglich eine größte untere
bzw. eine kleinste obere Schranke. Daher besitzt jede nichtleere, nach unten beschränkte
Teilmenge von R zwar ein Infimum, nicht aber unbedingt ein Minimum. Ebenso besitzt
jede nichtleere, nach oben beschränkte Teilmenge von R ein Supremum, nicht aber unbedingt ein Maximum. Man betrachte dazu die Abbildung 2.1 wie auch die nachfolgenden
Beispiele.
Beispiele.
(a) Wir haben bereits gezeigt, dass inf N = 1 gilt. Da auch 1 ∈ N gilt, ist die Zahl 1
nicht nur die größte untere Schranke von N sondern auch das kleinste Element von
N, d.h. es gilt min N = 1.
(b) Seien x1 , x2 , . . . , xn ∈ R reelle Zahlen mit x1 ≤ x2 ≤ · · · ≤ xn . Dann gilt
min {x1 , x2 , . . . , xn } = x1 ,
max {x1 , x2 , . . . , xn } = xn .
(c) Sei [a, b] ein nichtleeres, abgeschlossenes Intervall mit a, b ∈ R. Dann gilt
min [a, b] = a,
max [a, b] = b.
(d) Für nichtleere Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R gilt
min [a, b) = a,
max (a, b] = b.
Außerdem gilt sup [a, b) = b und inf (a, b] = a. Da jedoch b 6∈ [a, b) und a 6∈ (a, b] gilt,
besitzt das Intervall [a, b) kein Maximum und das Intervall (a, b] kein Minimum.
(e) Jedes nichtleere, offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R besitzt weder ein
Mininum noch ein Maximum.
♦
Man überlegt sich leicht, dass jede nach unten beschränkte Teilmenge von Z ein Minimum
besitzt. Ebenso offensichtlich ist, dass jede nach oben beschränkte Teilmenge von Z ein
Maximum besitzt. Daher kann man die folgenden beiden Funktionen definieren.
40
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Definition (Abrundungsfunktion, Gauß–Klammer). Die Abrundungsfunktion oder
Gaußklammer R → Z, x 7→ bxc ist durch
bxc := max{k ∈ Z | k ≤ x}
für alle x ∈ R definiert.
Definition (Aufrundungsfunktion). Die Aufrundungsfunktion R → Z, x 7→ dxe ist
durch
dxe := min{k ∈ Z | x ≤ k}
für alle x ∈ R definiert.
Die Abrundungsfunktion b · c wird gelegentlich auch mit [ · ] bezeichnet. Für jede reelle
Zahl x ∈ R nennt man den zugehörigen Funktionswert der Abrundungsfunktion bxc den
Ganzteil von x. Die Zahl x − bxc nennt man den Nachkommaanteil von x. Offenbar ist
eine Zahl k ∈ R genau dann Element von Z, wenn ihr Nachkommaanteil verschwindet, d.h.
wenn k = bkc bzw. k − bkc = 0 gilt. Für jede reelle Zahl x ∈ R gilt ferner die Abschätzung
bxc ≤ x ≤ dxe.
Daraus folgt insbesondere, dass man für jede noch so große, positive nichtnegative Zahl
R ≥ 0 eine natürliche Zahl N ∈ N wählen kann, so dass N > R gilt: Man wählt einfach
die Zahl N := dRe + 1. Außerdem existiert für jede noch so kleine, positive reelle Zahl
ε > 0 eine natürliche Zahl n ∈ N, so dass
1
<ε
n
gilt, nämlich n := d1/εe + 1. Obwohl diese Überlegungen trivial erscheinen, werden sie
doch häufig in Beweisen benötigt.
Beschränktheit nach unten und Beschränktheit nach oben kann man auch für reellwertige Funktionen definieren.
Definition (nach unten beschränkte Funktion). Sei X eine nichtleere Menge. Eine
Funktion f : X → R heißt nach unten beschränkt, wenn ihre Wertemenge nach unten
beschränkt ist.
Definition (nach oben beschränkte Funktion). Sei X eine nichtleere Menge. Eine
Funktion f : X → R heißt nach oben beschränkt, wenn ihre Wertemenge nach oben
beschränkt ist.
Die Wertemenge f (X) einer Funktion f : X → R ist bekanntlich durch
f (X) := y ∈ R ∃x ∈ X : f (x) = y
gegeben. Entsprechend definiert man das Infimum einer nach unten beschränkten Funktion
f : X → R als
inf f (x) := inf f (X)
x∈X
Wenn außerdem ein Element x∗ ∈ X existiert, so dass f (x∗ ) = inf f (X) gilt, definiert man
das Minimum der Funktion f als
min f (x) := f (x∗ ).
x∈X
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
41
Das Element x∗ wird dann ein Minimierer der Funktion f genannt. Für eine nach oben
beschränkte Funktion f : X → R definiert man das Supremum durch
sup f (x) := sup f (X).
x∈X
Falls außerdem ein Element x∗ ∈ X existiert, für dass f (x∗ ) = sup f (X) gilt, so definiert
man das Maximum der Funktion f als
max f (x) := f (x∗ ).
x∈X
Das Element x∗ wird dann ein Maximierer von f genannt.
Beispiele.
(a) Die Funktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist, ist
beispielsweise durch 0 nach unten beschränkt, und es gilt
inf f (x) = min f (x) = 0
x∈X
x∈R
Wegen f (0) = 0 ist die Zahl 0 ein Minimierer von f . Tatsächlich ist 0 der einzige
Minimierer von f , wie man leicht zeigen kann. Die Funktion f ist nicht nach oben
beschränkt.
(b) Die Funktion g : R\{0} → R, welche durch g(x) := 1/x2 für alle x ∈ R\{0} definiert
ist, ist nach unten beschränkt, und es gilt
inf
g(x) = 0.
x∈R\{0}
Allerdings besitzt die Funktion g kein Minimum, da g(x) > 0 für alle x ∈ R \ {0}
gilt. Die Funktion g ist außerdem nicht nach oben beschränkt.
♦
Reelle Zahlenfolgen sind bekanntlich nichts anderes als Funktionen von N nach R. Daher
definiert man nach unten bzw. nach oben beschränkte Folgen in R wie folgt.
Definition (nach unten beschränkte Folge). Eine Folge in R heißt nach unten beschränkt, wenn die Menge ihrer Folgenglieder nach unten beschränkt ist.
Definition (nach oben beschränkte Folge). Eine Folge in R heißt nach oben beschränkt, wenn die Menge ihrer Folgenglieder nach oben beschränkt ist.
Die Menge der Folgenglieder einer reellen Zahlenfolge (an )n∈N ist durch
{an | n ∈ N} = {a1 , a2 , a3 , . . . }
gegeben. In Analogie zu den nach unten beschränkten Teilmengen von R definiert man
das Infimum einer nach unten beschränkten reellen Zahlenfolge (an )n∈N als das Infimum
der Menge aller Folgenglieder, d.h. man definiert
inf an := inf{an | n ∈ N}.
n∈N
42
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Falls außerdem eine natürliche Zahl n∗ ∈ N existiert, so dass an∗ = inf{an | n ∈ N} gilt,
definiert man das Minimum der Folge (an )n∈N als
min an := an∗ .
n∈N
Das Supremum einer nach oben beschränkten reellen Zahlenfolge (an )n∈N definiert man
gemäß
sup an := sup{an | n ∈ N}.
n∈N
Wenn außerdem eine natürliche Zahl n∗ ∈ N existiert, für die an∗ = sup{an | n ∈ N} gilt,
dann definiert man das Maximum der Folge als
max an := an∗ .
n∈N
Gelegentlich werden das Infimum, das Minimum, das Supremum und das Maximum einer
reellen Zahlenfolge (an )n∈N auch mit inf (an )n∈N , min (an )n∈N , sup (an )n∈N und max (an )n∈N
bezeichnet.
Beispiele.
(a) Die so genannte Folge der Quadratzahlen (qn )n∈N , welche durch qn := n2 für alle
n ∈ N definiert ist, ist beispielsweise durch 1 nach unten beschränkt, und es gilt
inf qn = min qn = 1.
n∈N
n∈N
Die Folge (qn )n∈N ist jedoch nicht nach oben beschränkt.
(b) Die so genannte Folge der Stammbrüche (sn )n∈N , welche durch sn := 1/n für alle
n ∈ N definiert ist, ist nach oben beschränkt, und es gilt
sup sn = max sn = 1.
n∈N
n∈N
Die Folge (sn )n∈N ist außerdem nach unten beschränkt mit
inf sn = 0.
n∈N
Da jedoch 1/n 6= 0 für alle n ∈ N gilt, besitzt die Folge der Stammbrüche kein
Minimum.
♦
Übungsaufgaben
1. Gegeben seien die reellen Zahlen x1 := −3/2, x2 := π, x3 :=
Berechnen Sie die ganzen Zahlen bxi c und dxi e für i = 1, 2, 3, 4.
√
2 und x4 := log10 (124).
2. Skizzieren Sie die Funktionsgraphen der Funktionen [−3, 3] → R, x 7→ bxc und [−3, 3] →
R, x − bxc.
3. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der folgenden Teilmengen von R.
M1 = {x2 | x ∈ (0, 1]}
M2 = {−12, 1, 0, −4},
M3 = [−2, −1) ∪ (1, ∞),
M4 = {2k | k ∈ Z}
2.3. INFIMUM, SUPREMUM, MINIMUM UND MAXIMUM
43
4. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N , welche durch
an := 4n − n2 ,
(−1)n
,
n πn
,
cn := sin
2
d1 := 4,
dn+1 := dn /2
bn :=
für alle n ∈ N definiert sind.
5. Bestimmen Sie, falls dieses existiert, das Infimum, das Supremum, das Minimum und das
Maximum der nachfolgend angegebenen Funktionen.
f1 : [1, 2) → R, x 7→ 3x,
f2 : R → R, x 7→ −x3 ,
√
f3 : [0, ∞) → R, x 7→ x,
f4 : (0, 1] → R, x 7→ 1/x.
44
2.4
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Monotonie
Definition (monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine
Funktion f : D → R heißt monoton wachsend, wenn f (x) ≤ f (y) für alle x, y ∈ D mit
x ≤ y gilt.
Definition (streng monoton wachsende Funktion). Sei D ⊆ R eine nichtleere Menge.
Eine Funktion f : D → R heißt streng monoton wachsend, wenn f (x) < f (y) für alle
x, y ∈ D mit x < y gilt.
Definition (monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge. Eine
Funktion f : D → R heißt monoton wachsend, wenn f (x) ≥ f (y) für alle x, y ∈ D mit
x ≤ y gilt.
Definition (streng monoton fallende Funktion). Sei D ⊆ R eine nichtleere Menge.
Eine Funktion f : D → R heißt streng monoton fallend, wenn f (x) > f (y) für alle x, y ∈ D
mit x < y gilt.
Die Monotonie einer Funktion f : D → R, wobei D ⊆ R eine nichtleere Menge ist, lässt
sich bekannterweise am Funktionsgraphen
graph(f ) := {(x, y)T ∈ R2 | x ∈ D, y = f (x)}
ablesen. Falls eine solcher Graph von links nach rechts stets ansteigt, so ist die Funktion
monoton wachsend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die Funktion streng monoton wachsend. Falls der Graph von links nach rechts stets abfällt, ist die
Funktion monoton fallend. Verläuft der Graph dabei an keiner Stelle waagrecht, so ist die
Funktion streng monoton fallend (siehe auch Abbildun 2.2).
Beispiele.
(a) Eine affine Funktion g : R → R, welche für gegebene reelle Zahlen m, c ∈ R durch
g(x) = mx + c für alle x ∈ R definiert ist, ist genau dann streng monoton wachsend
bzw. streng monoton fallend, wenn m > 0 bzw. m < 0 gilt.
(b) Jede konstante Funktion ist sowohl monoton wachsend als auch monoton fallend. Ist
D ⊆ R eine nichtleere Menge, so wird eine Funktion f : D → R konstant genannt,
wenn eine Zahl y0 ∈ R existiert, so dass f (x) = y0 für alle x ∈ D gilt.
Wir erinnern uns, dass Folgen nichts anderes sind als Funktionen, deren Definitionsmenge
die Menge der natürlichen Zahlen N ist. Daher kann man den Monotoniebegriff auch auf
Folgen übertragen. Dementsprechend heißt eine Folge (an )n∈N in R monoton wachsend,
wenn
an ≤ an+1
für alle n ∈ N gilt. Die Folge heißt streng monoton wachsend, wenn
an < an+1
für alle n ∈ N gilt. Die Folge wird monoton fallend genannt, wenn
an ≥ an+1
2.4. MONOTONIE
45
(a)
(b)
(c)
(d)
Abbildung 2.2: Funktionsgraphen einer (a) monoton wachsenden, (b) streng monoton
wachsenden, (c) monoton fallenden, (d) streng monoton fallenden Funktion von R nach
R.
für alle n ∈ N gilt. Falls
an > an+1
für alle n ∈ N gilt, wird die Folge streng monoton fallend genannt.
Die Monotonie einer Folge in R wird letztlich von der Ordnungsrelation ≤ auf R bestimmt. Man kann den Monotoniebegriff jedoch auch auf Folgen in einer beliebigen Menge
X übertragen, sofern auf X eine Ordnungsrelation definiert ist. Wir geben hier zwei Beispiele dafür an.
Beispiele.
(a) Die Teilmengenrelation ⊆ ist bekanntlich eine Ordnungsrelation auf P(N), der Potenzmenge von N. Definiert man die Folge (Nn )n∈N in P(N) gemäß Nn := {1, 2, . . . , n}
für alle n ∈ N, so ist (Nn )n∈N eine monoton wachsende Folge bezüglich der Teilmengenrelation. Es gilt nämlich
Mn ⊆ Mn+1
für alle n ∈ N.
(b) Die Teilbarkeitsrelation | ist eine Ordnungsrelation auf N. Definiert man die Folge
(fn )n∈N gemäß fn := n! = n(n − 1) · · · 1 für alle n ∈ N, so gilt
fn | fn+1
(fn ist ein Teiler von fn+1 )
für alle n ∈ N. Also ist (fn )n∈N eine monoton wachsende Folge bezüglich der Teilbarkeitsrelation.
♦
Zum Abschluss dieses Abschnitts führen wir noch den Begriff der Teilfolge ein.
Definition (Teilfolge). Sei X eine nichtleere Menge und (xn )n∈N eine Folge in X. Eine
Folge (yn )n∈N in X heißt eine Teilfolge von (xn )n∈N , wenn eine streng monoton wachsende
Funktion ϕ : N → N existiert, so dass yn = xϕ(n) für alle n ∈ N gilt. Die Folge (yn )n∈N
wird dann auch mit (xϕ(n) )n∈N bezeichnet.
46
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
Beispiele.
(a) Sei (sn )n∈N die Folge R, welche durch sn := (−1)n für alle n ∈ N gegeben ist. Dann
ist beispielsweise die Folge (en )n∈N , welche durch en := 1 für alle n ∈ N gegeben ist,
eine Teilfolge von (sn )n∈N . Es gilt nämlich en = s2n für alle n ∈ N.
(b) Die Folge (sn )n∈N aus Teil (a) ist eine Teilfolge der Folge (zn )n∈N in C, welche durch
zn := in für alle n ∈ N definiert ist. Hierbei bezeichnet i die imaginäre Einheit. Es
gilt nämlich sn = z2n für alle n ∈ N. Auch die Folge (en )n∈N aus Teil (a) ist eine
Teilfolge von (zn )n∈N . Es gilt nämlich en = s2n = z4n für alle n ∈ N.
♦
Übungsaufgaben
1. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N hinsichtlich
ihrer Monotonie. Die Folgen sind dabei durch
1
2n
bn := 2n ,
an :=
πn ,
cn := cos
2
d1 := 1,
dn+1 := 1 + 2dn
für alle n ∈ N definiert.
2. Geben Sie jeweils die ersten 5 Folgenglieder der Teilfolgen (a2n )n∈N , (an2 )n∈N , (a6n+1 )n∈N
und (an! )n∈N der Folge (an )n∈N an, welche durch


1 falls n ≡ 0 mod 3,
an := 2 falls n ≡ 1 mod 3,


3 falls n ≡ 2 mod 3
für alle n ∈ N definiert ist.
3. Entscheiden Sie, ob die Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N Teilfolgen der Folge
(xn )n∈N in R sind. Die Folge (xn )n∈N ist dabei durch
xn := dn/2e
für alle n ∈ N definiert. Die übrigen Folgen sind gemäß
an := n,
bn := dn/3e,
cn := n2 ,
dn := 4n − n2
für alle n ∈ N definiert. Für jede reelle Zahl α ∈ R bezeichnet hierbei dαe die kleinste
ganze Zahl, welche größer oder gleich α ist. Die ersten Glieder der Folge (xn )n∈N lauten
dementsprechend x1 = x2 = 1, x3 = x4 = 2, x5 = x6 = 3 u.s.w.
2.5. GRENZWERTE VON FOLGEN
2.5
47
Grenzwerte von Folgen
Definition (konvergente Folge, Grenzwert). Sei (V, k · k) ein normierter Raum über
K. Eine Folge (vn )n∈N in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass für
jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass
kvn − vk < ε für alle n ≥ N
gilt. Der Vektor v heißt in diesem Fall der Grenzwert der Folge, und man sagt, dass die
Folge (vn )n∈N gegen v konvergiert. Außerdem schreibt man
lim vn = v
n→∞
oder auch vn → v (n → ∞).
Definition (divergente Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
in V heißt divergent, wenn sie nicht konvergent ist.
Anschaulich gesprochen konvergiert eine Folge genau dann gegen einen bestimmten Grenzwert, wenn die Folgenglieder für wachsende Indizes diesem Grenzwert immer näher kommen. Man sagt auch, dass die Folgenglieder einer konvergenten Folge, dem Grenzwert
beliebig nahe kommen. Dabei ist zu beachten, dass der Grenzwert selbst ein Folgenglied
sein kann. Im allgemeinen ist dies jedoch nicht der Fall.
Der nachfolgende Satz zeigt, weshalb es sinnvoll ist, von dem Grenzwert einer konvergenten Folge zu sprechen.
Satz 2.1. Der Grenzwert einer konvergenten Folge ist eindeutig bestimmt.
Eine spezielle Klasse konvergenter Folgen bilden die so genannten Nullfolgen.
Definition (Nullfolge). Sei (V, k · k) ein normierter Raum über K. Eine Folge in V heißt
Nullfolge, wenn sie gegen den Nullvektor 0 ∈ V konvergiert.
Ist (V, k · k) ein normierter Raum, so konvergiert eine Folge (vn )n∈N offenbar genau dann
gegen einen Vektor v ∈ V , wenn (kvn − vk)n∈N eine Nullfolge ist, d.h. wenn
lim kvn − vk = 0
n→∞
gilt. In den nachfolgenden Beispielen geben wir die Grenzwerte einiger grundlegender Zahlenfolgen an. Vereinzelt geben wir eine kurze Begründung für das Resultat an.
Beispiele.
(a) Für jede reelle Zahl α ∈ R, und für jede reelle Zahl β ∈ R, welche n + β 6= 0 für alle
n ∈ N erfüllt, gilt
α
lim
= 0.
n→∞ n + β
Ist nämlich ε > 0 eine beliebig gewählte, positive Zahl, so existiert eine natürliche
Zahl N ∈ N, so dass n + β > α/ε für alle n ∈ N mit n ≥ N gilt. Daraus folgt, dass
|α/(n + β) − 0| < ε für alle n ∈ N mit n ≥ N gilt. Also ist die Folge (an )n∈N , definiert
durch an := α/(n + β) für alle n ∈ N, eine Nullfolge in R.
48
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
(b) Für jede reelle Zahl β ∈ R und für jede reelle Zahl α ∈ R, welche n + β 6= 0 für alle
n ∈ N erfüllt, gilt
n+α
lim
= 1.
n→∞ n + β
Es gilt nämlich
α − β n + α
n + β − 1 = n + β ,
und in Beispiel (a) wurde gezeigt, dass die Folge (bn )n∈N , definiert durch bn :=
(α − β)/(n + β) für alle n ∈ N, eine Nullfolge in R ist.
(c) Für jede komplexe Zahl q ∈ C mit |q| < 1 gilt
lim q n = 0.
n→∞
(d) Für jede Nullfolge (an )n∈N in C und für jede natürliche Zahl p ∈ N gilt
p
lim p |an | = 0.
n→∞
Wählt man nämlich eine beliebige, positive Zahl ε > 0, dann gilt auch εp > 0. Da
(an )n∈N eine Nullfolge ist, existiert eine natürliche Zahl N ∈ N, so dass |an | < εp
für alle n ∈ N mit n ≥ Npgilt. Zieht man
p auf beiden Seiten der Ungleichung die p-te
Wurzel, so erhält man | p |an | − 0| = |an | < εp für alle n ∈ N mit n ≥ N .
(e) Es gilt
lim
n→∞
√
n
n = 1.
(f) Für jede komplexe Zahl q ∈ C mit |q| < 1 und jede natürliche Zahl p ∈ N gilt
lim np q n = 0.
n→∞
(g) Sei (V, k · k) ein normierter Raum über K, und sei (vn )n∈N eine konstante Folge in
V , d.h. es existiere ein Vektor v0 ∈ V , so dass vn := v0 für alle n ∈ N gilt. Dann
konvergiert (vn )n∈N gegen v0 .
♦
Die Eigenschaft einer Folge, konvergent oder nicht konvergent zu sein, wird oft als das
Konvergenzverhalten der Folge bezeichnet. Der folgende Satz liefert ein wichtiges Resultat
hinsichtlich des Konvergenzverhaltens der Teilfolgen einer konvergenten Folge.
Satz 2.2. Sei (V, k · k) ein normierter Raum über K. Eine Folge (vn )n∈N in V konvergiert
genau dann gegen einen Grenzwert v ∈ V , wenn alle Teilfolgen von (vn )n∈N gegen v
konvergieren.
Satz 2.2 liefert offenbar auch ein notwendiges Kriterium für die Konvergenz einer Folge.
Falls man nämlich aus einer beliebigen Folge zwei Teilfolgen extrahieren kann, die gegen
unterschiedliche Grenzwerte konvergieren, so folgt aus Satz 2.2, dass die ursprüngliche
Folge nicht konvergent sein kann.
Als nächstes untersuchen wir, was man über die Normen der Folgenglieder einer konvergenten Folge aussagen kann.
2.5. GRENZWERTE VON FOLGEN
49
Satz 2.3. Sei (V, k · k) ein normierter Raum, und sei (vn )n∈N eine konvergente Folge in V .
Dann gilt
lim kvn k = lim vn .
n→∞
n→∞
Als nächstes wollen wir einige Resultate zusammengestellen, die es erlauben, Grenzwerte
von bestimmten Folgen aus bereits bekannten Grenzwerten zu berechnen. Die nachfolgenden zwei Sätze liefern solche Rechenregeln für Grenzwerte.
Satz 2.4. Sei (V, k · k) ein normierter Raum über K. Seien außerdem (vn )n∈N und (wn )n∈N
zwei konvergente Folgen in V , und sei (αn )n∈N eine konvergente Folge in K. Dann gilt
(1) lim vn + wn = lim vn + lim wn .
n→∞
(2) lim αn vn =
n→∞
n→∞
lim αn
n→∞
n→∞
lim vn .
n→∞
Ist (V, k · k) eine normierte Algebra über K, so gilt außerdem
(3) lim vn wn = lim vn
lim wn .
n→∞
n→∞
n→∞
Man beachte, dass die Aussage in Teil (2) von Satz 2.4 insbesondere auch für jede konstante
Folge in K gilt. Eine konstante Folgen (αn )n∈N ist bekanntlich durch αn := α für alle n ∈ N
gegeben, wobei α ∈ K eine fest gewählte Zahl ist. Diese Zahl ist dann auch der Grenzwert
von (αn )n∈N . Aus Teil (2) von Satz 2.4 folgt daher, dass
lim αvn = α lim vn
n→∞
n→∞
für jede konvergente Folge (vn )n∈N und für jede Zahl α ∈ K gilt. Da außerdem v − w =
v + (−1)w für beliebige Vektoren v, w ∈ V gilt, implizieren die Teile (1) und (2) von
Satz 2.4 auch, dass
lim vn − wn = lim vn − lim wn
n→∞
n→∞
n→∞
für alle konvergenten Folge (vn )n∈N und (wn )n∈N gilt.
Die bisher eingeführten Rechenregeln für die Addition, die skalare Multiplikation und
die Multiplikation von Grenzwerten gelten alle konvergenten Folgen in einer normierten
Algebra V über K. Im Fall V = R oder V = C kann man darüber hinaus eine Rechenregel
für die Division von Grenzwerten beweisen.
Satz 2.5. Sei (αn )n∈N eine konvergente Folge in K \ {0}, deren Grenzwert ebenfalls ein
Element von K \ {0} ist. Dann gilt
lim
n→∞
1
1
=
.
αn
lim αn
n→∞
Laut Satz 2.5 konvergiert die Folge der Kehrbrüche einer konvergenten Folge in K gegen
den Kehrbruch des Grenzwertes. Da bekanntlich α/β = α · (1/β) für alle α, β ∈ K gilt,
folgt aus Teil (3) von Satz 2.4 und Satz 2.5 die Rechenregel
lim αn
αn
= n→∞
n→∞ βn
lim βn
lim
n→∞
50
KAPITEL 2. GRUNDBEGRIFFE DER ANALYSIS
für alle konvergenten Folgen (αn )n∈N in K und alle konvergenten Folgen (βn )n∈N in K\{0},
sofern der Grenzwert der Folge (βn )n∈N von Null verschieden ist.
Zum Abschluss dieses Kapitels wenden wir uns noch zwei Spezialfällen von Divergenz
zu, die man für reelle Zahlenfolgen definiert.
Definition (gegen ∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt
gegen ∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N
existiert, so dass
an > R für alle n ∈ N mit n ≥ N
gilt. In diesem Fall schreibt man
lim an = ∞
n→∞
oder an → ∞ (n → ∞).
Definition (gegen −∞ bestimmt divergente Folge). Eine Folge (an )n∈N in R heißt
gegen −∞ bestimmt divergent, wenn für jede reelle Zahl R ∈ R eine natürliche Zahl N ∈ N
existiert, so dass
an < R für alle n ∈ N mit n ≥ N
gilt. In diesem Fall schreibt man
lim an = −∞
n→∞
oder an → −∞ (n → ∞).
Man nennt eine reelle Zahlenfolge ganz allgemein bestimmt divergent, wenn sie entweder
gegen ∞ oder gegen −∞ bestimmt divergent ist. Man sollte sich klar machen, dass jede
nach ∞ bestimmt divergente Folge nach unten, nicht aber nach oben beschränkt ist. Die
Umkehrung dieser Aussage gilt jedoch nicht. Es gibt nämlich reelle Zahlenfolgen die nach
unten, nicht aber nach oben beschränkt sind, und die nicht gegen ∞ bestimmt divergieren.
Man betrachte hierzu auch die nachfolgenden Beispiele.
Beispiele.
(a) Die reelle Zahlenfolge (an )n∈N , welche durch an := −n für alle n ∈ N definiert ist,
ist gegen −∞ bestimmt divergent.
(b) Die reelle Zahlenfolge (bn )n∈N , welche durch bn := (−2)n für alle n ∈ N definiert ist,
ist divergent, aber nicht bestimmt divergent.
(c) Die nach unten, nicht aber nach oben beschränkte reelle Zahlenfolge (cn )n∈N , welche
durch
(
1
falls n gerade ist,
cn :=
2
n falls n ungerade ist
für alle n ∈ N definiert ist, ist divergent, aber nicht bestimmt divergent.
Das nachfolgende Lemma ist oft hilfreich, wenn man reelle Zahlenfolgen auf Konvergenz
hin untersucht.
Lemma 2.6. Sei (an )n∈N eine bestimmt divergente Zahlenfolge in R \ {0}. Dann gilt
lim
n→∞
1
= 0.
an
2.5. GRENZWERTE VON FOLGEN
51
Beweis. Da die Folge (an )n∈N bestimmt divergiert, ist die Folge (|an |)n∈N gegen ∞ bestimmt
divergent. Wählt man eine beliebige positive Zahl ε > 0, dann existiert demnach eine natürliche
Zahl N ∈ N derart, dass |an | > 1/ε für alle n ∈ N mit n ≥ N gilt. Entsprechend gilt dann
1/|an | < ε für alle n ∈ N mit n ≥ N . Damit ist gezeigt, dass die Folge (1/an )n∈N eine Nullfolge
ist.
Die Frage ob eine Folge konvergiert oder divergiert ist nicht immer leicht zu beantworten.
Wir werden im Kapitel 4 auf diese Frage näher eingehen.
Übungsaufgaben
1. Die konvergenten, reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N und (en )n∈N sind
durch
an :=
bn :=
cn :=
dn :=
en :=
2n + 1
,
3n2 + 2n + 1
√
n
n2 ,
1 + 2 + ··· + n
,
2
√n
n+ n
,
3n
(2n − 1)(3n − 2)(n + 1)
(5n − 1)(2n + 1)(3n − 1)
für alle n ∈ N definiert. Berechnen Sie die Grenzwerte dieser Folgen. Um den Grenzwert
der Folge (cn )n∈N zu berechnen, sollten Sie zunächst mittels vollständiger Induktion nach n
zeigen, dass 1 + 2 + . . . + n = n(n + 1)/2 für alle n ∈ N gilt.
2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Konvergenz hin, und bestimmen Sie gegebenenfalls den Grenzwert. Die Folgen seien dabei durch
√
√
an := n − 1 − n,
n
n
,
bn := −
2
2
n 4
cn :=
,
4 n
√
p
dn := n(n2 + 1) − n3
für alle n ∈ N definiert.
3. Sei (V, k · k) eine normierte Algebra über K, sei (vn )n∈N eine konvergente Folge in V mit
Grenzwert v, und sei p : V → V, x 7→ α0 + α1 x + α2 x2 + . . . + αn xn ein Polynom mit
Koeffizienten in α0 , α1 , . . . , αn ∈ K. Begründen Sie, weshalb die Folge (p(vn ))n∈N gegen p(v)
konvergiert.
4. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N , (bn )n∈N und (cn )n∈N , definiert durch
an := (−1)n ,
(
1
falls n ungerade ist,
bn :=
n/2 falls n gerade ist,
cn :=
für alle n ∈ N, divergent sind.
n2 − 2
n−1
Lernzielkontrolle
Nach dem Durcharbeiten diese Kapitels sollten Sie...
... wissen, was eine Folge und was eine Teilfolge ist.
... zu einer gegebenen rekursiven Definition die explizite Darstellung einer reellen Zahlenfolge bestimmen können.
... wissen, was eine Familie und was eine Teilfamilie ist.
... wissen, was eine Algebra und was eine normierte Algebra ist.
... wissen, was das nach unten beschränkte und nach oben beschränkte Teilmengen von
R sind.
... wissen, was das Infimum und das Minimum einer nach unten beschränkten Menge,
Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Infima
und Minima kennen.
... wissen, was das Supremum und das Maximum einer nach oben beschränkten Menge,
Folge oder Funktion ist. Insbesondere sollten Sie den Unterschied zwischen Suprema
und Maxima kennen.
... das Vollständigkeitsaxiom kennen.
... wissen, was monoton wachsende, streng monoton wachsende, monoton fallende und
streng monoton fallende Funktionen und Folgen sind.
... wissen, was konvergente und divergente Folgen sind.
... wissen, was eine Nullfolge ist.
... wissen, was bestimmt divergente Folgen sind.
... die Rechenregeln für Grenzwerte von Folgen kennen, und mit Hilfe dieser Regeln
Grenzwerte von konvergenten Folgen berechnen können, wo dies möglich ist.
52
Kapitel 3
Topologische Begriffe
3.1
Inneres, Rand und Abschluss von Mengen
Definition (innerer Punkt und Inneres). Sei (V, k · k) ein normierter Raum über K,
und sei M ⊆ V eine Menge. Ein Vektor v ∈ M heißt innerer Punkt von M , falls eine
positive Zahl ε > 0 existiert, so dass Bε (v) ⊆ M gilt. Die Menge aller inneren Punkte von
M wird das Innere von M genannt und mit M ◦ bezeichnet.
Wir erinnern uns, dass mit Bε (v) die offene Kugel in einem normierten Raum mit Mittelpunkt v und Radius ε bezeichnet wird. Gemäß Definition sind die inneren Punkte einer
Menge M stets Element von M . Daher gilt
M◦ ⊆ M
für jede eine Teilmenge M eines normierten Raums über K. Zu beachten ist, dass das
Innere einer Menge leer sein kann. Das ist bespielsweise für einpunktige Mengen der Fall.
Unter einpunktigen Mengen versteht man dabei Mengen von der Form {v} mit v ∈ V .
Definition (Randpunkt und Rand). Sei (V, k · k) ein normierter Raum über K, und
sei M ⊆ V eine Menge. Ein Vektor v ∈ V heißt Randpunkt von M , für jede positive Zahl
ε > 0 zwei Vektoren v0 , v1 ∈ Bε (v) existieren, so dass v0 6∈ M und v1 ∈ M gilt. Die Menge
aller Randpunkte von M wird der Rand von M genannt und mit ∂M bezeichnet.
Man beachte, dass die Randpunkte einer Menge M nicht notwendigerweise Elemente von
M sind. Daher ist ∂M in der Regel keine Teilmenge von M .
Man kann leicht zeigen, dass das Innere einer Menge und der Rand einer Menge disjunkt
sind, d.h. dass
M ◦ ∩ ∂M = ∅
für jede Menge M gilt. Außerdem überlegt man sich leicht, dass der Rand einer Menge
selbst keine inneren Punkte enthält, d.h. dass
(∂M )◦ = ∅
für jede Menge M gilt. Schließlich kann man zeigen, dass für jede Menge M die Identität
∂(∂M ) = ∂M
gilt. Neben dem Inneren und dem Rand einer Menge betrachtet man häufig auch den so
genannten Abschluss einer Menge.
53
54
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
(c)
(d)
Abbildung 3.1: (a) Eine Teilmenge M des R2 . (b) Das Innere von M . (c) Der Rand
von M . (d) Der Abschluss von M .
Definition (Abschluss, abgeschlossene Hülle). Sei (V, k · k) ein normierter Raum über
K, und sei M ⊆ V eine Menge. Dann heißt die Menge
M := M ∪ ∂M
der Abschluss oder die abgeschlossene Hülle von M .
Da der Abschluss einer Menge M die Vereinigung von M selbst und dem Rand von M ist,
folgt unmittelbar, dass
M ⊆M
für jede eine Teilmenge M eines reellen oder komplexen normierten Raums. In Abbildung 3.1 werden das Innere, der Rand und der Abschluss einer Menge durch Skizzen
veranschaulicht. Nachfolgend geben wir außerdem einige wichtige Beispiele an.
Beispiele.
(a) Wir betrachten den normierten Raum (R, | · |). Inneres, Rand und Abschluss eines
nichtleeren Intervalls [a, b) = {x ∈ R | a ≤ x < b} mit Intervallgrenzen a, b ∈ R sind
dann durch
[a, b)◦ = (a, b),
∂[a, b) = {a, b},
[a, b) = [a, b]
gegeben. Die Randpunkte des Intervalls [a, b) sind also genau die Intervallgrenzen
a und b. Man beachte außerdem, dass man für die Intervalle (a, b), [a, b] und (a, b]
dasselbe Innere, denselben Rand sowie denselben Abschluss erhält wie für das hier
betrachtete Intervall [a, b).
(b) Für jede offene Kugel Br (v) in einem normierten Raum gilt
Br (v)◦ = Br (v),
∂Br (v) = Sr (v).
3.1. INNERES, RAND UND ABSCHLUSS VON MENGEN
55
(c) In jedem normierten Raum ist die abgeschlossene Kugel Br (v) der Abschluss der
offenen Kugel Br (v).
(d) Im normierten Raum (R2 , | · |) betrachten wir die Verbindungsstrecke
S := {x = (x1 , x2 )T ∈ R2 | x1 ∈ [0, 1], x2 = x1 },
zwischen den Punkten (0, 0)T und (1, 1)T . Dann gilt S ◦ = ∅, ∂S = S und S = S.
(e) Ist (V, k · k) ein normierter Raum über K, so überlegt man sich leicht, dass
V ◦ = V,
∂V = ∅,
V = V.
gilt. Fass man die leere Menge ∅ als Teilmenge von V auf, so erhält man außerdem
∅◦ = ∂∅ = ∅ = ∅.
♦
Übungsaufgaben
1. Bestimmen Sie für i = 1, 2, 3, 4 die Mengen (Mi )◦ und Mi ∩ ∂Mi , wobei
M1 := (−1, 0),
M2 := [1, 2],
M3 := (−2, 0) ∪ (0, 2),
M4 := Z.
Fassen Sie dabei alle Mengen als Teilmengen von R auf.
2. Bestimmen Sie ∂S \ S für die Menge S := {1/n | n ∈ N} ⊂ R.
3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für jede Teilmenge M ⊆ V die
folgenden Aussagen gelten:
• M ◦ ∩ ∂M = ∅
• (∂M )◦ = ∅
• ∂(∂M ) = ∂M
4. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass für je zwei Teilmengen A, B ⊆ V
die Identität ∂(A ∩ B) = (∂A ∩ B) ∪ (A ∩ ∂B) gilt.
56
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
(c)
Abbildung 3.2: (a) Offene Teilmengen des R2 . (b) Abgeschlossene Teilmengen des R2
(c) Teilmengen des R2 , welche weder offen noch abgeschlossen sind.
3.2
Offene und abgeschlossene Mengen
Definition (offene Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge
O ⊆ V heißt offen, wenn jedes Element v ∈ O ein innerer Punkt von O ist.
Definition (abgeschlossene Menge). Sei (V, k · k) ein normierter Raum über K. Eine
Menge A ⊆ V heißt abgeschlossen, wenn die Menge V \ A offen ist.
Die Adjektive offen“ und abgeschlossen“ legen nahe, dass eine Menge genau dann offen
”
”
ist, wenn sie nicht abgeschlossen ist. Dies ist aber nicht der Fall! Wie wir anhand
einzelner Beispiele sehen werden, gibt es Mengen, die weder offen noch abgeschlossen sind.
Ferner gibt es Mengen, die sowohl offen als auch abgeschlossen sind.
Für die Identifizierung offener und abgeschlossener Mengen ist der nachfolgende Satz
sehr hilfreich.
Satz 3.1 (Charakterisierung offener und abgeschlossener Mengen). Sei (V, k · k)
ein normierter Raum über K, und sei M eine Teilmenge von V eine Menge. Dann gelten
die folgenden Aussagen.
(1) M ist genau dann offen, wenn M = M ◦ gilt.
(2) M ist genau dann abgeschlossen, wenn M = M gilt.
Aus Satz 3.1 folgt insbesondere, dass das Innere einer Menge offen, und dass der Abschluss
einer Menge abgeschlossen ist. Ferner gilt
∂M = ∂M ∪ ∂(∂M ) = ∂M ∪ ∂M = ∂M,
für jede Menge M , weshalb der Rand einer Menge abgeschlossen ist. Wir geben nun noch
einige Beispiele für offene und abgeschlossene Mengen an, wie auch Beispiel für Mengen,
die weder offen noch abgeschlossen sind.
Beispiele.
(a) Jedes offene Intervall (a, b) mit Intervallgrenzen a, b ∈ R ist eine offene Teilmenge
von R, und jedes abgeschlossene Intervall [a, b] ist eine abgeschlossene Teilmenge von
R.
(b) Unbeschränkte Intervalle der Form (a, ∞) und (−∞, b) mit a, b ∈ R sind offene
Teilmengen von R. Unbeschränkte Intervalle der Form [a, ∞) und (−∞, b] sind abgeschlossene Teilmengen von R.
3.2. OFFENE UND ABGESCHLOSSENE MENGEN
57
(c) Intervalle der Form [a, b) und (a, b] mit Intervallgrenzen a, b ∈ R sind weder offen
noch abgeschlossen.
(d) Jede offene Kugel Br (v) in einem normierten Raum ist offen. Wegen Sr (v) = ∂Br (v)
ist jede Sphäre in einem normierten Raum abgeschlossen. Ferner ist jede abgeschlossene Kugel Br (v) in einem normierten Raum abgeschlossen.
(e) Sei (V, k · k) ein normierter Raum über K. Fasst man die leere Menge ∅ als Teilmenge
von V auf, so gilt ∅ = ∅◦ . Also ist ∅ offen. Außerdem gilt V ◦ = V , weshalb V offen
ist. Offenbar gilt aber auch V \ ∅ = V und V \ V = ∅, woraus folgt, dass die Mengen
∅ und V sowohl offen als auch abgeschlossen sind.
Die Abgeschlossenheit einer Menge A kann auch über das Konvergenzverhalten der Folgen
in A charakterisiert werden.
Satz 3.2 (Folgenkriterium für Abgeschlossenheit). Sei (V, k · k) ein normierter Raum
über K. Eine Teilmenge A ⊆ V ist genau dann abgeschlossen, wenn der Grenzwert jeder
konvergenten Folge in A ein Element von A ist.
Mit Hilfe des von Satz 3.2 bereit gestellten Folgenkriteriums, kann man oft die Abgeschlossenheit einer Menge widerlegen. Man betracht dazu das folgende Beispiel.
Beispiel. Wir betrachten das Intervall (0, 1] ⊂ R. Die Folge (an )n∈N , definiert durch
an := 1/n für alle n ∈ N, ist offenbar eine Folge in (0, 1], die gegen Null konvergiert. Da
die Zahl 0 jedoch kein Element von (0, 1] ist, kann das Intervall (0, 1] nach Satz 3.2 nicht
abgeschlossen sein.
Als nächstes untersuchen wir, was man über Vereinigungen oder Durchschnitte offener
bzw. abgeschlossener Mengen aussagen kann.
Satz 3.3. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen.
(1) Sei (Oi )i∈I eine Familie offener Teilmengen von V . Dann ist die Vereinigung
[
Oi := v ∈ V ∃i ∈ I : v ∈ Oi
i∈I
ebenfalls eine offene Teilmenge von V .
(2) Sei O1 , O2 , . . . , Om eine endliche Anzahl offener Teilmengen von V . Dann ist der
Durchschnitt O1 ∩ O2 ∩ · · · ∩ Om ebenfalls eine offene Teilmenge von V .
(3) Sei (Ai )i∈I eine Familie abgeschlossener Teilmengen von V . Dann ist der Durchschnitt
\
Ai := v ∈ V ∀i ∈ I : v ∈ Ai
i∈I
ebenfalls eine abgeschlossene Teilmenge von V .
(4) Sei A1 , A2 , . . . , Am eine endliche Anzahl abgeschlossener Teilmengen von V . Dann
ist die Vereinigung A1 ∪ A2 ∪ · · · ∪ Am ebenfalls eine abgeschlossene Teilmenge von
V.
58
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Die Aussagen von Satz 3.3 können folgendermaßen zusammengefasst werden: Die Vereinigung beliebig vieler, sowie der Durschnitt endlich vieler offenen Mengen ist offen, und der
Durchschnitt beliebig vieler, sowie die Vereinigung endlich vieler abgeschlossener Mengen
ist abgeschlossen. Dass die Aussagen (2) und (4) von Satz 3.3 tatsächlich nur für endlich
viele offene bzw. abgeschlossene Mengen gelten können, soll anhand der folgenden Beispiele
verdeutlicht werden.
Beispiele.
(a) Für jedes n ∈ N sei das offene Intervall In ⊂ R durch In := (−1/n, 1/n) definiert.
Man kann leicht zeigen, dass
\
In = {0}
n∈N
gilt. Die einpunktige Menge {0} ist eine abgeschlossene Teilmenge von R.
(b) Für jedes n ∈ N sei das abgeschlossene Intervall In ⊂ R durch In := [−n, n] definiert.
Man überlegt sich leicht, dass dann
[
In = R
n∈N
gilt. Offenbar ist R eine offene Menge.
Übungsaufgaben
1. Zeigen Sie, dass die folgenden Mengen offene Teilmengen von R sind.
O1 := (−1, 1) \ {0},
[
O2 :=
(α, α + 1),
α∈[0,1]
O3 := R \ [−3, −2] ∪ [2, 3] ,
O4 := {1/x | x > 0}.
2. Sei (V, k · k) ein normierter Raum über K, und sei O ⊆ V eine offene und A ⊆ V eine
abgeschlossene Menge. Zeigen Sie, dass O \ A offen und A \ O abgeschlossen ist.
3. Zeigen Sie mit Hilfe des Folgenkriteriums für Abgeschlossenheit, dass jede nach unten beschränkte, abgeschlossene Teilmenge von R ein Minimum besitzt. Zeigen Sie außerdem, dass
jede nach oben beschränkte, abgeschlossene Menge ein Maximum besitzt.
4. Untersuchen Sie die folgenden Mengen Teilmengen von R2 auf Offenheit und Abgeschlossenheit.
M1 := [0, 1] × (0, 1],
M2 := B1 (0) \ {0},
M3 := (x1 , x2 )T ∈ R2 x2 > 1 ,
M4 := R2 \ Z2 .
Der Vektorraum R2 sei dabei mit der euklidischen Norm versehen.
3.3. BESCHRÄNKTHEIT
3.3
59
Beschränktheit
Definition (beschränkte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge B ⊆ V heißt beschränkt, wenn es eine positive Zahl R > 0 gibt, so dass kbk ≤ R für
alle b ∈ B gilt.
Ist (V, k · k) ein normierter Raum, so ist eine Teilmenge B ⊆ V offenbar genau dann
beschränkt, wenn eine nichtnegative Zahl R ≥ 0 existiert, so dass
B ⊆ BR (0)
gilt, wobei BR (0) die abgeschlossene Kugel um den Ursprung in V mit Radius R bezeichnet. Dies bedeutet insbesondere, dass die leere Menge ∅ eine beschränkte Menge ist. Eine
Menge B ⊆ V ist auch dann beschränkt, wenn ein Vektor v ∈ V und eine nichtnegative
Zahl r ≥ 0 existiert, so dass
B ⊆ Br (v)
gilt. Man kann nämlich leicht zeigen, dass dann
Br (v) ⊆ Bkvk+r (0)
für alle v ∈ V und alle r > 0 gilt. Da kvk+r eine nichtnegative Zahl ist, hat man somit eine
abgeschlossene Kugel um den Ursprung in V gefunden, welcher die Menge B als Teilmenge
enthält.
In Abschnitt 2.3 wurden bereits das Konzept der Beschränktheit nach oben sowie das
Konzept der Beschränktheit nach unten für Teilmengen von R eingeführt. Das folgende Lemma bringt diese Konzepte mit dem Konzept der Beschränktheit für Teilmengen
normierter Räume in Verbindung.
Lemma 3.4. Eine nichtleere Teilmenge von R ist genau dann beschränkt, wenn sie nach
unten und nach oben beschränkt ist.
Als nächstes gehen wir der Frage nach, was man über Vereinigungen und Durchschnitte
beschränkter Mengen aussagen kann.
Satz 3.5. Sei (V, k · k) ein normierter Raum über K. Dann gelten die folgenden Aussagen.
(1) Sei (Bi )i∈I eine Familie beschränkter Teilmengen von V . Dann ist der Durchschnitt
\
Bi
i∈I
ebenfalls eine beschränkte Teilmenge von V .
(2) Sei B1 , B2 , . . . , Bm eine endliche Anzahl beschränkter Teilmengen von V . Dann ist
die Vereinigung B1 ∪ B2 ∪ · · · ∪ Bm ebenfalls eine beschränkte Teilmenge von V .
Satz 3.5 besagt, dass der Durchschnitt beliebig vieler und die Vereinigung endlich vieler
beschränkter Mengen wieder beschränkt ist. Die Vereinigung unendlich vieler beschränkter
Mengen, muss hingegen nicht beschränkt sein, wie das nachfolgende Beispiel verdeutlicht.
60
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(a)
(b)
Abbildung 3.3: (a) Beschränkte Teilmengen des R2 . (b) Die Gerade M1 und der
Halbraum M2 sind Teilmengen des R2 , welche nicht beschränkt sind.
Beispiel. Für jede ganze Zahl k ∈ Z sei das abgeschlossene Intervall Ik := [k, k + 1]
definiert. Offenbar ist jedes dieser Intervalle beschränkt. Als Vereinigung aller Intervalle
erhält man jedoch die Menge
[
Ik = R,
k∈Z
welche nicht beschränkt ist.
♦
Als nächsten übertragen wir das Konzept der Beschränktheit auf Folgen in einem normierten Raum.
Definition (beschränkte Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
(vn )n∈N in V heißt beschränkt, wenn die Menge aller Folgenglieder beschränkt ist.
Offenbar ist eine Folge genau dann beschränkt, wenn man eine positive Zahl R > 0 finden
kann, so dass alle Folgenglieder Elemente der abgeschlossenen Kugel BR (v) sind. Dies ist
genau dann der Fall, wenn
kvn k ≤ R
für alle n ∈ N gilt. Eine reelle Zahlenfolge ist nach Lemma 3.4 genau dann beschränkt,
wenn sie sowohl nach oben als auch nach unten beschränkt ist. Man betrachte hierzu auch
die folgenden Beispiele.
Beispiele.
(a) Jede konstante Folge ist beschränkt.
(b) Die reelle Zahlenfolge (an )n∈N , definiert durch an := 1 − 1/n für alle n ∈ N, ist durch
0 nach unten und durch 1 nach oben beschränkt. Also ist (an )n∈N eine beschränkte
Folge in R.
(c) Die Folge (x(k) )k∈N in R2 sei durch
(k)
x
:=
sin(k)
cos(k)
für alle k ∈ N definiert. Man rechnet leicht nach, dass |x(k) | = 1 für alle k ∈ N gilt,
weshalb die Folge (x(k) )k∈N beschränkt ist.
3.3. BESCHRÄNKTHEIT
61
(d) Die Folge (y (k) )k∈N in R2 , welche durch
y
(k)
:=
k
1/k
für alle k ∈ N definiert ist, ist nicht beschränkt. Man kann nämlich leicht zeigen,
dass |y (k) | > k für alle k ∈ N gilt. Entsprechend findet man zu jeder positiven Zahl
R > 0 eine natürliche Zahl k ∈ N, so dass x(k) 6∈ BR (0) gilt.
Für konvergente Folgen gilt die folgende Aussage.
Lemma 3.6. Jede konvergente Folge ist beschränkt.
Beschränktheit ist also ein notwendiges Kriterium für die Konvergenz von Folgen. Abschließend führen wir noch das Konzept beschränkter Funktionen ein.
Definition (beschränkte Funktion). Sei X eine nichtleere Menge, und sei (W, k · k)
ein normierter Raum. Eine Funktion f : X → W heißt beschränkt, wenn ihre Wertemenge
beschränkt ist. Die Menge aller beschränkten Funktionen von X nach W wird mit B(X, W )
bezeichnet. Falls W = R gilt, bezeichnet man diese Menge auch mit B(X).
Übungsaufgaben
1. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass
Br (v) ⊆ Bkvk+r (0)
für jeden Vektor v ∈ V und jede positive Zahl r > 0 gilt.
2. Untersuchen Sie die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N auf Beschränktheit. Die Folgen sind durch
an := (−1)n ,
2n3 + n
,
n3 + 1
n4 − 3
,
cn := − 2
n +2
dn := sin(n)
bn :=
für alle n ∈ N definiert.
3. Untersuchen Sie die folgenden Funktionen auf Beschränktheit.
f1 : (−1, 1] → R, x 7→ x2 ,
1 − x1
f2 : R2 → R2 , x 7→
x22
f3 : R2 \ {0} → R, x 7→ 1/|x|,
sin(t)
f4 : R → R2 , t 7→
.
cos(t)
4. Sei (V, k · k) ein normierter Raum über K und M ⊆ V eine Menge, die nicht beschränkt ist.
Zeigen Sie, dass dann eine Folge (vn )n∈N in M existiert, so dass kvn k ≥ n für alle n ∈ N gilt.
62
3.4
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Kompakte Mengen
Definition (Überdeckung). Sei X eine beliebige Menge, und sei M ⊆ X eine Teilmenge
von X. Eine Familie (Mi )i∈I bestehend aus Teilmengen von X wird eine Überdeckung von
M genannt, wenn
[
M⊆
Mi
i∈I
gilt, d.h. wenn die Vereinigung aller zur Familie gehörenden Mengen die Menge M überdeckt.
Definition (offene Überdeckung). Sei (V, k · k) ein normierter Raum über K, und sei
M eine Teilmenge von V . Eine Überdeckung (Oi )i∈I von M heißt offen, wenn für jeden
Index i ∈ I die Menge Oi offen ist.
Definition (kompakte Menge). Sei (V, k · k) ein normierter Raum über K. Eine Menge
K ⊆ V heißt kompakt, wenn man aus jeder offenen Überdeckung (Oi )i∈I der Menge K
endlich viele offene Mengen Oi1 , Oi2 , . . . , Oim auswählen kann, so dass K ⊆ Oi1 ∪ Oi2 ∪
· · · ∪ Oim gilt.
Die definierende Eigenschaft kompakter Mengen kann nur schwer veranschaulicht werden.
Es genügt nicht sich vorzustellen, dass eine Menge kompakt ist, wenn sie mit einer endlichen Anzahl offener Mengen überdeckt werden kann. Das gilt nämlich für jede Teilmenge
eines normierten Raums. Vielmehr ist eine Menge M genau dann kompakt, wenn man aus
jeder Familie offener Mengen, deren Vereinigung M überdeckt, eine endliche Teilfamilie
auswählen kann, deren Vereinigung die Menge M ebenfalls überdeckt. Im allgemeinen ist
es schwierig zu entscheiden, ob eine Menge kompakt ist oder nicht. Wir wollen hier zwei
sehr einfache Fälle betrachten, in denen dies möglich ist.
Beispiel.
(a) Sei (V, k · k) ein normierter Raum, und sei v ∈ V ein beliebiger Vektor. Dann ist
die einpunktige Menge {v} kompakt. Ist nämlich (Oi )i∈I eine beliebige offene Überdeckung von {v}, so gilt
[
{v} ⊆
Oi ,
i∈I
und somit auch
v∈
[
Oi .
i∈I
Daraus folgt wiederum, dass mindestens ein Index i1 ∈ I existiert, so dass v ∈ Oi1
gilt. Dann gilt aber auch {v} ⊆ Oi1 , was bedeutet, dass Oi1 die Menge {v} bereits
überdeckt.
(b) Die Menge der ganzen Zahlen Z ist eine Teilmenge von R. Definiert man zu jeder
ganzen Zahl k ∈ Z das offene Intervall Ik := (k − 1/3, k + 1/3), so ist (Ik )k∈Z
eine offene Überdeckung von Z, welche aus unendlich vielen Intervallen besteht.
Man erkennt leicht, dass für jede nichtleere Teilmenge N ⊆ Z die Familie (Ik )k∈Z\N
keine Überdeckung von Z ist. Daher kann es keine endliche Anzahl von Intervallen
Ik1 , Ik2 , . . . , Ikm geben, so dass Ik1 ∪ Ik2 ∪ · · · ∪ Ikm die Menge Z überdeckt. Also ist
Z keine kompakte Teilmenge von R.
3.4. KOMPAKTE MENGEN
(a)
63
(b)
Abbildung 3.4: (a) Kompakte Teilmengen des R2 . (b) Teilmengen des R2 , welche nicht
kompakt sind.
Die Kompaktheit einer Menge K kann man auch über das Konvergenzverhalten aller
Folgen in K charakterisieren.
Satz 3.7 (Folgenkriterium für Kompaktheit). Sei (V, k · k) ein normierter Raum über
K. Eine Teilmenge K ⊆ V ist genau dann kompakt, wenn jede Folge in K eine konvergente
Teilfolge mit Grenzwert in K besitzt.
Als nächstes untersuchen wir die Eigenschaften kompakter Mengen.
Satz 3.8. Sei (V, k · k) ein normierter Raum über K, und sei K ⊆ V eine kompakte
Teilmenge. Dann ist K beschränkt und abgeschlossen.
Satz 3.8 besagt, dass Abgeschlossenheit und Beschränktheit notwendige Bedingungen für
die Kompaktheit sind. Entsprechend kann man diesen Satz verwenden, um zu zeigen, dass
bestimmte Mengen nicht kompakt sind.
Beispiele.
(a) Offene Intervalle (a, b), sowie Intervalle der Form (a, b] und [a, b) mit Intervallgrenzen
a, b ∈ R sind nicht abgeschlossen. Daher sind sie auch nicht kompakt.
(b) Intervalle der Form [a, ∞) und (−∞, b] mit Intervallgrenzen a, b ∈ R sind nicht
beschränkt, weshalb sie auch nicht kompakt sind.
♦
Für Teilmengen der Vektorräume Rn kann man zeigen, dass Beschränktheit und Abgeschlossenheit nicht nur notwendige, sondern auch hinreichende Bedingungen für Kompaktheit sind. Der entsprechende Satz ist als Satz von Heine–Borel bekannt.
Satz 3.9 (Heine–Borel). Eine Teilmenge des Kn ist genau dann kompakt, wenn sie
beschränkt und abgeschlossen ist. Dies gilt für alle n ∈ N.
Die praktische Anwendung des Satzes von Heine–Borel soll hier durch einige Beispiele
verdeutlicht werden.
Beispiele.
(a) Die Menge der reellen Zahlen R kann als eindimensionaler Vektorraum über R aufgefasst werden. Abgeschlossene Intervalle [a, b] mit Intervallgrenzen a, b ∈ R sind
sowohl abgeschlossen als auch beschränkt. Nach dem Satz von Heine–Borel sind solche Intervalle also kompakt.
64
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
(b) Für jede natürliche Zahl n ∈ N sind die abgeschlossenen Kugeln Br (x) und die
Sphären Sr (x) in Kn sowohl abgeschlossen als auch beschränkt. Nach dem Satz von
Heine–Borel sind diese Mengen also kompakt.
♦
Eine wichtige Folgerung aus dem Folgenkriterium für Kompaktheit (siehe Satz 3.7) und
dem Satz von Heine–Borel (siehe Satz 3.9) ist der Satz von Bolzano–Weierstraß.
Satz 3.10 (Bolzano–Weierstraß). Jede beschränkte Folge in Kn besitzt eine konvergente Teilfolge. Dies gilt für alle n ∈ N.
Übungsaufgaben
1. Untersuchen Sie die folgenden Teilmengen von R auf Kompaktheit:
M1 := [1, 2] ∪ [3, 4],
M2 := [−1, 1] \ {0},
M3 := {1/n | n ∈ N} ∪ {0},
M4 := N.
2. Zeigen Sie unter Verwendung der Sätze 3.3, 3.5 und 3.9, dass für jede natürliche Zahl n ∈ N
der Durchschnitt beliebig vieler und die Vereinigung endlich vieler kompakter Teilmengen
von Kn ebenfalls kompakt ist.
3.5. VOLLSTÄNDIGKEIT
3.5
65
Vollständigkeit
Definition (Cauchy–Folge). Sei (V, k · k) ein normierter Raum über K. Eine Folge
(vn )n∈N in V heißt Cauchy–Folge, wenn für jede positive Zahl ε > 0 eine natürliche Zahl
N ∈ N existiert, so dass
kvn − vm k < ε für alle m, n ∈ N mit n ≥ m ≥ N
gilt.
Anschaulich gesprochen ist eine Folge genau dann eine Cauchy–Folge, wenn ihre Folgenglieder für wachsende Indizes immer enger zusammenrücken. Oft ist die folgende Charakterisierung von Cauchy–Folgen hilfreich: Eine Folge (vn )n∈N in einem normierten Raum
(V, k · k) über K ist genau dann eine Cauchy–Folge, wenn für jede positive Zahl ε > 0
eine natürliche Zahl N ∈ N existiert, so dass für alle m, n ∈ N aus min{m, n} ≥ N stets
kvn − vm k < ε folgt. Das nachfolgende Lemma besagt, dass dies insbesondere dann der
Fall ist, wenn die Folge gegen einen Grenzwert konvergiert.
Lemma 3.11. Jede konvergente Folge ist eine Cauchy–Folge.
Wir wissen bereits, dass jede konvergente Folge beschränkt ist. Das folgende Lemma liefert
eine analoge Aussage für Cauchy–Folgen und somit eine notwendige Bedingung dafür, dass
eine Folge eine Cauchy–Folge sein kann.
Lemma 3.12. Jede Cauchy–Folge ist beschränkt.
Es stellt sich nun die folgende Frage: Angenommen, man hat eine Cauchy–Folge, deren
Glieder allesamt Elemente einer nichtleeren Teilmenge M eines normierten Raums sind.
Kann man dann schließen, dass die Folge einen Grenzwert besitzt, der ebenfalls ein Element
von M ist? Es zeigt sich, dass dies im Allgemeinen nicht der Fall ist. Aus diesem Grund
führt man die Eigenschaft der Vollständigkeit für Teilmengen eines normierten Raums ein.
Definition (vollständige Menge). Sei (V, k · k) ein normierter Raum über K. Eine Teilmenge M ⊆ V heißt vollständig, wenn jede Cauchy–Folge in M gegen ein Element von M
konvergiert.
Eine nicht vollständige Teilmenge eines normierten Raums wird unvollständig genannt. Ist
(V, k · k) ein normierter Raum über K, dann ist der Vektorraum V selbst ebenfalls eine Teilmenge von V . Daher kann man die Eigenschaft der Vollständigkeit auch für V definieren.
Dies führt auf den wichtigen Begriff eines Banach–Raums bzw. den eines Hilbert–Raums.
Definition (Banach–Raum). Ein normierter Raum (V, k · k) über K heißt Banach–
Raum über K, wenn V vollständig ist.
Definition (Hilbert–Raum). Ein Innenproduktraum (V, h · , · i) über K heißt Hilbert–
Raum über K, wenn V bezüglich der vom Skalarprodukt h · , · i induzierten Norm k · k
vollständig ist, d.h. wenn (V, k · k) ein Banach–Raum über K ist.
Da jede normierte Algebra insbesondere auch ein normierter Raum ist, kann man den
Begriff der Vollständigkeit auch auf normierte Algebren übertragen. Man kommt dann zu
so genannten Banach–Algebren.
66
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Definition (Banach–Algebra). Eine normierte Algebra (V, k · k) über K heißt Banach–
Algebra über K, wenn V vollständig ist.
Wir geben hier noch ein hinreichendes Kriterium für die Vollständigkeit einer Menge an.
Satz 3.13. Jede kompakte Menge ist vollständig.
Von besonderem Interesse sind die vollständigen Teilmengen der normierten Räume Rn
und Cn mit n ∈ N. Der folgende Satz liefert eine entsprechende Charakterisierung.
Satz 3.14. Eine Teilmenge von Kn ist genau dann vollständig, wenn sie abgeschlossen ist.
Dies gilt für alle n ∈ N.
Wie wir bereits wissen, ist der normierte Raum Kn für jede natürliche Zahl n ∈ N abgeschlossen. Nach Satz 3.14 ist Kn also vollständig und somit ein Banach–Raum über K.
Versieht den Vektorraum Rn darüber hinaus mit einem Skalarprodukt, so erhält man einen
Hilbert–Raum über R.
Es ist wichtig zu wissen, dass in allgemeinen normierten Räumen über K die Abgeschlossenheit einer Menge nicht gleichbedeutend mit deren Vollständigkeit ist. Die Teilmengen der normierten Räume Kn nehmen in dieser Hinsicht also eine Sonderstellung
ein.
Als nächstes wollen wir noch ein wichtiges Beispiel für eine unvollständige Teilmenge
von R kennen lernen.
Beispiel. Die Menge der rationalen Zahlen Q ist eine unvollständige Teilmenge von R.
Man betrachte dazu die Folge (an )n∈N , welche gemäß
a1 := 1,
an+1 :=
a2n + 2
2an
für alle n ∈ N rekursiv definiert ist. Da jedes Glied dieser Folge durch Addition, Multiplikation und Division von Bruchzahlen entsteht, ist (an )n∈N eine Folge
√ in Q. Man kann
außerdem zeigen, dass die Folge (an )n∈N gegen die irrationale Zahl 2 konvergiert. Da
die Folge konvergent ist, ist sie auch eine Cauchy–Folge. Die Folge (an )n∈N ist also eine
Cauchy–Folge in Q, die gegen einen Grenzwert konvergiert, der nicht Element von Q ist.
Man beachte, dass aufgrund von Satz 3.14 die Menge Q auch nicht abgeschlossen ist.
Dies kann man auch mit Hilfe des Folgenkriteriums für die Abgeschlossenheit einer Menge
zeigen (siehe Satz 3.2).
Übungsaufgaben
1. Zeigen Sie, dass die reellen Zahlenfolgen (an )n∈N und (bn )n∈N Cauchy–Folgen in R sind. Die
Folgen seien dabei durch
(−1)n
,
n
1
bn := n
3
für alle n ∈ N definiert. Lösen Sie diese Aufgabe ohne Verwendung von Lemma 3.11, indem
Sie die definierende Eigenschaft von Cauchy–Folgen nachweisen.
an :=
2. Sei (V, k · k) ein normierter Raum über K, seien (vn )n∈N und (wn )n∈N zwei Cauchy–Folgen
in V , und sei α ∈ K ein beliebiger Skalar. Zeigen Sie, dass die Folgen (vn + wn )n∈N und
(αvn )n∈N ebenfalls Cauchy–Folgen in V sind.
3.6. ZUSAMMENHÄNGENDE MENGEN
(a)
67
(b)
Abbildung 3.5: (a) Zusammenhängende Teilmengen des R2 (b) Eine nicht zusammenhängende Teilmenge des R2 .
3.6
Zusammenhängende Mengen
Definition (zusammenhängende Menge). Sei (V, k · k) ein normierter Raum über K.
Eine Menge M ⊆ V wird nicht zusammenhängend genannt, wenn es zwei offene Mengen
O1 , O2 ⊆ V gibt, so dass M ⊆ O1 ∪ O2 und O1 ∩ M 6= ∅ und O2 ∩ M 6= ∅ und O1 ∩ O2 = ∅
gilt. Anderfalls heißt die Menge M zusammenhängend.
Die mathematische Definition zusammenhängender Mengen ist auf den ersten Blick eher
unanschaulich. In den meisten Fällen genügt die Vorstellung, dass eine Menge genau dann
zusammenhängend ist, wenn sie nicht aus mehreren separaten, nichtleeren Teilmengen
besteht (siehe Abbdildung 3.5). Was genau mit separat“ gemeint ist, wird durch die ma”
thematische Definition präzisiert: Zwei nichtleere Teilmengen werden als separat angesehen, wenn sie in verschiedenen, disjunkten, offenen Mengen enthalten sind. Man betrachte
hierzu auch die nachfolgenden Beispiele.
Beispiele.
(a) Jede offene Kugel Br (v) und jede abgeschlossene Kugel Br (v) in einem normierten
Raum über K ist zusammenhängend.
(b) Die Menge M = [−2, −1] ∪ [1, 2] ist nicht zusammenhängend. Definiert man nämlich
die offenen Intervalle O1 := (−3, 0) und O2 := (0, 3), so gilt M ⊆ O1 ∪ O2 , O1 ∩ M =
[−2, 1], O2 ∩ M = [1, 2] und O1 ∩ O2 6= ∅.
Das folgende Lemma ist oft nützlich, um zusammenhängende Mengen zu identifizieren.
Lemma 3.15. Sei (V, k · k) ein normierter Raum über K, sei M ⊂ V eine zusammenhängende Menge, und sei Z ⊆ V eine weitere Menge, so dass M ⊆ Z ⊆ M gilt. Dann ist Z
ebenfalls zusammenhängend.
Der folgende wichtige Satz charakterisiert die nichtleeren, zusammenhängenden Teilmengen von R.
Satz 3.16. Eine nichtleere Teilmenge von R ist genau dann zusammenhängend, wenn sie
ein Intervall ist.
Wir erinnern daran, dass der Begriff Intervall“ sämtliche Teilmengen von R einschließt,
”
welche von der Form (a, b), [a, b], (a, b], [a, b), (−∞, b), (−∞, b], (a, ∞) und [a, ∞) sind.
Auch die Menge der reellen Zahlen R selbst ist ein Intervall, welches gelegentlich als
(−∞, ∞) bezeichnet wird. Der Satz 3.16 besagt also auch, dass die Menge R zusammenhängend ist.
68
KAPITEL 3. TOPOLOGISCHE BEGRIFFE
Übungsaufgaben
1. Untersuchen Sie, ob die folgenden Teilmengen von R zusammenhängend sind.
M1 := (−∞, 2) ∩ (−2, ∞),
M2 := Z,
M3 := (−1, 1) \ {0},
[
M4 :=
[n − 1, n).
n∈N
Verwenden Sie nach Möglichkeit Satz 3.16.
2. Zeigen Sie durch Angabe jeweils eines Gegenbeispiels, dass die Vereinigung und der Durchschnitt von zwei zusammenhängenden Mengen im Allgemeinen nicht zusammenhängend ist.
3. Sei (V, k · k) ein normierter Raum über K. Zeigen Sie, dass jede einpunktige Menge {v}, mit
v ∈ V , zusammenhängend ist.
4. Zeigen Sie, dass jede abgeschlossene und zusammenhängende Teilmenge von R, welche nach
oben, nicht aber nach unten beschränkt ist, ein Intervall von der Form (−∞, b] mit b ∈ R
ist.
Lernzielkontrolle
Nach dem Durcharbeiten diese Kapitels sollten Sie...
... wissen, was ein innerer Punkt und was das Innere einer Menge ist.
... wissen, was ein Randpunkt und was der Rand einer Menge ist.
... wissen, was der Abschluss einer Menge ist.
... wissen, was eine offene und was eine abgeschlossene Menge ist.
... wissen, was beschränkte Mengen, Folgen und Funktionen sind.
... den Satz von Heine–Borel kennen.
... wissen, was eine Cauchy–Folge ist.
... wissen, dass jede konvergente Folge eine Cauchy–Folge ist.
... wissen, dass jede konvergente Folge und jede Cauchy–Folge beschränkt ist.
... wissen, was es bedeutet, dass die Menge R vollständig ist, und dass die Menge Q
nicht vollständig ist.
... wissen, was ein Banach–Raum und was ein Hilbert–Raum ist.
... wissen, was eine zusammenhängende Menge ist.
... wissen, dass Intervalle die einzigen zusammenhängenden Teilmengen von R sind.
69
Kapitel 4
Konvergenzbegriffe
und Konvergenzkriterien
4.1
Konvergenz reeller Zahlenfolgen
Im Abschnitt 2.5 haben wir bereits den Begriff des Grenzwerts einer Folge eingeführt
und Rechenregeln für Folgengrenzwerte aufgestellt. In diesem Abschnitt widmen wir uns
speziell den Folgen in R. Im Mittelpunkt unserer Untersuchungen steht dabei die Frage,
ob eine gegebene Folge in R konvergiert oder divergiert. Insbesondere wollen wir hinreichende Bedingungen für die Konvergenz einer reellen Zahlenfolge zusammenstellen. Solche
Bedingungen nennt man Konvergenzkriterien.
Das erste Konvergenzkriterium, welches wir betrachten, ist als Cauchy–Kriterium bekannt. Das Cauchy–Kriterium folgt direkt aus der Tatsache, dass R ein vollständiger normierter Raum ist (siehe Satz 3.14).
Satz 4.1 (Cauchy–Kriterium). Eine Folge (an )n∈N in R ist genau dann konvergent,
wenn sie eine Cauchy–Folge ist, d.h. wenn zu jeder positiven Zahl ε > 0 eine natürliche
Zahl N ∈ N existiert, so dass
|an − am | < ε für alle m, n ∈ N mit n ≥ m ≥ N
gilt.
Das Cauchy–Kriterium liefert sowohl ein notwendiges als auch ein hinreichendes Kriterium
für die Konvergenz einer reellen Zahlenfolge. Es ist jedoch nur selten geeignet, um die
Konvergenz einer gegebenen Folge nachzuweisen. Deshalb geben wir noch zwei weitere
Konvergenzkriterien an, welche auf der Tatsache beruhen, dass R ein angeordneter Körper
ist (und zwar durch die Ordnungsrelation ≤). Dem nachfolgenden Satz kommt dabei eine
zentrale Rolle zu.
Satz 4.2. Seien (an )n∈N und (bn )n∈N zwei konvergente Folgen in R derart, dass eine
natürliche Zahl N ∈ N existiert, so dass an ≤ bn für alle n ∈ N mit n ≥ N gilt. Dann gilt
lim an ≤ lim bn .
n→∞
n→∞
Gemäß Satz 4.2 bleibt die Ordnungsrelation ≤ beim Grenzübergang von reellen
Zahlenfolgen erhalten. Seien also (an )n∈N und (bn )n∈N zwei reelle Zahlenfolgen, die
70
4.1. KONVERGENZ REELLER ZAHLENFOLGEN
71
gegen Grenzwerte a ∈ R bzw. b ∈ R konvergieren, und deren Folgenglieder die Ungleichung
an ≤ bn für alle n ∈ N erfüllen, dann gilt auch a ≤ b. Die strikte Ordnungsrelation <
bleibt im Allgemeinen jedoch nicht erhalten! Selbst wenn also die Glieder der Zahlenfolgen
(an )n∈N und (bn )n∈N die strikte Ungleichung an < bn für alle n ∈ N erfüllen, gilt für die
Grenzwerte im Allgemeinen nur noch a ≤ b. So erfüllen beispielsweise die Glieder der
Folgen (an )n∈N und (bn )n∈N , welche durch an := 1/(n + 1) und bn := 1/n für alle n ∈ N
definiert sind, die strikte Ungleichung an < bn für alle n ∈ N. Die Grenzwerte a = 0 und
b = 0 dieser Folgen erfüllt jedoch nur noch die Ungleichung a ≤ b.
Eine wichtige Folgerung aus Satz 4.2 ist das folgende Konvergenzkriterium für reelle
Zahlenfolgen, welches unter dem Namen Sandwichtheorem bekannt ist.
Satz 4.3 (Sandwichtheorem). Seien (pn )n∈N und (qn )n∈N zwei Folgen in R, die gegen
denselben Grenzwert a ∈ R konvergieren. Sei außerdem (an )n∈N eine Folge in R mit der
Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so dass pn ≤ an ≤ qn für alle n ∈ N
mit n ≥ N gilt. Dann konvergiert die Folge (an )n∈N ebenfalls gegen a.
Das folgende Beispiel verdeutlicht, wie man das Sandwichtheorem bei bestimmten reellen
Zahlenfolgen dazu verwenden kann, den Grenzwert zu bestimmen.
Beispiel. Wir betrachten die reelle Zahlenfolge (an )n∈N , welche durch
an :=
für alle n ∈ N definiert ist. Offenbar gilt
n
1
2n
2
1
= n ≤ an ≤ 2 =
2
2
n
n
sowie
2n
2n
für alle n ∈ N mit n ≥ 4,
n
1
2
= lim
= 0.
n→∞ 2
n→∞ n
lim
Nach dem Sandwichtheorem konvergiert die Folge (an )n∈N also ebenfalls gegen Null.
♦
Ein weiteres wichtiges Konvergenzkriterium für reelle Zahlenfolgen ist das so genannte
Monotoniekriterium.
Satz 4.4 (Monotoniekriterium). Sei (an )n∈N eine Folge in R, welche monoton wachsend
und nach oben beschränkt ist. Dann konvergiert die Folge (an )n∈N gegen ihr Supremum.
Falls die Folge (an )n∈N monoton fallend und nach unten beschränkt ist, konvergiert sie
gegen ihr Infimum.
Eine monoton wachsende oder monoton fallende Zahlenfolge (an )n∈N , welche gegen einen
Grenzwert a ∈ R konvergiert, wird gelegentlich auch monoton konvergent genannt. Falls
die Folge monoton wachsend ist, schreibt man häufig
an % a
(n → ∞),
um die monotone Konvergenz anzudeuten. Ist die Folge monoton fallend, so schreibt man
auch
an & a (n → ∞).
Aus dem Monotoniekriterium kann man noch ein weiteres, etwas schwächeres“ Konver”
genzkriterium für reelle Zahlenfolgen herleiten.
72
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Satz 4.5. Sei (an )n∈N eine Folge in R, welche nach oben beschränkt und ab einem bestimmten Index monoton wachsend ist. Dann ist die Folge konvergent. Dasselbe gilt, wenn
die Folge nach unten beschränkt und ab einem bestimmten Index monoton fallend ist.
Im nachfolgenden Beispiel demonstrieren wir, wie man das Monotoniekriterium verwenden
kann, um die Existenz der so genannten Eulerschen Zahl e zu beweisen.
Beispiel (Die Eulersche Zahl e). Wir betrachten die Folge (an )n∈N in R, welche durch
1 n
an := 1 +
n
für alle n ∈ N definiert ist. Gemäß der verallgemeinerten ersten binomischen Formel gilt
n X
n 1
n
n 1
n 1
n 1
an =
=
+
+
+ ··· +
.
2
k
k n
0
1 n
2 n
n nn
k=0
Als erstes zeigen wir, dass die Folge (an )n∈N streng monoton wachsend ist. Dabei verwenden wir die Tatsache, dass für je zwei positive Zahlen p > 0 und q > 0 mit p ≤ q die
Ungleichung p/q ≤ (p + 1)/(q + 1) gilt. Man erhält daher die Abschätzung
n!
n 1
=
k
k n
k!(n − k)!nk
1 n n−1 n−2
n−k+1
=
· ·
·
···
k! n
n
n
n
n
n−1
n−k+2
1 n+1
·
·
·
···
≤
k! n + 1 n + 1 n + 1
n+1
(n + 1)!
=
k!(n − k + 1)!(n + 1)k
n+1
1
=
.
k
(n + 1)k
für alle n ∈ N und für alle k ∈ {1, 2, . . . , n}. Daraus folgt wiederum
n n n+1
X
X
X n + 1
n 1
1
1
n+1
an =
≤
<
= an+1
k
k
k n
k
k
(n + 1)
(n + 1)k
k=0
k=0
k=0
für alle n ∈ N. Als nächstes zeigen wir, dass die Folge (an )n∈N durch die Zahl 3 nach oben
beschränkt ist. Für jede natürliche Zahl k ∈ {1, 2, . . . , n} gilt offenbar
n!
1 n n−1
n−k+1
1
n 1
=
=
· ·
···
≤ .
k
k
k n
k! n
n
n
k!
k!(n − k)!n
Daher erhält man die Abschätzung
1
1
1
1
1
+ + + ... +
+
1! 2! 3!
(n − 1)! n!
1
1
1
1
1
≤1+ +
+
+ ··· +
+
1 1·2 2·3
(n − 2)(n − 1) (n − 1)n
1 1
1 1
1
1
1
1
=1+1+
−
+
−
+ ··· +
−
+
−
1 2
2 3
n−2 n−1
n−1 n
an ≤ 1 +
4.1. KONVERGENZ REELLER ZAHLENFOLGEN
=1+1+
=3−
73
1 1
−
1 n
1
n
≤3
für alle n ∈ N. Nach dem Monotoniekriterium konvergiert die Folge (an )n∈N also gegen
eine reelle Zahl. Diese Zahl wird die Eulersche Zahl genannt, und mit e bezeichnet. Es gilt
also
1 n
e := lim 1 +
n→∞
n
Die Eulersche Zahl e ist irrational, und es gilt e ≈ 2,7182818.
♦
Die im voran gegangenen Beispiel untersuchte Folge (an )n∈N gehört zu einer ganzen Familie
konvergenter Folgen in R, deren Grenzwerte durch Potenzen der Eulerschen Zahl gegeben
sind.
Lemma 4.6. Für jede rationale Zahl x ∈ Q gilt
x n
lim 1 +
= ex .
n→∞
n
Man kann die Aussage von Lemma 4.6 dazu verwenden, um die Exponentialfunktion x 7→
ex für alle rationalen Zahlen x ∈ Q zu definieren. Darüber hinaus kann man zeigen, dass
die Aussage von Lemma 4.6 auch für irrationale Zahlen x ∈ R \ Q gilt.
Übungsaufgaben
1. Bestimmen Sie die Grenzwerte der Folgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N in R. Die
Folgen sind durch
n+1
1
an := 1 +
,
n
n
n
bn :=
,
n+1
n
1
cn := 1 − 2 ,
n
n
0 + 2 + 4 + · · · + 2(n − 1)
dn :=
n2
für alle n ∈ N definiert. Verwenden Sie das Lemma 4.6.
2. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N , (dn )n∈N .
Die Folgen sind durch
√
n
an := 100,
p
n
bn := 1 + n2 ,
3n
cn := n ,
3 √
3
n
dn := √
3
n +n
für alle n ∈ N definiert. Verwenden Sie das Sandwichtheorem.
74
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
3. Beweisen Sie mit Hilfe des Sandwich–Theorems die folgende Aussage. Ist (an )n∈N eine Nullfolge in R und (bn )n∈N eine beschränkte Folge in R, dann konvergiert die Folge (an bn )n∈N
gegen Null.
4. Sei n ∈ N eine natürliche Zahl und x ∈ Kn ein beliebiger Vektor. Die reelle Zahlenfolge
(ap )p∈N sei durch ap := kxkp für alle p ∈ N definiert, wobei kxkp die p-Norm von x bezeichnet
(siehe Beispiel (g) auf Seite 9). Zeigen Sie mit Hilfe des Sandwichtheorems, dass die Folge
(ap )p∈N gegen kxk∞ konvergiert. Hierbei bezeichnet kxk∞ die Maximumnorm von x.
5. Untersuchen Sie, ob die reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N konvergent sind. Die Folgen sind durch
1
1
1
+
+ ··· +
,
n+1 n+2
2n
p
b1 := 0, bn+1 = 2 + bn
1
1
c1 := , cn+1 := cn 1 −
,
2
n+1
1
d1 := 1, dn+1 =
d1 + d2 + · · · + dn
an :=
für alle n ∈ N definiert. Verwenden Sie das Monotoniekriterium.
4.2. KONVERGENZ VON REIHEN
4.2
75
Konvergenz von Reihen
Definition (Reihe). Sei V ein Vektorraum über K, und sei (vn )n∈N eine Folge in V . Dann
heißt die Folge (sN )N ∈N in V , welche durch
sN :=
N
X
vn = v1 + v2 + . . . + vN
n=1
für alle N ∈ N gegeben ist, die von (vn )n∈N erzeugte Reihe in V . Für jeden Index N ∈ N
nennt man das Folgenglied sN die N -te Partialsumme der Reihe (sN )N ∈N , und für jeden
Index n ∈ N heißt das Folgenglied vn der n-te Summand der Reihe (sN )N ∈N . Die Reihe
(sN )N ∈N wird üblicherweise durch die Schreibweise
∞
X
vn
n=1
dargestellt. Manchmal stellt man die Reihe auch durch Angabe der ersten Summanden in
der Form v1 + v2 + · · · + vN + · · · dar.
Eine Reihe ist also nichts anderes als eine Folge, deren Glieder durch sukzessives Aufsummieren der Glieder einer anderen Folge entstehen. Jedes Glied einer Reihe ist somit
eine Summe, welche aus endlich vielen Summanden besteht. Dennoch ist die Vorstellung
weit verbreitet, eine Reihe seiPeine Summe mit unendlich vielen Summanden, was vor
allem durch die Schreibweise ∞
n=1 vn nahegelegt wird. Wie wir noch sehen werden, hat
diese Vorstellung sogar eine gewisse Berechtigung, wenn es sich bei der Reihe um eine
konvergente Reihe (s.u.) handelt.
Ähnlich wie bei Folgen, ist es bei Reihen oft nützlich die Menge N0 oder eine Menge
von der Form N ∪ {0, −1, −2, . . . , −m} mit m ∈ N als Indexmenge zu wählen. Man stellt
die von einer Folge (vn )∞
n=−m erzeugte Reihe dann durch
∞
X
vn
n=−m
dar. Im folgenden geben wir einige Beispiele für Reihen in R an.
Beispiele.
(a) Die Reihe
∞
X
1 = 1 + 1 + 1 + 1 + ···
k=1
wird von der konstanten Folge (an )n∈N erzeugt, welche durch an := 1 für alle n ∈ N
definiert ist. Man erkennt
leicht, dass für jeden Index N ∈ N die N -te Partialsumme
P
dieser Reihe durch N
1
k=1 = N gegeben ist.
(b) Die Reihe
∞
X
1
1 1 1
= 1 + + + + ···
n
2 3 4
n=1
wird
P1 die harmonische
P2 Reihe genannt. Die ersten
P3 Partialsummen dieser Reihe lauten
n=1 1/n = 1,
n=1 1/n = 1 + 1/2 = 3/2,
n=1 1/n = 1 + 1/2 + 1/3 = 11/6.
76
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(c) Sei q ∈ C eine komplexe Zahl. Dann heißt die Reihe
∞
X
qn = 1 + q + q2 + q3 + · · ·
n=0
die geometrische Reihe zu q.
♦
Eine wichtige Rolle in der Analysis spielen so genannte konvergente Reihen.
Definition
(konvergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
P∞
n=1 vn in V heißt konvergent, wenn ein Vektor v ∈ V existiert, so dass
lim
N →∞
N
X
vn = v
n=1
gilt. Der Vektor v heißt dann der Grenzwert von
∞
X
P∞
n=1 vn ,
und man schreibt
vn = v.
n=1
Definition (divergente Reihe). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
in V heißt divergent, wenn sie nicht konvergent ist.
P
Man beachte, dass das Symbol ∞
n=1 vn tatsächlich zwei Bedeutungen hat. Zunächst bezeichnet es die Reihe, welche von einer Folge (vn )n∈N erzeugt wird. Ist diese Reihe konvergent, so bezeichnet das Symbol jedoch auch den Grenzwert der Reihe. Welche Bedeutung dem Symbol zukommt muss jeweils aus dem Kontext erschlossen werden, was im
Allgemeinen jedoch keine Schwierigkeiten bereitet.
PN Um eine Verwechselung gänzlich auszuschließen,
kann
man
die
Reihe
auch
durch
n=1 vn N ∈N darstellen, und das Symbol
P∞
v
ausschließlich
für
den
Grenzwert
der
Reihe
verwenden, was jedoch eher unüblich
n=1 n
ist. Nachfolgend geben wir einige wichtige Beispiele für konvergente Reihen in R an.
Beispiele.
(a) Der Mathematiker Leonhard Euler konnte zeigen, dass die Reihe
∞
X
1
1 1
1
=1+ + +
+ ···
2
n
4 9 16
n=1
gegen die Zahl π 2 /6 konvergiert.
(b) Die Reihe
∞
X
1
1 1 1
= 1 + + + + ···
n!
1 2 6
n=0
konvergiert gegen die Eulersche Zahl e.
(c) Die so genannte alternierende harmonische Reihe
∞
X
(−1)n+1
n=1
n
konvergiert gegen die Zahl ln(2).
=1−
1 1 1
+ − ± ···
2 3 4
4.2. KONVERGENZ VON REIHEN
77
(d) Die so genannte Leibniz–Reihe
∞
X
(−1)n
1 1 1
= 1 − + − ± ···
2n + 1
3 5 7
n=0
konvergiert gegen die Zahl π/4.
♦
Als nächstes wollen wir einige Rechenregeln für die Grenzwerte konvergenter Reihen zusammenstellen.
P
P∞
Satz 4.7. Sei (V, k · k) ein normierter Raum über K, seien ∞
n=1 vn und
n=1 wn zwei
konvergente Reihen in V , und sei α ∈ K ein beliebiger Skalar. Dann gelten die folgenden
Aussagen.
(1)
∞
X
(vn + wn ) =
n=1
(2)
∞
X
(αvn ) = α
n=1
∞
X
vn +
n=1
∞
X
∞
X
wn .
n=1
vn .
n=1
Wir kommen nun zur Untersuchung des Konvergenzverhaltens von Reihen. Im allgemeinen
ist es schwierig zu erkennen, ob eine gegebene Reihe konvergiert oder divergiert. Das
folgende Lemma liefert zunächst eine notwendige Bedingung für die Konvergenz einer
Reihe.
P
Lemma 4.8. Sei (V, k · k) ein normierter Raum über K, und sei ∞
n=1 vn eine konvergente
Reihe in V . Dann bildet die Folge der Reihensummanden (vn )n∈N eine Nullfolge in V .
Es muss noch einmal betont werden, dass das Lemma 4.8 lediglich ein notwendiges, nicht
aber ein hinreichendes Kriterium für die Konvergenz einer Reihe liefert. Es gibt nämlich
auch divergente Reihen, deren Summanden eine Nullfolge bilden.
Eine wichtige Klasse konvergenter Reihen bilden die geometrischen Reihen zu den
komplexen Zahlen, welche betragsmäßig echt kleiner als Eins sind. Die Grenzwerte dieser
Reihen können darüber hinaus explizit berechnet werden, wie der nachfolgende Satz zeigt.
Satz 4.9. Die geometrische Reihe zu einer komplexen Zahl q ∈ C ist genau dann konvergent, wenn |q| < 1 gilt. Für den Grenzwert der Reihe gilt dann
∞
X
qn =
n=0
1
.
1−q
Man betrachte die nachfolgenden Beispiele.
Beispiele.
(a) Nach Satz 4.9 gilt
∞
∞ n
X
X
1
1
1
=
=
n
3
3
1−
n=0
n=0
1
3
3
= .
2
78
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Abbildung 4.1: Die Reihe
P∞
n=1
1/2n konvergiert gegen die Zahl 1.
(b) Für die komplexe Zahl z = i/2 gilt |z| = 1/2 < 1. Also konvergiert die geometrische
Reihe zu z, und wir erhalten die komplexe Zahl
∞
X
n=0
zn =
1
1−
i
2
=
4 2
+ i
5 5
als Grenzwert der Reihe.
♦
Ein besonders interessantes Ergebnis erhält man, wenn man die Reihe
∞
X
1 1 1
1
1
= + + +
+ ···
n
2
2 4 8 16
n=1
auf Konvergenz hin untersucht. Fasst man nämlich jede N -te Partialsumme sN := 1/2 +
1/4 + · · · + 1/2N dieser Reihe als die Position eines Punktes P auf der reellen Zahlengerade
auf, so erkennt man, dass sich der Punkt P der Zahl 1 immer weiter annähert. Beim
Übergang von einem Index N ∈ N zum jeweils nächsten Index N + 1 legt der Punkt P
dabei immer genau die Hälfte der Distanz zurück, die zwischen ihm und der Zahl 1 liegt
(siehe Abbildung 4.1). Eine solche Bewegung“ des Punktes P bezeichnen wir im folgenden
”
als Annäherungsschritt“. Es stellt sich die Frage, ob der Punkt jemals die Zahl 1 erreicht.
”
Mit Hilfe von Satz 4.9 kann man diese Frage beantworten. Es gilt nämlich
!
∞
∞ n
X
X
1
1
1
=
−1=
− 1 = 1.
n
2
2
1 − 12
n=1
n=0
Der Punkt P kommt der Zahl 1 also beliebig nahe, d.h. für jede positive Zahl ε > 0
existiert eine natürliche Zahl N ∈ N, so dass nach N Annäherungsschritten der Abstand
zwischen dem Punkt P und der Zahl 1 kleiner als ε ist. Da die Zahl 1 der Grenzwert
der Folge (sN )n∈N ist, kommt man leicht zu der Vorstellung, der Punkt P würde die
Zahl 1 nach unendlich vielen Annäherungsschritten erreichen. Es ist dabei allerdings nicht
wirklich klar, was genau unter nach unendlich vielen Annäherungsschritten“ zu verstehen
”
sein soll. Daher ist eine gewisse Vorsicht bei dieser Interpretation des Ergebnisses geboten.
Betrachtet man die alternierende harmonische Reihe sowie die Leibniz–Reihe, so fällt
auf, dass die Summanden beider Reihen abwechselnd positiv und negativ sind. Reihen
in R mit dieser Eigenschaft werden alternierend genannt. Die genaue Definition lautet
folgendermaßen:
P
Definition (alternierende Reihe). Eine Reihe ∞
n=1 an in R wird alternierend genannt,
n
wenn sgn(an ) = (−1) für alle n ∈ N oder sgn(an ) = (−1)n+1 für alle n ∈ N gilt.
4.2. KONVERGENZ VON REIHEN
79
Für alternierende Reihen gilt das folgende Konvergenzkriterium, welches unter dem Namen
Leibniz–Kriterium bekannt ist.
P
Satz 4.10 (Leibniz–Kriterium). Sei ∞
n=1 an eine alternierende Reihe in R mit der
Eigenschaft, dass die Folge (|an |)n∈N der Beträge der Reihensummanden monoton gegen
Null konvergiert. Dann ist die Reihe konvergent.
Das Leibniz–Kriterium garantiert offenbar insbesondere die Konvergenz der Leibniz–Reihe
(siehe Beispiel (d) auf Seite 77). Zu
ist, dass das Leibniz–Kriterium für die KonPbeachten
∞
vergenz einer alternierende Reihe n=1 an in R voraussetzt, dass die Folge (|an |)n∈N monoton gegen Null konvergiert. Tatsächlich gibt es divergente, alternierende Reihen in R, bei
denen die Folge der Beträge der Reihesummanden nichtmonoton gegen Null konvergiert.
Man betrachte dazu die nachfolgenden zwei Beispiele.
Beispiele.
(a) Die Reihe
√
√
√
∞
X
(−1)n
2
3
4
√
= −1 +
−
+
∓ ···
2
3
4
n
n=1
erfüllt die Voraussetzungen des Leibniz–Kriteriums und ist daher konvergent.
(b) Sei (an )n∈N die reelle Zahlenfolge, welche durch
(
1/n falls n ungerade,
an :=
−1/n2 falls n gerade
für alle n ∈ N definiert ist, und sei
∞
X
n=1
an = 1 −
1
1 1
+ −
± ··· ,
4 3 16
die zugehörige Reihe. Dann konvergiert die Folge (|an |)n∈N zwar gegen Null, jedoch
nicht monoton. Daher sind die Voraussetzungen fürPdas Leibniz–Kriterium nicht
erfüllt. Tatsächlich kann man zeigen, dass die Reihe ∞
♦
n=1 an divergent ist.
Mit dem Satz 4.9 und dem Leibniz–Kriterium stehen uns zwei Werkzeuge zur Verfügung,
um die Konvergenz von geometrischen und alternierenden Reihen nachzuweisen. Als nächstes befassen wir uns mit der Frage, wie man die Divergenz von Reihen nachweisen kann.
Zunächst geben wir zwei wichtige Beispiele für divergente Reihen in R an.
Beispiele.
(a) Die harmonische Reihe ist divergent. Betrachtet man nämlich die Partialsummen sN := 1 + 1/2 + 1/3 + . . . + 1/N der harmonischen Reihe, so erhält man die
Abschätzung
|s2N − sN | =
1
1
1
1
1
+
+ ··· +
≥N·
=
N +1 N +2
2N
2N
2
für alle N ∈ N. Dies bedeutet aber, dass die Folge (sn )n∈N der Partialsummen der
harmonischen Reihe keine Cauchy–Folge sein kann. Nach dem Cauchy–Kriterium
(siehe Satz 4.1) ist die Folge (sn )n∈N und damit die harmonische Reihe also divergent.
80
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(b) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| ≥ 1 ist divergent. ♦
Als nächstes führen wir den Begriff der Minorante ein. Dieser wird benötigt, um ein Kriterium für die Divergenz einer Reihe in R zu formulieren.
P∞
P∞
Definition (Minorante).
Sei
a
eine
Reihe
in
R.
Eine
Reihe
n
n=1
n=1 mn in R heißt
P∞
eine Minorante für n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass 0 ≤ mn ≤
an für alle n ∈ N mit n ≥ N gilt.
Eine Minorante ist also eine Reihe, deren Summanden bis auf endlich viele Ausnahmen
nichtnegativ und indexweise kleiner oder gleich wie die Summanden einer gegebenen Reihe
in R sind. Entsprechend ist jede N -te Partialsumme der Minorante kleiner oder gleich wie
die N -te Partialsumme der ursprünglichen Reihe für N ∈ N. Daraus ergibt sich aber, dass
die Divergenz der Minorante auch die Divergenz der ursprünglichen Reihe impliziert. Dies
ist die Idee, die dem so genannten Minorantenkriterium zugrunde liegt.
Satz 4.11 (Minorantenkriterium). Jede Reihe in R, für die eine divergente Minorante
existiert, divergiert bestimmt gegen ∞.
Aus dem Minorantenkriterium folgt auch, dass jede divergente Reihe in R mit nichtnegativen Summanden gegen ∞ bestimmt divergeriert. Jede solche Reihe ist nämlich eine
divergente Majorante für sich selbst. Das nachfolgende Beispiel verdeutlicht, wie man mit
Hilfe des Minorantenkriteriums die bestimmte Divergenz einer Reihe in R beweisen kann.
Beispiel. Wir betrachten die Reihe
∞
X
n=1
√
1
n2
+1
.
Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt
an = √
1
n2
+1
≥√
1
1
=√
2
2n
+n
n2
für alle n ∈ N.
√
√
P
P∞
Die Reihe ∞
Minorante
für
die
Reihe
1/
n2 + 1.
n=1 1/( 2n) ist also eine divergente
n=1
√
P∞
2
Nach dem Minorantenkriterium ist die Reihe n=1 1/ n + 1 somit gegen ∞ bestimmt
divergent.
♦
Übungsaufgaben
1. Geben Sie die ersten vier Partialsummen der nachfolgenden Reihen in R an.
∞
X
n=1
n,
∞
X
1
,
2
n
n=1
∞
X
(−1)n
,
2n + 1
n=0
∞
X
(−2)n .
n=1
2. Zeigen Sie, dass die folgenden Reihen konvergent sind, und bestimmen Sie den Grenzwert
jeder Reihe.
∞ ∞ ∞
X
X
X
1
1
n−1
n
3
−
,
−
,
.
2
2
2+n
n
n
+
1
n
(n
+
1)
n
n=1
n=1
n=1
Hinweis: Leiten Sie allgemeine Formeln für die Partialsummen der Reihen her.
4.2. KONVERGENZ VON REIHEN
81
3. Untersuchen Sie die folgenden Reihen auf Konvergenz und berechnen Sie gegebenenfalls die
Grenzwerte.
∞
∞
∞ √ n
∞
∞
∞
X
X
X
X
X
X
6
6n
2
1
n
,
,
,
,
(1
+
i)
,
(1 + i)−n .
n
n
n
4
5
5
2
n=0
n=0
n=2
n=1
n=0
n=0
4. Für jede natürliche Zahl z ∈ {0, 1, 2, . . . , 9} bezeichne 0,z die Dezimaldarstellung einer reellen
Zahl mit periodischer Nachkommastelle z. Zeigen Sie mit Hilfe von Satz 4.9, dass
0,z =
z
9
für alle z ∈ {0, 1, 2, . . . , 9} gilt. Beachten Sie, dass dies insbesondere die Identität 0,9 = 1
beweist.
5. Zeigen Sie, dass die folgenden Reihen divergent sind.
∞ √
X
n
,
n
n=1
∞
X
(n + 1)(n − 1)
,
n2
n=1
∞
X
n
,
2
n +4
n=1
∞
X
1
√ .
n+ n
n=1
6. Sei q ∈ C eine komplexe Zahl, für die |q| < 1 gilt. Zeigen Sie, dass dann
∞
X
n=k
für alle k ∈ N0 gilt.
qn =
qk
1−q
82
4.3
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Absolute Konvergenz von Reihen
Neben der Konvergenz und der Divergenz definiert man für Reihen noch ein weiteres
Konvergenzverhalten, welches als absolute Konvergenz bezeichnet wird. Es zeigt sich, dass
absolut konvergente Reihen im wesentlichen wie gewöhnliche Summen behandelt werden
können.
Definition
(absolut konvergente Reihe). Sei (V, k · k) ein
normierter Raum. Eine ReiP
P∞
he ∞
v
in
V
heißt
absolut
konvergent,
wenn
die
Reihe
n=1 n
n=1 kvn k konvergent ist.
P
Man beachte, dass die Reihe ∞
n=1 kvn k in der obigen Definition stets eine Reihe in R ist.
Wir erinnern außerdem daran, dass die Menge der reellen Zahlen R sowie die Menge der
komplexen Zahlen C standardmäßig mit der jeweiligen
Betragsfunktion als Norm verseP
a
absolute Konvergenz
hen sind. Will man also beispielsweise eine Reihe ∞
n=1 n in R aufP
hin untersuchen, so muss man das Konvergenzverhalten der Reihe ∞
n=1 |an | bestimmen.
Nachfolgend geben wir einige Beispiele für absolut konvergente Reihen an.
Beispiele.
(a) Die geometrische Reihe zu jeder komplexen Zahl q ∈ C mit |q| < 1 ist absolut
konvergent.
(b) Man kann zeigen, dass für jede reelle Zahl α > 1 die Reihe
∞
X
1
nα
n=1
absolut konvergent ist. Für α ≤ 1 ist die Reihe hingegen divergent.
(c) Jede konvergente Reihe in R mit nichtnegativen Summanden ist trivialerweise auch
absolut konvergent.
(d) Nach dem Leibniz–Kriterium ist die Reihe
∞
X
(−1)n
n=0
n
konvergent. Die Reihe ist jedoch nicht absolut konvergent, da die harmonische Reihe
divergent ist.
♦
Der nachfolgende Satz klärt, wie die Konvergenz und die absolute Konvergenz einer Reihe
in einem Banach–Raum (d.h. in einem vollständigen normierten Raum) zusammenhängen.
Satz 4.12. Jede absolut konvergente Reihe in einem Banach–Raum ist konvergent.
Man beachte, dass für jede natürliche Zahl n ∈ N die mit einer Norm versehenen Vektorräume Rn und Cn nach Satz 3.14 vollständig und somit Banach–Räume über R bzw. C
sind. Gemäß Satz 4.12 ist daher insbesondere jede absolut konvergente Reihe in R und in
C konvergent.
Wie eingangs bereits erwähnt wurde, können absolut konvergente Reihen in vielerlei
Hinsicht wie gewöhnliche Summen behandelt werden. Einen erster Hinweis hierauf liefert
der nachfolgende Satz, der besagt, dass für absolut konvergente Reihen eine Variante der
Dreiecksungleichung gilt.
4.3. ABSOLUTE KONVERGENZ VON REIHEN
83
Satz 4.13 (Dreiecksungleichung
P∞ für absolut konvergente Reihen). Sei (V, k · k) ein
Banach–Raum über K, und sei n=1 vn eine absolut konvergente Reihe in V . Dann gilt
∞
∞
X X
vn ≤
kvn k.
n=1
n=1
Die Addition in einem Vektorraum ist bekanntlich eine kommutative Verknüpfung. Dies
bedeutet, dass sich die Summe endlich vieler Vektoren nicht ändert, wenn man die Reihenfolge der Vektoren vertauscht. Ein analoges Resultat kann für absolut konvergente Reihen
gezeigt werden. Der entsprechende Satz ist als Umordnungssatz bekannt.
P
Satz 4.14 (Umordnungssatz). Sei (V, k · k) ein Banach–Raum über K, sei ∞
n=1 vn eine
absolutPkonvergente Reihe in V , und sei ϕ : N → N eine bijektive Abbildung. Dann ist die
Reihe ∞
n=1 vϕ(n) ebenfalls absolut konvergent, und es gilt
lim
N →∞
N
X
n=1
vϕ(n) = lim
N →∞
N
X
vn .
n=1
Der Umordnungssatz besagt, dass der Grenzwert einer absolut konvergenten Reihe invariant gegenüber einer Umordnung der Reihensummanden ist. Es stellt sich die Frage, ob
diese Aussage auch für solche Reihen gilt, die zwar konvergent, nicht aber absolut konvergent sind. Die überraschende Antwort lautet: Nein! Tatsächlich kann man zeigen, dass
sich der Grenzwert einer nicht absolut konvergenten Reihe in der Regel ändert, wenn man
die Reihenfolge der Reihensummanden ändert. Mehr noch: Durch Umordnung der Reihensummanden kann man die Reihe gegen jeden beliebigen Grenzwert konvergieren und
sogar bestimmt divergieren lassen. Diese Aussage ist als Riemannscher Umordnungssatz
bekannt.
Im Rest dieses Abschnitts stellen wir einige hinreichende Kriterien für die absolute
Konvergenz von Reihen zusammen. Zu diesem Zweck führen wir zunächst den Begriff der
Majorante ein.
P
Definition (Majorante). Sei ∞
n=1 an eine Reihe
P∞in R mit nichtnegativen Summanden,
d.h. es gelte an ≥ 0 für alle n ∈ N. Eine Reihe n=1 Mn in R heißt eine Majorante für
P
∞
n=1 an , wenn eine natürliche Zahl N ∈ N existiert, so dass an ≤ Mn für alle n ∈ N mit
n ≥ N gilt.
Existiert für eine Reihe in R mit nichtnegativen Summanden eine absolut konvergente
Majorante, so kann man zeigen, dass auch die ursprüngliche Reihe absolut konvergiert.
Auf diesem Prinzip beruht das so genannte Majorantenkriterium.
Satz
normierter Raum über K, und sei
P∞ 4.15 (Majorantenkriterium). Sei (V, k · k)
Pein
∞
dass für die Reihe n=1 kvn k eine konvergente Majorante
n=1 vn eine Reihe in V , soP
existiert. Dann ist die Reihe ∞
n=0 vn absolut konvergent.
Das nachfolgende Beispiel verdeutlicht, wie man das Majorantenkriterium anwendet.
84
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Beispiel. Wir betrachten die Reihe
∞
X
√
n=1
1
n3
+1
.
Bezeichnet man den n-ten Summanden der Reihe mit an , so gilt
|an | = √
1
n3
1
1
≤ √ = 3/2
3
n
+1
n
für alle n ∈ N.
√
P∞
P∞
3/2 ) ist also Majorante für die Reihe
Die Reihe
1/(n
|1/
n3 + 1|. Da diese
n=1
n=1
√
P∞
3
Majorante konvergent ist, ist die Reihe
n=1 1/ n + 1 absolut konvergent nach dem
Majorantenkriterium .
♦
Um mit dem Majorantenkriterium arbeiten zu können, muss man natürlich wissen, welche Reihen in R absolut konvergieren. Wir erinnern uns, dass beispielsweise sämtliche
geometrische Reihen
reellen Zahlen q ∈ (0, 1) absolut konvergieren. Auch die Reihen
P
P∞ zu−α
∞
mit α > 1 sind absolut konvergent.
n=1 1/n! und
n=1 n
Ein weiteres Kriterium, mit dem man entweder die absolute Konvergenz oder aber die
Divergenz einer Reihe nachweisen kann, ist das so genannte Wurzelkriterium.
Satz
P∞ 4.16 (Wurzelkriterium). Sei (V, k · k) ein normierter Raum über K. Eine Reihe
n=0 vn in V ist absolut konvergent, wenn eine Zahl q ∈ (0, 1) und eine natürliche Zahl
N ∈ N existiert, so dass
p
n
kvn k ≤ q für alle n ∈ N mit n ≥ N
gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass
p
n
kvn k ≥ 1 für alle n ∈ N mit n ≥ N
gilt, dann ist die Reihe divergent.
In den nachfolgenden Beispielen demonstrieren wir die Anwendung des Wurzelkriteriums.
Beispiele.
(a) Wir betrachten die Reihe
∞ X
n=1
n
2n + 1
n
.
Bezeichnet man den n-ten Summanden der Reihe mit an für n ∈ N, so erhält man
p
n
n
1
n
≤
=
für alle n ∈ N.
|an | =
2n + 1
2n
2
Nach dem Wurzelkriterium ist die Reihe also absolut konvergent.
(b) Das Konvergenzverhalten der Reihe
∞ X
2n n
.
n+4
n=1
soll untersucht werden. Bezeichnet man den n-ten Summanden der Reihe mit an für
n ∈ N, so erhält man die Abschnätzung
p
2n
n
|an | =
≥ 1 für alle n ∈ N mit n ≥ 4.
n+4
Nach dem Wurzelkriterium ist die Reihe demzufolge divergent.
♦
4.3. ABSOLUTE KONVERGENZ VON REIHEN
85
Bei der Verwendung des Wurzelkriteriums ist eine gewisse Vorsicht geboten.
P∞ Will man
nämlich mit Hilfe dieses Kriteriums die absolute Konvergenz einer Reihe n=1 vn nachweisen, so genügt es nicht zu zeigen, dass die strikte Ungleichung
p
n
kvn k < 1
ab einem bestimmten
P Index N ∈ N gilt. Dies gilt nämlich beispielsweise auch für die
divergente Reihe ∞
n=1 1/2.
Neben dem Wurzelkriterium gibt es noch ein zweites Kriterium, mit dem man die absolute Konvergenz oder aber die Divergenz einer Reihe nachweisen kann. Dieses Kriterium
wird das Quotientenkriterium genannt.
Satz 4.17
P∞ (Quotientenkriterium). Sei (V, k · k) ein normierter Raum über K. Eine
Reihe
n=0 vn in V ist absolut konvergent, wenn eine reelle Zahl q ∈ (0, 1) und eine
natürliche Zahl N ∈ N existiert, so dass
kvn+1 k
≤q
kvn k
für alle n ∈ N mit n ≥ N
gilt. Falls hingegen eine natürliche Zahl N ∈ N existiert, so dass
kvn+1 k
≥1
kvn k
für alle n ∈ N mit n ≥ N
gilt, dann ist die Reihe divergent.
In den nachfolgenden Beispielen wird das Quotientenkriterium angewendet.
Beispiele.
(a) Wir betrachten die Reihe
∞
X
n=1
2n
(n + 1)!
in R. Bezeichnet man den jeweils n-ten Summanden der Reihe mit an für n ∈ N, so
erhält man
|an+1 |
2n+1 (n + 1)!
2
2
= n
=
≤
für alle n ∈ N.
|an |
2 (n + 2)!
n+2
3
Nach dem Quotientenkriterium ist die Reihe also absolut konvergent.
(b) Sei an der n-te Summand der Reihe
∞
X
n=1
n!
(n + 1)2
in R für n ∈ N. Dann erhält man die Abschnätzung
|an+1 |
(n + 1)! (n + 1)2
(n + 1)3
=
=
≥1
|an |
(n + 2)2 n!
(n + 2)2
für alle n ∈ N mit n ≥ 2,
weshalb die Reihe nach dem Quotientenkriterium divergent ist.
♦
86
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Man beachte, dass es für die Anwendung
P∞ des Quotientenkriteriums nicht genügt zu zeigen,
dass die Summanden einer Reihe n=1 vn die strikte Ungleichung
kvn+1 k
<1
kvn k
ab einem bestimmten Index N ∈ N erfüllen. Dies ist nämlich auch für die Summanden der
harmonischen Reihe der Fall. Die harmonische Reihe ist jedoch bekanntlich divergent.
Zum Abschluss dieses Abschnitts geben noch ein Lemma an, welches sich oft als nützlich erweist, wenn man eine Reihe mittels dem Quotienten- oder dem Wurzelkriterium auf
absolute Konvergenz hin untersucht.
Lemma 4.18. Sei (an )n∈N eine konvergente Reihe in R mit Grenzwert a. Weiterhin seien
p ∈ R und q ∈ R zwei reelle Zahlen, so dass p < a < q gilt. Dann existiert eine natürliche
Zahl N ∈ N, so dass
p ≤ an ≤ q für alle n ∈ N mit n ≥ N
gilt.
P∞
Warum ist dieses Lemma nützlich? Man stelle sich vor, dass man eine Reihe
n=1 vn
p
auf absolute Konvergenz hin untersucht und dabei feststellt, dass die Folge ( n kvn k)n∈N
konvergent ist. Wenn nun
p
lim n kvn k < 1
n→∞
gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die absolute Konvergenz
der Reihe aus dem Wurzelkriterium erfüllt sind. Wenn hingegen
p
lim n kvn k > 1
n→∞
gilt, dann folgt aus Lemma 4.18, dass die Voraussetzungen für die Divergenz der Reihe aus
dem Wurzelkriterium erfüllt sind. Ähnlich verhält es sich mit dem Quotientenkriterium.
Wenn also die Folge (kvn+1 k/kvn k)n∈N konvergent ist, und darüber hinaus
lim
n→∞
kvn+1 k
<1
kvn k
gilt, dann kann man mit Hilfe des Quotientenkriteriums folgern, dass die Reihe absolut
konvergent ist. Wenn hingegen
kvn+1 k
lim
>1
n→∞ kvn k
gilt, dann folgt aus Lemma 4.18 und dem Quotientenkriterium die Divergenz der Reihe. Ist
einer der zuvor behandelten Grenzwerte genau gleich 1, dann ist keine Aussage möglich.
Übungsaufgaben
1. Untersuchen Sie die folgenden Reihen auf absolute Konvergenz.
∞
X
1
√
,
n
n
+1
n=1
∞
X
(−1)n+1
,
2n − 1
n=1
P∞
∞
X
n2
,
2n
n=1
!
∞
n
X
X
1
,
3k
n=1
k=1
∞
X
n=1
2n
.
+1
n3
2. Zeigen Sie, dass die Reihe n=1 cos(n)/2n absolut konvergent ist, und dass für den Grenzwert s dieser Reihe die Ungleichung |s| ≤ 1 gilt.
P∞
3. Zeigen Sie, dass die Reihe n=1 4−n−cos(πn) absolut konvergent ist, und bestimmen Sie den
Grenzwert dieser Reihe. Verwenden Sie dazu den Umordnungssatz.
4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN
4.4
87
Punktweise Konvergenz von Funktionenfolgen
Definition (Funktionenfolge). Seien X und Y zwei nichtleere Mengen. Eine Folge
(fn )n∈N heißt eine Funktionenfolge von X nach Y , wenn für jeden Index n ∈ N das n-te
Folgenglied fn eine Funktion von X nach Y ist.
Unter einer Funktionenfolge versteht man also eine Folge, deren Glieder allesamt Funktionen mit sind, welche einen gemeinsamen Definitions- und Wertebereich besitzen. Im
folgenden geben wir einige Beispiele für Funktionenfolgen an.
Beispiele.
n
(a) Die Funktionenfolge (fn )∞
n=0 von R nach R, deren Glieder durch fn (x) := x für alle
x ∈ R und alle n ∈ N definiert sind, wird die Folge der Monome genannt. Die ersten
drei Glieder dieser Funktionenfolge sind offenbar durch f0 (x) = 1, f1 (x) = x und
f2 (x) = x2 für alle x ∈ R gegeben.
(b) Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R, welche durch sn (x) :=
sin(nx) und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N gegeben sind, sind
für die Analyse bestimmter Schwingungsvorgänge von entscheidender Bedeutung.
(c) Betrachtet man die Glieder der Funktionenfolge (δn )n∈N von R nach R, welche durch

2

 n x + n x ∈ [−1/n, 0)
δn (x) := −n2 x + n x ∈ [0, 1/n]


0
sonst
für alle x ∈ R und alle n ∈ N definiert sind, so stellt man folgendes fest: Für jede
natürliche Zahl n ∈ N schließt der Graph von δn mit der x-Achse ein gleichschenkliges Dreieck mit einer Grundseite der Länge 2/n und einer Höhe von n ein. Der
Flächeninhalt eines solchen Dreiecks beträgt bekanntlich 1.
♦
Ist (fn )n∈N eine Funktionenfolge von X nach Y , wobei X und Y zwei nichtleere Mengen
sind, so kann man zu jeder fest gewählten Stelle x ∈ X eine Folge (fn (x))n∈N in Y , dem
Wertebereich der Funktionenfolge, definieren. Die Glieder der Folge (fn (x))n∈N sind dabei
durch die Funktionswerte der Glieder von (fn )n∈N an der Stelle x gegeben. Man beachte:
(fn )n∈N bezeichnet eine Folge von Funktionen, (fn (x))n∈N bezeichnet eine Folge
von Funktionswerten.
Ist der Wertebereich einer Funktionenfolge ein normierter Raum, so gelangt man in natürlicher Weise zu einem Konvergenzbegriff, welcher als punktweise Konvergenz bezeichnet
wird.
Definition (punktweise Konvergenz, Grenzfunktion). Sei X eine nichtleere Menge,
sei x ∈ X ein Element dieser Menge, und sei (W, k · k) ein normierter Raum über K.
Eine Funktionenfolge (fn )n∈N von X nach W heißt konvergent an der Stelle x, wenn die
Folge (fn (x))n∈N in W konvergent ist. Ist D ⊆ X eine nichtleere Menge, so heißt die
Funktionenfolge punktweise konvergent auf D, falls sie an jeder Stelle x ∈ D konvergent
ist. In diesem Fall definiert man die so genannte Grenzfunktion f : D → W von (fn )n∈N
auf D durch
f (x) := lim fn (x)
n→∞
für alle x ∈ D.
88
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(a)
(b)
Abbildung 4.2: (a) Graphen der ersten vier Glieder der Funktionenfolge (pn )n∈N von
[0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1] und alle n ∈ N definiert ist. (b)
Graph der zugehörigen Grenzfunktion.
Definition (divergente Funktionenfolge). Eine Funktionenfolge heißt an einer Stelle
ihres Definitionsbereichs divergent, wenn sie an jener Stelle nicht punktweise konvergent
ist. Ist M eine nichtleere Teilmenge des Definitionsbereichs, so heißt die Funktionenfolge
divergent auf M , wenn sie an jeder Stelle x ∈ M divergent ist.
Ist X eine nichtleere Menge, D ⊆ X eine nichtleere Teilmenge, und (W, k · k) ein normierter
Raum, so konvergiert eine Funktionenfolge (fn )n∈N von X nach W offenbar genau dann
punktweise gegen eine Grenzfunktion f : D → W , wenn für jede Stelle x ∈ D die folgende
Aussage wahr ist: Zu jeder positiven Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so
dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N
gilt. Die punktweise Konvergenz einer Funktionenfolge auf wird also über die Konvergenz
der Funktionswerte ihrer Glieder auf der Menge D definiert.
Als nächstes führen wir den Begriff des Konvergenzbereiches einer Funktionenfolge ein.
Definition (Konvergenzbereich). Sei X eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei (fn )n∈N eine Funktionenfolge von X nach W . Sei außerdem
D ⊆ X eine nichtleere Menge, so dass (fn )n∈N auf punktweise konvergent auf D und
divergent auf jeder Teilmenge von X \ D ist. Dann heißt D der Konvergenzbereich von
(fn )n∈N .
Der Konvergenzbereich einer Funktionenfolge ist also die größtmögliche Teilmenge des
Definitionsbereichs, auf der die Funktionenfolge punktweise konvergent ist. Im folgenden
geben wir einige Beispiele für Funktionenfolgen und deren Konvergenzbereiche an.
Beispiele.
√
(a) Die Funktionenfolge (fn )n∈N von R nach R, welche durch fn (x) := x2 − x/ n + 1/n
für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen
die Grenzfunktion f : R → R, welche durch f (x) := x2 für alle x ∈ R definiert ist.
Der Konvergenzbereich der Funktionenfolge ist also R.
(b) Die Funktionenfolge (pn )n∈N von [0, ∞] nach R, welche durch pn (x) := xn für alle
x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise im Intervall [0, 1] gegen
die Grenzfunktion p : [0, 1] → R, welche durch
(
0 falls x ∈ [0, 1),
p(x) :=
1 falls x = 1
4.4. PUNKTWEISE KONVERGENZ VON FUNKTIONENFOLGEN
89
für alle x ∈ [0, 1] definiert ist (siehe auch Abbildung 4.2). Für jede reelle Zahl x > 1
divergiert die Folge (pn (x))n∈N bestimmt gegen ∞. Das Intervall [0, 1] ist demnach
Konvergenzbereich der Funktionenfolge (pn )n∈N .
(c) Die Funktionenfolge (hn )n∈N von R nach R, welche durch
(
1 falls x ∈ [n − 1, n],
hn (x) :=
0 sonst
für alle x ∈ R und alle n ∈ N definiert ist, konvergiert punktweise auf ganz R gegen
die Nullfunktion auf R. Wählt man nämlich eine beliebige Stelle x ∈ R aus, so gilt
offenbar hn (x) = 0 für alle n ≥ dxe + 1. Der Konvergenzbereich der Funktionenfolge
(hn )n∈N ist also R, und die Grenzfunktion h : R → R ist durch h(x) = 0 für alle
x ∈ R gegeben.
♦
Übungsaufgaben
1. Die Funktionenfolgen (sn )n∈N und (cn )n∈N von [0, 2π] nach R seien durch sn (x) := sin(nx)
und cn (x) := cos(nx) für alle x ∈ [0, 2π] und alle n ∈ N definiert. Skizzieren Sie die Graphen
der ersten drei Glieder beider Funktionenfolgen.
2. Die Funktionenfolge von R nach R der so genannten Legendre–Polynome (Pn )∞
n=0 ist rekursiv
durch P0 (x) := 1, P1 (x) := x und nPn (x) := (2n − 1)xPn−1 (x) − (n − 1)Pn−2 (x) für alle
x ∈ R und alle n ∈ N mit n ≥ 2 definiert. Geben Sie die Polynome P2 , P3 und P4 dieser
Funktionenfolge an.
3. Bestimmen Sie den Konvergenzbereich der Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und
(rn )n∈N von R nach R, und geben Sie die jeweilige Grenzfunktion an. Die Funktionenfolgen
sind durch
fn : R → R, x 7→ nx/(n + 1),
p
gn : R → R, x 7→ n |x|,
hn : R → R, x 7→ (2x)n + 1,
(
n/2 falls x ∈ [−1/n, 1/n],
rn : R → R, x 7→
0
sonst
für alle n ∈ N definiert.
4. Die Funktionenfolge (fn )∞
n=0 von R nach R ist rekursiv durch f0 (x) := 1 und fn (x) :=
fn−1 (x) + xn für alle x ∈ R und alle n ∈ N definiert. Geben Sie den Konvergenzbereich und
die Grenzfunktion dieser Funktionenfolge an.
90
4.5
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Gleichmäßige Konvergenz von Funktionenfolgen
Im voran gegangenen Abschnitt haben wir die punktweise Konvergenz bei Funktionenfolgen kennen gelernt. Neben diesem Konvergenzbegriff gibt es bei Funktionenfolgen noch
den Begriff der gleichmäßigen Konvergenz, den wir im folgenden einführen.
Definition (gleichmäßige Konvergenz). Seien X und D ⊆ X zwei nichtleere Mengen,
und sei (W, k · k) ein normierter Raum über K. Eine Funktionenfolge (fn )n∈N von X nach
W heißt gleichmäßig konvergent auf D, wenn eine Funktion f : D → W existiert, so dass
folgendes gilt: Für jede positive Zahl ε > 0 existiert eine natürliche Zahl N ∈ N, so dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N und für alle x ∈ D
gilt.
Das nachfolgende Lemma besagt, dass die gleichmäßige Konvergenz stets auch die punktweise Konvergenz einer Funktionenfolge impliziert. Gleichmäßige Konvergenz ist also eine
stärkere“ Eigenschaft als punktweise Konvergenz.
”
Lemma 4.19. Jede Funktionenfolge, die auf einer bestimmten Menge gleichmäßig konvergent ist, ist auf derselben Menge auch punktweise konvergent.
Betrachtet man noch einmal die Definitionen für punktweise und gleichmäßige Konvergenz, so stellt man fest, dass eine Funktionenfolge (fn )n∈N genau dann punktweise bzw.
gleichmäßig auf einer Menge D gegen eine Grenzfunktion f konvergiert, wenn man für
jede Stelle x ∈ D und für jede positive Zahl ε > 0 eine natürliche Zahl N ∈ N wählen
kann, so dass
kfn (x) − f (x)k < ε
für alle n ∈ N mit n ≥ N gilt. Der wesentliche Unterschied besteht nun darin, dass man bei
gleichmäßiger Konvergenz die Zahl N unabhängig von der Stelle x wählen kann. Die Zahl
N ist bei gleichmäßiger Konvergenz also eine Funktion von ε. Bei punktweiser Konvergenz
ist die Zahl N hingegen eine Funktion von ε und x.
Will man gleichmäßige Konvergenz nachweisen, so ist die folgende Beobachtung hilfreich: Eine Funktionenfolge (fn )n∈N konvergiert gleichmäßig auf einer Menge D gegen eine
Grenzfunktion f , wenn der Abstand
kfn (x) − f (x)k
durch einen Ausdruck nach oben abgeschätzt werden kann, der von n, nicht aber von x abhängt, und für n → ∞ gegen Null konvergiert. Man betrachte dazu auch die nachfolgenden
Beispiele.
Beispiele.
(a) Die Funktionenfolge (fn )n∈N von R nach R, die durch fn (x) := x + sin(nx)/n für
alle x ∈ R und alle n ∈ N definiert ist, konvergiert gleichmäßig auf ganz R gegen die
Grenzfunktion f : R → R, welche durch f (x) := x für alle x ∈ R definiert ist. Es gilt
nämlich
|sin(nx)|
1
|fn (x) − f (x)| =
≤
n
n
für alle x ∈ R und alle n ∈ N. Es ist also möglich, zu jeder positive Zahl ε > 0 einen
Index N ∈ N zu wählen, so dass |fn (x) − f (x)| < 1/n < ε für alle n ∈ N mit n ≥ N
und alle x ∈ R gilt.
4.5. GLEICHMÄSSIGE KONVERGENZ VON FUNKTIONENFOLGEN
91
(b) Die Funktionenfolge (gn )n∈N von R nach R, die durch gn (x) := x/n für alle x ∈ R
und alle n ∈ N definiert ist, konvergiert auf jeder nichtleeren, beschränkten Menge
M ⊂ R gleichmäßig gegen die Nullfunktion g : M → R auf M , welche durch g(x) := 0
für alle x ∈ M definiert ist. Es gilt nämlich
|gn (x) − g(x)| =
|x|
1
≤ sup {|x| | x ∈ M }
n
n
für alle x ∈ M und alle n ∈ N. Man beachte hierbei, dass sup {|x| | x ∈ M } eine
reelle Zahl ist, die nicht von der Stelle x abhängt.
Im Rest dieses Abschnitts wollen wir einen weiteren Zugang zur gleichmäßigen Konvergenz
von Funktionenfolgen vorstellen. Dazu nehmen wir im folgenden an, dass D eine nichtleere
Menge und (W, k · k) ein normierter Raum über K ist.
Die Menge aller beschränkten Folgen von D nach W wird dann bekanntlich mit
B(D, W ) bezeichnet. Man zeigt leicht, dass die Menge B(D, W ) ein Vektorraum über
K ist. Die Menge B(D, W ) wird darüber hinaus zu einem normierten Raum über K, wenn
man sie mit der so genannten Supremumsnorm k · k∞,D : B(D, W ) → R versieht. Die
Supremumsnorm ist dabei durch
kf k∞,D := sup kf (x)k
x∈D
für alle f ∈ B(D, W ) definiert. Im normierten Raum (B(D, W ), k · k∞,D ) ist dann die
Konvergenz von Folgen in gewohnter Weise definiert: Eine Folge (fn )n∈N in B(D, W )
konvergiert genau dann gegen einen Grenzwert f ∈ B(D, W ), wenn für jede positive
Zahl ε > 0 eine natürliche Zahl N ∈ N existiert, so dass kfn − f k∞,D < ε für alle
n ∈ N mit n ≥ N gilt. Man beachte hierbei, dass die Folge (fn )n∈N eine Funktionenfolge
von D nach W ist. Daher stellt sich die Frage, inwieweit die Konvergenz im normierten
Raum (B(D, W ), k · k∞,D ) mit der punktweisen oder der gleichmäßigen Konvergenz auf
der Menge D zusammenhängen. Das nachfolgende Lemma gibt hierauf eine abschließende
Antwort.
Lemma 4.20. Sei D eine nichtleere Menge und (W, k · k) ein normierter Raum über K.
Eine Folge beschränkter Funktionen (fn )n∈N von D nach W konvergiert genau dann gleichmäßig auf D gegen eine Grenzfunktion f : D → W , wenn sie bezüglich der Supremumsnorm gegen f konvergiert, d.h. wenn für jede positive Zahl ε > 0 eine natürliche Zahl
N ∈ N existiert, so dass
kfn − f k∞,D < ε
für alle n ∈ N mit n ≥ N
gilt.
Betrachtet man die Aussage von Lemma 4.20 sowie die voran gegangenen Überlegungen,
so erkennt man, dass gleichmäßige Konvergenz verglichen mit punktweiser Konvergenz
der natürlichere“ Konvergenzbegriff für Funktionenfolgen ist. Die gleichmäßige Konver”
genz entspricht nämlich genau dem üblichen Konvergenzbegriff, den man für Folgen im
normierten Raum (B(D, W ), k · k∞,D ) hat.
92
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Übungsaufgaben
1. Bestimmen Sie für die Funktionenfolgen (fn )n∈N , (gn )n∈N , (hn )n∈N und (pn )n∈N von [0, 1]
nach R die jeweilige Grenzfunktion. Zeigen Sie außerdem, dass die Funktionenfolgen gleichmäßig auf [0, 1] gegen ihre Grenzfunktionen konvergieren. Die Funktionenfolgen sind durch
fn : [0, 1] → R, x 7→
x
,
x+n
r
1
,
n
n sin(πx) + cos(nπx)
hn : [0, 1] → R, x 7→
,
n
nx2
pn : [0, 1] → R, x 7→
nx + 1
gn : [0, 1] → R, x 7→
x+
für alle n ∈ N definiert.
2. Sei D eine nichtleere Menge, und sei (W, k · k) ein normierter Raum über K. Zeigen Sie dass
die Menge B(D, W ) aller beschränkten Funktionen von D nach W ein Vektorraum über K
ist.
3. Sei D eine nichtleere Menge, sei (W, k · k) ein normierter Raum über K, und sei B(D, W ) die
Menge aller beschränkten Funktionen von D nach W . Zeigen Sie, dass die Supremumsnorm
eine Norm auf B(D, W ) ist.
4.6. KONVERGENZ VON POTENZREIHEN
4.6
93
Konvergenz von Potenzreihen
Definition (Potenzreihe). Sei (an )∞
n=0 eine Folge in K. Dann heißt die Funktionenfolge
(fN )∞
von
K
nach
K,
deren
Glieder
gemäß
N =0
fN (v) :=
N
X
an (x − x0 )n = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N
n=0
für alle x ∈ V und alle N ∈ N definiert sind, die zur Folge (an )∞
n=0 gehörende Potenzreihe
auf K mit der Entwicklungsstelle x0 . Die Glieder der Folge (an )∞
n=0 werden die Koeffizienten der Potenzreihe genannt. Für jeden Index N ∈ N bezeichnet man die Funktion fN
als das N -te Partialpolynom der Potenzreihe. Die Potenzreihe selbst wird oft durch die
Schreibweise
∞
X
an (x − x0 )n
n=0
dargestellt, wobei man vereinbart, dass x die Variable der Potenzreihe sei. Es ist auch
üblich, eine Potenzreihe durch Angabe der ersten Terme als a0 +a1 (x−x0 )+a2 (x−x0 )2 +· · ·
darzustellen.
Wie der Begriff Partialpolynom bereits andeutet, ist jedes Glied fN einer Potenzreihe
(fN )∞
N =0 ein Polynom vom Grad N . Dies erkennt man besonders gut, wenn die Entwicklungsstelle der Potenzreihe der Nullvektor ist. Die Potenzreihe ist dann nämlich von der
Form
∞
X
an xn ,
n=0
wobei x die Variable der Potenzreihe bezeichnet. Für jede Zahl N ∈ N0 ist das N -te
Partialpolynom der Potenzreihe dann durch
N
X
an xn = a0 + a1 x + a2 x2 + · · · + aN xN
n=0
gegeben. Es sollte noch erwähnt werden, dass der Begriff Partialpolynom in der mathematischen Fachliteratur keineswegs üblich ist. Wir verwenden ihn dennoch, da er deutlich
macht, dass eine Potenzreihe im wesentlichen eine Folge von Polynomen ist.
Wie bei allen Funktionenfolgen stellt sich auch bei Potenzreihen die Frage nach Konvergenzbereichen. Der nachfolgende Satz macht dazu eine erste Aussage.
Satz 4.21. Sei
P∞
n=0 an (x
− x0 )n eine Potenzreihe auf K mit der Variable x, so dass
lim
n→∞
p
n
|an | = 0
gilt. Dann konvergiert die Potenzreihe punktweise auf ganz K.
Das nachfolgende Beispiel verdeutlicht die Anwendung von Satz 4.21. Darüber hinaus
liefert es eine wichtige Darstellung der Exponentialfunktion x 7→ ex .
94
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
Beispiel (Die Exponentialfunktion). Wir betrachten die Potenzreihe
∞
X
xn
n=0
n!
=1+x+
x2 x3
+
+ ···
2!
3!
auf R mit der Variable x. Die Entwicklungsstelle dieser Potenzreihe ist die Zahl Null, und
die Folge der Koeffizienten lautet (1/n!)∞
n=0 . Unser Ziel ist es zu zeigen, dass die Potenzreihe
auf ganz R punktweise konvergiert. Dazu untersuchen wir zunächst die Zahlenfolge (cn )n∈N ,
welche durch cn := nn /(n!en ) für alle n ∈ N definiert ist. Man rechnet leicht nach, dass
cn+1
1
1 n 1
1 n e
=
1+
≤ lim 1 +
= =1
cn
e
n
e n→∞
n
e
für alle n ∈ N gilt. Die Folge (cn )n∈N ist also monoton fallend. Daher gilt insbesondere
c1 ≥ cn für alle n ∈ N. Da außerdem 1 ≥ c1 gilt, erhält man 1 ≥ cn für alle n ∈ N. Durch
Umformung der letzten Ungleichung erhält man die Abschätzung
n
n
n! ≥
e
√
für
alle n ∈ N. Entsprechend gilt n n! ≥ n/e für alle n ∈ N, woraus folgt, dass die Folge
√
( n n!)n∈N gegen ∞ bestimmt divergiert. Man erhält daher
s 1
1
lim n = lim √
= 0.
n
n→∞
n→∞
n!
n!
Nach Satz 4.21 konvergiert die Potenzreihe also punktweise auf ganz R. Die Grenzfunktion
ist dabei die Exponentialfunktion exp : R → R, welche durch exp(x) := ex für alle x ∈ R
definiert ist.
♦
Im Allgemeinen ist der Konvergenzbereich einer Potenzreihe auf K eine echte Teilmenge
von K. Man überlegt sich leicht, dass jede Potenzreihe an ihrer Entwicklungsstelle gegen
Null konvergiert. Daher ist die Entwicklungsstelle immer ein Element des Konvergenzbereichs. Mit Hilfe des nachfolgenden Satzes lässt sich darüber hinaus eine Teilmenge des
Konvergenzbereichs angeben.
P
n
Satz 4.22. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf K mit der Variable x. Sei außerdem
s > 0 eine positive Zahl mit der Eigenschaft, dass eine natürliche Zahl N ∈ N existiert, so
dass
p
n
|an | ≤ s für alle n ∈ N mit n ≥ N
gilt. Dann konvergiert die Potenzreihe punktweise auf der offenen Kugel Br (x0 ) in K,
wobei r := 1/s gilt.
Die Anwendung von Satz 4.22 wird im nachfolgenden Beispiel verdeutlicht.
Beispiel. Wir betrachten die Potenzreihe
∞
X
n + (−1)n
n=0
n+2
(x − 2)n
4.6. KONVERGENZ VON POTENZREIHEN
95
in R mit der Variable x und der Entwicklungsstelle 2. Offenbar gilt
s
r
n
√
n
n n + 1
n n + (−1) ≤ 1≤1
n+2 ≤
n+2
für alle n ∈ N. Nach Satz 4.22 konvergiert die Potenzreihe also punktweise auf dem Intervall
(1, 3) = B1 (2).
♦
Satz 4.22 legt nahe, dass der Konvergenzbereich einer Potenzreihe stets die Obermenge
einer offenen Kugel ist. Der Mittelpunkt der Kugel ist dabei durch die Entwicklungsstelle
der Potenzreihe gegeben. Der Radius der Kugel hängt von der Rate ab, mit der die Absolutbeträge der Koeffizienten der Potenzreihe gegen Null konvergieren. Man kann zeigen,
dass für jede Potenzreihe auf K, die nicht auf ganz K konvergiert, eine größte offene Kugel
existiert, auf der die Potenzreihe punktweise konvergiert. Der Radius dieser Kugel wird
der Konvergenzradius der Potenzreihe genannt.
P
n
Definition (Konvergenzradius). Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf K mit der
Variable x. Eine positive Zahl R > 0 wird der Konvergenzradius der Potenzreihe genannt,
wenn die Potenzreihe auf der offenen Kugel BR (x0 ) in K punktweise konvergiert, und auf
jeder Teilmenge von K \ BR (x0 ) divergiert. Falls die Potenzreihe auf ganz K punktweise
konvergiert, sagt man, dass ihr Konvergenzradius ∞ sei.
Wie der nachfolgende Satz zeigt, kann der Konvergenzradius bestimmter Potenzreihen auf
K, die nicht auf ganz K punktweise konvergieren, explizit berechnet werden.
Satz 4.23. Sei
P∞
n=0 an (x
− x0 )n eine Potenzreihe auf K mit der Variable x, so dass
p
S := lim n |an | > 0
n→∞
gilt. Dann ist R := 1/S der Konvergenzradius der Potenzreihe.
Die Anwendung des Satzes 4.23 wird im nachfolgenden Beispiel demonstriert.
Beispiel. Betrachtet man die Koeffizienten der Potenzreihe
∞
X
n3n (x − 1)n
n=0
in R mit der Variable x und der Entwicklungsstelle 1, so stellt man fest, dass
p
√
lim n |n3n | = lim 3 n n = 3
n→∞
n→∞
gilt. Nach Satz 4.23 konvergiert die Potenzreihe also punktweise auf dem offenen Intervall
(2/3, 4/3) = B1/3 (1) und divergiert außerhalb des abgeschlossenen Intervalls [2/3, 4/3]. ♦
Mit Hilfe von Potenzreihen werden eine Reihe wichtiger Funktionen in der Mathematik
definiert. Wir haben bereits gesehen, dass die Exponentialfunktion exp : R → R, x 7→ ex
als Grenzfunktion der Potenzreihe
∞
X
xn
n=0
n!
definiert werden kann. Nachfolgend geben wir weitere wichtige Beispiele für Potenzreihen
an, deren Grenzfunktionen explizit bekannt sind.
96
KAPITEL 4. KONVERGENZBEGRIFFE UND KONVERGENZKRITERIEN
(b)
(a)
Abbildung 4.3: (a) Die Graphen der Funktionen Sinus Hyperbolicus und Cosinus
Hyperbolicus. (b)
der Funktion Logarithmus Naturalis. Der Konvergenzbereich
PGraph
∞
der Potenzreihe n=1 (−1)n+1 (x − 1)n /n ist grau dargestellt.
Beispiele.
(a) Die Sinusfunktion sin : R → R ist die Grenzfunktion der Potenzreihe
∞
X
(−1)n
x3 x5 x7
x2n+1 = x −
+
−
± ···
(2n + 1)!
3!
5!
7!
n=0
auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass
sin(0) = 0 gilt.
(b) Die Cosinusfunktion cos : R → R ist die Grenzfunktion der Potenzreihe
∞
X
(−1)n
n=0
(2n)!
x2n = 1 −
x2 x4 x6
+
−
± ···
2!
4!
6!
auf R mit der Variable x. Anhand der Potenzreihe erkennt man insbesondere, dass
cos(0) = 1 gilt.
(c) Die so genannte hyperbolische Sinusfunktion sinh : R → R, welche auch Sinus Hyperbolicus genannt wird, ist durch
ex − e−x
2
für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Man kann zeigen, dass der
Sinus Hyperbolicus die Grenzfunktion der Potenzreihe
sinh(x) :=
∞
X
x2n+1
x3 x5 x7
=x+
+
+
+ ···
(2n + 1)!
3!
5!
7!
n=0
auf R mit der Variable x ist.
(d) Die so genannte hyperbolische Cosinusfunktion cosh : R → R, welche auch Cosinus
Hyperbolicus genannt wird, ist durch
ex + e−x
2
für alle x ∈ R definiert (siehe auch Abbildung 4.3(a)). Der Cosinus Hyperbolicus ist
die Grenzfunktion der Potenzreihe
∞
X
x2n
x2 x4 x6
=1+
+
+
+ ···
(2n)!
2!
4!
6!
cosh(x) :=
n=0
auf R mit der Variable x.
4.6. KONVERGENZ VON POTENZREIHEN
97
(e) Die Potenzreihe
n
X
(−1)n+1
n
n=1
1
1
1
(x − 1)n = (x − 1) − (x − 1)2 + (x − 1)3 − (x − 1)4 ± · · ·
2
3
4
mit der Variable x konvergiert punktweise auf dem Intervall (0, 2] gegen den Logarithmus Naturalis, also gegen die Funktion f : (0, 2] → R, welche duch f (x) := ln(x)
für alle x ∈ (0, 2] definiert ist (siehe auch Abbildung 4.3(b)).
♦
Mit Hilfe der Potenzreihendarstellungen der Sinusfunktion, der Cosinusfunktion und der
Exponentialfunktion kann man sehr leicht die Eulersche Formel
eix = cos(x) + i sin(x)
für alle x ∈ R nachweisen. Es gilt nämlich
eix =
=
∞
X
(ix)n
n=0
∞ X
k=0
=
n!
(ix)2k+1
(ix)2k
+
(2k)!
(2k + 1)!
∞
X
(ix)2k+1
+
(2k)!
(2k + 1)!
∞
X
(ix)2k
k=0
k=0
∞
∞
X
(i2 )k 2k X i(i2 )k 2k+1
x +
x
=
(2k)!
(2k + 1)!
k=0
=
∞
X
(−1)k
k=0
(2k)!
k=0
∞
X
x2k + i
k=0
(−1)k 2k+1
x
(2k + 1)!
= cos(x) + i sin(x).
Desweiteren kann man die die Potenzreihendarstellungen verwenden, um beispielsweise die
Exponentialfunktion auf normierten Algebren zu definieren.
Übungsaufgaben
1. Bestimmen Sie die Konvergenzradien der folgenden Potenzreihen auf R.
!
n
n2
∞
∞ ∞
∞ ∞
n
X
X
X
X
X
X
1
n2 n
1
1
n n
n
n
2 x ,
1+
x ,
x ,
x ,
xn .
1−
n
n!
n
k
n=1
n=1
n=0
n=1
n=0
k=1
Hierbei bezeichnet x jeweils die Variable der Potenzreihe.
2. Bestimmen Sie für jede der nachfolgend angegebenen Potenzreihen auf R eine möglichst
große Zahl r > 0, so dass die jeweilige Potenzreihe auf dem Intervall (−r, r) punktweise
konvergiert.
∞
X
n=0
2n cos(n)xn ,
∞
X
n=0
4n + (−1)n xn ,
∞
X
x2n ,
n=0
∞
X
sin(n) cos(n)xn .
n=0
Hierbei bezeichnet x jeweils die Variable der Potenzreihe.
3. Weisen Sie mit Hilfe der Potenzreihendarstellungen der hyperbolischen Sinusfunktion, der
hyperbolischen Cosinusfunktion und der Exponentialfunktion die Formel ex = cosh(x) +
sinh(x) nach. Die Formel folgt übrigens direkt aus der Definition von sinh und cosh.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... die folgenden Kriterien für die Konvergenz einer reellen Zahlenfolgen kennen: Das
Cauchy–Kriterium, das Sandwichtheorem und das Monotoniekriterium.
... wissen, was eine Reihe ist.
... wissen, was man unter einer konvergenten und unter einer absolut konvergenten Reihe
versteht.
... den Grenzwert der geometrischen Reihe zu einer komplexen Zahl q ∈ C mit |q| < 1
berechnen können.
... das Leibniz–Kriterium für die Konvergenz und das Minorantenkriterium für die Divergenz einer Reihe kennen.
... wissen, dass die harmonische Reihe divergent ist.
... sie folgenden Kriterien für die absolute Konvergenz einer Reihe kennen und anwenden
können: Das Majorantenkriterium, das Wurzelkriterium und das Quotientenkriterium.
... wissen, was eine Funktionenfolge ist.
... wissen, was man unter einer punktweise konvergenten und unter einer gleichmäßig
konvergenten Funktionenfolge versteht.
... wissen, was der Konvergenzbereich einer Funktionenfolge ist.
... wissen, was eine Potenzreihe ist.
... wissen, was man unter dem Konvergenzradius einer Potenzreihe versteht.
... den Konvergenzradius einer Potenzreihe bestimmen können, falls dies möglich ist.
... die Potenzreihen der Exponentialfunktion, der Sinusfunktion und der Cosinusfunktion kennen.
98
Kapitel 5
Stetige Funktionen
5.1
Grenzwerte von Funktionen
In diesem Abschnitt soll der Grenzwertbegriff auf Funktionen erweitert werden. Im Unterschied zu den Gliedern einer Folge sind die Funktionswerte einer Funktion im Allgemeinen
nicht durch Indizes in aufsteigender Folge angeordnet. Daher muss man einen anderen
Zugang wählen, um den Grenzwert einer Funktion zu definieren.
Definition (Grenzwert einer Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses
dieser Menge, und sei f : D → W eine Funktion. Ein Vektor w0 ∈ W wird der Grenzwert
von f in v0 genannt, wenn für jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert,
so dass
kf (v) − w0 kW < ε für alle v ∈ (Bδ (v0 ) ∩ D) \ {v0 }
gilt. Man schreibt dann
lim f (v) = w0
v→v0
oder auch f (v) → w0 (v → v0 ).
Anschaulich gesprochen ist ein Element w0 ∈ W genau dann Grenzwert einer Funktion
f : D → W im Punkt v0 ∈ D, wenn folgendes gilt: Wenn sich ein Punkt v ∈ D dem Punkt
v0 immer weiter annähert, ohne dabei die Definitionsmenge D zu verlassen, dann nähern
sich die zugehörigen Funktionswerte f (v) dem Wert w0 immer weiter an. Zu beachten ist,
dass der Grenzwert w0 selbst kein Funktionswert von f sein muss. Die Funktion f muss an
der Stelle v0 nicht einmal definiert sein. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : [0, 1) → R, welche durch f (x) = (x2 − 1)/(x − 1)
für alle x ∈ (0, 1) definiert ist. Es gilt
lim f (x) = 2.
x→1
Für alle x ∈ [0, 1) gilt nämlich
2
f (x) − 2 = x − 1 − 2 = (x + 1)(x − 1) − 2 = |(x + 1) − 2| = |x − 1|.
x−1
x−1
Ist ε > 0 vorgegeben, so wählt man δ = ε. Für alle x ∈ (Bδ (1)∩[0, 1))\{1} ⊆ (1−δ, 1)
gilt dann |x − 1| < δ und somit |f (x) − 2| < ε. Man beachte, dass die Funktion f an
der Stelle x = 1 nicht definiert ist, da dort x − 1 = 0 gilt.
99
100
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.1: Eine Funktion f : D → W besitzt in v0 ∈ D den Grenzwert w0 , wenn
für alle ε > 0 ein δ > 0 existiert, so dass das Bild von (Bδ (v0 ) ∩ D) \ {v0 } unter f eine
Teilmenge von Bε (w0 ) ist.
(b) Die Funktion g : R → R sei durch
(
x2
g(x) =
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert. Es gilt
lim g(x) = 0.
x→0
√
Ist nämlich eine positive Zahl ε > 0 vorgegeben, so kann man beispielsweise δ = ε
wählen. Für alle x ∈ (Bδ (0) ∩ R) \ {0} = (−δ, 0) ∪ (0, δ) gilt dann die Abschätzung
|g(x) − 0| = |x2 | < δ 2 = ε. Man beachte, dass der Grenzwert der Funktion g in
x = 0 nicht mit dem Funktionswert von g an der Stelle x = 0 übereinstimmt. Der
Grenzwert ist nämlich 0, wie wir gezeigt haben, und der Funktionswert ist 1.
Lässt sich der Grenzwertbegriff für Funktionen auf den Grenzwertbegriff für Folgen zurückführen? In gewisser Weise ja. Man betrachte dazu das nachfolgende Lemma.
Lemma 5.1. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge, sei v0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W ist genau dann Grenzwert von f in v0 , wenn für jede
gegen v0 konvergente Folge (vn )n∈N in D \ {v0 } die Folge der Funktionswerte (f (vn ))n∈N
gegen w0 konvergiert.
Mit Hilfe von Lemma 5.1, sowie den Sätzen 2.4 und 2.5 kann man leicht zeigen, dass die
folgenden Rechenregeln für Funktionsgrenzwerte gelten.
Satz 5.2. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge und sei v0 ∈ D ein Punkt des Abschlusses von D. Seien außerdem
f : D → W , g : D → W und α : D → W Funktionen, welche einen Grenzwert in v0
besitzen. Dann gilt
(1) lim f (v) + g(v) = lim f (v) + lim g(v).
v→v0
(2) lim α(v)f (v) =
v→v0
v→v0
v→v0
lim α(v) lim f (v) .
v→v0
v→v0
Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem
(3) lim f (v)g(v) = lim f (v) lim g(v) .
v→v0
v→v0
v→v0
5.1. GRENZWERTE VON FUNKTIONEN
101
(b)
(a)
Abbildung 5.2: (a) Graph der Funktion f : R → R \ {0}, x 7→ sin(x)/x. (b) Graph
der Heaviside–Funktion.
Satz 5.3. Sei (V, k · k) ein normierter Raum über K, sei D eine nichtleere Menge und sei
v0 ∈ D ein Punkt des Abschlusses von D. Sei ferner f : V → K \ {0} eine Funktion, welche
einen Grenzwert in v0 besitzt, der von Null verschieden ist. Dann gilt
lim
v→v0
1
1
=
.
f (v)
lim f (v)
v→v0
Für die Bestimmung von Funktionsgrenzwerten ist es oft hilfreich, die Potenzreihendarstellungen bestimmter Funktionen zu kennen. Dies ist insbesondere dann der Fall, wenn
eine Funktion in Abhängigkeit der Sinus-, Cosinus- oder Exponentialfunktion definiert ist.
Man betrachte hierzu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) = sin(x)/x für alle
x ∈ R \ {0} definiert ist (siehe auch Abbildung 5.2(a)). Mit der Potenzreihendarstellung der Sinusfunktion ergibt sich
x3 x5 x7
x2 x4 x6
1
x−
+
−
± ··· = 1 −
+
−
± ···
f (x) =
x
3!
5!
7!
3!
5!
7!
Anhand dieser Darstellung von f als Potenzreihe erkennt man, dass
lim f (x) = 1
x→0
gilt. Setzt man nämlich in der Potenzreihendarstellung für x die Zahl 0 ein, so verschwinden alle Potenzen von x, und es bleibt lediglich die Zahl 1 stehen.
(b) Gegeben sei die Funktion g : R\{1} → R, definiert durch g(x) = (x−1)/ ln(x) für alle
x ∈ R \ {1}. Mit der Potenzreihendarstellung der natürlichen Logarithmusfunktion
erhält man
1
1
(x − 1)2 (x − 1)3
x − 1 (x − 1)2
=
(x − 1) −
+
∓ ··· = 1 −
+
∓ ···
g(x)
x−1
2
3
2
3
Demnach gilt
lim g(x) =
x→1
1
lim
x→1 g(x)
−1
= 1.
In der Potenzreihendarstellung der Funktion 1/g verschwinden nämlich die Potenzen
von (x − 1), wenn man für x die Zahl 1 einsetzt.
♦
102
KAPITEL 5. STETIGE FUNKTIONEN
Für Funktionen, die auf Teilmengen der reellen Zahlen definiert sind, betrachtet man
gelegentlich so genannte einseitige Grenzwerte. Je nachdem, ob man sich von links“ oder
”
von rechts“ dem Punkt annähert, an dem der Grenzwert bestimmt werden soll, spricht
”
man von linksseitigen bzw. rechtsseitigen Grenzwerten.
Definition (linksseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R
eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W heißt linksseitiger Grenzwert von f in x0 , wenn für
jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (x0 − δ, x0 ) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→x0 −
oder auch f (x) → w0 (x → x0 −).
Definition (rechtsseitiger Grenzwert). Sei (W, k · k) ein normierter Raum, sei D ⊂ R
eine nichtleere Menge, sei x0 ∈ D ein Punkt des Abschlusses von D, und sei f : D → W
eine Funktion. Ein Vektor w0 ∈ W heißt rechtsseitiger Grenzwert von f in x0 , wenn für
jede positive Zahl ε > 0 eine positive Zahl δ > 0 existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (x0 , x0 + δ) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→x0 +
oder auch f (x) → w0 (x → x0 +).
Der linksseitige und der rechtsseitige Grenzwert einer Funktion f an einem gegebenen
Punkt x ∈ R können verschieden sein. Es kann auch vorkommen, dass einer der beiden
einseitigen Grenzwerte existiert, während der andere Grenzwert nicht existiert. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Wir betrachten die Funktion f : R \ {0} → R, welche durch f (x) := xsgn(x) für alle
x ∈ R\{0} definiert ist. Gesucht sind die einseitigen Grenzwerte von f in 0. Offenbar
gilt f (x) = x−1 = 1/x = −1/|x| für alle x < 0. Daher erhält man
lim f (x) = −∞.
x→0−
Der linksseitige Grenzwert von f in 0 existiert also nicht. Für x > 0 erhält man
hingegen f (x) = x1 = x = |x|. Daher gilt
lim f (x) = 0.
x→0+
(b) Die so genannte Heaviside–Funktion H : R → R ist durch
(
0 falls x < 0,
H(x) :=
1 falls x ≥ 0
5.1. GRENZWERTE VON FUNKTIONEN
103
für alle x ∈ R definiert (siehe auch Abbildung 5.2(b)). Man erkennt leicht, dass
lim H(x) = 0,
x→0−
sowie
lim H(x) = 1
x→0+
gilt. Die Heaviside–Funktion besitzt also an der Stelle 0 unterschiedliche links- und
rechtsseitige Grenzwerte.
♦
Existiert für eine Funktion f , die auf einer Teilmenge von R definiert ist, der Grenzwert
an einer Stelle x0 , so existieren auch der linksseitige und der rechtsseitige Grenzwert von
f in x0 , und es gilt
lim f (x) = lim f (x) = lim f (x).
x→x0
x→x0 −
x→x0 +
Existiert einer der beiden einseitigen Grenzwerte nicht, oder gilt
lim f (x) 6= lim f (x),
x→x0 +
x→x0 −
dann existiert kein Grenzwert von f in x0 .
Bei Funktionen, die auf unbeschränkten Teilmengen von R definiert sind, interessiert
man sich gelegentlich für das Verhalten sehr weit links bzw. sehr weit rechts vom Ursprung.
Man untersucht dann das Konvergenzverhalten solcher Funktionen, wenn deren Argument
gegen −∞ bzw. gegen ∞ strebt.
Definition (Grenzwert gegen −∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine
Menge, die nicht nach unten beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor
w0 ∈ W wird der Grenzwert von f gegen −∞ genannt, wenn für jede positive Zahl ε > 0
eine reelle Zahl R ∈ R existiert, so dass
kf (x) − w0 k < ε für alle x ∈ (−∞, R] ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→−∞
oder auch f (x) → w0 (x → −∞).
Definition (Grenzwert gegen ∞). Sei (W, k · k) ein normierter Raum, sei D ⊂ R eine
Menge, die nicht nach oben beschränkt ist, und sei f : D → W eine Funktion. Ein Vektor
w0 ∈ W wird der Grenzwert von f gegen ∞ genannt, wenn für jede positive Zahl ε > 0
eine reelle Zahl R ∈ R existiert, so dass
kf (x) − w0 k < ε für alle x ∈ [R, ∞) ∩ D
gilt. Man schreibt dann
lim f (x) = w0
x→∞
oder auch f (x) → w0 (x → ∞).
Man betrachte die nachfolgenden Beispiele.
104
KAPITEL 5. STETIGE FUNKTIONEN
Beispiele.
(a) Wir betrachten die Funktion f : R → R, welche durch f (x) := (3x2 + 2x + 1)/(4x2 +
x + 2) für alle x ∈ R definiert ist. Es gilt dann
3+
3x2 + 2x + 1
lim f (x) = lim
= lim
x→∞
x→∞ 4x2 + x + 2
x→∞ 4 +
2
x
1
x
+
+
1
x2
2
x2
3
= .
4
(b) Sei p : R → R irgendein Polynom. Dann gilt
p(x)
= 0.
x→∞ ex
lim
Die Exponentialfunktion wächst also stärker als jedes Polynom, wenn ihr Argument
gegen ∞. Außerdem gilt
lim p(x)ex = 0.
x→−∞
Die Exponentialfunktion dominiert also auch hier das Konvergenzverhalten.
♦
Ist D eine Teilmenge von R, welche nicht nach oben beschränkt ist, ist f : D → R eine
reellwertige Funktion, und ist y0 ∈ R eine reelle Zahl, dann ist die Aussage
lim f (x) = y0
x→∞
gleichbedeutend damit, dass die Gerade {(x, y)T ∈ R2 | y = y0 } waagrechte Asymptote für
den Funktionsgraphen von f ist, wenn x gegen ∞ strebt.
Übungsaufgaben
1. Bestimmen Sie die folgenden Grenzwerte:
1 − x2
1
x3 + 6x2 + 11x + 6
lim
,
lim x sin
,
lim
,
x→−1 3x + 3
x→0
x→−2
x
x2 + x − 2
√
lim
x→0
2x + 1 −
x
√
x+1
.
2. Bestimmen Sie die folgenden Grenzwerte:
ex − cos(x)
,
x→0
x
lim
lim
x→1
2 ln(x)
,
x−1
lim
x→0
1 − cos(x)
,
x2
lim
x→0
2x
.
e2x − 1
Verwenden Sie Potenzreihendarstellungen, wo dies möglich ist.
3. Untersuchen Sie, ob für die folgenden Funktionen ein links- bzw. rechtsseitiger Grenzwert in
x0 = 0 existiert, und bestimmen Sie diesen gegebenenfalls:
x
f1 : R → R, x 7→ p ,
|x|
f2 : R → R, x 7→ bxc − 2x,
bxc
,
x
|x| sin(x)
f4 : R → R, x 7→
.
x2
f3 : R → R, x 7→
4. Bestimmen Sie die nachfolgenden Grenzwerte
3x3 + 4x2 + 5
,
x→∞ 1 + 10x − 7x2
lim
lim (x10 + 4x2 ) e−x ,
x→∞
x5 + 4x3 + 8
,
x→−∞ 2x7 − 4x6 + 13
lim
sin(x)
.
x→∞
x
lim
5.2. STETIGKEIT
5.2
105
Stetigkeit
In diesem Abschnitt führen wir den wichtigen Begriff der Stetigkeit für Funktionen ein.
Wie sich zeigen wird, ist dieser Begriff eng mit dem Grenzwertbegriff für Funktionen
verbunden.
Definition (stetige Funktion). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume
über K, sei D ⊆ V eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine
Funktion f : D → W heißt stetig an der Stelle v0 , wenn für jede positive Zahl ε > 0 eine
positive Zahl δ > 0 existiert, so dass
kf (v) − f (v0 )kW < ε für alle v ∈ Bδ (v0 ) ∩ D
gilt. Hierbei bezeichnet Bδ (v0 ) die offene Kugel in V mit Mittelpunkt v0 und Radius δ.
Die Funktion heißt stetig, wenn sie an jeder Stelle in D stetig ist. Die Menge aller stetigen
Funktionen von D nach W wird mit C(D, W ) bezeichnet. Falls W = R gilt, bezeichnet
man diese Menge auch mit C(D).
Nachfolgend geben wir einige einfache Beispiele für stetige Funktionen an.
Beispiele.
(a) Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine
nichtleere Menge. Dann ist jede konstante Funktion von D nach W stetig.
(b) Sei (V, k · k) ein normierter Raum über K. Dann ist die identische Funktion auf V
stetig. Die identische Funktion idV : V → V auf V ist bekanntlich durch idV (v) := v
für alle v ∈ V definiert.
(c) Die Exponentialfunktion und der natürliche Logarithmus sind stetige Funktionen von
R nach R bzw. von (0, ∞) nach R.
(d) Die Sinusfunktion und die Cosinusfunktion sind stetige Funktionen von R nach R.
Die Tangensfunktion ist an jeder Stelle ihres Definitionsbereichs stetig.
(e) Jede lineare Abbildung von Km nach Kn , wobei m ∈ N und n ∈ N zwei natürliche
Zahlen sind, ist stetig.
Betrachtet man die Definition für die Stetigkeit einer Funktion f an einer Stelle v0 genauer, so erkennt man, dass diese große Ähnlichkeit mit der Definition des Grenzwertes
von f in v0 hat. Tatsächlich kann man die Stetigkeit einer Funktion auch mit Hilfe von
Funktionsgrenzwerten charakterisieren, wie das nachfolgende Lemma zeigt.
Lemma 5.4. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V
eine nichtleere Menge, und sei v0 ∈ D ein Punkt dieser Menge. Eine Funktion f : D → W
ist genau dann stetig an der Stelle v0 , wenn
lim f (v) = f (v0 )
v→v0
gilt.
106
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.3: Eine Funktion f : D → W ist an einer Stelle v0 ∈ D stetig, wenn für
alle ε > 0 ein δ > 0 existiert, so dass das Bild von Bδ (v0 ) ∩ D unter f eine Teilmenge
von Bε (f (v0 )) ist.
Gemäß Lemma 5.4 ist eine Funktion f also genau dann an einer Stelle v0 ihres Definitionsbereichs stetig, wenn der Grenzwert von f in v0 mit dem Funktionswert von f in
v0 übereinstimmt. Mit diesem Prinzip kann man sehr leicht die Stetigkeit einer Funktion
zeigen bzw. widerlegen. Man betrachte dazu auch die folgenden Beispiele.
Beispiele.
√
(a) Die Quadratwurzelfunktion · : [0, ∞) → R ist stetig. Ist nämlich x0 > 0 eine
beliebige Stelle, so erhält man
√
|x − x0 |
0 f (x) − f (x0 ) = x − √x0 = √x − x
x + √x0 ≤ √x0
für alle x ∈ R. Daher gilt
lim f (x) − f (x0 ) = 0,
x→x0
d.h. der Funktionswert f (x0 ) ist auch der Grenzwert von f in x0 . Für x0 = 0 lässt
sich dies ebenfalls zeigen.
(b) Die Funktion sinc : R → R, welche durch
(
sin(x)/x
sinc(x) :=
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert ist, wird Sinus Cardinalis genannt. Sie ist an der Stelle x0 = 0
stetig, da
sin(x)
lim sinc(x) = lim
= 1 = sinc(0)
x→0
x→0
x
gilt. An allen übrigen Stellen ist sinc ebenfalls stetig.
(c) Die Funktion f : R → R, welche durch
(
x2
f (x) :=
1
falls x 6= 0,
falls x = 0
für alle x ∈ R definiert ist, ist an der Stelle x0 = 0 nicht stetig. Es gilt nämlich
lim f (x) = lim x2 = 0 6= 1 = f (0).
x→0
x→0
An allen übrigen Stellen ist die Funktion f jedoch stetig.
♦
5.2. STETIGKEIT
107
Bei Funktionen, die auf Teilmengen D von R definiert sind, kann man bekanntlich einseitige
Grenzwerte an einer Stelle x0 ∈ D betrachten. Der Grenzwert von f in x0 existiert in
diesem Fall genau dann, wenn der linksseitige und der rechtsseitige Grenzwert von f in x0
existieren, und wenn beide einseitigen Grenzwerte übereinstimmen. Entsprechend ist die
Funktion f genau dann an der Stelle x0 stetig, wenn
lim f (x) = lim f (x) = f (x0 )
x→x0 +
x→0−
gilt. Dieses Kriterium ist nützlich, wenn man abschnittsweise definierte Funktionen auf
Stetigkeit hin untersucht. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Für die Heaviside–Funktion (siehe Beispiel (b) auf Seite 2) gilt bekanntlich
lim H(x) = 0 6= 1 = lim H(x).
x→0−
x→0+
Daher ist die Heaviside–Funktion an der Stelle x0 = 0 nicht stetig.
(b) Betrachtet man die Funktion f : R → R, welche durch
(
x
falls x < 0,
f (x) :=
−x
1−e
falls x ≥ 0
für alle x ∈ R definiert ist, so stellt man fest, dass
lim f (x) = lim x = 0 = lim 1 − e−x = lim f (x)
x→0−
x→0−
x→0+
x→0+
gilt. Die Funktion ist also an der Stelle x0 = 0 stetig.
♦
Wir kommen nun zu einem weiteren Kriterium für die Stetigkeit von Funktionen.
Satz 5.5 (Folgenkriterium für Stetigkeit). Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V eine nichtleere Menge. Eine Funktion f : D → W
ist genau dann stetig an einer Stelle v0 ∈ D, wenn für jede Folge (vn )n∈N in D, welche
gegen v0 konvergiert, die Folge der Funktionswerte (f (vn ))n∈N gegen f (v0 ) konvergiert.
Aus dem Folgenkriterium für Stetigkeit folgt insbesondere, dass die Gleichung
lim f (vn ) = f lim vn
n→∞
n→∞
für jede stetige Funktion f und jede konvergente Folge (vn )n∈N gilt. Diese Tatsache kann
man unter anderem dazu verwenden, die Grenzwerte bestimmter Folgen zu berechnen.
Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Man betrachte die Folge (an )n∈N , welche durch
1
1
1
an := ln 1 + + + · · · +
1! 2!
n!
für alle n ∈ N definiert ist. Offenbar gilt dann an = ln(sn ) für alle n ∈PN, wobei
∞
sn := 1 + 1/1! + 1/2! + · · · + 1/n! die n-te Partialsumme der Reihe
k=1 1/k!
bezeichnet. Wir wissen bereits, dass die Folge (sn )n∈N gegen die Eulersche Zahl
e konvergiert. Da der natürliche Logarithmus eine stetige Funktion ist, gilt demnach
lim an = lim ln(sn ) = ln lim sn = ln(e) = 1.
n→∞
n→∞
n→∞
108
KAPITEL 5. STETIGE FUNKTIONEN
Abbildung 5.4: Die Verkettung zweier Funktionen f und g, welche an den Stellen u0
und v0 = f (u0 ) stetig sind, ist an der Stelle u0 stetig.
(b) Aus Satz 2.3 und dem Folgenkriterium für Stetigkeit ergibt sich, dass jede Norm eine
stetige Funktion ist.
♦
Mit dem Folgenkriterium für Stetigkeit (d.h. mit Satz 5.5), sowie mit den Sätzen 2.4 und
2.5 kann man weiterhin ganz leicht die nachfolgenden beiden Sätze beweisen.
Satz 5.6. Seien (V, k · kV ) und (W, k · kW ) normierte Räume über K, und sei D ⊆ V eine
nichtleere Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen,
die an einer Stelle v0 ∈ D stetig sind. Dann gelten die folgenden Aussagen.
(1) Die Funktion f + g : D → W ist an der Stelle v0 stetig.
(2) Die Funktion αf : D → W ist an der Stelle v0 stetig.
Ist (W, k · kW ) eine normierte Algebra über K, so gilt außerdem
(3) Die Funktion f g : D → W ist an der Stelle v0 stetig.
Satz 5.7. Sei (V, k · k) ein normierter Raum über K, sei D ⊆ V eine nichtleere Menge,
und sei f : D → K \ {0} eine Funktion, welche an einer Stelle v0 ∈ D stetig ist. Dann ist
die Funktion
1
:D→K
f
ebenfalls an der Stelle v0 stetig.
Man beachte dass die Vektoraddition, die skalare Multiplikation, die Multiplikation, sowie
die Division in den Sätzen 5.6 und 5.7 jeweils punktweise zu verstehen ist (siehe Beispiel
(e) auf Seite 34). Ist D eine nichtleere Teilmenge eines normierten Raumes, und ist W ein
normierter Raum über K, so folgt aus den Teilen (1) und (2) von Satz 5.6, dass die Menge
aller stetigen Funktionen von D nach W ein Vektorraum über K ist. Wie bereits erwähnt,
wird die Menge aller stetigen Funktionen von D nach W mit C(D, W ) bezeichnet. Ist W
eine normierte Algebra über K, dann folgt aus Teil (3) von Satz 5.6, dass C(D, W ) eine
Algebra über K ist.
Der nachfolgende Satz macht eine Aussage über die Verkettung von Funktionen, die
an bestimmten Stellen ihrer Definitionsbereiche stetig sind.
Satz 5.8. Seien (U, k · kU ), (V, k · kV ) und (W, k · kW ) normierte Räume über K, und seien
C ⊆ U und D ⊆ V zwei nichtleere Mengen. Sei außerdem g : C → D eine Funktion, die an
einer Stelle u0 ∈ U stetig ist, und f : D → E eine Funktion, die an der Stelle v0 := g(u0 )
stetig ist. Dann ist die Funktion f ◦ g : C → W ebenfalls an der Stelle u0 stetig.
5.2. STETIGKEIT
109
Die Voraussetzungen für Satz 5.8 sind in Abbildung 5.4 noch einmal anschaulich dargestellt. Die Sätze 5.6, 5.7 und 5.8 werden in der Regel dazu verwendet, die Stetigkeit von
gegebenen Funktionen nachzuweisen. Der Nachweis gelingt, wenn man zeigen kann, dass
sich eine gegebene Funktion als Addition, Subtraktion, Multiplikation, Division oder Verkettung von stetigen Funktionen darstellen lässt. Eine weitere Möglichkeit, die Stetigkeit
einer Funktion nachzuweisen, liefert der nachfolgende Satz.
Satz 5.9. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume, sei D ⊆ V eine nichtleere
Menge, und sei (fn )n∈N eine Folge stetiger Funktionen von D nach W , welche gleichmäßig
auf D gegen eine Grenzfunktion f : D → W konvergiert. Dann ist f ebenfalls stetig.
Die Aussage von Satz 5.9 kann auch dazu verwendet werden, die gleichmäßige Konvergenz
einer Funktionenfolge zu widerlegen. Man betrachte dazu das nachfolgende Beispiel.
Beispiel.
Die Funktionenfolge (pn )n∈N von [0, 1] nach R, welche durch pn (x) := xn für alle x ∈ [0, 1]
und alle n ∈ N definiert ist, konvergiert bekanntlich punktweise gegen die Grenzfunktion
p : [0, 1] → R, welche durch
(
0 falls x ∈ [0, 1),
p(x) :=
1 falls x = 1
für alle x ∈ R definiert ist. Jedes Glied der Folge (pn )n∈N ist eine stetige Funktion. Die
Grenzfunktion p ist hingegen nicht stetig. Gemäß Satz 5.9 kann die Konvergenz von (pn )n∈N
gegen p also nicht gleichmäßig sein.
♦.
Wir beschließen diesen Abschnitt mit einer weiteren Charakterisierung stetiger Funktionen, die in den nachfolgenden Abschnitten von großer Bedeutung sein wird.
Satz 5.10. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, und sei D ⊆ V
eine nichtleere Menge. Eine Funktion f : D → W ist genau dann stetig, wenn für jede
offene Menge Θ ⊆ W eine offene Menge O ⊆ V existiert, so dass f −1 (Θ) = D ∩ O gilt.
Übungsaufgaben
1. Geben seien die stetigen Funktionen
f1 : R → R, x 7→ 1,
f2 : R → R, x 7→ x,
f3 : [0, ∞) → R, x 7→
√
x,
x
f4 : R → R, x 7→ e ,
f5 : (0, ∞) → R, x 7→ ln(x).
Stellen Sie die nachfolgend angegebenen Funktionen als Verknüpfungen (d.h. als Summen,
Differenzen, Produkte, Quotienten, Vielfache oder Verkettungen) von f1 , f2 , . . . , f5 dar:
2
g1 : R → R, x 7→ e−x ,
g2 : R → R, x 7→ 2x2 − 3x + 2,
g3 : R → R, x 7→ 2x ,
110
KAPITEL 5. STETIGE FUNKTIONEN
g4 : [0, ∞) → R, x3/2 ,
g5 : (0, ∞) → R, x 7→ xx .
Verwenden Sie dabei, dass ab = eb ln(a) für alle a > 0 und alle b ∈ R gilt. Sind die Funktionen
g1 , g2 , . . . , g5 stetig?
2. Zeigen Sie mit Hilfe von Satz 5.6, dass jedes Polynom eine stetige Funktion von R nach R ist.
Verwenden Sie dabei die Tatsache, dass die Funktionen f : R → R und g : R → R, welche
durch f (x) = x bzw. g(x) = 1 für alle x ∈ R definiert sind, stetig sind.
3. Wie muss α ∈ R gewählt werden, damit die Funktion fα : R → R, definiert durch
(
2
(1 + x2 − ex )/x4 falls x 6= 0,
fα (x) :=
α
falls x = 0
für alle x ∈ R, stetig ist?
4. Bestimmen Sie jeweils Menge aller Stellen, an denen die folgenden Funktionen stetig sind.
(
(x3 − 1)/(x − 1) falls x 6= 1,
f1 : R → R, x 7→
3
falls x = 1
(
(cos(x) − 1)/x falls x 6= 0,
f2 : R → R, x 7→
0
falls x = 0
( √
x + 1 falls x ≥ 0,
√
,
f3 : R → R, x 7→
− 1 − x falls x < 0,
(
0 falls x ∈ Q,
f4 : R → R, x 7→
.
1 falls x 6∈ Q
5. Bestimmen Sie die Grenzwerte der reellen Zahlenfolgen (an )n∈N , (bn )n∈N , (cn )n∈N und (dn )n∈N .
Die Folgen sind durch
nπ
π
an = sin
cos π +
,
2n + π
n
1 1 1
(−1)n+1
bn = tan 1 − + − ± · · · +
,
3 5 7
2n − 1
2
cn = n ln 1 +
,
n
d1 := e,
n
dn+1 := dn e(−1)
/(n+1)
für alle n ∈ N definiert. Verwenden Sie dabei die Tatsache, dass der natürliche Logarithmus,
die Funktionen Sinus und Tangens, sowie die Exponentialfunktion stetige Funktionen sind.
5.3. DER ZWISCHENWERTSATZ
5.3
111
Der Zwischenwertsatz
In diesem Abschnitt lernen wir den wichtigen Zwischenwertsatz kennen der für jede stetige
Funktion gilt, die auf einer zusammenhängenden Menge definiert ist. Aus dem Zwischenwertsatz lassen sich eine Reihe wichtiger Folgerungen ableiten. Ein paar davon stellen wir
in diesem Abschnitt vor. Die Grundlage für alle Resultate in diesem Abschnitt bildet der
nachfolgende Satz.
Satz 5.11. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊆ V eine
nichtleere, zusammenhängende Menge, und sei f : D → W eine stetige Funktion. Dann
ist f (D) ebenfalls zusammenhängend.
Umgangssprachlich kann die Aussage von Satz 5.11 wie folgt formuliert werden: Eine stetige Funktion bildet zusammenhängende Mengen auf zusammenhängende Mengen ab. Dies
ist in der Tat eine bemerkenswerte Eigenschaft stetiger Funktionen. Erinnert man sich nun
daran, dass die nichtleeren, zusammenhängenden Teilmengen von R genau die Intervalle
sind (siehe Satz 3.16), dann kommt man leicht zum so genannten Zwischenwertsatz für
stetige Funktionen.
Satz 5.12 (Zwischenwertsatz). Sei (V, k · k) ein normierter Raum über K, D ⊆ V eine nichtleere, zusammenhängende Menge, f : D → R eine stetige Funktion. Seien ferner
y1 , y2 ∈ f (D) zwei Funktionswerte von f mit y1 < y2 . Dann existiert zu jedem Zwischenwert y ∈ [y1 , y2 ] eine Stelle v ∈ D, so dass f (v) = y gilt.
Die Aussage des Zwischenwertsatzes kann man folgendermaßen ausdrücken: Eine stetige
Funktion, welche auf einer zusammenhängenden Menge definiert ist und zwei Funktionswerte y1 und y2 annimmt, nimmt auch jeden Funktionswert zwischen y1 und y2 an. In den
nachfolgenden Beispielen wird die Aussage des Zwischenwertsatzes noch einmal verdeutlicht. Ferner wird eine mögliche Anwendung des Zwischenwertsatzes demonstriert.
Beispiele.
(a) Wir betrachten Funktion f : [−π, π] → R, welche durch f (x) := x cos(x cos(x))/π
für alle x ∈ R definiert ist. Offenbar ist f als Verknüpfung stetiger Funktionen stetig.
Das Intervall [−π, π] ist zusammenhängend. Wir interessieren uns für die Bildmenge
von f . Man rechnet leicht nach, dass f (−π) = 1 und f (π) = −1 gilt. Nach dem
Zwischenwertsatz nimmt f daher jeden Funktionswert zwischen −1 und 1 an. Das
Intervall [−1, 1] ist somit eine Teilmenge der Bildmenge von f .
(b) Die Funktion g : [0, 1] × [0, 1] → R sei durch g(x, y) = x2 − 6xy + 2y definiert. Die
Funktion g kann als Verknüpfung stetiger Funktionen dargestellt werden, weshalb sie
stetig ist. Das Quadrat [0, 1] × [0, 1] ist eine zusammenhängende Teilmenge des R2 .
Ferner gilt g(1, 1) = −3 und g(0, 1) = 2. Aufgrund des Zwischenwertsatzes nimmt die
Funktion g auf [0, 1] × [0, 1] alle Funktionswerte zwischen −3 und 2 an. Die Funktion
g besitzt also insbesondere eine Nullstelle.
(c) Besitzt die Gleichung
sin(2x) − ex = −5
für x eine Lösung im Intervall [0, π]? Um diese Frage zu beantworten, kann man
die linke Seite der Gleichung als Funktion f : R → R auffassen, welche durch
f (x) := sin(2x) − ex für alle x ∈ R definiert ist. Die Funktion f ist als Verknüpfung
112
KAPITEL 5. STETIGE FUNKTIONEN
stetiger Funktionen stetig. Ferner gilt f (0) = −1 und f (π) = −eπ . Nach dem Zwischenwertsatz nimmt die Funktion f auf dem Intervall [0, π] jeden Funktionswert
zwischen −eπ und −1 an. Wegen −eπ < −2π < −23 = −8 gilt −5 ∈ [−eπ , −1].
Daher existiert eine Stelle x ∈ [0, π], für die f (x) = −5 gilt. Die obige Gleichung
besitzt also eine Lösung im Intervall [0, π].
♦
Eine wichtige Folgerung aus dem Zwischenwertsatz ist der so genannte Nullstellensatz von
Bolzano.
Satz 5.13 (Nullstellensatz von Bolzano). Sei I ⊆ R ein reelles Intervall, und sei
f : I → R eine stetige Funktion. Seien ferner a, b ∈ I zwei reelle Zahlen, so dass a < b und
f (a)f (b) < 0 gilt. Dann besitzt die Funktion f eine Nullstelle im offenen Intervall (a, b),
d.h. es existiert eine reelle Zahl z ∈ (a, b) mit f (z) = 0.
Der Nullstellensatz von Bolzano bildet die theoretische Grundlage für ein einfaches numerisches Verfahren, mit dem Näherungswerte für die Nullstelle einer stetigen Funktion
berechnet werden können. Dieses Verfahren beruht auf der Konstruktion immer kleine”
rer“Intervalle, welche mindestens eine Nullstelle der Funktion enthalten. Es wird Bisektionsverfahren genannt.
Algorithmus (Bisektionsverfahren). Gegeben sei ein reelles Intervall I ⊆ R, eine stetige Funktion f : I → R sowie zwei Stellen a0 , b0 ∈ I mit a < b, für die f (a0 )f (b0 ) < 0
gilt. Zu einer vorgegebenen positiven Zahl ε > 0 sind zwei Zahlen a, b ∈ I mit a < b und
b − a < ε gesucht, so dass f in dem Intervall [a, b] eine Nullstelle besitzt. Man berechnet
dann die Intervalle [a0 , b0 ], [a1 , b1 ], [a2 , b2 ], . . . gemäß
ak−1 + bk−1
,
2
(
[ak−1 , ck ] falls f (ak−1 )f (ck ) < 0,
[ak , bk ] :=
[ck , bk−1 ] sonst
ck :=
für k = 1, 2, 3, . . . , solange bis bn − an < ε für ein n ∈ N gilt. Das gesuchte Intervall ist
dann durch [a, b] := [an , bn ] gegeben.
Der Parameter ε im Bisektionsverfahren gibt die Genauigkeit vor, mit der eine Nullstelle
der Funktion f angenähert werden soll. Je kleiner ε gewählt wird, desto genauer ist die
Näherung. Allerdings wächst mit kleiner werdendem ε auch die Anzahl der Schritte, die das
Bisektionsverfahren benötigt, um die geforderte Genauigkeit zu erreichen. Im Vergleich zu
anderen numerischen Verfahren, mit denen Näherungswerte für Nullstellen von Funktionen
berechnet werden können, ist das Bisektionsverfahren eher ineffizient bzw. langsam“. Die
”
Vorteil des Bisektionsverfahrens besteht jedoch darin, dass nur wenige Voraussetzungen
an die Funktion f stellt, und dass es relativ leicht implementiert werden kann.
Übungsaufgaben
1. Gibt es eine stetige und surjektive Funktion, die vom Intervall (0, 1) in die Menge M1 :=
(0, ∞) bzw. in die Menge M2 := (−1, 1) \ {0} abbildet? Geben Sie ggf. eine entsprechende
Funktion an.
5.3. DER ZWISCHENWERTSATZ
113
2. Zeigen Sie mit Hilfe des Zwischenwertsatzes, dass die Gleichung
e2x − ln(1 + x) = 2
eine Lösung x im Intervall [0, 1] besitzt.
3. Man betrachte die Funktion f : (−1, 1) \ {0} → R, welche durch f (x) := sgn(x) für alle
x ∈ [−1, 1] \ {0} definiert ist. Zeigen Sie, dass f stetig ist. Erfüllt f die Voraussetzungen des
Zwischenwertsatzes?
4. Berechnen Sie von Hand die ersten drei Intervalle [a1 , b1 ], [a2 , b2 ], [a3 , b3 ], welche das Bisektionsverfahren für die Funktion f : R → R, x 7→ x5 − 3x3 + 1 und die Startwerte a1 := 0
und b1 := 1 liefert.
114
5.4
KAPITEL 5. STETIGE FUNKTIONEN
Der Satz vom Minimum und Maximum
Neben dem Zwischenwertsatz gibt es noch einen weiteren wichtigen Satz, der für alle
stetigen Funktionen gilt. Dieser Satz als der Satz vom Minimum und Maximum bekannt.
Der Satz vom Minimum und Maximum beruht auf der folgenden wichtigen Aussage über
das Abbildungsverhalten stetiger Funktionen.
Satz 5.14. Seien (V, k · kV ) und (W, k · kW ) zwei normierte Räume über K, sei D ⊂ V
eine nichtleere, kompakte Menge, und sei f : D → R eine stetige Funktion. Dann ist f (D)
kompakt.
Satz 5.14 besagt, dass stetige Funktionen kompakte Mengen auf kompakte Mengen abbilden. Dieses Wissen benötigt man, um den nachfolgenden Satz zu beweisen.
Satz 5.15 (Satz vom Minimum und Maximum). Sei (V, k · k) ein normierter Raum
über K, sei D ⊂ V eine nichtleere, kompakte Menge, und sei f : D → R eine stetige
Funktion. Dann existieren zwei Vektoren v∗ , v ∗ ∈ D mit
f (v∗ ) = min f (v),
v∈D
∗
f (v ) = max f (v).
v∈D
Umgangssprachlich kann der Satz vom Minimum und Maximum folgendermaßen formuliert werden: Jede stetige Funktion nimmt auf einer kompakten Menge ihr Minimum und
ihr Maximum an. Die Kompaktheit der Definitionsmenge ist hierbei von entscheidender
Bedeutung, wie man anhand der nachfolgenden Beispiele erkennt.
Beispiele.
(a) Die Funktion f : [−1, 1] → R, welche durch f (x) := x7 − 4x6 + 3x − 5 für alle x ∈
[−1, 1] definiert ist, ist offenbar ein Polynom und somit stetig. Die Definitionsmenge
von f ist abgeschlossen und beschränkt, und nach dem Satz von Heine–Borel (siehe
Satz 3.9) somit kompakt. Nach dem Satz vom Minimum und Maximum besitzt die
Funktion f also einen minimalen und einen maximalen Funktionswert.
(b) Die Funktion g : (0, 1) → R, welche durch g(x) := 1/x für alle x ∈ (0, 1) definiert
ist, ist zwar stetig, ihre Definitionsmenge ist aber nicht kompakt. Daher kann man
den Satz von Minimum und Maximum nicht auf die Funktion g anwenden. Wie
man leicht zeigt, besitzt die Funktion g tatsächlich kein Minimum und auch kein
Maximum.
Mit dem Satz vom Minimum und Maximum lassen sich eine Reihe wichtiger Aussagen
beweisen. Im folgenden Abschnitt werden wir eine solche wichtige Aussage kennen lernen.
Übungsaufgaben
1. Gibt es eine stetige und surjektive Funktion, die vom Intervall [0, 1] in die Menge M1 :=
[−1, 1] bzw. in die Menge M2 := (0, 1) abbildet? Geben Sie ggf. eine entsprechende Funktion
an.
2. Zeigen Sie, dass die Funktion f : [−1, 1] → R2 , definiert durch
3
−t + 2t − t
f (t) :=
et − t2
für alle t ∈ [−1, 1] beschränkt ist.
5.5. ÄQUIVALENZ VON NORMEN
5.5
115
Äquivalenz von Normen
In den zurück liegenden Abschnitten wurden zahlreiche Begriffe und Eigenschaften mit
Hilfe von Normen definiert. Insbesondere die Konzepte von Konvergenz und Stetigkeit
wurden in normierten Räumen (V, k · k) und somit in Abhängigkeit einer Norm k · k definiert. Bereits im Abschnitt 1.1 haben wir aber gesehen, dass man auf einem Vektorraum
V im Allgemeinen unterschiedliche Normen definieren kann. Es stellt sich daher die folgende Frage: Angenommen, k · k(1) und k · k(2) sind zwei unterschiedliche Normen auf einem
Vektorraum V . Ferner sei (vn )n∈N eine Folge in V , von der man weiß, dass sie bezüglich
der Norm k · k(1) konvergent ist. Ist diese Folge dann auch bezüglich der Norm k · k(2) konvergent? Am Ende dieses Abschnitts werden wir darauf folgende Antwort geben können:
Ja, sofern V = Kn gilt oder die Normen k · k(1) und k · k(2) äquivalent sind.
Definition (äquivalente Normen). Sei V ein Vektorraum über K. Zwei Normen k · k(1)
und k · k(2) auf V heißen zueinander äquivalent, wenn zwei positive Konstanten c > 0 und
C > 0 existieren, so dass
ckvk(2) ≤ kvk(1) ≤ Ckvk(2)
für alle v ∈ V gilt.
Man kann leicht zeigen, dass die Äquivalenz von Normen tatsächlich eine Äquivalenzrelation auf der Menge aller Normen auf einem gegebenen Vektorraum ist. Für die offenen
Kugeln äquivalenter Normen gilt das folgende wichtige Lemma.
Lemma 5.16. Sei V ein normierter Raum über K, und seien k · k(1) und k · k(2) zwei
äquivalente Normen auf V . Sei außerdem v ∈ V ein beliebiger Vektor und r > 0 eine
beliebige, positive Zahl. Dann existieren positive Zahlen s > 0 und S > 0, so dass
(2)
Bs(2) (v) ⊆ Br(1) (v) ⊆ BS (v)
(1)
gilt. Hierbei bezeichnet Br (v) die offene Kugel in V mit Mittelpunkt v und Radius
(2)
(2)
r bezüglich der Norm k · k(1) . Mit Bs (v) und BS (v) werden die offenen Kugeln mit
Mittelpunkt v und den Radien s bzw. S bezüglich der Norm k · k(2) bezeichnet.
Vergegenwärtigen wir uns die Bedeutung von Lemma 5.16. In den zurück liegenden Abschnitten dieses Skripts wurden sämtliche topologische Begriffe wie auch sämtlich Konvergenzbegriffe letztlich über offene Kugeln definiert. Eine Folge (vn )n∈N in einem normierten
Raum wird beispielsweise konvergent gegen einen Vektor v genannt, wenn für alle ε > 0
ein N ∈ N existiert, so dass
kvn − vk < ε
für alle n ∈ N mit n ≥ N gilt. Die strikte Ungleichung bedeutet jedoch nichts anderes, als
dass vn ∈ Bε (v) gilt, wobei Bε (v) die offene Kugel mit Mittelpunkt v und Radius ε bezüglich der Norm k · k bezeichnet. Ein typisches Beispiel für einen topologischen Begriff, der
mit Hilfe von offenen Kugeln definiert wird, ist die Offenheit von Mengen. Eine Teilmenge
O eines normierten Raumes wird bekanntlich als offen bezeichnet, wenn für jeden Punkt
v der Menge eine offene Kugel Bε (v) existiert, so dass Bε (x) ⊆ O gilt.
Lemma 5.16 besagt nun folgendes: Wenn eine Folge bezüglich einer gegebenen Norm
k · k konvergent ist, dann ist sie auch bezüglich jeder zu k · k äquivalenten Norm konvergent. Man kann nämlich zu jeder offenen Kugel Bε (v) bezüglich k · k eine offene Kugel
bezüglich der äquivalenten Norm finden, so dass diese eine Teimenge von Bε (v) ist. Aus
116
KAPITEL 5. STETIGE FUNKTIONEN
demselben Grund ist jede Menge, die bezüglich einer gegebenen Norm k · k offen ist, auch
bezüglich jeder anderen, zu k · k äquivalenten Norm offen. Grundsätzlich kann man also folgendes sagen: Sämtliche Konvergenzeigenschaften von Folgen, Reihen, etc. und sämtliche
topologischen Eigenschaften von Mengen bleiben für äquivalente Normen erhalten.
Welche in diesem Skript bereits eingeführten Normen sind zueinander äquivalent? Das
folgende Lemma macht dazu eine wichtige Aussage.
Lemma 5.17. Jede Norm auf Kn ist zur Maximumnorm k · k∞ auf Kn äquivalent. Diese
Aussage gilt für alle n ∈ N.
Da die Äquivalenz von Normen eine Äquivalenzrelation auf der Menge aller Normen eines
Vektorraums ist, folgt aus Lemma 5.17 unmittelbar der nachfolgende Satz.
Satz 5.18. Alle Normen auf Kn sind zueinander äquivalent. Diese Aussage gilt für alle
n ∈ N.
Eine weitere wichtige Folgerung aus Lemma 5.17 ist der nachfolgende Satz, der eine Aussage über die Konvergenz vektorwertiger Folgen und Funktionen macht. Mit vektorwertig“
”
ist hierbei gemeint, dass die Glieder einer Folge Elemente des Vektorraums Kn sind, bzw.
dass eine Funktion in diesen Vektorraum abbildet, wobei man implizit n > 1 voraussetzt.
Satz 5.19. Eine Folge (x(k) )k∈N in Kn konvergiert genau dann gegen einen Vektor x ∈ Kn ,
wenn die Komponenten der Folgenglieder gegen die Komponenten von x konvergieren. Eine
Funktion f mit Bild in Kn besitzt genau dann in einem Punkt v0 den Grenzwert w0 ∈ Kn ,
wenn die Komponenten von w0 die Grenzwerte der Komponenten von f in v0 sind.
Umgangssprachlich können die Aussagen von Satz 5.19 folgendermaßen formuliert werden:
Eine vektorwertige Folge konvergiert genau dann gegen einen bestimmten Vektor, wenn
sie komponentenweise gegen diesen konvergiert. Der Grenzwert einer Funktion ist genau
dann ein bestimmter Vektor, wenn dies komponentenweise der Fall ist. Zur Erläuterung
dieser Aussagen betrachte man die nachfolgenden Beispiele.
Beispiele.
(a) Die Folge (x(k) )k∈N in R2 , deren Glieder durch
√
n
n
(k)
x :=
1/n
für alle k ∈ N gegeben sind, soll auf Konvergenz hin untersucht werden. Laut
Satz 5.19 kann diese Untersuchung komponentenweise erfolgen. Die erste Komponente der Folgenglieder konvergiert offenbar gegen 1, während die zweite Komponente
gegen 0 konvergiert. Also gilt
1
(k)
lim x =
.
0
k→∞
(b) Die Funktion f : R \ {0} → R2 sei durch
sin(x)/x
f (x) =
(x2 − 2x)/(2x)
5.5. ÄQUIVALENZ VON NORMEN
117
für alle x ∈ R \ {0} definiert. Es soll der Grenzwert von f in 0 bestimmt werden.
Wieder geht man komponentenweise vor und erhält so
1
lim f (x) =
−1
x→0
als Grenzwert.
♦
Übungsaufgaben
1. Für je zwei Normen k · k(1) und k · k(2) auf einem Vektorraum V über K gelte k · k(1) ∼
k · k(2) genau dann, wenn die Normen zueinander äquivalent sind. Zeigen Sie, dass ∼ eine
Äquivalenzrelation auf der Menge aller Normen auf V ist.
2. Sei V ein Vektorraum über K, und sei k · k(0) eine Norm auf V mit der Eigenschaft, dass alle
Normen auf V zu k · k(0) äquivalent sind. Zeigen Sie, dass dann alle Normen auf V zueinander
äquivalent sind.
3. Es seien | · | und k · k∞ die euklidischen Norm bzw. die Maximumnorm auf Rn , wobei n ∈ N
beliebig, aber fest gewählt sei. Bestimmen Sie zwei Zahlen c > 0 und C > 0 in Abhängigkeit
von n, so dass ckxk∞ ≤ |x| ≤ Ckxk∞ für alle x ∈ Rn gilt.
4. Bestimmen Sie die folgenden Funktionsgrenzwerte:
5
(3x − 3)/(2x5 + 7)
sin(x2 )/x
2
lim
, lim
,
2
x→∞
x→0 x + 3x + 1
x4 e−x
lim
x→1
(x2 − 1)/(x3 − 1)
.
x ln(x)
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... Grenzwerte von Funktionen bestimmen können.
... einseitige Grenzwerte von Funktionen bestimmen können.
... Grenzwerte von Funktionen gegen ∞ und gegen −∞ bestimmen können.
... wissen, dass eine Funktion genau dann an einer Stelle ihres Definitionsbereichs stetig
ist, wenn der Grenzwert an der Stelle mit dem Funktionswert übereinstimmt.
... stetige Funktionen anhand ihrer Definition erkennen können.
... das Folgenkriterium für Stetigkeit kennen.
... den Zwischenwertsatz sowie den Nullstellensatz von Bolzano kennen.
... den Satz vom Minimum und Maximum kennen.
... wissen, dass eine vektorwertige Folge bzw. eine vektorwertige Funktion genau dann
gegen einen bestimmten Grenzwert konvergiert, wenn sie gegen diesen komponentenweise konvergiert.
118
Kapitel 6
Differentialrechnung
6.1
Differenzierbarkeit
Definition (differenzierbare Funktion, Ableitung). Sei (W, k · k) ein normierter Raum
über K, sei D ⊆ R eine nichtleere Menge und x0 ∈ D◦ ein innerer Punkt dieser Menge. Eine
Funktion f : D → W wird differenzierbar an der Stelle x0 genannt, wenn der Grenzwert
f (x0 + h) − f (x0 )
h→0
h
f 0 (x0 ) := lim
existiert. Der Grenzwert f 0 (x0 ) ∈ Rm wird dann die Ableitung von f an der Stelle x0
genannt. Die Funktion f wird differenzierbar genannt, wenn der Grenzwert f 0 (x0 ) an
jeder Stelle x0 ∈ D◦ existiert. Die Funktion f 0 : D◦ → W, x 7→ f 0 (x) wird dann die
Ableitung von f genannt.
Bei in der obigen Definition ist zu beachten, dass die Ableitung einer Funktion an einer
gegebenen Stelle und die Ableitung einer Funktion zwei unterschiedliche Klassen von Objekten bezeichnen. Der erstgenannte Begriff bezeichnet nämlich ein Element des Wertebereichs der Funktion, während der zweite Begriff eine Funktion bezeichnet. Die Bestimmung
der Ableitung f 0 einer Funktion f wird auch als Ableiten von f bezeichnet.
Ist D eine Teilmenge von R und f eine auf D definierte, differenzierbare Funktion, so
ist der Ableitung f 0 von f zunächst nur auf dem Inneren von D definiert. Unter gewissen
Voraussetzungen ist es jedoch möglich, den Definitionsbereich von f 0 auf ganz D zu erweitern. Dies ist beispielsweise dann der Fall, wenn die Funktion f auf einem abgeschlossenen
Intervall [a, b] definiert ist, und die einseitigen Grenzwerte
f 0 (a) := lim
f (a + h) − f (a)
h
f 0 (b) := lim
f (b + h) − f (b)
h
h→a+
und
h→b−
existieren.
Ableitungen von Funktionen, die von einer Teilmenge D der reellen Zahlen nach R
abbilden, sind aus dem Schulunterricht bereits gut bekannt. Ist f : D → R eine solche
Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist, dann interpretiert man die Ableitung f 0 (x0 ) als Steigung des Graphen von f an der Stelle x0 . Man betrachte beispielsweise
eine affine Funktion g : R → R, welche durch
g(x) := mx + c
119
120
KAPITEL 6. DIFFERENTIALRECHNUNG
(a)
(b)
Abbildung 6.1: (a) Sekante an den Graph der Funktion f an den Stellen x0 und x0 +h.
(b) Tangente an den Graph von f an der Stelle x0 .
für alle x ∈ R gegeben ist. Hierbei sein m ∈ R und c ∈ R zwei fest gewählte, reelle Zahlen
sind. Der Graph von g ist bekanntlich eine Gerade mit der Steigung m. Die Ableitung
g 0 : R → R von g ist an jeder Stelle x0 ∈ R durch
g(x0 + h) − g(x0 )
m(x0 + h) + c − mx0 − c
mh
= lim
= lim
=m
h→0
h→0
h→0 h
h
h
g 0 (x0 ) = lim
gegeben. An jeder Stelle x0 ∈ R entspricht die Ableitung von g an der Stelle x0 also genau
der Steigung der Gerade. Allgemein kann man den so genannten Differenzenquotienten
f (x0 + h) − f (x0 )
h
einer Funktion f : D → R an der Stelle x0 ∈ D als die Steigung einer Sekante interpretieren, welche die Punkte des Funktionsgraphen an den Stellen x0 und x0 + h verbindet.
Wenn h gegen Null strebt, wird die Sekante einer Tangente immer ähnlicher, welche den
Funktionsgraphen an der Stelle x0 berührt. Die Steigung dieser Tangente ist genau durch
f 0 (x0 ) gegeben, und man definiert diese Steigung als Steigung des Funktionsgraphen an
der Stelle x0 . Man betrachte dazu auch Abbildung 6.1.
Nachfolgend geben wir einige Beispiele für differenzierbare Funktionen und deren Ableitungen an. Man beachte, dass der Ableitungsbegriff auch für vektorwertige Funktionen
definiert ist.
Beispiele.
(a) Für jede Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle x ∈ R
definiert. Gemäß der verallgemeinerten binomischen Formel gilt dann
pn (x0 + h) − pn (x0 )
h→0
h
(x0 + h)n − xn0
= lim
h→0
h
!
n
1 X n n−k k
= lim
x
h − x0
h→0 h
k 0
k=0
!
1
n n−2 2
n−1
n
n−1
n
= lim
x0 + nx0 h +
x
h + · · · + nx0 h
+ h − x0
h→0 h
2 0
!
1
n
= lim
nxn−1
h+
xn−2 h2 + · · · + nx0 hn−1 + hn
0
h→0 h
2 0
p0n (x0 ) = lim
6.1. DIFFERENZIERBARKEIT
= lim
h→0
nxn−1
0
121
!
n n−2 1
n−2
n−1
+
x
h + · · · + nx0 h
+h
2 0
|
{z
}
| {z } | {z }
→0
→0
→0
= nxn−1
0
an jeder Stelle x0 ∈ R. Für jede Zahl n ∈ N ist die Funktion pn also differenzierbar.
Die Ableitung von pn ist durch p0n : R → R, x 7→ nxn−1 gegeben.
(b) Jede konstante Funktion f : R → Rm , wobei m ∈ N eine natürliche Zahl bezeichnet,
ist differenzierbar. Wie man leicht nachrechnet, ist die Ableitung f 0 : R → Rm
ebenfalls eine konstante Funktion, welche jede Stelle x ∈ R auf den Nullvektor 0 ∈
Rm abbildet.
(c) Wir betrachten die Funktion g : R → R2 , welche durch
t
g(t) := 2
t
für alle t ∈ R definiert ist. Mit dem Resultat von Beispiel (a) weist man leicht nach,
dass g differenziertbar ist, und dass die Ableitung g 0 : R → R2 durch
1
g 0 (t) :=
2t
für alle t ∈ R gegeben ist.
♦
Am Beispiel (c) wird deutlich, dass man die Ableitung einer vektorwertigen Funktion
berechnet, indem man diese komponentenweise ableitet.
Das nachfolgende Lemma ist grundlegend für das Verständnis von Ableitungen.
Lemma 6.1. Sei (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere
Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x0 ∈ D◦ differenzierbar,
wenn es einen Vektor w0 ∈ W , eine positive Zahl r > 0 und eine Funktion ε : Br (0) → W
gibt, so dass Br (x0 ) ⊆ D, sowie
f (x0 + h) = f (x0 ) + w0 h + ε(h)h
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt. Es ist dann w0 = f 0 (x0 ).
Ist f eine Funktion, die an einer Stelle x0 im Innern ihres Definitionsbereichs differenzierbar
ist, so kann die Funktion h 7→ f (x0 +h) gemäß Lemma 6.1 als Summe der affinen Funktion
h 7→ f (x0 ) + f 0 (x0 )h und der Funktion h 7→ hε(h) dargestellt werden. Die Funktion
h 7→ f (x0 ) + f 0 (x0 )h nennt man auch die Linearisierung von f in der Nähe von x0 . In der
Physik und den Ingenieurwissenschaften wird die Linearisierung einer Funktion f häufig
dazu verwendet, um das Änderungsverhalten von f nahe einer gegebenen Stelle x0 zu
untersuchen. Oft stellt der Funktionswert f (x0 ) dabei den Zustand eines Systems und
f (x0 + h) den Zustand nach einer Störung des Systems dar. Die Funktion h 7→ ε(h)h kann
bei einer Untersuchung des Änderungsverhaltens oft vernachlässigt werden, da sie sehr
schnell gegen Null konvergiert, wenn h gegen Null strebt.
Wir wiederholen nun einige bekannte Resultate über die Differenzierbarkeit von Funktionen. Zunächst geht es um den Zusammenhang zwischen der Stetigkeit und der Differenzierbarkeit einer Funktion.
122
KAPITEL 6. DIFFERENTIALRECHNUNG
(b)
(a)
(c)
Abbildung 6.2: (a) Graph der Signum–Funktion.
(b) Graph der Betragsfunktion. (c)
p
Graph der Funktion f : R → R, x 7→ sgn(x) |x|. Keine der drei Funktionen ist an der
Stelle x0 = 0 differenzierbar.
Lemma 6.2. Sei (W, k · k) ein normierter Raum über K, sei D ⊆ R eine nichtleere Menge,
und sei f : D → W eine Funktion, die an einer Stelle x0 ∈ D◦ differenzierbar ist. Dann ist
f an der Stelle x0 auch stetig.
Laut Lemma 6.2 impliziert die Differenzierbarkeit einer Funktion an einer bestimmten
Stelle ihres Definitionsbereichs auch die Stetigkeit der Funktion an dieser Stelle. Damit
liefert das Lemma ein notwendiges Kriterium für die Differenzierbarkeit: Eine Funktion
kann nur dann an einer gegebenen Stelle differenzierbar sein, wenn sie an dieser Stelle auch
stetig ist. Dass Lemma 6.2 kein hinreichendes Kriterium für die Differenzierbarkeit einer
Funktion liefert, wird anhand der nachfolgenden Beispiele deutlich.
Beispiele.
(a) Die Signum–Funktion sgn : R → R ist an jeder Stelle x0 ∈ R\{0} stetig und differenzierbar. An der Stelle x0 = 0 ist die Signum–Funktion jedoch nicht stetig, weshalb
sie an dieser Stelle auch nicht differenzierbar sein kann (siehe auch Abbildung 6.2
(a)).
(b) Die Betragsfunktion | · | : R → R ist an der Stelle x0 = 0 zwar stetig, aber nicht
differenzierbar. Es gilt nämlich
|0 + h| − |0|
|h|
−h
= lim
= lim
= −1,
h→0−
h→0− h
h→0− h
h
lim
sowie
|0 + h| − |0|
|h|
h
= lim
= lim
= 1.
h→0+
h→0+ h
h→0+ h
h
lim
Da sich der rechtsseitige und linksseitige Grenzwert unterscheiden, existiert der
Grenzwert, der die Ableitung an der Stelle x0 = 0 definiert, nicht (siehe auch Abbildung 6.2 (b)).
(c) Wir betrachten die Funktion f : R → R, welche durch f (x) := sgn(x)|x| für alle
x ∈ R definiert ist. Die Funktion f ist an der Stelle x0 = 0 offenbar stetig, da
p lim f (x) = lim sgn(x) |x| = 0 = f (0)
x→0
x→0
6.1. DIFFERENZIERBARKEIT
123
gilt. Sie ist an der Stelle x0 = 0 jedoch nicht differenzierbar. Es gilt nämlich
p
p
sgn(h) |h|
sgn(h) |h|
1
f (0 + h) − f (0)
= lim
= lim
= lim p
= ∞.
lim
h→0
h→0 sgn(h)|h|
h→0
h→0
h
h
|h|
Der Differenzenquotient divergiert also bestimmt gegen ∞, wenn h gegen 0 strebt.
Anschaulich gesprochen, wird der Graph der Funktion f an der Stelle x0 = 0 un”
endlich steil“ (siehe auch Abbildung 6.2 (c)).
♦
Als nächstes kommen wir zu den bekannten Rechenregeln für differenzierbare Funktionen,
welche in den nachfolgenden Sätzen zusammengefasst sind.
Satz 6.3. Seien (W, k · k) ein normierter Raum über K, und sei D ⊆ R eine nichtleere
Menge. Seien außerdem f : D → W , g : D → W und α : D → K Funktionen, die an einer
Stelle x0 ∈ D◦ differenzierbar sind. Dann gelten die folgenden Aussagen.
(1) Die Funktion f + g : D → W ist an der Stelle x0 differenzierbar, und es gilt
(f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).
(2) Die Funktion αf : D → W ist an der Stelle x0 differenzierbar, und es gilt
(αf )0 (x0 ) = α0 (x0 )f (x0 ) + α(x0 )f 0 (x0 )
Ist (W, k · k) eine normierte Algebra über K, so gilt außerdem
(3) Die Funktion f g : D → W ist an der Stelle x0 differenzierbar, und es gilt
(f g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
Die Aussagen von Satz 6.3 sind auch als Summen- und Produktregeln der Differentialrechnung bekannt. Da für jede konstante Funktion α : D → K, x 7→ α0 stets α0 (x) = 0 für alle
x ∈ D gilt, folgt aus der Aussage (2) auch die Regel des konstanten Faktors. Diese besagt
folgendes: Ist f : D → W eine Funktion, welche an einer Stelle x0 ∈ D◦ differenzierbar
ist, und ist α0 ∈ K eine Konstante, dann ist die Funktion α0 f : D → W ebenfalls an der
Stelle x0 differenzierbar, und es gilt
(α0 f )0 (x0 ) = α0 f 0 (x0 ).
Den nachfolgenden Satz nennt man auch die Quotientenregel der Differentialrechnung.
Satz 6.4. Sei D ⊆ R eine nichtleere Menge, und seien f : D → K und g : D → K \ {0}
zwei Funktionen, welche an einer Stelle x0 ∈ D◦ differenzierbar sind. Dann ist die Funktion
f
:D→K
g
an der Stelle x0 ebenfalls differenzierbar, und es gilt
0
f
f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
(x0 ) =
2
g
g(x0 )
124
KAPITEL 6. DIFFERENTIALRECHNUNG
Die Liste der Rechenregeln für Ableitungen wird komplettiert durch die so genannte Kettenregel.
Satz 6.5. Sei (W, k · k) ein normierter Raum über K, und seien C ⊆ R und D ⊆ R zwei
nichtleere Mengen. Seien ferner f : D → W und g : C → D zwei Funktionen, so dass g an
einer Stelle x0 ∈ C ◦ differenzierbar ist, und so dass f an der Stelle g(x0 ) differenzierbar
ist. Dann ist die Funktion f ◦ g : C → W an der Stelle x0 ebenfalls differenzierbar, und es
gilt
(f ◦ g)0 (x0 ) = (f 0 ◦ g)(x0 )g 0 (x0 ).
Mit Hilfe der Sätze 6.3, 6.4 und 6.5 kann man die Ableitungen zahlreicher Funktionen
berechnen. Besonders wichtig ist dabei die Kettenregel, da sich viele Funktionen als Verkettung einfacherer Funktionen schreiben lassen, deren Ableitungen man kennt.
Beispiele.
(a) Wir betrachten die Funktion f : R → R, welche durch
f (x) := x6 (7 + x + x2 )4
für alle x ∈ R definiert ist. Als Verknüpfung differenzierbarer Funktionen ist f differenzierbar. Durch Anwendung der Summen-, Produkt- und Kettenregel (Satz 6.3
und Satz 6.5) ergibt sich für die Ableitung f : R → R die Zuordnungsvorschrift
f 0 (x) = 6x5 (7 + x + x2 )4 + 4x6 (7 + x + x2 )3 (1 + 2x)
für alle x ∈ R.
(b) Die Funktion g : R → R sei durch
g(x) :=
x + x3
1 + x2
für alle x ∈ R definiert. Als Verknüpfung differenzierbarer Funktionen ist g differenzierbar. Zur Bestimmung der Ableitung g 0 : R → R verwendet man die Quotientenregel (Satz 6.3 und Satz 6.4) und erhält
g 0 (x) =
(1 + x3 )(1 + x2 ) − 2x(x + x3 )
(1 + x2 )2
für alle x ∈ R.
♦
Wir kommen nun noch zu einem wichtigen Satz, der es uns erlaubt, Ableitungen von
solchen Funktionen zu bestimmen, die als Grenzfunktionen von Potenzreihen definiert
sind.
P
n
Satz 6.6. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R mit der Variable x, welche auf
einer offenen Kugel Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) konvergiert. Dann ist f
differenzierbar, und die Ableitung f 0 : Br (x0 ) → R ist durch
0
f (x) =
n
X
n=1
für alle x ∈ Br (x0 ) gegeben.
nan (x − x0 )n−1
6.1. DIFFERENZIERBARKEIT
125
Beispiele.
(a) Wir betrachten die Exponentialfunktion exp : R → R, x 7→ ex . Diese ist bekanntlich
die Grenzfunktion der Potenzreihe
∞
X
xn
n!
n=0
=1+x+
x2 x3
+
+ ··· ,
2!
3!
welche auf ganz R konvergiert. Gemäß Satz 6.6 gilt
exp0 (x) =
∞
∞
∞
X
X
xn−1 X xn−1
xn
=
=
= exp(x)
n
n!
(n − 1)!
n!
n=1
n=1
n=0
für alle x ∈ R. Die Ableitung der Exponentialfunktion ist also die Exponentialfunktion selbst.
(b) Mit Hilfe von Satz 6.6 kann man ebenfalls zeigen, dass sin0 = cos und cos0 = − sin
gilt.
Bekanntlich ist der natürliche Logarithmus ln : (0, ∞) → R die Umkehrfunktion der
Exponentialfunktion exp : R → R, d.h. es gilt x = exp(ln(x)) für alle x > 0. Diese
Identität kann bei der Bestimmung gewisser Ableitungen hilfreich sein.
Beispiele.
(a) Sei f : (0, ∞) → R die identische Funktion auf (0, ∞), welche gemäß f (x) = x für
alle x > 0 definiert ist. Die Ableitung f 0 : (0, ∞) → R dieser Funktion ist dann durch
f 0 (x) = 1 für alle x > 0 definiert. Nun stellt man fest, dass auch f (x) = exp(ln(x))
für alle x > 0 gilt. Nach der Kettenregel muss also 1 = f 0 (x) = ln0 (x) exp(ln(x)) =
ln0 (x)x für alle x > 0 gelten. Daraus folgt, dass ln0 (x) = 1/x für alle x > 0 gilt.
(b) Für jede Zahl α ∈ R sei die Funktion fα : (0, ∞) → R durch fα (x) = xα für alle
x > 0 definiert. Aufgrund der Identität x = exp(ln(x)) erhält man für die Funktion fα
die Darstellung fα (x) = exp(α ln(x)). Die Kettenregel liefert entsprechend fα0 (x) =
αx−1 exp(α ln(x)) = αx−1 xα = αxα−1 für alle x > 0.
(c) Für jede reelle Zahl α > 0 sei die Funktion gα : R → R durch gα (x) = αx für
alle x ∈ R definiert. Wegen α = exp(ln(α)) ist kann die Funktion gα auch durch
gα (x) = exp(x ln(α)) dargestellt werden. Mit der Kettenregel ergibt sich somit
g 0 (x) = ln(α) exp(x ln(α)) = ln(α)αx für alle x ∈ R.
Übungsaufgaben
1. Berechnen Sie die Ableitungen der folgenden Funktionen:
f1 : R → R, x 7→ 3x4 + 2x2 − 5x + 1,
f2 : (−∞, 0) → R, x 7→
√
1 − x,
f5 : (0, π) → R, x 7→ cot(x) =
cos(x)
,
sin(x)
f6 : R → R → R, x 7→ 4x ln(x2 + 1),
e3x
f3 : (0, ∞) → R, x 7→ √ ,
x
f7 : (0, ∞) → R, x 7→ xx ,
f4 : R → R, x 7→ sin(x) cos(2x),
f8 : R \ Z → R, x 7→ x − bxc.
126
KAPITEL 6. DIFFERENTIALRECHNUNG
2. Berechnen Sie die Ableitungen der vektorwertigen Funktionen f : (0, 2π) → R2 , g : [0, 1] →
R2 und h : R → R2 , welche durch
√
te2t
t cos(t)
4t
√
f (t) = √
, g(t) =
,
h(t)
=
1 − t2
1 + t2
t sin(t)
definiert sind.
3. Bestimmen Sie die Menge aller Stellen, an denen die folgenden Funktionen differenzierbar
sind:
(
sin(x)/x falls x 6= 0,
f1 : R → R, x 7→
1
falls x = 0,
(
(x − 1)2 falls x < 0,
f2 : R → R, x 7→
(x + 1)2 falls x ≥ 0,
(
√
sin( −x) falls x < 0,
f3 : R → R, x 7→
√
− sin( x) falls x ≥ 0,
(
(2x − 2)/(1 + x2 ) falls x < 1,
f4 : R → R, x 7→
ln(x)
falls x ≥ 1,
4. Weisen Sie mit Hilfe von Satz 6.6 die folgenden Identitäten nach: sin0 = cos, cos0 = − sin,
sinh = cosh und cosh0 = sinh.
5. Weisen Sie mit Hilfe von Satz 6.6 nach, dass ln(x) = 1/x für alle x ∈ (0, 2) gilt. Verwenden
Sie dazu die Potenzreihendarstellung des natürlichen Logarithmus zur Entwicklungsstelle 1
(siehe Beispiel (e) auf Seite 5).
6. Berechnen Sie die Ableitung der Funktion f : (0, 2) → R, welche durch
f (x) =
für alle x ∈ (0, 2) definiert ist.
∞
X
(−1)n
(x − 1)n
2−n
n
n=2
6.2. DER MITTELWERTSATZ
6.2
127
Der Mittelwertsatz
In diesem Abschnitt kommen wir zu einem wichtigen Satz, der für alle differenzierbaren
Funktionen gilt, die auf Teilmengen der reellen Zahlen definiert sind. Dieser Satz ist als
Mittelwertsatz der Differentialrechnung oder einfach als Mittelwertsatz bekannt. Zunächst
benötigen wir jedoch das folgende Lemma.
Lemma 6.7. Sei D ⊆ R ein nichtleere Menge, und sei f : D → R eine differenzierbare
Funktion, die an einer Stelle ξ ∈ D◦ ihr Minimum bzw. ihr Maximum annimmt. Dann gilt
f 0 (ξ) = 0.
Man beachte dass im Lemma 6.7 vorausgesetzt wird, dass ξ ein innerer Punkt der Definitionsmenge D von f ist. Wenn die Funktion f ihr Minimum bzw. ihr Maximum an einem
Randpunkt ξ von D annimmt, dann gilt f 0 (ξ) = 0 im Allgemeinen nicht. Die Funktion
f : [0, 1] → R, x 7→ x nimmt ihr Minimum beispielsweise an der Stelle x = 0 und ihr
Maximum an der Stelle x = 1 an. Es gilt jedoch f 0 (0) = f 0 (1) = 1.
Mit Lemma 6.7 und dem Satz von Minimum und Maximum (Satz 5.15) kann man den
folgenden Satz beweisen, der als Satz von Rolle bekannt ist.
Satz 6.8 (Satz von Rolle). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine
differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b, [a, b] ⊆ D
und f (a) = f (b) gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass f 0 (ξ) = 0 gilt.
Die Aussage des Satzes von Rolle kann folgendermaßen formuliert werden: Jede differenzierbare Funktion, die auf einem abgeschlossenen Intervall definiert ist, und die an den Intervallgrenzen dieselben Funktionswerte aufweist, besitzt mindestens eine stationäre Stelle
im Innern des Intervalls. Ähnlich wie der Nullstellensatz von Bolzano (Satz 5.13) nur die
Existenz von mindestens einer Nullstelle sichert, sichert der Satz von Rolle lediglich die
Existenz von mindestens einer stationären Stelle. Darüber hinausgehende Informationen,
etwa zur genauen Anzahl stationärer Stellen oder zu deren Lage, liefert der Satz von Rolle
nicht. Dennoch ist er oft nützlich, weshalb er hier erwähnt wird. Außerdem folgt aus dem
Satz von Rolle der Mittelwertsatz der Differentialrechnung.
Satz 6.9 (Mittelwertsatz). Sei D ⊆ R eine nichtleere Menge, und sei f : D → R eine
differenzierbare Funktion. Seien ferner a, b ∈ R zwei reelle Zahlen, so dass a < b und
[a, b] ⊆ D gilt. Dann existiert eine Zahl ξ ∈ (a, b), so dass
f (b) − f (a)
= f 0 (ξ)
b−a
gilt.
Der Mittelwertsatz bedeutet anschaulich folgendes: Ist die reellwertige Funktion f auf
einem abgeschlossenen Intervall [a, b] definiert, dann existiert eine Stelle ξ ∈ (a, b) derart,
dass die Tangente an den Graphen von f an der Stelle ξ dieselbe Steigung besitzt wie die
Sekante an den Graphen von f an den Stellen a und b. Der Mittelwertsatz zählt neben
dem Zwischenwertsatz und dem Satz vom Minimum und Maximum zu den bekanntesten
und wichtigsten Sätzen der Analysis. Eine wichtige Folgerung aus dem Mittelwertsatz der
Differentialrechnung ist die so genannte Regel von de l’Hôpital (alternative Schreibweise:
Regel von de l’Hospital).
128
KAPITEL 6. DIFFERENTIALRECHNUNG
(b)
(a)
Abbildung 6.3: (a) Veranschaulichung des Satzes von Rolle: Die Funktion f besitzt im
Intervall (a, b) eine stationäre Stelle ξ. (b) Veranschaulichung des Mittelwertsatzes: Die
Tangente an den Graphen von f an der Stelle ξ besitzt dieselbe Steigung wie die Sekante
durch die Punkte (a, f (a)) und (b, f (b)).
Satz 6.10 (Regel von de l’Hôpital). Sei D ⊆ R eine nichtleere Menge, und sei x0 ∈ D
ein Punkt dieser Menge. Ferner seien f : D → R und g : D → R zwei Funktionen, für die
entweder
lim f (x) = lim g(x) = 0
x→x0
x→x0
oder
lim |f (x)| = lim |g(x)| = ∞
x→x0
gilt. Dann gilt
lim
x→x0
x→x0
f 0 (x)
f (x)
= lim 0
,
g(x) x→x0 g (x)
wenn der Grenzwert auf der rechten Seite existiert. Wenn die Funktion f 0 /g 0 für x → x0
bestimmt divergiert, dann divergiert auch die Funktion f /g. Dieser Satz gilt auch, wenn
man den Ausdruck x → x0 jeweils durch x → x0 +, x → x0 −, x → ∞ oder x → −∞
ersetzt.
Die Regel von de l’Hôpital kann verwendet werden, um gewisse Funktionsgrenzwerte zu
bestimmen. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Bei der Bestimmung des Grenzwerts
ex − e
lim √
x→1
x−1
kann die Regel von de l’Hôpital angewendet werden, da sowohl der Zähler als auch
der Nenner des Bruchs gegen Null konvergiert, wenn x gegen 1 strebt. Man erhält
√
ex − e l’H
ex
lim √
= lim 1 −1/2 = lim 2 xex = 2e.
x→1
x→1 x
x→1
x−1
2
Mit l’H“ wird hierbei die Stelle angedeutet, an der die Regel von de l’Hôpital ver”
wendet wird.
(b) Auch der Grenzwert
lim x ln(x)
x→0+
6.2. DER MITTELWERTSATZ
129
kann mit der Regel von de l’Hôpital bestimmt werden. Es gilt nämlich
x ln(x) =
ln(x)
.
x−1
Der Zähler des Bruchs auf der rechten Seite divergiert bestimmt gegen −∞, während
der Nenner gegen ∞ bestimmt divergiert, wenn x von rechts gegen Null strebt. Man
erhält daher
ln(x) l’H
x−1
=
lim
= lim −x = 0
x→0+ x−1
x→0+ −x−2
x→0+
lim x ln(x) = lim
x→0+
als rechtsseitigen Grenzwert.
(c) Manchmal muss die Regel von de l’Hôpital mehrfach angewendet werden, um den
Grenzwert bestimmter Funktionen zu bestimmen. Man betrachte etwa den Grenzwert
sin(x2 ) − x2
lim
x→0
x3
Durch zweimaliges Anwenden der Regel von de l’Hôpital erhält man
2x cos(x2 ) − 2x
2 cos(x2 ) − 2
sin(x2 ) − x2 l’H
=
lim
=
lim
x→0
x→0
x→0
x3
3x2
3x
2
−4x sin(x )
l’H
= 0.
= lim
x→0
3
lim
Dasselbe Ergebnis erhält man, wenn man die Funktion x 7→ sin(x2 ) als Potenzreihe
darstellt.
♦
Die Regel von de l’Hôpital ist eine Rechenregel, mit der Funktionsgrenzwerte bestimmt
werden können. Sie darf keinesfalls mit der Quotientenregel der Differentialrechnung verwechselt werden. Außerdem muss man bei der Bestimmung von Funktionsgrenzwerten
immer genau nachprüfen, ob die Voraussetzungen für die Regel von de l’Hôpital erfüllt
sind. Oft wird dies nicht beachtet. Man betrachte dazu das nachfolgende Beispiel
Beispiel. Bei der Bestimmung des einseitigen Grenzwerts
ln(x)
x→0+ x
lim
kann die Regel von de l’Hôpital nicht angewendet werden. Der Zähler des Bruches konvergiert nämlich bestimmt gegen −∞, während der Nenner gegen Null konvergiert. Wendet
man die Regel von de l’Hôpital dennoch an, erhält man das falsche Ergebnis, dass die
Funktion gegen ∞ bestimmt divergiert. Tatsächlich divergiert die Funktion bestimmt gegen −∞. Dies erkennt man, wenn man den Ansatz x = 1/t mit t > 0 verwendet. Man
erhält dann nämlich
ln(x)
ln(1/t)
= lim
= lim −t ln(t) = −∞.
t→∞ 1/t
t→∞
x→0+ x
lim
Hierbei wurde verwendet, dass ln(1/t) = ln(1) − ln(t) = − ln(t) für alle t > 0 gilt.
♦
130
KAPITEL 6. DIFFERENTIALRECHNUNG
Übungsaufgaben
1. Zeigen Sie: Eine differenzierbare Funktion f : R → R, die n ∈ N verschiedene Nullstellen
besitzt, besitzt auch mindestens n − 1 verschiedene stationäre Stellen.
2. Berechnen Sie die folgenden Grenzwerte mit der Regel von de l’Hôpital:
√
2
ln(x)
x2 − ex−1
x−1
,
lim x ln(x) , lim x
lim
,
lim √
.
x→0+
x→1
x→1 x3 − 1
x→1+
e
−e
x−1
3. Zeigen Sie, dass
xα − 1
α
=
x→1 xβ − 1
β
lim
für alle α ∈ R und alle β ∈ R \ {0} gilt.
4. Zeigen Sie, dass die Funktion f : R → R, welche durch
(
x1/x falls x > 0,
f (x) :=
0
falls x ≤ 0
für alle x ∈ R definiert ist, an jeder Stelle ihres Definitionsbereichs stetig und differenzierbar
ist.
6.3. STETIGE DIFFERENZIERBARKEIT
6.3
131
Stetige Differenzierbarkeit
Im letzten Abschnitt wurde gezeigt, dass eine Funktion nur dann differenzierbar sein kann,
wenn sie auch stetig ist. Es stellt sich nun die Frage, ob die Ableitung einer differenzierbaren
Funktion selbst wieder eine stetige Funktion ist. Tatsächlich ist dies im Allgemeinen nicht
der Fall. Daher führt man die Eigenschaft der Stetigen Differenzierbarkeit ein.
Definition (stetig differenzierbare Funktion). Sei (W, k · k) ein normierter Raum,
und sei D ⊆ R ein nichtleere, offene Menge. Eine Funktion f : D → W heißt stetig
differenzierbar, wenn sie differenzierbar ist, und wenn ihre Ableitung f 0 : D → W stetig
ist.
Wie die nachfolgenden Beispiele zeigen, ist nicht jede differenzierbare Funktion auch stetig
differenzierbar.
Beispiele.
(a) Die Funktion f : R → R sei durch
(
−x2
f (x) :=
x3
falls x < 0,
falls x ≥ 0
für alle x ∈ R definiert. Man kann sehr leicht zeigen, dass die Funktion f differenzierbar ist. Die Ableitung f 0 : R → R ist durch
(
−2x falls x < 0,
f (x) :=
3x2 falls x ≥ 0
für alle x ∈ R gegeben. Wie man leicht nachweist, ist die Ableitung f 0 stetig. Die
Funktion f ist also stetig differenzierbar.
(b) Die Funktion g : R → R, welche durch
(
x2 cos(1/x) falls x 6= 0,
g(x) :=
0
falls x = 0
für alle x ∈ R definiert ist, ist differenzierbar. Ihre Ableitung g 0 : R → R ist durch
(
2x cos(1/x) + sin(1/x) falls x 6= 0,
g 0 (x) :=
0
falls x = 0
für alle x ∈ R definiert. Da der Grenzwert der Ableitung g 0 in x0 = 0 jedoch nicht
existiert, ist g 0 nicht stetig. Die Funktion g ist also differenzierbar, aber nicht stetig
differenzierbar.
♦
Im folgenden nehmen wir an, dass D eine offene Teilmenge von R ist, und dass (W, k · k)
ein normierter Raum ist. Wenn eine Funktion f : D → W stetig differenzierbar ist, und
wenn die Ableitung f 0 : D → W sogar differenzierbar ist, dann kann man bekanntlich die
so genannte zweite Ableitung f 00 : D → W von f bestimmen. An jeder Stelle x0 ∈ D ist
die zweite Ableitung durch
f 0 (x0 + h) − f 0 (x0 )
h→0
h
f 00 (x0 ) := lim
132
KAPITEL 6. DIFFERENTIALRECHNUNG
definiert. Für k ∈ N definiert man allgemein die k-te Ableitung f (k) : D → W einer
Funktion f : D → W durch
f (k−1) (x0 + h) − f (k−1) (x0 )
h→0
h
f (k) (x0 ) := lim
für alle x0 ∈ D, wobei man f (0) := f setzt. Man erhält die k-te Ableitung von f also, indem
man jeweils die (k − 1)-te Ableitung von f erneut ableitet. Dies setzt natürlich voraus,
dass die (k − 1)-te Ableitung eine differenzierbare Funktion ist. In diesem Fall nennt man
f eine k-mal differenzierbare Funktion.
Definition (k-mal differenzierbare Funktion). Sei (W, k · k) ein normierter Raum, sei
D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine Funktion
f : D → W heißt k-mal differenzierbar, wenn die ersten k Ableitungen f 0 : D → W ,
f 00 : D → W , . . . , f (k) : D → W von f existieren.
Die k-te Ableitung f (k) einer k-mal differenzierbaren Funktion f kann stetig sein oder auch
nicht. Man kommt daher zu der folgenden Definition.
Definition (k-mal stetig differenzierbare Funktion). Sei (W, k · k) ein normierter
Raum, sei D ⊆ R ein nichtleere, offene Menge, und sei k ∈ N eine natürliche Zahl. Eine
Funktion f : D → W heißt k-mal stetig differenzierbar, wenn sie k-mal differenzierbar ist,
und wenn die k-te Ableitung von f stetig ist. Die Menge aller k-mal stetig differenzierbaren
Funktionen von D nach W wird üblicherweise mit C k (D, W ) bezeichnet. Falls W = R gilt,
bezeichnet man die Menge C k (D, W ) auch mit C k (D).
Gemäß der obigen Definition besteht für jede natürliche Zahl k ∈ N die Menge C k (D, W )
aus allen Funktionen von D nach W , die k-mal stetig differenzierbar sind. Es sollte noch
erwähnt werden, dass mit C 0 (D, W ) gelegentlich die Menge aller stetigen Funktionen von
D nach W bezeichnet wird. Man macht sich leicht klar, dass
C(D, W ) = C 0 (D, W ) ⊃ C 1 (D, W ) ⊃ C 2 (D, W ) ⊃ . . .
gilt. Mit wachsendem k gibt es also immer weniger Funktionen, die Elemente der Menge
C k (D, W ) sind. Sind f : D → W und g : D → W zwei Funktionen, für die eine natürliche
Zahl m ∈ N existiert, so dass f ∈ C k+m (D, W ) und g ∈ C k (D, W ) \ C k+m (D, W ) gilt, so
sagt man, dass f regulärer sei als g. Es stellt sich die Frage, ob es Funktionen gibt, die in
allen Mengen C 0 (D, W ), C 1 (D, W ), C 2 (D, W ), . . . . Solche Funktionen gibt es in der Tat,
und man nennt sie glatte Funktionen.
Definition (glatte Funktion). Sei (W, k · k) ein normierter Raum, und sei D ⊆ R ein
nichtleere, offene Menge. Eine Funktion f : D → W heißt glatt, wenn für jede natürliche
Zahl k die k-te Ableitungen f (k) : D → W von f existieren, und wenn f (k) stetig ist.
Die Menge aller glatten Funktionen von D nach W wird üblicherweise mit C ∞ (D, W )
bezeichnet. Falls W = R gilt, bezeichnet man die Menge C ∞ (D, W ) auch mit C ∞ (D).
Ist D eine nichtleere, offene Teilmenge der reellen Zahlen und (W, k · k) ein normierter
Raum, so ist die Menge aller glatten Funktionen von D nach W genau die Schnittmenge
aller Mengen C k (D, W ) mit k ∈ N, d.h. es gilt
∞
C (D, W ) =
∞
\
C k (D, W ).
k=1
Abschließend geben wir einige wichtige Beispiele für glatte Funktionen an.
6.3. STETIGE DIFFERENZIERBARKEIT
133
Beispiele.
(a) Jedes Polynom vom Grad n ∈ N ist stetig und differenzierbar. Die Ableitung eines
solchen Polynoms ist wieder ein Polynom vom Grad n − 1. Ferner ist die Ableitung
eines Polynoms vom Grad Null ist immer die Nullfunktion, welche ebenfalls stetig
und differenzierbar ist. Daher ist jedes Polynom eine glatte Funktion.
(b) Die Exponentialfunktion exp : R → R, x 7→ ex ist stetig und differenzierbar. Die
Ableitung der Exponentialfunktion ist die Exponentialfunktion selbst. Dementsprechend ist die Exponentialfunktion glatt.
(c) Die Funktionen Sinus und Cosinus sind glatt.
♦
Übungsaufgaben
1. Bestimmen Sie die ersten drei Ableitungen der folgenden Funktionen:
f1 : R → R, x 7→ x3 + 2x2 − 3x + 4,
2
f2 : R → R, x 7→ e−x ,
f3 : R → R, x 7→ sin(2πx),
f4 : R → R, x 7→ x ln(x2 + 1).
2. Für jede natürliche Zahl n ∈ N sei die Funktion pn : R → R durch pn (x) := xn für alle n ∈ N
definiert. Geben Sie allgemein die k-te Ableitung von pn für k ∈ {1, . . . , n} an. Wie lautet
jeweils die (n + 1)-te Ableitung von pn ?
3. Zeigen Sie, dass die Funktion f : R → R, definiert durch
(
x3 sin(1/x) falls x 6= 0,
f (x) :=
0
falls x = 0
für alle x ∈ R, stetig differenzierbar ist.
4. Zeigen Sie, dass die Funktion f : R → R, welche durch
(
x3 sin(1/x2 ) falls x 6= 0,
f (x) :=
0
falls x = 0
für alle x ∈ R, differenzierbar, aber nicht stetig differenzierbar ist.
5. Für jede natürliche Zahl n ∈ N, sei die Funktion fn : R → R durch
(
xn+1 falls x ≥ 0,
fn (x) :=
0
falls x < 0
für alle x ∈ R definiert. Zeigen Sie, dass f ∈ C n (R) \ C n+1 (R) für alle n ∈ N gilt.
134
6.4
KAPITEL 6. DIFFERENTIALRECHNUNG
Der Satz von Taylor
Funktionen von der Form f : D → R, wobei D eine nichtleere Teilmenge der reellen
Zahlen ist, dienen oft zur Modellierung von physikalischen oder wirtschaftswissenschaftlichen Zusammenhängen. Da solche Zusammenhänge sehr komplex sein können, ist auch die
Funktion f in der Regel nicht von einfacher Form, also insbesondere kein Polynom oder
keine einfache Exponentialfunktion. Man ist daher oft bestrebt, eine komplizierte Funktion, zumindest in der Nähe einer bestimmten Stelle ihres Definitionsbereichs, durch ein
Polynom anzunähern. Eine wichtige Rolle spielt dabei der so genannte Satz von Taylor,
um den es in diesem Abschnitt gehen soll. Zunächst machen wir die folgende Beobachtung.
P
n
Lemma 6.11. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel
Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert. Dann gilt f ∈ C ∞ (Br (x0 )),
sowie
∞
X
f (n) (x0 )
f (x) =
(x − x0 )n
n!
n=0
für alle x ∈ Br (x0 ).
Gemäß
6.11 sind alle Ableitungen f 0 , f 00 , f 000 , . . . der Grenzfunktion f einer PotenzPLemma
∞
reihe n=0 an (x − x0 )n an der Entwicklungsstelle x0 durch die Koeffizienten a1 , a2 , a3 , . . .
der Potenzreihe bestimmt. Es gilt nämlich
an =
f (n) (x0 )
n!
für alle n ∈ N0 . Hierbei bezeichnet f (n) die n-te Ableitung von f . Wie üblich definiert man
f (0) := f . Es fällt auf, dass die Ausdrücke auf der rechten Seite des Gleichheitszeichens
nicht nur für solche Funktionen f gebildet werden können, die Grenzfunktionen einen
Potenzreihe sind. Tatsächlich können die Ausdrücke für alle glatten Funktionen f gebildet
werden. Fasst man diese Ausdrücke dann als Koeffizienten einer Potenzreihe auf, so gelangt
man zu den so genannten Taylor–Reihen.
Definition (Taylor–Reihe). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein
Punkt dieser Menge, und sei f ∈ C ∞ (D) eine glatte, reellwertige Funktion. Dann heißt
die Potenzreihe
∞
X
f (n) (x0 )
(x − x0 )n
n!
n=0
auf R mit der Variable x die Taylor–Reihe von f zur Entwicklungsstelle x0 .
Eine Potenzreihe ist bekanntlich zunächst nichts anderes als eine Folge von Polynomen,
den so genannten Partialpolynomen der Potenzreihe. Wir erinnernPuns, dass zu jeder Zahl
n
N ∈ N0 das N -te Partialpolynom fN : R → R einer Potenzreihe ∞
n=0 an (x − x0 ) auf R
durch fN (x) = a0 + a1 (x − x0 ) + a2 (x − x0 )2 + · · · + aN (x − x0 )N für alle x ∈ R gegeben
ist. Die Partialpolynome einer Taylor–Reihe bezeichnet man als Taylor–Polynome. Solche
Taylor–Polynome können auch für nichtglatte Funktionen definiert werden.
6.4. DER SATZ VON TAYLOR
135
Definition (Taylor–Polynom). Sei D ⊆ R eine nichtleere Menge, sei x0 ∈ D◦ ein
innerer Punkt dieser Menge, sei N ∈ N0 eine natürliche Zahl, und sei f : D → R eine
N -mal differenzierbare Funktion. Dann heißt das Polynom TN,x0 : R → R, welches durch
TN,x0 (x) :=
N
X
f (n) (x0 )
n=0
n!
(x − x0 )n
= f (x0 ) + f 0 (x0 )(x − x0 ) +
f 00 (x0 )
f N (x0 )
(x − x0 )2 + · · · +
(x − x0 )N
2!
N!
für alle x ∈ R definiert ist, das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 .
In den nachfolgenden Beispielen wird verdeutlicht, wie man Taylor–Polynome zu gegebenen Funktionen bestimmt.
Beispiele.
√
(a) Wir betrachten die Funktion f : (−1, ∞) → R, welche durch f (x) := 1 + x für alle
x ∈ (−1, 1) definiert ist. Es soll das dritte Taylor–Polynom T3,0 : R → R von f zur
Entwicklungsstelle x0 = 0 bestimmt werden. Für alle x ∈ R gilt
T3,0 (x) = f (0) + f 0 (0)x +
f 00 (0) 2 f 000 (0) 3
x +
x .
2
3!
Die ersten drei Ableitungen der Funktion f sind durch
1
,
f 0 (x) = √
2 x+1
1
f 00 (x) = − p
,
4 (x + 1)3
3
f 000 (x) = p
8 (x + 1)5
für alle x ∈ (−1, 1) gegeben. Es gilt also f (0) = 1, f 0 (0) = 1/2, f 00 (0) = −1/4, sowie
f 000 (0) = 3/8. Demzufolge erhält man
T3,0 (x) = 1 +
x x2 x3
−
+
2
8
16
für alle x ∈ R.
(b) Wir bestimmen das dritte Taylor–Polynom T3,1 : R → R des natürlichen Logarithmus ln : (0, ∞) → R zur Entwicklungsstelle x0 = 1. Dieses ist durch
T3,1 (x) = ln(1) + ln0 (1)(x − 1) +
ln00 (1)
ln000 (1)
(x − 1)2 +
(x − 1)3
2
3!
für alle x ∈ R gegeben. Offenbar gilt
ln0 (x) =
1
,
x
ln00 (x) = −
1
,
x2
ln000 (x) =
2
x3
für alle x ∈ (0, ∞), und so erhält man ln(1) = 0, ln0 (1) = 1, ln00 (1) = −1 und
ln000 (1) = 2. Das Taylor–Polynom besitzt also die Darstellung
T3,1 (x) = (x − 1) −
für alle x ∈ R.
(x − 1)2 (x − 1)3
+
2
3
136
KAPITEL 6. DIFFERENTIALRECHNUNG
(c) Zu jeder Zahl N ∈ N0 soll das jeweilige N -te Taylor–Polynom der Exponentialfunktion exp : R → R, x 7→ ex zur Entwicklungsstelle x0 = 0 bestimmt werden. Zunächst
erhält man, dass die N -te Ableitung der Exponentialfunktion wieder die Exponentialfunktion ist. Entsprechend gilt exp(n) (x0 ) = exp(0) = 1 für alle N ∈ N0 . Das N -te
Taylor–Polynom TN,0 : R → R ist also durch
TN,0 (x) = 1 + x +
x2
xN
+ ··· +
2!
N!
P
n
gegeben. Offenbar ist TN,0 das N -te Partialpolynom der Potenzreihe ∞
n=0 x /n!,
die ja bekanntlich auf ganz R punktweise gegen die Exponentialfunktion konvergiert.
Wegen Lemma 6.11 war dies auch zu erwarten.
♦
Im Beispiel (c) wurde deutlich, dass die Taylor–Polynome der Exponentialfunktion
zur
P∞ n
Entwicklungsstelle Null genau den Partialpolynomen der Potenzreihe
x
/n!
entn=0
sprechen. Demzufolge entspricht auch die Taylor–Reihe der Exponentialfunktion zur Entwicklungsstelle Null genau dieser Potenzreihe. Das Beispiel verdeutlicht ein allgemeines
Prinzip, das im nachfolgenden Lemma formuliert ist.
P
n
Lemma 6.12. Sei ∞
n=0 an (x − x0 ) eine Potenzreihe auf R, die in einer offenen Kugel
Br (x0 ) gegen eine Grenzfunktion f : Br (x0 ) → R konvergiert.
Dann ist die Taylor–Reihe
P
a
(x − x0 )n .
von f zur Entwicklungsstelle x0 genau die Potenzreihe ∞
n
n=0
Kennt man also die Potenzreihendarstellung einer Funktion f für eine bestimmte Entwicklungsstelle x0 , so kennt man laut Lemma 6.12 auch die Taylor–Reihe sowie sämtliche
Taylor–Polynome von f zur Entwicklungsstelle x0 .
Wir wissen nun, wie man Taylor–Polynome zu einer gegebenen Funktion f berechnet.
Ist f die Grenzfunktion einer Potenzreihe auf R mit der Entwicklungsstelle x0 , so sind die
Taylor–Polynome zur Entwicklungsstelle x0 genau die Partialpolynome der Potenzreihe.
Mit wachsendem N approximiert das N -te Taylor–Polynom die Funktion f also immer
besser. Es stellt sich nun die Frage, ob dies auch für die Taylor–Polynome von Funktionen gilt, die nicht als Grenzfunktionen von Potenzreihen dargestellt werden können. Eine
Aussage dazu liefert der wichtige Satz von Taylor.
Satz 6.13 (Taylor). Sei D ⊆ R eine nichtleere, offene Menge, sei x0 ∈ D ein Punkt dieser
Menge, und sei r > 0 eine reelle Zahl, so dass Br (x0 ) ⊆ D gilt. Sei außerdem N ∈ N0
eine natürliche Zahl und f ∈ C N +1 (D) eine (N + 1)-mal stetig differenzierbare Funktion.
Dann existiert für alle x ∈ Br (x0 ) eine Stelle ξ ∈ Br (x0 ), mit
(
(x0 , x) falls x > x0 ,
ξ∈
(x, x0 ) falls x < x0 ,
so dass
f (x) = TN,x0 (x) +
f (N +1) (ξ)
(x − x0 )N +1
(N + 1)!
gilt. Hierbei bezeichnet TN,x0 das N -te Taylor–Polynom von f zur Entwicklungsstelle x0 .
Die Bedeutung des Satzes von Taylor wird klar, wenn man sich vorstellt, dass man eine
gegebene Funktion f ∈ C N +1 (D), wobei D eine offene Teilmenge von R ist, nahe einer
Stelle x0 ∈ D durch das entsprechende Taylor–Polynom TN,x0 approximieren will. Die
6.4. DER SATZ VON TAYLOR
137
Abbildung 6.4: Graph der Funktion f : (−1, ∞) → R, x 7→
drei Taylor–Polynome T0,0 , T1,0 und T2,0 .
√
1 + x so wie der ersten
Frage ist dann nämlich, wie gut diese Approximation ist. Wertet man nämlich anstatt
der Funktion f das Taylor–Polynom TN,x0 an einer Stelle x aus, so erhält man einen
Funktionswert TN,x0 (x), der sich in der Regel von Funktionswert f (x) unterscheidet. Der
Approximationsfehler beträgt ist dabei durch |f (x) − TN,x0 (x)| gegeben. Der Satz von
Taylor ermöglicht nun eine Abschätzung dieses Fehlers nach oben. Es gilt nämlich
f (N +1) (ξ)
f (x) − TN,x (x) =
|x − x0 |N +1
0
(N + 1)!
für eine Stelle ξ die zwischen x und der Entwicklungsstelle x0 liegt. Anhand dieser Darstellung des Approximationsfehlers erkennt man, dass der Funktionswert f (x) durch den
Funktionswert TN,x0 (x) des Taylor–Polynoms umso besser approximiert wird, je größer N
ist, je kleiner |f (N +1) (ξ)| ist, und je näher x an der Entwicklungsstelle x0 liegt. Oftmals
kann der Ausdruck auf der rechten Seite des Gleichheitszeichens nach oben abgeschätzt
werden, wodurch man eine obere Schranke für den Approximationsfehler erhält. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) In den Ingenieurswissenschaften wird häufig die Näherungsformel
√
1+x≈1+
x
2
verwendet. Betrachtet man noch einmal das Beispiel (a) auf Seite 135, so erkennt
man,
dass hier offenbar die Funktion f : (−1, ∞) → R, definiert durch f (x) :=
√
1 + x für alle x > −1, durch das erste Taylor–Polynom T1,0 : R → R zur Entwicklungsstelle x0 = 0 approximiert wurde. Wie groß ist der maximale Approximationsfehler, wenn beispielsweise −0, 5 ≤ x ≤ 0, 5 gilt? Nach dem Satz von Taylor existiert
für jedes x ∈ (−1, 1) eine Stelle ξ ∈ R, die zwischen x und x0 liegt, so dass
2
00
f (x) − T1,0 (x) = |f (ξ)| |x|2 = p |x|
2!
8 (ξ + 1)3
gilt. Der Ausdruck auf der rechten Seite wird also für x = ξ = −0, 5 maximal. Daher
gilt
2
f (x) − T1,0 (x) ≤ p |−0, 5|
≈ 0, 0884
8 (−0, 5 + 1)3
für −0, 5 ≤ x ≤ 0, 5. Je nach Anwendung muss ein Ingenieur nun entscheiden, ob
ein maximaler Approximationsfehler von 0, 0884 akzeptabel ist oder nicht.
138
KAPITEL 6. DIFFERENTIALRECHNUNG
(b) Die Cosinusfunktion soll in der Nähe der Stelle x0 = 0 durch ihr zweites Taylor–
Polynom T2,0 : R → R approximiert werden, welches durch
T2,0 (x) = 1 −
x2
2
für alle x ∈ R gegeben ist. Aus welcher Menge kann dann x gewählt werden, so dass
der Approximationsfehler |cos(x) − T2,0 (x)| garantiert kleiner als eine vorgegebene
Fehlerschranke ε > 0 ist? Nach dem Satz von Taylor existiert für jedes x ∈ R eine
Zahl ξ zwischen 0 und x, so dass
000
cos(x) − T2,0 (x) = |cos (ξ)| |x|3 = |sin(ξ)| |x|3
3!
3!
gilt. Eine Abschätzung der rechten Seite nach oben erhält man, wenn man die Un3 /6.
gleichung |sin(ξ)| ≤ 1 verwendet. Es ergibt sich dann |cos(x) − T2,0 (x)| ≤ |x|√
Wenn der Approximationsfehler kleiner als ε bleiben soll, muss man also |x| ≤ 3 6ε
wählen.
Übungsaufgaben
1. Bestimmen Sie die jeweils das dritte Taylor–Polynom zur Entwicklungsstelle x0 = 0 der
folgenden Funktionen:
f1 : R → R, x 7→ 2x ,
f2 : (−1, 1) → R, x 7→ 1/(1 − x),
f3 : (−1, 1) → R, x 7→ 1/(1 − x)2 ,
f4 : R → R, x 7→ xex .
Bestimmen Sie außerdem das dritte Taylor–Polynom der Tangensfunktion zur Entwicklungsstelle x0 = 0.
2. Bestimmen Sie die ersten drei Taylor–Polynome zur Entwicklungsstelle x0 = 0 der Funktion
f : R → R, welche durch f (x) = 3x2 − x + 4 für alle x ∈ R gegeben ist. Was fällt Ihnen auf?
Wie lautet die Taylor–Reihe der Funktion f zur Entwicklungsstelle x0 = 0?
3. Geben Sie die sechs Taylor–Polynome der Sinusfunktion zur Entwicklungsstelle x0 = 0 an.
Wie lautet die Taylor–Reihe der Sinusfunktion zur Entwicklungsstelle x0 = 0?
4. Zeigen Sie mit Hilfe des Satzes von Taylor, dass
lim
h→0+
f (x − h) − 2f (x) + f (x + h)
= f 00 (x)
h2
für jede Funktion f ∈ C 3 (R) und jede Stelle x ∈ R gilt.
5. Zur Herleitung der Schwingungsgleichung für ein idealisiertes Pendel verwendet man die
Näherungsformel sin(x) ≈ x. Geben Sie eine obere Schranke für den Approximationsfehler
an, wenn −1 ≤ x ≤ 1 gilt? Wie groß darf |x| maximal werden, wenn der Approximationsfehler
garantiert durch 10−1 nach oben beschränkt sein soll?
6.5. PARTIELLE DIFFERENZIERBARKEIT
6.5
139
Partielle Differenzierbarkeit
Bisher haben wir Ableitung von Funktionen betrachtet, die auf Teilmengen von R definiert
waren. In diesem Abschnitt wenden wir uns Funktionen zu, die auf Teilmengen von Rn
mit n ∈ N definiert sind. Für solche Funktionen führen wir zunächst das Konzept der
partiellen Differenzierbarkeit ein.
Definition (partiell differenzierbare Funktion, partielle Ableitung). Seien n ∈ N
und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner D ⊆ Rn eine nichtleere Menge, sei
x(0) ∈ D◦ ein innerer Punkt dieser Menge, und sei (W, k · k) ein normierter Raum über K.
Eine Funktion f : D → W heißt nach der k-ten Koordinate partiell differenzierbar an der
Stelle x(0) , wenn der Grenzwert
f x(0) + he(k) − f x(0)
(0)
∂k f x
:= lim
h→0
h
existiert. Hierbei bezeichnet e(k) den k-ten Vektor der Standardbasis des Rn . Die Zahl
∂k f (x) heißt dann die partielle Ableitung von f nach der k-ten Koordinate an der Stelle
x(0) . Die Funktion f wird partiell differenzierbar an der Stelle x(0) genannt, wenn alle partiellen Ableitungen ∂1 f (x(0) ), ∂2 f (x(0) ), . . . , ∂n f (x(0) ) von f an der Stelle x(0) existieren.
Die Funktion wird schließlich partiell differenzierbar genannt, wenn alle partiellen Ableitungen von f an jeder Stelle x(0) ∈ D existieren. In diesem Fall definiert man für jede Zahl
k ∈ {1, 2, . . . , n} die Funktion ∂k f : D◦ → W, x 7→ ∂k f (x), welche die partielle Ableitung
von f nach der k-ten Koordinate genannt wird.
Wir wollen einige der soeben eingeführten Begriffe anhand eines einfachen Beispiels erläutern.
Beispiel. Die Funktion f : R2 → R sei durch f (x) = x21 + x1 x2 + 3x2 für alle Vektoren
x = (x1 , x2 )T ∈ R2 definiert. An der Stelle x(0) = (0, 0)T gilt dann
f x(0) + he(1) − f x(0)
f (0, 0)T + h(1, 0)T − f (0, 0)T
(0)
∂1 f (x ) = lim
= lim
h→0
h→0
h
h
T
T
2
f (h, 0) − f (0, 0)
h
= lim
= lim
= lim h
h→0
h→0 h
h→0
h
= 0.
Die Funktion f ist also an der Stelle x(0) = (0, 0)T nach der ersten Koordinate partiell
differenzierbar. Die partielle Ableitung von f nach der ersten Koordinate an der Stelle
x(0) = (0, 0)T ist Null. Es gilt außerdem
f x(0) + he(2) − f x(0)
f (0, h)T − f (0, 0)T
(0)
∂2 f (x ) = lim
= lim
h→0
h→0
h
h
= 3.
Also ist die Funktion f an der Stelle x(0) = (0, 0)T auch nach der zweiten Koordinate
partiell differenzierbar, und die partielle Ableitung nach der zweiten Koordinate an dieser
Stelle beträgt 3. Da die partiellen Ableitungen nach beiden Koordinaten existieren, ist f
an der Stelle x(0) = (0, 0)T partiell differenzierbar.
♦
140
KAPITEL 6. DIFFERENTIALRECHNUNG
Als nächstes wenden wir uns der Frage zu, wie man partielle Ableitungen einer Funktion
berechnen kann. Das folgende Lemma liefert dazu die Grundlage.
Lemma 6.14. Seien n ∈ N und k ∈ {1, 2, . . . , n} zwei natürliche Zahlen. Sei ferner
(0) (0)
(0) T
D ⊆ Rn eine nichtleere Menge, sei x(0) = x1 , x2 , . . . , xn
∈ D◦ ein innerer Punkt
dieser Menge, und sei (W, k · k) ein normierter Raum über K. Weiterhin sei r > 0 eine
(0)
(0)
positive Zahl derart, dass Br (x(0) ) ⊆ D gilt, und I := (xk − r, xk + r) ein offenes
Intervall. Sei außerdem f : D → W eine Funktion, welche an der Stelle x(0) nach der k-ten
Koordinate partiell differenzierbar ist, und sei g : I → W diejenige Funktion, welche durch
T (0)
(0)
(0)
g(z) := f x1 , . . . , xk−1 , z, xk−1 , . . . , x(0)
n
(0) für alle z ∈ I definiert ist. Dann gilt ∂k f x(0) = g 0 xk .
Man mache sich folgendes klar: Die Funktion g in Lemma 6.14 gibt die Abhängigkeit der
Funktion f bezüglich der k-ten Komponente der vektorwertigen Variable in der Nähe der
Stelle x(0) wieder. Die partielle Ableitung von f nach der k-ten Koordinate an der Stelle
x(0) ist dann genau durch die Ableitung von g an der entsprechenden Stelle gegeben. Das
Lemma 6.14 stellt also einen Zusammenhang zwischen den partiellen Ableitungen einer
Funktion mit vektorwertiger Variable und der gewöhnlichen Ableitung von Funktionen
mit reellwertiger Variable her.
Hinsichtlich der Berechnung von partiellen Ableitungen besagt das Lemma 6.14 folgendes: Ist eine Funktion f gegeben, welche von den Komponenten x1 , x2 , . . . , xn eines
Vektors x ∈ Rn abhängt, so berechnet man zu gegebenem k ∈ {1, 2, . . . , n} die partielle
Ableitung nach der k-Koordinate ∂k f , indem man die Funktion f nach xk ableitet. Man
betrachtet also lediglich die Komponente xk als Variable und alle übrigen Komponenten
x1 , . . . , xk−1 , xk+1 , . . . , xn als Konstanten. Bei der Bestimmung der partiellen Ableitung
∂k f spielen also nur solche Terme eine Rolle, die von der Vektorkomponente xk abhängen.
Dabei gelten wieder alle bekannten Ableitungsregeln.
Beispiele.
(a) Die Funktion f : R2 → R sei durch f (x) := 3 sin(x1 ) sin(x2 ) + x1 + 2x2 für alle
Vektoren x = (x1 , x2 )T ∈ R2 definiert. Die Funktion f ist partiell differenzierbar.
Ihre partiellen Ableitungen ∂1 f : R2 → R und ∂2 f : R2 → R sind durch
∂1 f (x) = 3 cos(x1 ) sin(x2 ) + 1,
∂2 f (x) = 3 sin(x1 ) cos(x2 ) + 2
für alle x = (x1 , x2 )T ∈ R2 gegeben. Man erhält die partielle Ableitung ∂1 f , indem
man f nach der Variable x1 ableitet. In gleicher Weise erhält man die partielle
Ableitung ∂2 f , indem man f nach der Variable x2 ableitet.
(b) Die Funktion g : R3 → R sei durch g(x) := x1 x2 + x2 x3 + x3 x1 für alle Vektoren
x = (x1 , x2 , x3 )T ∈ R3 definiert. Die partiellen Ableitungen von f sind dann durch
∂1 g(x) = x2 + x3 ,
∂2 g(x) = x1 + x3 ,
∂3 g(x) = x2 + x1
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
♦
6.5. PARTIELLE DIFFERENZIERBARKEIT
141
Der Begriff der partiellen Ableitung wird auch auf Funktionen übertragen, welche von
mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R und Y ⊆ R zwei
nichtleere Mengen, ist (W, k · k) ein normierter Raum über K, und ist f : X × Y → W
eine Funktion, deren Variablen mit x und y bezeichnet werden, so definiert man zu je zwei
vorgegebenen Punkten x0 ∈ X ◦ und y0 ∈ Y die so genannte partielle Ableitung von f nach
x an der Stelle x = x0 und y = y0 durch
∂f
f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) := lim
.
h→0
∂x
h
In gleicher Weise definiert man zu je zwei vorgegebenen Punkten x0 ∈ X und y0 ∈ Y ◦
man die so genannte partielle Ableitung von f nach y an der Stelle x = x0 und y = y0
durch
f (x0 , y0 + h) − f (x0 , y0 )
∂f
(x0 , y0 ) := lim
.
h→0
∂y
h
Man erkennt, dass die partielle Ableitung von f nach x an der Stelle x = x0 und y = y0
ähnlich definiert ist, wie die Ableitung einer Funktion, die nur von einer reellwertigen
Variable abhängt. Dasselbe gilt für die partielle Ableitung von f nach y an der Stelle
x = x0 und y = y0 . Wenn die partiellen Ableitungen von f nach x bzw. nach y an jeder
möglichen Stelle existieren, so definiert man die Funktionen
∂f
: X ◦ × Y → W, (x, y) 7→
∂x
∂f
: X × Y ◦ → W, (x, y) 7→
∂y
∂f
(x, y),
∂x
∂f
(x, y),
∂y
welche die partiellen Ableitungen von f nach x bzw. nach y genannt werden.
Partielle Ableitungen nach den Variablen einer Funktion tauchen oft in der Physik und
in den Ingenieurswissenschaften auf. Die Variablen einer Funktion stellen dabei häufig bestimmte physikalische Größen dar. Leitet man eine Funktion partiell nach einer bestimmten
Variable ab, so erhält Informationen über das Änderungsverhalten der Funktion bezüglich
der jeweiligen physikalischen Größe. Von besonderer Wichtigkeit ist oft die partielle Ableitung einer Funktion f nach einer Zeitvariable, welche oft mit t bezeichnet wird. Eine
solche partiellen Ableitungen nach der Zeit“ wird oft mit f˙ bezeichnet. Man betrachte
”
dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die Funktion f : R × R × R → R sei durch f (x, y, z) := x2 y + sin(x + πz) für alle
x ∈ R, alle y ∈ R und alle z ∈ R definiert. Die partiellen Ableitungen ∂f /∂x, ∂f /∂y
und ∂f /∂z von f sind dann durch
∂f
(x, y, z) = 2xy + cos(x + πz),
∂x
∂f
(x, y, z) = x2 ,
∂y
∂f
(x, y, z) = π cos(x + πz)
∂z
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben sind.
(b) Die kinetische Energie T eines Körpers mit der Masse m und der konstanten Geschwindigkeit v ist durch
1
T = mv 2
2
142
KAPITEL 6. DIFFERENTIALRECHNUNG
gegeben. Die kinetische Energie kann also als eine Funktion T : [0, ∞) × [0, ∞) → R
betrachtet werden, welche durch T (m, v) := mv 2 /2 für alle m ≥ 0 und alle v ≥ 0
definiert ist. Die Änderungsraten der kinetischen Energie bezüglich der Masse m bzw.
bezüglich der Geschwindigkeit v werden durch die partiellen Ableitungen von T nach
m bzw. nach v beschrieben. Die partiellen Ableitungen ∂T /∂m : [0, ∞) × [0, ∞) → R
und ∂T /∂v : [0, ∞) × [0, ∞) → R sind dabei durch ∂T /∂m (m, v) = v 2 /2 und
∂T /∂v (m, v) = mv für alle m ≥ 0 und alle v ≥ 0 gegeben. Oftmals werden lediglich
die Formeln
∂T
v2
= ,
∂m
2
∂T
= mv
∂v
für die Änderungsraten angegeben.
(c) Ein Körper, der sich während einer Zeitspanne t mit einer konstanten Geschwindigkeit v fortbewegt, legt die Strecke s = vt zurück. Die zeitliche Änderungsrate
der Strecke ist durch die partielle Ableitung ṡ = v, also durch die Geschwindigkeit
gegeben.
♦
Wie man leicht erkennt, sind die partiellen Ableitungen in den zuvor genannten Beispielen allesamt stetige Funktionen. Im Allgemeinen kann man jedoch nicht erwarten, die
eine partielle Ableitung einer Funktion stetig ist. Man führt daher, ähnlich wie bei den
gewöhnlichen Ableitungen, den Begriff der stetigen partiellen Differenzierbarkeit ein.
Definition (stetig partiell differenzierbare Funktion). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, sei x(0) ∈ D◦ ein Punkt dieser Menge, und
sei (W, k · k) ein normierter Raum über K. Eine Funktion f : D → W heißt stetig partiell
differenzierbar, wenn sie partiell differenzierbar ist, und wenn die partiellen Ableitungen
∂1 f, ∂2 f, . . . , ∂n f stetige Funktionen sind.
Ähnlich wie man höhere Ableitungen f 00 , f 000 , . . . einer Funktion f bilden kann, die auf
einer Teilmenge von R definiert ist, kann man unter gewissen Voraussetzungen auch partielle Ableitungen höherer Ordnung von Funktion bilden, die auf Teilmengen des Rn mit
n ∈ N definiert sind. Sei n ∈ N eine natürliche Zahl, (W, k · k) ein normierter Raum und
f : D → W eine partiell differenzierbare Funktion, wobei D eine nichtleere, offene Teilmenge des Rn ist. Dann nennt man ∂1 f, ∂2 f, . . . , ∂n f die partiellen Ableitungen der Ordnung 1
von f . Eine partielle Ableitung der Ordnung 2 von f erhält man, indem man eine partielle
Ableitung der Ordnung 1 erneut partiell ableitet. Die so entstehenden partiellen Ableitungen ∂1 ∂1 f, ∂2 ∂1 f, . . . , ∂n ∂1 f, ∂1 ∂2 f, ∂2 ∂2 f, . . . , ∂n ∂2 f, ∂1 ∂n f, ∂2 ∂n f, . . . , ∂n ∂n f sind an
jeder Stelle x(0) ∈ D durch
∂l f x(0) + he(k) − ∂l f x(0)
(0)
∂k ∂l f x
:= lim
,
h→0
h
also durch ∂k ∂l f x(0) := ∂k (∂l f ) x(0) für alle k, l ∈ {1, 2, . . . , n} definiert. Dies setzt natürlich voraus, dass die partielle Ableitung ∂l f an der Stelle x(0) nach der k-ten Koordinate
partiell differenzierbar ist.
Allgemein erhält man eine partielle Ableitung der Ordnung k einer Funktion f , indem
man eine partielle Ableitung der Ordnung k−1 von f erneut partiell ableitet. Hierbei ist k ∈
N eine natürliche Zahl mit n ≥ 2. Man überlegt sich leicht, dass es zu einer Funktion, die auf
einer Teilmenge des Rn definiert ist, maximal nk partielle Ableitungen der Ordnung k gibt.
Dies setzt jedoch voraus, dass alle Ableitungen der Ordnungen k −1 partiell differenzierbar
sind. Man spricht in diesem Fall von einer k-mal partiell differenzierbaren Funktion.
6.5. PARTIELLE DIFFERENZIERBARKEIT
143
Definition (k-mal partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N zwei
natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k) ein
normierter Raum. Eine Funktion f : D → W heißt k-mal partiell differenzierbar, wenn
alle partiellen Ableitungen der Ordnung k von f existieren.
Die partiellen Ableitungen der Ordnung k einer k-mal partiell differenzierbaren Funktion
f können stetig sein oder auch nicht. Falls alle partiellen Ableitungen stetige Funktionen
sind, so nennt man f eine k-mal stetig partiell differenzierbare Funktion.
Definition (k-mal stetig partiell differenzierbare Funktion). Seien n ∈ N und k ∈ N
zwei natürliche Zahlen. Sei außerdem D ⊆ Rn eine nichtleere, offene Menge und (W, k · k)
ein normierter Raum. Eine Funktion f : D → W heißt k-mal stetig partiell differenzierbar,
wenn sie k-mal partiell differenzierbar ist, und wenn alle partiellen Ableitungen der Ordnung k von f stetig sind. Die Menge alle k-mal stetig partiell differenzierbaren Funktionen
von D nach W wird mit C k (D, W ) bezeichnet. Falls W = R gilt, bezeichnet man die
Menge C k (D, W ) auch mit C k (D).
In den nachfolgenden Beispielen werden partielle Ableitungen höherer Ordnung von zwei
Funktionen bestimmt. Dabei werden die folgenden Konventionen verwendet: Um anzudeuten, dass eine Funktion p-mal nach der k-ten Koordinate partiell abgeleitet wurde,
verwendet man das Symbol ∂km . Es ist gilt also
∂km f := ∂k · · · ∂k f
| {z }
p-mal
für jede Funktion f . Die partielle Ableitung, die durch p-maliges partielles Ableiten einer
Funktion f nach einer Variable x entsteht, wird mit ∂ p f /∂xp bezeichnet, d.h.
∂pf
∂
∂
f
:=
···
p
∂x
|∂x {z ∂x}
p-mal
Ferner bezeichnet man die partielle Ableitung, welche durch q-maliges partielles Ableiten
einer Funktion f nach einer Variable y und anschließendes p-maliges partielles Ableiten
von f nach einer zweiten Variable x entsteht, mit ∂ p+q f /(∂xp ∂y q ), also
∂ p+q f
∂
∂ ∂
∂
:=
···
···
f.
∂xp ∂y q
∂x
∂x
∂y
∂y
| {z } | {z }
p-mal
q-mal
Man beachte, dass bei einer solchen Ableitung zuerst nach y und dann nach x partiell
abgeleitet wird.
Beispiele.
(a) Die Funktion f : R2 → R sei durch f (x) := x31 x2 − x1 x42 für alle x ∈ R2 definiert.
Die beiden partiellen Ableitungen der Ordnung 1 von f sind durch
∂1 f (x) = 3x21 x2 − x42 ,
∂2 f (x) = x31 − 4x1 x32
144
KAPITEL 6. DIFFERENTIALRECHNUNG
für alle x ∈ R2 gegeben. Die vier partiellen Ableitungen der Ordnung 2 von f sind
durch
∂12 f (x) = 6x1 x2 ,
∂2 ∂1 f (x) = 3x21 − 4x32 ,
∂1 ∂2 f (x) = 3x21 − 4x32
∂22 f (x) = −12x1 x22
für alle x ∈ R2 gegeben. Die acht partiellen Ableitungen der Ordnung 3 von f sind
schließlich durch
∂13 f (x) = 6x2 ,
∂12 ∂2 f (x) = 6x1 ,
∂2 ∂12 f (x) = 6x1 ,
∂2 ∂1 ∂2 f (x) = −12x22 ,
∂1 ∂2 ∂1 f (x) = 6x1 ,
∂1 ∂22 f (x) = −12x22 ,
∂22 ∂1 f (x) = −12x22 ,
∂23 f (x) = −24x1 x2
für alle x ∈ R2 gegeben. Da alle partiellen Ableitungen bis zur Ordnung 3 stetige
Funktionen sind, ist f mindestens dreimal stetig partiell differenzierbar.
(b) Es sei z : [0, 1] × [0, 2π) → R die Funktion, die durch z(r, ϕ) := sin(πr) cos(4ϕ) für
alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) definiert ist. Die beiden partiellen Ableitungen der
Ordnung 1 von z sind dann durch
∂z
(r, ϕ) = π cos(πr) cos(4ϕ),
∂r
∂z
(r, ϕ) = −4 sin(πr) sin(4ϕ)
∂ϕ
für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Die partiellen Ableitungen der Ordnung 2 sind durch
∂2z
(r, ϕ) = −π 2 sin(πr) cos(4ϕ),
∂r2
∂2z
(r, ϕ) = −4π cos(πr) sin(4ϕ)
∂ϕ∂r
∂2z
(r, ϕ) = −4π cos(πr) sin(4ϕ),
∂r∂ϕ
∂2z
(r, ϕ) = −16 sin(πr) cos(4ϕ)
∂ϕ2
für alle für alle r ∈ [0, 1] und alle ϕ ∈ [0, 2π) gegeben. Da alle partiellen Ableitungen
bis zur Ordnung 2 stetige Funktionen sind, ist g mindestens zweimal stetig partiell
differenzierbar.
♦
In den zuvor genannten Beispielen fällt auf, dass einige partielle Ableitungen höherer
Ordnung identisch sind. So gilt in Beispiel (a) etwa ∂1 ∂2 f = ∂2 ∂1 f , wie auch ∂1 ∂22 f =
∂2 ∂1 ∂2 f = ∂22 ∂1 f und ∂2 ∂12 f = ∂1 ∂2 ∂1 f = ∂12 ∂2 f . Im Beispiel (b) erkennt man, dass
∂ 2 g/(∂r∂ϕ) = ∂ 2 g/(∂ϕ∂r) gilt. Dies ist kein Zufall. Vielmehr steckt dahinter ein allgemeines Prinzip, welches durch den Satz von Schwarz formuliert wird.
6.5. PARTIELLE DIFFERENZIERBARKEIT
145
Satz 6.15 (Schwarz). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene
Menge, sei (W, k · k) ein normierter Raum, und sei f ∈ C 2 (D, W ) eine zweimal stetig
partiell differenzierbare Funktion. Dann gilt ∂k ∂l f = ∂l ∂k f für alle k, l ∈ {1, 2, . . . , n}.
Umgangssprachlich kann die Aussage des Satzes von Schwarz folgendermaßen wieder
gegeben werden: Ist eine Funktion zweimal stetig partiell differenzierbar, so spielt es
bei der Bestimmung einer Ableitung der Ordnung 2 keine Rolle, in welcher Reihenfolge
die partiellen Ableitungen nach den jeweiligen Koordinate gebildet werden. Man überlegt sich leicht, dass diese Aussage verallgemeinert werden kann. Für eine dreimal stetig partiell differenzierbare Funktion f , die auf einer Teilmenge des Rn definiert ist,
gilt also ∂k ∂l ∂m f = ∂k ∂m ∂l f = ∂m ∂l ∂k f = ∂l ∂k ∂m f = ∂l ∂m ∂k f = ∂m ∂k ∂l f für alle
k, l, m ∈ {1, 2, . . . , m}.
Mit dem Satz von Schwarz kann man sich beim Berechnen von partiellen Ableitungen
höherer Ordnung ein gewisses Maß an Arbeit ersparen. Hat man nämlich beispielsweise
von einer zweimal stetig partiell differenzierbaren Funktion f die partielle Ableitung ∂1 ∂2 f
berechnet, so muss man die partielle Ableitung ∂2 ∂1 f nicht gesondert berechnen. Nach
dem Satz von Schwarz gilt nämlich ∂1 ∂2 f = ∂2 ∂1 f . Wir wollen dies noch anhand eines
abschließenden Beispiels verdeutlichen.
Beispiel. Die Funktion f : R × R × R → R sei durch f (x, y, z) := xy 3 − y 2 z 4 + x2 z für
alle x ∈ R, alle y ∈ R und alle z ∈ R definiert. Diese Funktion ist beliebig oft stetig
partiell differenzierbar. Sie besitzt genau 9 (= 32 ) partielle Ableitungen der Ordnung 2.
Die partiellen Ableitungen nach nur einer Variable sind dabei durch
∂2f
(x, y, z) = 2z,
∂x2
∂2f
(x, y, z) = 6xy − 2z 4 ,
∂y 2
∂2f
(x, y, z) = −12y 2 z 2
∂z 2
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben. Von den gemischten partiellen Ableitungen müssen nur genau drei explizit berechnet werden. Nach dem Satz von Schwarz gilt
nämlich
∂2f
(x, y, z) =
∂x∂y
∂2f
(x, y, z) =
∂x∂z
∂2f
(x, y, z) =
∂y∂z
∂2f
(x, y, z) = 3y 2 ,
∂y∂x
∂2f
(x, y, z) = 2x,
∂z∂x
∂2f
(x, y, z) = −8yz 3
∂z∂y
für alle x ∈ R, alle y ∈ R und alle z ∈ R
Übungsaufgaben
1. Berechnen Sie alle partiellen Ableitungen der Ordnung 1 der folgenden Funktionen:
f1 : R2 → R, x 7→ x31 x2 + ex1 −3x3 ,
q
f2 : R3 → R, x 7→ x41 + x43 + x1 x2 sin(2πx3 ),
♦
146
KAPITEL 6. DIFFERENTIALRECHNUNG
f3 : R × R → R, (x, y) 7→ ex−y + ln(1 + y 2 ),
f4 : R × R × R → R, (x, y, z) 7→ z/(1 + x2 + y 2 ).
2. Geben Sie alle partiellen Ableitungen der Ordnung 2 der folgenden Funktionen an:
f : R3 → R, x 7→ x41 x32 − 2x21 x2 + x1 x32 ,
g : R × [0, 2π) × [0, π) → R, (r, ϕ, θ) 7→ e−r sin(ϕ)(π 2 − θ2 ).
3. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x|
für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die
euklidische Norm des Vektors x. Bestimmen Sie ∂k fn für alle k ∈ {1, 2, . . . , n}.
4. Für die Wirkleistung P , die Stromstärke I und den Widerstand R an einem elektrischen
Verbraucher gilt die Formel P = RI 2 . Bestimmen Sie für jede der drei Größen P , I und R
die Änderungsraten bezüglich der jeweiligen anderen Größen.
6.6. GRADIENT UND HESSE–MATRIX
6.6
147
Gradient und Hesse–Matrix
Definition (Gradient). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D →R eine
an der Stelle x(0) partiell differenzierbare Funktion. Dann heißt der Vektor ∇f x(0) ∈ Rn ,
welcher durch


∂1 f x(0)  ∂2 f x(0) 


∇f x(0) := 

..

. 
∂n f x(0)
definiert ist, der Gradient von f an der Stelle x(0) . Ist f partiell differenzierbar, so definiert man die Funktion ∇f : D◦ → Rn , x 7→ ∇f (x), welche der Gradient oder das
Gradientenfeld von f genannt wird.
Offenbar ist der Gradient einer Funktion f an einer Stelle x(0) derjenige Vektor, dessen
Komponenten genau den partiellen Ableitungen der Ordnung 1 von f an der Stelle x(0)
entsprechen. Das Gradientenfeld von f ist eine Vektorwertige Funktion. Das Symbol ∇
wird übrigens Nabla genannt.
Der Gradient wird auch für solche Funktionen definiert, die von mehreren reellwertigen
Variablen abhängen. Seien beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere
Mengen, und sei f : X ×Y ×Z → R eine partiell differenzierbare Funktion, deren Variablen
mit x, y und z bezeichnet werden. Dann ist der Gradient ∇f : X ◦ × Y ◦ × Z ◦ → R3 durch


∂f
 ∂x (x, y, z)


 ∂f


∇f (x, y, z) := 
 ∂y (x, y, z)



 ∂f
(x, y, z)
∂z
◦
◦
◦
für alle x ∈ X , alle y ∈ Y und alle z ∈ Z definiert. In den nachfolgenden Beispielen
wird sowohl der Gradient einer Funktion mit einer vektorwertigen Variable als auch der
Gradient einer Funktion mit mehreren reellwertigen Variablen berechnet.
Beispiele.
(a) Die Funktion f : R3 → R sei durch f (x) := 3x1 x32 −x22 x43 +x31 x3 für alle Vektoren x =
(x1 , x2 )T ∈ R2 definiert. Die Funktion ist partiell differenzierbar, und ihr Gradient
ist durch


3x32 + 3x21 x3


∇f (x) = 9x1 x22 − 2x2 x43 
−4x22 x33 + x31
für alle x = (x1 , x2 )T ∈ R2 gegeben.
(b) Die Funktion g : R × R × R → R sei durch g(x, y, z) := cos(x)ey + z sin(x) für alle
x ∈ R, alle y ∈ R und alle z ∈ R definiert. Der Gradient von g ist dann durch


− sin(x)ey + z cos(x)


cos(x)ey
∇g(x, y, z) = 

sin(x)
für alle x ∈ R, alle y ∈ R und alle z ∈ R gegeben.
♦
148
KAPITEL 6. DIFFERENTIALRECHNUNG
Welche Informationen liefert das Gradientenfeld einer Funktion? Das folgende Lemma gibt
eine erste Antwort auf diese Frage.
Lemma 6.16. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge,
und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion von D nach R. Dann
existiert zu jeder Stelle x(0) ∈ D eine positive Zahl r > 0 und eine Funktion ε : Br x(0) →
R, so dass Br x(0) ⊆ D, sowie
f x(0) + h = f x(0) ) + ∇f (x(0) ) · h + ε(h)|h|
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt.
Man beachte, dass das h in Lemma 6.16 einen Vektor aus dem Rn bezeichnet. Entsprechend
bezeichnet ∇f (x(0) ) · h das euklidische Skalarprodukt von h mit dem Gradienten von f an
der Stelle x(0) , und |h| bezeichnet die euklidische Norm des Vektors h.
Das Lemma 6.16 macht eine Aussage darüber, wie eine stetig partiell differenzierbare
Funktion in der Nähe einer Stelle ihres Definitionsbereichs mit Hilfe des Gradientenfeldes
dargestellt werden. Das Lemma besitzt dabei
eine gewisse Ähnlichkeit zum Lemma 6.1.
(0)
Offenbar ist die Funktion h 7→ f x + h in der Nähe der Stelle h = 0 als Summe der
affinen Funktion h 7→ f x(0) ) + ∇f (x(0) ) · h und der Funktion h 7→ ε(h)|h| darstellbar. Das
Gradientenfeld ermöglicht also lokale Linearisierungen einer stetig partiell differenzierbaren Funktion.
Das Gradientenfeld spielt außerdem eine wichtige Rolle bei der Identifikation so genannter lokaler Extremalstellen einer reellwertigen Funktion. Eine lokale Extremalstelle
ist ein Stelle, an der eine Funktion ein lokales Extremum annimmt. Man unterscheidet
dabei die folgenden zwei Arten lokaler Extrema.
Definition (lokales Minimum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale
Minimalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und
f x(0) = min f (x)
x∈Br (x(0) )
gilt. Der Funktionswert f x(0) wird dann ein lokales Minimum von f genannt.
Definition (lokales Maximum). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine
nichtleere Menge, und sei f : D → R eine Funktion. Ein Punkt x(0) ∈ D◦ heißt eine lokale
Maximalstelle von f , wenn eine positive Zahl r > 0 existiert, so dass Br (x(0) ) ⊆ D und
f x(0) = max f (x)
x∈Br (x(0) )
gilt. Der Funktionswert f x(0) wird dann ein lokales Maximum von f genannt.
Für lokale Extremalstellen einer Funktion gilt der folgende, wichtige Satz.
Satz 6.17 (notwendiges Kriterium für lokale Extrema). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig partiell
differenzierbare Funktion von D nach R, die an einer Stelle x(0) ∈ D ein lokales Extremum
besitzt. Dann gilt ∇f x(0) ) = 0.
6.6. GRADIENT UND HESSE–MATRIX
149
Der Satz 6.17 ist offenbar die mehrdimensionale Version eines bekannten Resultats aus
dem Mathematikunterricht der Oberstufe: Eine reellwertige, differenzierbare Funktion f ,
die auf einer nichtleeren Teilmenge D der reellen Zahlen definiert ist, kann nur dann an
einer Stelle x0 ∈ D◦ ein lokales Extremum aufweisen, wenn f 0 (x0 ) = 0 gilt. Für reellwertige,
stetig partiell differenzierbare Funktionen, die auf nichtleeren Teilmengen des Rn definiert
sind, wird die Forderung f 0 (x0 ) = 0 durch ∇f (x(0) ) = 0 ersetzt. In diesem Zusammenhang
führt man auch den Begriff der stationären Stelle für Funktionen ein, die auf Teilmengen
des Rn definiert sind.
Definition (stationäre Stelle). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei und sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion
von D nach R. Ein Punkt x(0) ∈ D wird eine stationäre Stelle von f genannt, wenn
∇f (x(0) ) = 0 gilt.
Wie kann man nun entscheiden, ob an einer stationären Stelle einer stetig partiell differenzierbaren Funktion ein lokales Extremum dieser Funktion vorliegt oder nicht? Im Falle
einer zweimal differenzierbaren Funktion f , die auf einer Teilmenge der reellen Zahlen definiert ist, kann man bekanntlich die zweite Ableitung f 00 verwenden. An einer Stelle x0 im
Innern des Definitionsbereichs von f liegt nämlich genau dann ein lokales Minimum vor,
wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 gilt. Ein lokales Maximum liegt genau dann vor, wenn
f 0 (x0 ) = 0 und f 00 (x0 ) < 0 gilt. Für Funktionen, die auf Teilmengen des Rn definiert sind,
benötigt man ein Äquivalent zur zweiten Ableitung. Ein solches Äquivalent ist durch die
so genannte Hesse–Matrix gegeben.
Definition (Hesse–Matrix). Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → R
eine an der
x(0) zweimal partiell differenzierbare Funktion. Dann heißt die Matrix
Stelle
2
(0)
n×n
∇ f x
∈R
, welche durch

∂12 f x(0) ∂1 ∂2 f x(0) . . . ∂1 ∂n f x(0)  ∂2 ∂1 f x(0)
∂22 f x(0)
. . . ∂2 ∂n f x(0) 


2
∇ f (x) := 

..
..
..

.
.
. 
∂n ∂1 f x(0) ∂n ∂2 f x(0) . . . ∂n2 f x(0)

definiert ist, die Hesse–Matrix von f an der Stelle x(0) . Ist f zweimal partiell differenzierbar, so definiert man die Funktion ∇2 f : D◦ → Rn×n , x 7→ ∇2 f (x). Die Funktion ∇2 f
heißt die Hesse–Matrix von f .
Die Hesse-Matrix einer Funktion, die von mehreren reellwertigen Variablen abhängt, wird
folgendermaßen gebildet: Ist f beispielsweise eine zweimal partiell differenzierbare Funktion, die nach R abbildet, und die von drei Variablen x, y und z abhängt. Dann ist die
Hesse-Matrix von f durch
 2

∂ f
∂2f
∂2f
 ∂x2 (x, y, z) ∂x∂y (x, y, z) ∂x∂z (x, y, z)


 2

2f
2f
∂
f
∂
∂


∇2 f (x, y, z) := 

(x, y, z)
(x,
y,
z)
(x,
y,
z)
2
 ∂y∂x

∂y
∂y∂z
 2

2
2
 ∂ f

∂ f
∂ f
(x, y, z)
(x, y, z)
(x,
y,
z)
∂z∂x
∂z∂y
∂z 2
150
KAPITEL 6. DIFFERENTIALRECHNUNG
gegeben. Aus dem Satz von Schwarz (Satz 6.15) folgt, dass die Hesse–Matrix jeder zweimal
stetig partiell differenzierbaren Funktion symmetrisch ist. In den nachfolgenden Beispielen
sind die Hesse–Matrizen von zwei solcher Funktionen angegeben.
Beispiele.
(a) Die Funktion f : R3 → R sei durch f (x) := x31 x2 − x32 x3 + x33 x1 für alle Vektoren
x = (x1 , x2 , x3 )T ∈ R3 definiert. Offenbar ist f zweimal partiell differenzierbar. Die
Hesse–Matrix von f ist durch

3x21
6x1 x2

∇2 f (x) :=  3x21
3x23
−6x2 x3
−3x22
3x23


−3x22 
6x3 x1
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
(b) Die Funktion g : R × R → R sei durch g(x, y) := sin(πx) sin(2πy) für alle x ∈ R und
alle y ∈ R definiert. Die Hesse–Matrix von g ist durch
!
−π 2 sin(πx) sin(2πy) 2π 2 cos(πx) cos(2πy)
2
∇ g(x, y) :=
2π 2 cos(πx) cos(2πy) −4π 2 sin(πx) sin(2πy)
für alle x ∈ R und alle y ∈ R gegeben.
♦
Für das Gradientenfeld und die Hesse–Matrix einer zweimal stetig partiell differenzierbaren
Funktion gilt das folgende Lemma.
Lemma 6.18. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge,
und sei f ∈ C 2 (D) eine zweimal stetig partiell differenzierbare Funktion von D nach
R. Dann existiert
zu jeder Stellex(0) ∈ D eine positive Zahl r > 0 und eine Funktion
ε : Br x(0) → R, so dass Br x(0) ⊆ D, sowie
f x(0) + h = f x(0) + ∇f x(0) · h + h · ∇2 f x(0) h + ε(h)|h|2
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt.
Der nachfolgende Satz, welcher hinreichende Kriterien für die Existenz lokaler Extremalstellen einer zweimal stetig partiell differenzierbaren liefert, ist eine einfache Folgerung aus
Satz 6.17 und Lemma 6.18.
Satz 6.19 (hinreichende Kriterien für lokale Extrema). Sei n ∈ N eine natürliche
Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und sei x(0) ∈ D stationäre Stelle einer
zweimal stetig partiell differenzierbaren Funktion f ∈ C 2 (D). Dann gelten die folgenden
Aussagen:
(1) Die Funktion
f besitzt an der Stelle x(0) ein lokales Minimum, wenn die Hesse–Matrix
∇2 f x(0) positiv definit ist.
6.6. GRADIENT UND HESSE–MATRIX
151
(2) Die Funktion f besitzt an der Stelle x(0) ein lokales Maximum, wenn die Hesse–
Matrix ∇2 f x(0) negativ definit ist.
Die Sätze 6.17 und 6.19 dazu verwendet werden, lokale Extremalstellen einer Funktion zu
bestimmen. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Sei f : R2 → R diejenige Funktion, die durch f (x) = −3x21 −2x1 x2 −x22 +2x1 +2x2 für
alle Vektoren x = (x1 , x2 )T ∈ R2 definiert ist. Besitzt diese Funktion lokale Extremalstellen? Zur Beantwortung dieser Frage bestimmt man zunächst den Gradienten
∇f : R2 → R2 und die Hesse–Matrix ∇2 f : R2 → R2×2 von f . Wie man leicht
nachrechnet, gilt
−6x1 − 2x2 + 2
−6 −2
∇f (x) =
,
∇2 f (x) =
−2x1 − 2x2 + 2
−2 −2
für alle x = (x1 , x2 )T ∈ R2 . Die Hesse–Matrix von f ist also eine konstante, matrixwertige Funktion. Als nächstes bestimmt man die stationären Stelle von f , d.h. man
sucht Vektoren x ∈ R2 , für die
∇f (x) = 0
gilt. Offenbar führt dies auf das lineare Gleichungssystem
−6x1 − 2x2 = −2,
−2x1 − 2x2 = −2.
Die eindeutige Lösung dieses Gleichungssystems lautet x1 = 0 und x2 = 1. Der
Punkt x(0) := (0, 1)T ist also die einzige stationäre Stelle von f . Gemaß Satz 6.17
kann nur an dieser Stelle ein lokales Extremum von f vorliegen. Da die Hesse–Matrix
∇2 f x(0) negativ definit ist, liegt gemäß Satz 6.19 an der Stelle x(0) ein lokales
Maximum von f vor.
(b) Die Funktion g : [0, 1] × [0, 1] → R, welche durch g(x, y) := sin(2πx) + 2y 2 − y für
alle x ∈ [0, 1] und alle y ∈ [0, 1] definiert ist, soll auf lokale Extremalstellen hin
untersucht werden. Der Gradient und die Hesse–Matrix von g sind durch
!
!
2π cos(2πx)
−4π 2 sin(2πx) 0
2
∇g(x, y) =
,
∇ g(x, y) =
4y − 1
0
4
für alle x ∈ [0, 1] und alle y ∈ [0, 1] gegeben. Zunächst sucht man nach stationären
Stellen, d.h. nach Stellen (x, y) ∈ [0, 1] × [0, 1] für die
∇g(x, y) = 0
gilt. Die erste Komponente des Gradienten ist offenbar genau dann Null, wenn x =
1/4 oder x = 3/4 gilt. Die zweite Komponente verschwindet genau dann, wenn
y = 1/4 gilt. Also sind (x, y) = (1/4, 1/4) und (x, y) = (3/4, 1/4) die einzigen
stationären Stellen von g. Nur an diesen Stellen kann ein lokales Extremum von g
vorliegen. Ob an einer stationären Stelle tatsächlich ein lokales Extremum vorliegt,
erkennt man an der Hesse–Matrix. An der Stelle (x, y) = (1/4, 1/4) ist diese durch
−4π 2 0
∇2 g(1/4, 1/4) =
0
4
152
KAPITEL 6. DIFFERENTIALRECHNUNG
1
1
0
−1
x2
−2
0
−3
−4
−5
1
1
0.5
0
0
−1
−1
−0.5
x2
(a)
−1
−1
x1
0
1
x1
(b)
Abbildung 6.5: (a) Graph der Funktion f : R2 → R, x 7→ 1−2x21 −3x22 . (b) Darstellung
des Gradientenfeldes ∇f .
gegeben. Die Hesse–Matrix ∇2 g(1/4, 1/4) ist weder positiv noch negativ definit. Ein
hinreichendes Kriterium für eine lokale Extremalstelle ist also nicht erfüllt. Tatsächlich besitzt die Funktion g an der Stelle (x, y) = (1/4, 1/4) kein lokales Extremum.
An (x, y) = (3/4, 1/4) der Stelle gilt hingegen
2 4π 0
2
.
∇ g(3/4, 1/4) =
0 4
Die Hesse–Matrix ∇2 g(3/4, 1/4) ist positiv definit. Damit liegt an der stationären
Stelle (x, y) = (3/4, 1/4) ein lokales Minimum von g vor.
♦
Zum Abschluss dieses Abschnitts geben wir noch eine recht anschauliche Charakterisierung
des Gradientenfeldes einer stetig partiell differenzierbaren Funktion an.
Satz 6.20. Sei n ∈ N eine natürliche Zahl, sei D ⊆ Rn eine nichtleere, offene Menge, und
(0)
sei f ∈ C 1 (D) eine stetig partiell differenzierbare Funktion. Sei
weiterhin x ∈ D eine
(0)
nichtstationäre Stelle von f . Dann zeigt der Gradient ∇f x
in diejenige Richtung, in
(0)
die f am steilsten anwächst. Der negative Gradient −∇f x
zeigt in diejenige Richtung,
in die f am steilsten abfällt.
Die Tatsache, dass der negative Gradient einer Funktion immer in die Richtung des steilsten Abfalls einer Funktion zeigt, macht man sich unter anderem in bestimmten numerischen Verfahren zunutze, mit denen lokale Minima einer Funktion bestimmt werden.
Solche Verfahren werden ganz allgemein Gradientenverfahren genannt. Darüber hinaus
nutzt man die in Satz 6.20 formulierte Eigenschaft des Gradientenfelds für die Entwicklung zahlreicher physikalischer und ingenieurswissenschaftlicher Modelle.
Übungsaufgaben
1. Bestimmen Sie den Gradient und die Hesse–Matrix der folgenden Funktionen:
f1 : R3 → R, x 7→ x41 x2 + x21 x2 + x2 x23 ,
6.6. GRADIENT UND HESSE–MATRIX
153
f2 : R2 → R, x 7→ x1 x2 + 1,
f3 : R2 → R, x 7→ sin(x1 ) cos(2x2 ),
f4 : R3 → R, x 7→ exp(x21 + x22 − x23 ).
2. Für jede natürliche Zahl n ∈ N ist die Funktion fn : Rn \ {0} → R, welche durch fn (x) := |x|
für alle Vektoren x ∈ Rn definiert ist, partiell differenzierbar. Hierbei bezeichnet |x| die
euklidische Norm des Vektors x. Bestimmen Sie das Gradientenfeld von fn .
3. Bestimmen Sie alle stationären Stellen und alle Extremalstellen der folgenden Funktionen:
f1 : R2 → R, x 7→ (2x31 + 3x21 − 36x1 ) exp(−x22 ),
f2 : R2 → R, x 7→ (1 − x22 )/(1 + x21 ),
f3 : R2 → R, x 7→ x1 (1 − exp(1 − x22 )),
f4 : (0, π) × (0, π) → R, (x, y) 7→ sin(x) sin(y/2).
4. Sei n ∈ N eine natürliche Zahl, sei d ∈ Rn ein Vektor mit |d| = 1, und sei f : Rn → R eine
stetig partiell differenzierbare Funktion. Zeigen Sie, dass dann
f x(0) + td − f x(0)
= ∇f x(0) · d
lim
t→0
t
für alle x(0) ∈ Rn gilt. Verwenden Sie dazu das Lemma 6.16. Der Grenzwert auf der linken
Seite der Gleichung wird übrigens die Richtungsableitung von f an der Stelle x(0) in Richtung
d genannt.
154
6.7
KAPITEL 6. DIFFERENTIALRECHNUNG
Totale Differenzierbarkeit
Zum Abschluss dieses Kapitels führend wir noch kurz den Begriff der totalen Differenzierbarkeit ein. Totale Differenzierbarkeit ist eine Eigenschaft, die bestimmten Funktionen von
Rn nach Rm mit n ∈ N und m ∈ N zukommt. Falls n = 1 und m = 1 gilt, so entspricht die
totale Differenzierbarkeit genau der gewöhnlichen Differenzierbarkeit. In diesem Sinne ist
die totale Differenzierbarkeit der natürliche Differenzierbarkeitsbegriff für vektorwertige
Funktionen, die von einer vektorwertigen Variable abhängen.
Definition (total differenzierbare Funktion, totale Ableitung). Seien m ∈ N und
n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein
innerer Punkt dieser Menge. Eine Funktion f : D → Rm wird total differenzierbar an der
Stelle x(0) genannt, wenn eine lineare Funktion ϕ : Rn → Rm existiert, so dass
f x(0) + h −f x(0) − ϕ(h)
lim
=0
h→0
|h|
gilt. Die lineare Funktion
ϕ wird dann die totale Ableitung von f an der Stelle x(0) genannt
(0)
und mit Df x
bezeichnet. Die Funktion f heißt total differenzierbar, wenn sie an jeder
◦
Stelle in D total differenzierbar ist. Die Funktion Df : D◦ → Lin(Rn , Rm ), x 7→ Df (x)
wird dann die totale Ableitung von f genannt. Hierbei bezeichnet Lin(Rn , Rm ) die Menge
aller linearen Abbildungen von Rn nach Rm .
Es muss betont werden, dass für jede Stelle x(0) im Innern des
Definitionsbereichs einer
total differenzierbaren Funktion f die totale Ableitung Df x(0) eine lineare Abbildung ist.
Das bedeutet, dass die totale Ableitung Df x(0) selber von einer vektorwertigen Variable
abhängig ist. Welche Rolle die totale Ableitung einer total differenzierbaren Funktion
spielt, wird anhand des nachfolgenden Lemmas deutlich.
Lemma 6.21. Seien n ∈ N und m ∈ N zwei natürliche Zahlen, und sei D ⊆ Rn eine
nichtleere Menge. Eine Funktion f : D → W ist genau dann an einer Stelle x(0) ∈ D◦ total
differenzierbar, wenn es eine lineare Abbildung ϕ : Rn → Rm , eine positive Zahl r > 0 und
eine Funktion ε : Br (0) → Rm gibt, so dass Br (x0 ) ⊆ D, sowie
f x(0) + h = f x(0) + ϕ(h) + ε(h)|h|
für alle h ∈ Br (0) und
lim ε(h) = 0
h→0
gilt. Es ist dann ϕ = Df x(0) .
Nach Lemma 6.21 kann man eine total differenzierbare Funktion f : D → Rm , die auf
einer Teilmenge D des Rn definiert ist, in der Nähe einer Stelle x(0) ∈ D◦ mit Hilfe der
totalen Ableitung linearisieren. Dies bedeutet, dass man die Funktion h 7→ f x(0) + h
in der Nähe von Null durch die affine Funktion h 7→ f x(0) + Df x(0) (h) approximiert.
Da die Funktion h 7→ ε(h)|h| sehr schnell gegen Null geht, wenn h gegen den Nullvektor
strebt, kann sie in der Regel vernachlässigt werden. Dasselbe Prinzip haben wir bereits bei
der Ableitung und dem Gradienten
einer Funktion
kennen gelernt (siehe Lemma 6.1 und
6.16). Die Funktion h 7→ f x(0) + Df x(0) (h) wird entsprechend die Linearisierung von
f an der Stelle x(0) genannt.
6.7. TOTALE DIFFERENZIERBARKEIT
155
Wie kann die totale Ableitung einer total differenzierbaren Funktion f : D → Rm
mit
n
(0)
◦
(0)
D ⊆ R bestimmt werden? Da für jede Stelle x ∈ D die totale Ableitung Df x
eine
lineare Abbildung von Rn nach Rm ist, muss es eine Matrix A ∈ Rm×n geben, so dass
Df x(0) (h) = Ah
für alle h ∈ Rn gilt. Wir werden sehen, dass diese Matrix A durch die so genannte Jacobi–
Matrix von f an der Stelle x(0) gegeben ist.
Definition (Jacobi–Matrix). Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆
Rn eine nichtleere Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem
f : D → Rm eine an der Stelle x(0) partiell differenzierbare Funktion mit den Komponenten
f1 : D → R, f2 : D → R, . . . , fm : D → R. Dann heißt die Matrix f 0 x(0) ∈ Rm×n ,
welche durch


∂1 f1 x(0) ∂2 f1 x(0) . . . ∂n f1 x(0)  ∂1 f2 x(0)
∂2 f2 x(0)
. . . ∂n f2 x(0) 


f 0 x(0) := 

..
..
..


.
.
.
(0)
(0)
(0)
∂1 fm x
∂2 fm x
. . . ∂n fm x
definiert ist, die Jacobi–Matrix von f an der Stelle x(0) . Ist f partiell differenzierbar, so
definiert man die Funktion f 0 : D◦ → Rm×n , x 7→ f 0 (x), welche die Jacobi–Matrix von f
genannt wird.
Man erkennt, dass in der jeweils j-ten Spalte der Jacobi–Matrix einer Funktion f die
partielle Ableitung nach der j-ten Koordinate von f steht. Natürlich definiert man die
Jacobi–Matrix auch für solche Funktionen, die von mehreren reellwertigen Variablen abhängen. Sind beispielsweise X ⊆ R, Y ⊆ R und Z ⊆ R drei nichtleere Mengen, und ist
f : X × Y × Z → Rm eine partiell differenzierbare, vektorwertige Funktion, die von drei
Variablen x, y und z abhängt, dann ist die Jacobi–Matrix f 0 : X ◦ × Y ◦ × Z ◦ → Rm von
f durch


∂f1
∂f1
∂f1
(x, y, z)
(x, y, z)
(x, y, z)
 ∂x

∂y
∂z


 ∂f2

∂f
∂f
2
2


(x,
y,
z)
(x,
y,
z)
(x,
y,
z)


∂x
∂y
∂z
0


f (x, y, z) = 

..
..
..


.
.
.




 ∂fm

∂fm
∂fm
(x, y, z)
(x, y, z)
(x, y, z)
∂x
∂y
∂z
◦
◦
◦
für alle x ∈ X , y ∈ Y und z ∈ Z gegeben. Nachfolgend sind einige Beispiele für
Jacobi–Matrizen angegeben.
Beispiele.
(a) Die Funktion f : R3 → R2 sei durch
x21 + x22 − x3
x1 − 4x2 + x23
f (x) :=
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben. Die Jacobi–Matrix f 0 : R3 → R2×3 von f ist
dann durch
2x1 2x2 −1
f 0 (x) =
1
−4 2x3
für alle x = (x1 , x2 , x3 )T ∈ R3 gegeben.
156
KAPITEL 6. DIFFERENTIALRECHNUNG
(b) Die Funktion g : [0, ∞) × [0, 2π) → R2 sei durch
r cos(ϕ)
g(r, ϕ) :=
r sin(ϕ)
für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert. Als Jacobi–Matrix erhält man die
matrixwertige Funktion g 0 : [0, ∞) × [0, 2π) → R2×2 , welche gemäß
cos(ϕ) −r sin(ϕ)
0
g (r, ϕ) =
sin(ϕ)
r cos(ϕ)
für alle r ∈ [0, ∞) und alle ϕ ∈ [0, 2π) definiert ist.
(c) Das Funktional ϕ : R2 → R sei durch ϕ(x) := x41 + x42 für alle x = (x1 , x2 )T ∈ R2
definiert. Die zugehörige Jacobi–Matrix ϕ0 : R2 → R1×2 ist dann an jeder Stelle
x = (x1 , x2 )T ∈ R2 eine einzeilige Matrix, welche durch
ϕ0 (x) = 4x31 4x32
gegeben ist.
♦
Für die Jacobi–Matrix gilt nun der folgende, wichtige Satz.
Satz 6.22. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere
Menge, und sei x(0) ∈ D◦ ein innerer Punkt dieser Menge. Sei außerdem f : D → Rm eine
Funktion, welche an der Stelle x(0) total differenzierbar ist. Dann ist f an der Stelle x(0)
auch partiell differenzierbar und stetig, und es gilt
Df x(0) (h) = f 0 x(0) h
für alle h ∈ Rn . Hierbei bezeichnet f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) .
Laut 6.22 impliziert die totale Differenzierbarkeit die partielle Differenzierbarkeit einer
Funktion, die von einer vektorwertigen Variable abhängt. Man kann darüber hinaus zeigen,
dass es Funktionen gibt, die an einer Stelle im Innern ihres Definitionsbereichs zwar partiell
differenzierbar, nicht aber total differenzierbar sind. Also ist totale Differenzierbarkeit eine
stärkere Eigenschaft als partielle Differenzierbarkeit. Schließlich gilt noch der folgende Satz.
Satz 6.23. Seien m ∈ N und n ∈ N zwei natürliche Zahlen, sei D ⊆ Rn eine nichtleere,
offene Menge, und sei f ∈ C 1 (D, Rm ) eine stetig partiell differenzierbare Funktion von D
nach Rm . Dann ist f total differenzierbar.
Die Aussage von Satz 6.23 hat eine praktische Konsequenz. Angenommen, man berechnet
die Jacobi–Matrix f 0 einer Funktion f und stellt fest, dass jede Komponente von f 0 eine
stetige Funktion ist. Dann ist f stetig partiell differenzierbar nach Satz 6.23 somit auch
total differenzierbar. In einem solchen Fall erkennt man also die totale Differenzierbarkeit
einer Funktion anhand ihrer Jacobi–Matrix.
Beispiel. Die Funktion f : R2 → R2 sei durch
f (x) :=
x21 − x1 x2 + x22
x31 x2 − x1 x32
!
6.7. TOTALE DIFFERENZIERBARKEIT
157
für alle x = (x1 , x2 )T ∈ R2 definiert. Die Jacobi–Matrix von f ist dann durch
!
2x
−
x
−x
+
2x
1
2
1
2
f 0 (x) :=
3x21 x2 − x32 x31 − 3x1 x22
für alle x = (x1 , x2 )T ∈ R2 gegeben. Offenbar sind alle Komponenten der Jacobi–Matrix
stetige Funktionen. Nach Satz 6.23 ist f also total differenzierbar, und nach Satz 6.22 ist
die Ableitung Df : R2 → Lin(R2 , R2 ) durch
!
!
2x1 − x2
−x1 + 2x2
h1
Df (x)(h) =
3x21 x2 − x32 x31 − 3x1 x22
h2
für alle x = (x1 , x2 )T ∈ R2 und alle h = (h1 , h2 )T ∈ R2 gegeben.
Übungsaufgaben
1. Bestimmen Sie die Jacobi–Matrix und die totale Ableitung der folgenden Funktionen:
!
−4x21 + 5x32 − x3
3
2
f : R → R , x 7→
,
2x1 + 3x22 − 3x53
!
sin(x1 )x2 + x1 cos(x2 )
2
2
g : R → R , x 7→
,
exp(−x1 + x2 )


x21 + x22

p
u : R2 → R3 , x 7→  1 + x21 − x2  ,
x1 x2

2x1 x2 + x23 − 1



v : R3 → R3 , x 7→ 3x1 − 4x2 + 5x3 
x1 x2 x3 − 1
2. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine partiell differenzierbare Funktion.
Zeigen Sie, dass dann
T
∇f x(0) = f 0 x(0)
für alle x(0) ∈ Rn gilt, wobei f 0 x(0) die Jacobi–Matrix von f an der Stelle x(0) bezeichnet.
3. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R eine stetig partiell
differenzierbare
Funktion. Zeigen Sie, dass f total differenzierbar ist, und dass Df x(0) (h) = ∇f x(0) · h
für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie dazu die Definition der totalen
Differenzierbarkeit sowie Lemma 6.16.
4. Sei f : R → R eine differenzierbare Funktion. Zeigen Sie, dass f total differenzierbar ist, und
dass Df (x0 )(h) = f 0 (x0 )h für alle x0 ∈ R und alle h ∈ Rn gilt, wobei f 0 (x0 ) die gewöhnliche
Ableitung von f an der Stelle x0 bezeichnet. Verwenden Sie dazu die Definition der totalen
Differenzierbarkeit sowie Lemma 6.1.
5. Sei n ∈ N eine natürliche Zahl, und sei f : Rn → R diejenige Funktion, die durch f (x) := |x|2
ist, wobei |x| die euklidische Norm von x bezeichnet. Zeigen Sie,
für alle x ∈ Rn gegeben
dass dann Df x(0) (h) := 2x(0) · h für alle x(0) ∈ Rn und alle h ∈ Rn gilt. Verwenden Sie
dazu die Definition der totalen Differenzierbarkeit, sowie die Identität |x|2 = x · x, welche
bekanntlich für alle x ∈ Rn gilt.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... wissen, was eine differenzierbare Funktion ist.
... wissen, wie die Ableitung einer Funktion an einer Stelle im Innern ihres Definitionsbereichs definiert ist.
... sämtliche Ableitungsregeln (Summenregel, Produktregel, Regel des konstanten Faktors, Quotientenregel, Kettenregel) beherrschen.
... die Ableitung einer Potenzreihe bestimmen können.
... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs differenzierbar
ist, an dieser Stelle auch stetig ist.
... den Satz von Rolle und den Mittelwertsatz der Differentialrechnung kennen.
... Funktionsgrenzwerte mit Hilfe der Regel von de l’Hôpital berechnen können.
... wissen, was eine k-mal differenzierbare Funktion, und was eine k-mal stetig differenzierbare Funktion ist.
... zu einer gegebenen Zahl N ∈ N und einer gegebenen Stelle x0 das N -te Taylor–
Polynom zur Entwicklungsstelle x0 einer N -mal differenzierbaren Funktion bestimmen können.
... den Satz von Taylor kennen.
... wissen, was eine partiell differenzierbare Funktion ist.
... partielle Ableitungen einer Funktion berechnen können.
... wissen, was eine k-mal partiell differenzierbare Funktion, und was eine k-mal stetig
partiell differenzierbare Funktion ist.
... den Satz von Schwarz kennen.
... den Gradienten einer partiell differenzierbaren Funktion bestimmen können.
... die Hesse–Matrix einer zweimal partiell differenzierbaren Funktion bestimmen können.
... wissen, dass jede lokale Extremalstelle einer reellwertigen Funktion eine stationäre
Stelle der Funktion ist.
... lokale Extremalstellen einer reellwertigen Funktion bestimmen können, die entweder von einer vektorwertigen Variable oder von mehreren reellwertigen Variablen
abhängt.
... wissen, was eine total differenzierbare Funktion ist.
... wissen, dass jede Funktion, die an einer Stelle ihres Definitionsbereichs total differenzierbar ist, an dieser Stelle auch partiell differenzierbar und stetig ist.
... wissen, dass jede stetig partiell differenzierbare Funktion auch total differenzierbar
ist.
... die Jacobi–Matrix einer partiell differenzierbaren Funktion bestimmen können.
158
Kapitel 7
Integralrechnung
7.1
Das Lebesgue–Maß
In diesem wie auch im nächsten Abschnitt soll geklärt werden, was man unter dem Integral
Z
f (x) dx
Ω
einer reellwertigen Funktion f : D → R über einer Menge Ω ⊆ D versteht, wobei D eine
Teilmenge des Vektorraums Rn ist.
Falls n = 1 gilt, und Ω ein nichtleeres Intervall [a, b] mit Intervallgrenzen a ∈ R und
b ∈ R ist, bezeichnet man das Integral von f über Ω üblicherweise mit
Z b
f (x) dx.
a
Wenn die Funktion f stetig ist und darüber hinaus nur nichtnegative Funktionswerte
besitzt, interpretiert man das Integral als den Flächeninhalt der Fläche, die vom Graph
von f , der Abszisse (also der x-Achse) und den beiden senkrechten Graden x = a und x = b
eingeschlossen wird. Eine analoge Interpretation des Integrals wird auch für den Fall, dass
n > 1 gilt, angestrebt: Das Integral soll den Inhalt derjenigen Menge widerspiegeln, die
von dem Graph von f , der Menge Ω × {0} und der Menge ∂Ω × R begrenzt wird. Daher
macht es Sinn, zunächst einmal zu klären, was man unter dem Inhalt bzw. dem Volumen
einer Menge verstehen soll.
Es ist tatsächlich nicht leicht, einen sinnvollen Inhalts- oder Volumenbegriff für Teilmengen des Rn zu definieren. Von einem sinnvollen Volumenbegriff würde man beispielsweise erwarten, dass sich das Volumen einer Menge nicht ändert, wenn man die Menge
verschiebt. Auch sollte die Summe der Volumina zweier disjunkter Mengen genau gleich
dem Volumen der Vereinigung beider Mengen sein. Weiterhin sollte das Volumen einer
Menge stets größer oder gleich dem Volumen jeder Teilmenge sein.
In der Mathematik wird der Inhalt oder das Volumen einer Menge ganz allgemein als
das Maß der Menge bezeichnet. Es hat sich gezeigt, dass es ganz unterschiedliche Möglichkeiten gibt, ein solches Maß zu definieren. Die heutzutage gebräuchlichste Definition des
Maßbegriffs geht auf den französischen Mathematiker Henri Léon Lebesgue (1875–1941)
zurück. In diesem Abschnitt soll dieses so genannte Lebesgue–Maß (gesprochen: Lebäk–
”
Maß“) eingeführt werden. Es wird sich zeigen, dass man nur bestimmten Teilmengen des
Rn in sinnvoller Weise ein Lebesgue–Maß zuordnen kann. Diese Mengen werden dann
Lebesgue–messbar genannt. Das Mengensystem aller Lebesgue–messbaren Teilmengen der
Rn spielt eine wichtige Rolle bei der Definition von Integralen.
159
160
KAPITEL 7. INTEGRALRECHNUNG
Abbildung 7.1: Ein zweidimensionales, rechtsoffenes Intervall.
Bevor wir definieren können, was eine Lebesgue–messbare Menge und was das Lebesgue–
Maß einer solchen Menge ist, benötigen wir noch einige grundlegende Begriffe. Zunächst
erweitern wir den Intervallbegriff auf bestimmte Teilmengen des Rn .
Definition (n-dimensionales, rechtsoffenes Intervall). Sei n ∈ N eine natürliche
Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren.
Dann nennt man die Menge
[a, b) := [a1 , b1 ) × [a2 , b2 ) × · · · × [an , bn )
= x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi < bi für alle i = 1, 2, . . . , n
ein n-dimensionales, rechtsoffenes Intervall. Die Menge aller n-dimensionalen, rechtsoffenen Intervalle wird im Folgenden mit J (Rn ) bezeichnet.
Eine Menge, deren Elemente ebenfalls Mengen sind, wird üblicherweise als Mengensystem
bezeichnet, so auch J (Rn ). Man beachte, dass für jede natürliche Zahl n ∈ N das Mengensystem J (Rn ) insbesondere die leere Menge ∅ enthält, da beispielsweise [a, a) = ∅ für alle
Vektoren a ∈ Rn gilt. Für n = 1 besteht J (Rn ) aus allen rechtsoffenen Intervallen [a, b)
mit Intervallgrenzen a, b ∈ R. Für n = 2 besteht J (Rn ) aus sämtlichen Rechtecken, deren
Seiten parallel zu den Koordinatenachsen verlaufen, und die jeweils nur die linke und die
untere Seite als Teilmenge enthalten (siehe auch Abbildung 7.1). Für n = 3 besteht J (Rn )
aus Quadern, deren Kanten parallel zu den Koordinatenachsen verlaufen. Für rechtsoffene
Intervalle kann man sehr leicht einen Volumenbegriff definieren.
Definition (Volumen eines rechtsoffenen Intervalls). Sei n ∈ N eine natürliche Zahl,
und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren. Dann
nennt man die Zahl


falls [a, b) = ∅,
0
n
Y
vol [a, b) :=

 (bi − ai ) sonst
i=1
das n-dimensionale Volumen von [a, b). Die so definierte Funktion vol : J (Rn ) → R wird
die n-dimensionale Volumenfunktion genannt.
Für n = 1 entspricht vol([a, b)) genau der Länge b−a des Intervalls [a, b) ⊂ R. Für n = 2 ist
vol([a, b)) genau der Flächeninhalt (b1 −a1 )(b2 −a2 ) des Rechtecks [a, b) ⊂ R2 , und für n = 3
ist vol([a, b)) genau der Rauminhalt (b1 − a1 )(b2 − a2 )(b3 − a3 ) des Quaders [a, b) ⊆ R3 . Die
n-dimensionale Volumenfunktion ordnet also jedem rechtsoffenen Intervall ein Volumen
7.1. DAS LEBESGUE–MASS
161
zu, welches für n ∈ {1, 2, 3} genau der geometrischen Länge bzw. dem geometrischen
Flächeninhalt bzw. dem geometrischen Rauminhalt entspricht. Man betrachte dazu auch
die nachfolgenden Beispiele.
Beispiele.
(a) Für das rechtsoffene Intervall [1, 3) ⊆ R gilt vol([1, 3)) = 3 − 1 = 2. Das Volumen
vol([1, 3)) entspricht offenbar genau der Länge des Intervalls.
(b) Für a = (−1, −1)T ∈ R2 und b = (1, 1)T ∈ R2 gilt vol([a, b)) = (1 − (−1))2 = 4.
Tatsächlich ist das rechtsoffene Intervall [a, b) ein Quadrat, dessen Seiten die Länge
2 besitzen. Das Volumen vol([a, b)) entspricht somit genau dem Flächeninhalt des
Quadrats.
Mit Hilfe der n-dimensionale Volumenfunktion kann man für jede Teilmenge des Rn ein so
genanntes äußeres Lebesgue–Maß definieren. Die Definition des äußeren Lebesgue–Maßen
bildet eine wichtige Vorstufe für die Definition eines allgemeinen Volumenbegriffs.
Definition (äußeres Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei P(Rn )
die Potenzmenge von Rn . Dann heißt die Funktion meas∗ : P(Rn ) → R ∪ {∞}, welche
durch
)
(∞
∞
[
X
∗
n
Jk ⊇ A
meas (A) := inf
vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit
k=1
k=1
P(Rn )
für alle A ∈
definiert ist, die n-dimensionale, äußere Lebesgue–Maßfunktion. Für
jede Menge A ∈ P(Rn ) nennt man meas∗ (A) das n-dimensionale, äußere Lebesgue–Maß
von A.
Die Definition des n-dimensionalen äußeren Lebesgue–Maßes kann folgendermaßen motiviert werden: Durch die äußere Lebesgue–Maßfunktion meas∗ soll jeder Teilmenge A des
Rn genau eine nichtnegative Zahl meas∗ (A) zugeordnet werden, die einen möglichen Wert
für das Volumen von A darstellt. Dabei lässt man die Frage außer Acht, ob der Menge A
tatsächlich in sinnvoller Weise ein Volumen zugeordnet werden kann. Zu dem möglichen
Wert für das Volumen von A gelangt man durch folgende Überlegung: Wenn eine Folge
rechtsoffener Intervalle (Jk )k∈N eine Überdeckung (siehe Abschnitt 3.4) von A bildet, dann
muss die Summe aller Intervallvolumina größer oder gleich dem Volumen von A sein. Kann
man die Überdeckung (Jk )k∈N so wählen, dass die Summe der Intervallvolumina möglichst
klein ist, so hat man das mögliche Volumen von A gut approximiert. Man sucht also das
Infimum der Menge
(∞
)
∞
X
[
n
vol(Jk ) (Jk )k∈N ist eine Folge in J (R ) mit
Jk ⊇ A .
k=1
k=1
Da jedes Intervallvolumen größer oder gleich Null ist, ist auch die Summe aller Intervallvolumina größer oder gleich Null. Dies gilt für jede Folge rechtsoffener Intervalle (Jk )k∈N , die
eine Überdeckung von A bildet. Die obige Menge ist also durch Null nach unten beschränkt,
weshalb sie ein Infimum besitzt. Dieses Infimum, welches die Zahl meas∗ (A) definiert, ist
die größte untere Schranke für alle Volumensummen von Intervallfolgen, welche die Menge
A überdecken.
Das äußere Lebesgue–Maß besitzt eine Reihe von Eigenschaften, die man von einem
Volumenbegriff erwarten würde. Der nachfolgende Satz listet die wichtigsten Eigenschaften
des äußeren Lebesgue–Maßes auf.
162
KAPITEL 7. INTEGRALRECHNUNG
Satz 7.1. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) meas∗ (∅) = 0.
(2) Seien A ∈ P(Rn ) und B ∈ P(Rn ) zwei Mengen mit A ⊆ B. Dann gilt
meas∗ (A) ≤ meas∗ (B).
(3) Sei (Ak )k∈N eine Folge in P(Rn ). Dann gilt
!
∞
∞
[
X
∗
meas
Ak ≤
meas∗ (Ak ).
k=1
k=1
(4) Sei A ∈ P(Rn ) eine Menge und x ∈ Rn ein Vektor. Dann gilt
meas∗ (A + x) = meas∗ (A).
Hierbei ist A + x := {a + x | a ∈ A}.
Weiterhin kann man zeigen, dass das n-dimensionale äußere Lebesgue–Maß meas∗ (J) eines
rechtsoffenen Intervalls J ∈ J (Rn ) mit dem Volumen vol(J) des Intervalls überein. Dies
ist der Inhalt des nachfolgenden Satzes.
Satz 7.2. Sei n ∈ N eine natürliche Zahl und J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann
gilt meas∗ (J) = vol(J).
Mit Hilfe des äußeren Lebesgue–Maßes wird eine wichtige Klasse von Mengen definiert,
welche man die Lebesgue–Nullmengen nennt.
Definition (Lebesgue–Nullmenge). Eine Menge N ⊆ Rn wird Lebesgue–Nullmenge
genannt, wenn meas∗ (N ) = 0 gilt. Die Menge aller Teilmengen des Rn , welche Lebesgue–
Nullmengen sind, wird mit N (Rn ) bezeichnet.
Nach Definition des n-dimensionalen äußeren Lebesgue–Maßes ist eine Teilmenge N des
Rn genau dann eine Lebesgue–Nullmenge, wenn es zu jeder positiven Zahl ε > 0 eine Folge
(Jk )k∈N in J gibt, so dass
∞
[
Jk ⊇ N
k=1
und
∞
X
vol(Jk ) < ε
k=1
gilt. Nachfolgend geben wir einige wichtige Beispiele für Lebesgue–Nullmengen an.
Beispiele.
(a) Laut Aussage (1) in Satz 7.1 ist die leere Menge ∅ eine Lebesgue–Nullmenge.
(b) Jede einpunktige Menge {x} mit x ∈ Rn ist eine Lebesgue–Nullmenge.
7.1. DAS LEBESGUE–MASS
163
(c) Man kann zeigen dass jede Vereinigung abzählbar vieler Lebesgue–Nullmengen ebenfalls eine Lebesgue–Nullmenge ist. Daher sind auch die Mengen N, Z und sogar Q
als Teilmengen von R Lebesgue–Nullmengen.
(d) Jede Gerade im Vektorraum Rn mit n ≥ 2 und jede Ebene im Vektorraum Rn mit
n ≥ 3 eine Lebesgue–Nullmenge.
♦
Wie bereits angedeutet wurde, wird das n-dimensionale äußere Lebesgue–Maß letztendlich
nicht dazu verwendet, einen Volumenbegriff für Teilmengen des Rn zu definieren. Der
Grund hierfür ist, dass die Funktion meas∗ im Allgemeinen nicht additiv ist. Man kann
nämlich zeigen, dass es Teilmengen A des Rn gibt, für die jeweils mindestens eine Menge
E ⊆ Rn existiert, so dass
meas∗ (E) < meas∗ (E ∩ A) + meas∗ (E \ A)
gilt. Definiert man nun die Menge B := E \ A, so sind A und B offenbar zwei disjunkte
Mengen, für die A ∪ B = E gilt. Würde man das äußere Lebesgue–Maß dazu verwenden,
die Volumina der Mengen A, B und A∪B zu definieren, so würde dies zu einem paradoxen
Resultat führen. Aus der obigen Ungleichung und der Tatsache, dass E ∩ A ⊆ A gilt, folgt
nämlich die Ungleichungskette
meas∗ (A ∪ B) = meas∗ (E) < meas∗ (E ∩ A) + meas∗ (B) ≤ meas∗ (A) + meas∗ (B).
Die Summe der Volumina von A und B wäre somit echt größer als das Volumen der
disjunkten Vereinigung von A und B. Dies widerspricht jedoch einer fundamentalen Vorstellung, die man üblicherweise von einem Volumenbegriff hat. Die Summe der Volumina
zweier disjunkter Mengen sollte nach dieser Vorstellung nämlich stets gleich dem Volumen
der Vereinigung beider Mengen sein.
Was ist also zu tun? Einerseits besitzt das n-dimensionale äußere Lebesgue–Maß eine Reihe wichtiger Eigenschaften, die man von einem Volumenbegriff erwarten würde.
Andererseits führt das n-dimensionale äußere Lebesgue–Maß für gewisse Teilmengen des
Rn zu Resultaten, die mit einem Volumenbegriff nicht vereinbar sind. Einerseits ist das
Lebesgue–Maß also ein natürlicher Kandidat für einen Volumenbegriff, andererseits liefert
es für bestimmte Mengen paradoxe Resultate. Aus diesem Grund geht man folgendermaßen
vor: Zunächst gibt man das Ziel auf, für jede Teilmenge des Rn ein Volumen zu definieren.
Mit Hilfe des äußeren Lebesgue–Maßes definiert man dann nur für jene Teilmengen des
Rn ein Volumen, für die sich keine paradoxen Resultate ergeben. Solche Mengen werden
Lebesgue–messbar genannt.
Definition (Lebesgue–messbare Menge). Sei n ∈ N eine natürliche Zahl. Eine Menge
A ⊆ Rn wird Lebesgue–messbar genannt, wenn
meas∗ (E) = meas∗ (E ∩ A) + meas∗ (E \ A)
für alle E ⊆ Rn gilt. Das Mengensystem aller Lebesgue–messbaren Teilmengen des Rn
wird mit L(Rn ) bezeichnet.
Das Mengensystem L(Rn ) besteht genau aus den Teilmengen des Rn , für die man mit
Hilfe des äußeren Lebesgue–Maßes einen sinnvollen Volumenbegriff definieren kann. Wie
die nachfolgenden beiden Sätze zeigen, ist das Mengensystem L(Rn ) sehr groß, d.h. es
enthält sehr viele Teilmengen des Rn .
164
KAPITEL 7. INTEGRALRECHNUNG
Satz 7.3. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Rn ⊆ L(Rn ).
(2) Für jede Menge A ⊆ L(Rn ) gilt auch Rn \ A ∈ L(Rn ).
(3) Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt
∞
[
Ak ∈ L(Rn ).
k=1
Sei (Ak )k∈N eine Folge in L(Rn ). Dann gilt
∞
\
Ak ∈ L(Rn ).
k=1
Im wesentlichen besagt der Satz 7.3, dass man aus gegebenen Lebesgue–messbaren Mengen durch Bildung des Komplements, der Vereinigung und des Durchschnitts weitere
Lebesgue–messbare Mengen konstruieren kann. Der nachfolgende Satz listet einige Klassen
Lebesgue–messbarer Mengen auf.
Satz 7.4. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Für jede offene Menge O ⊆ Rn gilt O ∈ L(Rn ).
(2) Für jede abgeschlossene Menge A ⊆ Rn gilt A ∈ L(Rn ).
(3) Für jedes rechtsoffene Intervall J ⊆ J (Rn ) gilt J ∈ L(Rn ).
(4) Für jede Nullmenge N ⊆ N (Rn ) gilt N ∈ L(Rn ).
Für alle Lebesgue–messbaren Teilmengen des Rn definiert man nun in folgender Weise das
so genannte n-dimensionale Lebesgue–Maß.
Definition (Lebesgue–Maß). Sei n ∈ N eine natürliche Zahl, und sei L(Rn ) das Mengensystem aller Lebesgue–messbaren Teilmengen von Rn . Dann heißt die Funktion meas :
L(Rn ) → R ∪ {∞}, welche durch
meas(A) := meas∗ (A)
für alle A ∈ L(Rn ) definiert ist, die n-dimensionale, Lebesgue–Maßfunktion. Für jede
Menge A ∈ L(Rn ) nennt man meas(A) das n-dimensionale, Lebesgue–Maß von A.
Per Definition stimmt das Lebesgue–Maß meas(A) jeder Lebesgue–messbaren Menge A
stets mit dem äußeren Lebesgue–Maß meas∗ (A) der Menge überein. Die Funktionen meas
und meas∗ unterscheiden sich nämlich lediglich in ihren Definitionsbereichen. Während
die äußere Lebesgue–Maßfunktion meas∗ auf der Potenzmenge P(Rn ) definiert ist, ist die
Lebesgue–Maßfunktion meas nur auf dem Mengensystem aller Lebesgue–messbaren Mengen L(Rn ) definiert. Da L(Rn ) eine Teilmenge von P(Rn ) ist, gilt der folgende Grundsatz:
Sämtliche Aussagen in Satz 7.1 bleiben gültig, wenn man P(Rn ) durch L(Rn )
und meas∗ durch meas ersetzt. Darüber hinaus besitzt das n-dimensionale Lebesgue–
Maß weitere wichtige Eigenschaften, die im nachfolgenden Satz aufgelistet werden.
7.1. DAS LEBESGUE–MASS
165
Satz 7.5. Sei n ∈ N eine natürliche Zahl. Dann gelten die folgenden Aussagen.
(1) Sei J ∈ J (Rn ) ein rechtsoffenes Intervall. Dann gilt
meas(J) = vol(J).
(2) Sei (Ak )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ). Dann gilt
!
∞
∞
[
X
meas
Ak =
meas(Ak ).
k=1
k=1
(3) Seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare Mengen. Dann gilt
meas(A ∪ B) + meas(A ∩ B) = meas(A) + meas(B).
Die Aussage (2) in Satz 7.5 impliziert, dass das Lebesgue–Maß additiv ist. Sind nämlich
A und B zwei disjunkte, Lebesgue–messbare Teilmengen des Rn , so kann man eine Folge
paarweise disjunkter Mengen (Ak )k∈N in L(Rn ) durch A1 := A, A2 := B und Ak := ∅ für
alle k ∈ N mit k ≥ 3 definieren. Es gilt dann
!
∞
∞
[
X
meas(A ∪ B) = meas
Ak =
meas(Ak ) = meas(A) + meas(B).
k=1
k=1
Die Summe der Lebesgue–Maße zweier disjunkter Mengen ist somit immer gleich dem
Lebesgue–Maß der Vereinigung beider Mengen. Diese Eigenschaft war für das äußere
Lebesgue–Maß nicht gegeben. Das Lebesgue–Maß erfüllt indes alle wichtigen Eigenschaften eines Volumens. Daher definiert man für jede Lebesgue–messbare Teilmenge A des Rn
das n-dimensionale Lebesgue–Maß meas(A) als das Volumen von A.
Laut Aussage (1) in Satz 7.5 kann das Lebesgue–Maß eines rechtsoffenen Intervalls
explizit berechnet werden. Kann man weiterhin eine gegebene Menge A ⊆ Rn als disjunkte
Vereinigung einer Folge paarweise disjunkter, rechtsoffener Intervalle (Jk )k∈N und einer
Lebesgue–Nullmenge N darstellen, so kann man auch das Lebesgue–Maß von A explizit
berechnen. Es gilt dann nämlich
!
!
∞
∞
∞
[
[
X
meas(A) = meas N ∪
Ak = meas(N ) + meas
Ak = 0 +
meas(Ak ).
k=1
k=1
k=1
Man betrachte dazu auch die nachfolgenden Beispiele.
Beispiele.
(a) Es soll das eindimensionale Lebesgue–Maß eines nichtleeren, abgeschlossenen Intervalls [a, b] mit den Intervallgrenzen a, b ∈ R bestimmt werden. Offenbar ist [a, b] die
disjunkte Vereinigung des rechtsoffenen Intervalls [a, b) und der Lebesgue–Nullmenge
{b}. Es gilt demnach
meas [a, b] = meas [a, b) ∪ {b}
= meas [a, b) + meas {b}
= meas [a, b)
= b − a.
166
KAPITEL 7. INTEGRALRECHNUNG
(a)
(b)
Abbildung 7.2: (a) Das Dreieck ∆ := {x ∈ R2 | x1 ≥ 0, x2 ≥ 0, x1 + x2 < 1}. (b) Eine
(l)
mögliche Kachelung“ von ∆ mit rechtsoffenen Intervallen Jk .
”
(b) Sei (a, b) ein nichtleeres, offenes Intervall mit den Intervallgrenzen a, b ∈ R. Dann ist
das rechtsoffene Intervall [a, b) offenbar die disjunkte Vereinigung von (a, b) und der
Lebesgue–Nullmenge {a}. Man erhält also
meas (a, b) = meas {a} + meas (a, b)
= meas {a} ∪ (a, b)
= meas [a, b)
= b − a.
(c) Die Menge ∆ := {x = (x1 , x2 )T ∈ R2 |x1 ≥ 0, x2 ≥ 0, x1 +x2 < 1} besitzt die Gestalt
eines rechtwinkligen Dreiecks, dessen Katheten parallel zu den Koordinatenachsen im
R2 verlaufen (siehe Abbildung 7.2(a)). Das zweidimensionale Lebesgue–Maß dieser
Menge kann folgendermaßen bestimmt werden: Für jeden Index l ∈ N0 und jeden
Index k ∈ {0, 1, . . . , 2l − 1} definiert man das zweidimensionale, rechtsoffene Intervall
l
k 2k + 1
2 − k − 1 2l+1 − 2k − 1
(l)
Jk := l , l+1
×
,
.
2 2
2l
2l+1
(l)
Man kann zeigen, dass ∆ die disjunkte Vereinigung all dieser Intervalle Jk ist (siehe
Abbildung 7.2(b)). Man rechnet außerdem leicht nach, dass
(l) meas Jk
=
1
22l+2
für alle l ∈ N0 und alle k ∈ {0, 1, . . . , 2l − 1} gilt. Entsprechende erhält man
!!
!
l −1
l −1
∞ 2[
∞
2X
[
X
(l)
(l)
meas(∆) = meas
Jk
=
meas Jk
=
∞
X
l=0
l=0
l
2
22l+2
k=0
=
1
4
∞ X
l=0
l=0
1
2
l
=
k=0
1
1
·
4 1−
1
2
1
= .
2
Wie erwartet, entspricht das Lebesgue–Maß von ∆ genau dem Flächeninhalt eines
rechtwinkligen Dreiecks, dessen Katheten beide die Länge 1 haben.
♦
Zum Abschluss dieses Kapitels kommen wir noch auf eine Formulierung zu sprechen, die
häufig in der Integrationstheorie wie auch in der Stochastik verwendet wird.
7.1. DAS LEBESGUE–MASS
167
Definition (Lebesgue–fast überall). Sei n ∈ N eine natürliche Zahl, und sei A ⊆ Rn
eine beliebige Menge. Man sagt, dass eine Eigenschaft Lebesgue–fast überall oder einfach
nur fast überall auf A gilt, wenn die Menge N aller Punkte von A, für die die Eigenschaft
nicht gilt, eine Lebesgue–Nullmenge ist.
Die nachfolgenden Beispiele sollen verdeutlichen, wie die Formulierung fast überall“ üb”
licherweise verwendet wird.
Beispiele.
(a) Die Signumfunktion sgn : R → R ist an jeder Stelle x ∈ R \ {0} stetig. An der Stelle
x = 0 ist sie nicht stetig. Die Menge aller Punkte in R, an denen die Signumfunktion
nicht stetig ist, ist also die einpunktige Menge {0}. Da {0} eine Lebesgue–Nullmenge
ist, ist die Signumfunktion fast überall auf R stetig.
(b) Die Betragsfunktion | · | : R → R ist an jeder Stelle x ∈ R \ {0} differenzierbar. Also
ist die Betragsfunktion fast überall auf R differenzierbar.
(c) Die so genannte Dirichlet–Funktion D : R → R ist durch
(
1 falls x ∈ Q,
D(x) :=
0 sonst
für alle x ∈ R definiert. Da die Menge aller rationalen Zahlen Q eine Lebesgue–
Nullmenge ist, besitzt die Dirichlet–Funktion fast überall auf R den Funktionswert
Null.
♦
Übungsaufgaben
1. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare
Mengen. Zeigen Sie, dass dann auch A ∪ B ∈ L(Rn ), A ∩ B ∈ L(Rn ) und B \ A ∈ L(Rn )
gilt. Verwenden Sie dazu die Aussagen in Satz 7.3. Dabei kann es hilfreich sein, die Folge
(Ak )k∈N in L(Rn ) zu betrachten, welche durch A1 := A, A2 := B und Ak := ∅ für alle k ≥ 3
definiert ist.
2. Sei n ∈ N eine natürliche Zahl, und seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–
messbare Mengen mit A ⊆ B. Zeigen Sie, dass dann meas(B \ A) = meas(B) − meas(A)
gilt. Verwenden Sie dazu die definierende Eigenschaft Lebesgue–messbarer Mengen, sowie
die Tatsache, dass meas(M ) = meas∗ (M ) für alle M ∈ L(Rn ) gilt.
3. Bestimmen Sie die zweidimensionalen Lebesgue–Maße der folgenden Mengen:
M1 := [3, 5) × [1, 2) ∪ [3, 4) × [2, 3)
M2 := [0, 3) × [0, 2) ∪ [1, 3) × [1, 4) ,
M3 := [1, 4) × [3, 7) \ [2, 3) × [4, 6) ,
k
!
∞
[
2 − 1 2k+1 − 1
1
M4 :=
,
× 0, k+1
2k
2k+1
2
k=0
Verwenden Sie dazu die Aussagen in Satz 7.5. Es kann hilfreich sein, die Mengen zu skizzieren.
4. Zeigen Sie, dass die Strecke S := {x = (x1 , x2 )T ∈ R2 | 0 ≤ x1 < 1, x2 = x1 } eine Lebesgue–
Nullmenge ist. Konstruieren Sie dazu für jede natürliche Zahl n ∈ N genau n rechtsoffene
(n)
(n)
(n)
(n)
(n)
(n)
Intervalle J1 , J2 , . . . , Jn ∈ J (R2 ) derart, dass die Vereinigung J1 ∪ J2 ∪ · · · ∪ Jn
die Strecke S überdeckt und die Summe der Intervallvolumina genau 1/n beträgt.
168
7.2
KAPITEL 7. INTEGRALRECHNUNG
Das Lebesgue–Integral
Nachdem wir im voran gegangenen Abschnitt das Lebesgue–Maß eingeführt haben, wenden
wir uns in diesem Abschnitt dem so genannten Lebesgue–Integral zu. Es hat sich gezeigt,
dass es verschiedene Möglichkeiten gibt, das Integral
Z
f (x) dx
Ω
einer Funktion f : D → R über einer Menge Ω ⊆ D mit D ⊆ Rn sinnvoll zu definieren.
Verwendet man die Definition, die im wesentlichen auf Henri Léon Lebesgue zurück geht,
erhält man das so genannte Lebesgue–Integral von f über Ω. Andere Definitionen des
Integrals gehen auf den deutschen Mathematiker Bernhard Riemann (1826–1866) bzw.
auf den französischen Mathematiker Marie Ennemond Camille Jordan (1838–1922) zurück.
Verwendet man deren Definitionen, so erhält man das Riemann–Integral bzw. das Jordan–
Integral von f über Ω.
Heutzutage verwendet man in der Regel die Definition des Integrals nach Lebesgue.
Wie wir noch sehen werden, kann das Lebesgue–Integral von f über Ω nur für bestimmte
Funktionen f und nur für bestimmte Mengen Ω definiert werden. Die Menge Ω muss nämlich Lebesgue–messbar sein. Die Funktion f wiederum muss ebenfalls Lebesgue-messbar
sein. Was dies bedeutet soll nachfolgend erläutert werden. Zunächst jedoch definieren wir
einige grundlegende Begriffe.
Definition (charakteristische Funktion). Sei n ∈ N eine natürliche Zahl, und seien
D ⊆ Rn und A ⊆ Rn zwei beliebige Mengen. Dann heißt die Funktion χA : D → R, welche
durch
(
1 falls x ∈ D ∩ A,
χA (x) :=
0 falls x ∈ D \ A
für alle x ∈ D definiert ist, die charakteristische Funktion oder die Indikatorfunktion von
A auf D genannt.
Gemäß Definition nimmt jede charakteristische Funktion χA auf einer Menge D maximal
zwei verschiedene Funktionswerte an, nämlich 0 und 1. Für die zugehörigen Urbilder gilt
−1
χ−1
A ({0}) = D \ A und χA ({1}) = D ∩ A. Wir kennen bereits einige Funktionen, die
als charakteristische Funktionen bestimmter Teilmengen von R aufgefasst werden können.
Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Die charakteristische Funktion χ[0,∞) : R → R der Menge aller nichtnegativen Zahlen
auf R entspricht genau der Heaviside–Funktion (siehe Beispiel (b) auf Seite 102).
(b) Die charakteristische Funktion χQ : R → R der Menge aller rationalen Zahlen auf R
entspricht genau der Dirichlet–Funktion (siehe Beispiel (c) auf Seite 167).
♦
Mit Hilfe der charakteristischen Funktionen kann man eine bestimmte Klasse reellwertiger
Funktionen definieren, die als einfache Funktionen bezeichnet werden.
7.2. DAS LEBESGUE–INTEGRAL
169
Definition (einfache Funktion). Sei n ∈ N eine natürliche Zahl und D ∈ L(Rn ) eine
nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird einfach genannt,
wenn es endlich viele Lebesgue–messbare Mengen A1 , A2 , . . . , AN ∈ L(Rn ) und ebenso
viele von Null verschiedene Zahlen a1 , a2 , . . . , aN ∈ R \ {0} gibt, so dass
f=
N
X
ak χAk
k=1
gilt, wobei χAk für alle k = 1, 2, . . . , N die charakteristische Funktion der Menge Ak auf
D bezeichnet. Die Menge aller einfachen Funktionen von D nach R wird im folgenden mit
E(D) bezeichnet.
Einfache Funktionen sind also Linearkombinationen endlich vieler charakteristischer Funktionen von Lebesgue–messbaren Mengen. Aus diesem Grund besitzt jede einfache Funktion
nur endlich viele unterschiedliche Funktionswerte. Nachfolgend geben wir einige Beispiele
für einfache Funktionen an.
Beispiele.
(a) Für je zwei Lebesgue–messbare Mengen D ∈ L(Rn ) und A ∈ L(Rn ) ist die charakteristische Funktion χA von A auf D einfach.
(b) Jede Nullfunktion f : Rn → {0} ist einfach. Es gilt nämlich f = χ∅ , wobei χ∅ die
charakteristische Funktion der leeren Menge auf Rn bezeichnet. Die leere Menge ist
eine Lebesgue–Nullmenge und somit Lebesgue–messbar laut Satz 7.4(4).
(c) Jede konstante Funktion f : Rn → {a} mit a > 0 ist einfach. Es gilt nämlich
f = aχRn . Hierbei bezeichnet χRn die charakteristische Funktion von Rn auf Rn .
Der Vektorraum Rn ist laut Satz 7.3(1) eine Lebesgue–messbare Menge.
(d) Die Signumfunktion sgn : R → R ist einfach. Es gilt nämlich sgn = χ(0,∞) − χ(−∞,0) ,
wobei χ(−∞,0) und χ(0,∞) die charakteristischen Funktionen der Mengen aller negativen bzw. aller positiven Zahlen auf R bezeichnen. Die Mengen (−∞, 0) und (0, ∞)
sind offen und damit auch Lebesgue–messbar laut Satz 7.4(1).
♦
Für einfache Funktionen, deren Funktionswerte nichtnegativ sind, definiert man das Lebesgue–
Integral in folgender Weise.
Definition (Lebesgue–Integral einer nichtnegativen, einfachen Funktion). Sei
n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare
Menge,
PN
und sei f ∈ E(D) eine einfache Funktion mit der Darstellung f = k=1 ak χAk , wobei
die Zahlen a1 , a2 , . . . , aN alle positiv seien. Sei ferner Ω ∈ L(Rn ) eine Lebesgue–messbare
Menge mit Ω ⊆ D. Dann nennt man
Z
f (x) dx :=
Ω
das Lebesgue–Integral von f über Ω.
N
X
k=1
ak meas(Ak ∩ Ω)
170
KAPITEL 7. INTEGRALRECHNUNG
(a)
(b)
Abbildung 7.3: (a) Graph der einfachen Funktion f = 2χ[−1,1] +χ[2,3) +3χ[3,5] . (b) Das
Lebesgue–Integral von f über dem Intervall [0, 4] entspricht genau dem Flächeninhalt der
grau unterlegten Fläche.
Um das Lebesgue–Integrals einer nichtnegativen, einfachen Funktion f zu berechnen, muss
man lediglich zu jedem positiven Funktionswert ak von f die Teilmenge Ak ∩ Ω des Integrationsbereichs kennen, auf der dieser Funktionswert angenommen wird. Das Lebesgue–
Integral wird dann berechnet, indem man jeden positiven Funktionswert mit dem Maß der
entsprechenden Menge multipliziert und anschließend alle Produkte aufsummiert. Da das
Lebesgue–Maß einer Menge auch ∞ sein kann, ist es durchaus möglich, dass
Z
f (x) dx = ∞
Ω
gilt. Das Integral wird in diesem Fall unbeschränkt genannt. Die Berechnung des Lebesgue–
Integrals einer nichtnegativen, einfachen Funktion soll noch anhand eines Beispiels verdeutlicht werden.
Beispiel. Die einfache Funktion f ∈ E(R) sei durch f := 2χ[−1,1] + χ[2,3) + 3χ[3,5] definiert
(siehe Abbildung 7.3(a)). Offenbar besitzt f nur nichtnegative Funktionswerte, weshalb das
Lebesgue–Integral von f über jeder Lebesgue–messbaren Teilmenge Ω von R definiert ist.
Im Fall Ω = [0, 4] erhält man insbesondere
Z
f (x) dx = 2 meas [−1, 1] ∩ [0, 4] + meas [2, 3) ∩ [0, 4] + 3 meas [3, 5] ∩ [0, 4]
[0,4]
= 2 meas [0, 1] + meas [2, 3) + 3 meas [3, 4]
=2·1+1+3·1
= 6.
Das Lebesgue–Integral entspricht genau dem Flächeninhalt der Menge aller Punkte, die
sich unterhalb des Graphen von f und oberhalb der x-Achse, sowie innerhalb des Intervalls
[0, 4] befinden (siehe Abbildung 7.3(b)).
♦
Bislang wurde das Lebesgue–Integral lediglich für nichtnegative, einfache Funktionen definiert. Unser nächstes Ziel ist es, das Lebesgue–Integral darüber hinaus für möglichst viele
Funktionen zu definieren. Zu diesem Zwecken führen wir den sogenannten Positivteil und
den Negativteil einer reellwertigen Funktion ein.
Definition (Positivteil). Sei X eine nichtleere Menge und f : X → R eine Funktion.
Dann heißt die Funktion f + : X → R, welche durch f + (x) := max{f (x), 0} für alle x ∈ X
definiert ist, der Positivteil von f .
7.2. DAS LEBESGUE–INTEGRAL
(a)
171
(b)
(c)
Abbildung 7.4: (a) Graph einer Funktion f : R → R. (b) Graph des Positivteils f +
von f . (c) Graph des Negativteils f − von f .
Definition (Negativteil). Sei X eine nichtleere Menge und f : X → R eine Funktion.
Dann heißt die Funktion f − : X → R, welche durch f − (x) := max{−f (x), 0} für alle
x ∈ X definiert ist, der Negativteil von f .
Man macht sich leicht klar, dass für jede reellwertige Funktion f die Identität
f = f+ − f−
gilt. Zu beachten ist, dass sowohl der Positivteil f + als auch der Negativteil f − nichtnegative Funktionen sind. Es ist daher möglich, jede reellwertige Funktion als Differenz
zweier nichtnegativer Funktionen darzustellen. Man überlegt sich außerdem leicht, dass
der Positivteil und der Negativteil jeder einfachen Funktion ebenfalls einfache Funktionen
sind.
Als nächstes definieren wir eine Klasse von Funktionen, die als Grenzfunktionen bestimmter Folgen von einfachen Funktionen darstellbar sind. Diese Funktionen werden
Lebesgue–messbar genannt.
Definition (Lebesgue–messbare Funktion). Sei n ∈ N eine natürliche Zahl, und sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird
Lebesgue–messbar genannt, wenn eine Funktionenfolge (fm )m∈N in E(D) existiert, so dass
+ (x))
−
für jedes x ∈ D die Folgen (fm
m∈N und (fm (x))m∈N monoton wachsend sind und gegen
f + (x) bzw. gegen f − (x) konvergieren.
Die Menge aller Lebesgue–messbaren Funktionen, die auf einer Lebesgue–messbaren Menge D definiert sind, ist sehr groß. Wie der nachfolgende Satz zeigt, umfasst diese Menge
insbesondere alle stetigen Funktionen auf D.
Satz 7.6. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge,
und sei f : D → R eine stetige Funktion. Dann ist f Lebesgue–messbar.
Da der Positivteil f + wie auch der Negativteil f − einer Lebesgue–messbaren Funktion f
Grenzfunktionen zweier Folgen nichtnegativer, einfacher Funktionen sind, und da für jede
nichtnegative, einfache Funktion das Lebesgue–Integral über einer Lebesgue–messbaren
Menge Ω definiert ist, kann man in folgender Weise das Lebesgue–Integral von f + und f −
über Ω definieren.
172
KAPITEL 7. INTEGRALRECHNUNG
Definition (Lebesgue–Integral des Positivteils). Sei n ∈ N eine natürliche Zahl, sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue–
messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes
+ (x))
+
x ∈ D die Folge (fm
m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede
n
Lebesgue–messbare Menge Ω ∈ L(R ) mit Ω ⊆ D heißt dann
Z
Z
+
fm
(x) dx
f + (x) dx := lim
m→∞ Ω
Ω
das Lebesgue–Integral von f + über Ω.
Definition (Lebesgue–Integral des Negativteils). Sei n ∈ N eine natürliche Zahl, sei
D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge, und sei f : D → R eine Lebesgue–
messbare Funktion. Sei außerdem (fm )m∈N eine Funktionenfolge in E(D), so dass für jedes
− (x))
−
x ∈ D die Folge (fm
m∈N streng monoton wachsend gegen f (x) konvergiert. Für jede
Lebesgue–messbare Menge Ω ∈ L(Rn ) mit Ω ⊆ D heißt dann
Z
Z
−
−
fm
(x) dx
f (x) dx := lim
m→∞ Ω
Ω
das Lebesgue–Integral von f − über Ω.
Man beachte, dass die Integrale der einfachen Funktionen in den obigen Definition unbeschränkt sein können. Außerdem können sie gegen ∞ bestimmt divergieren, wenn m gegen
∞ strebt. In beiden Fällen wäre dann das Integral des Positivteils bzw. des Negativteils
unbeschränkt. Ist hingegen f eine Funktion derart, dass jedes Integral des Positivteils
f + und jedes Integral des Negativteils f − beschränkt ist, so nennt man die Funktion f
Lebesgue–integrierbar.
Definition (Lebesgue–integrierbare Funktion). Sei n ∈ N eine natürliche Zahl, und
sei D ∈ L(Rn ) eine nichtleere, Lebesgue–messbare Menge. Eine Funktion f : D → R wird
Lebesgue–integrierbar genannt, wenn sie Lebesgue–messbar ist, und wenn
Z
f + (x) dx < ∞
D
und
Z
f − (x) dx < ∞
D
gilt. Die Menge aller Lebesgue–integrierbaren Funktionen von D nach R wird üblicherweise
mit L1 (D) bezeichnet.
Für jede Lebesgue–integrierbare Funktion kann nun in folgender Weise das Lebesgue–
Integral definiert werden.
Definition (Lebesgue–Integral). Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn )
eine nichtleere, Lebesgue–messbare Menge, und sei f ∈ L1 (D) eine Lebesgue–messbare
Funktion. Sei ferner Ω ∈ L(Rn ) eine Lebesgue-messbare Menge mit Ω ⊆ D. Dann heißt
Z
Z
Z
+
f (x) dx :=
f (x) dx −
f − (x) dx
Ω
das Lebesgue–Integral von f über Ω.
Ω
Ω
7.2. DAS LEBESGUE–INTEGRAL
(a)
173
(b)
(c)
Abbildung 7.5: (a)–(c) Die Folge nichtnegativer, einfacher Funktionen (fm )m∈N konvergiert punktweise monoton wachsend gegen die Funktion f : [0, 1] → R, x 7→ x2 . Die
Flächeninhalte der grau unterlegten Bereiche entsprechen jeweils genau den Lebesgue–
Integralen der Folgenglieder von (fm )m∈N .
Das nachfolgende Beispiel dient dazu, die Definition des Lebesgue–Integrals noch einmal
zu verdeutlichen. Außerdem zeigt das Beispiel, wie man das Lebesgue–Integral bestimmter
Funktionen streng nach Definition“ berechnen kann.
”
Beispiel. Wir betrachten die Funktion f : [0, 1] → R, welche durch f (x) := x2 für
alle x ∈ Rn definiert ist. Da die Funktion f ausschließlich nichtnegative Funktionswerte
besitzt, gilt f + = f und f − = 0. Für jede natürliche Zahl m ∈ N und jeden Index
k ∈ {1, 2, . . . , 2m − 1} definieren wir das rechtsoffene Intervall
k k+1
(m)
Jk := m , m
2
2
(m)
(m)
sowie die Zahl ak := k 2 /22m . Es gilt dann meas(Jk ) = 1/2m für alle m ∈ N und jeden
Index k ∈ {1, 2, . . . , 2m − 1}. Als nächstes definieren wir die Funktionenfolge (fm )m∈N in
E([0, 1]) durch
m−1
2X
(m)
fm :=
ak χJ (m)
k=1
k
für alle m ∈ N (siehe Abbildung 7.5). Man überlegt sich leicht, dass
m 2
b2 xc
+
fm
(x) = fm (x) =
2m
für alle m ∈ N und alle x ∈ [0, 1] gilt. Verwendet man die Tatsache, dass ba+bc ≥ bac+bbc
+ (x))
für alle a, b ∈ R gilt, so kann man zeigen, dass die Folge (fm
m∈N für jedes x ∈ [0, 1] monoton wächst. Mit Hilfe des Sandwichtheorems (siehe Satz 4.3) zeigt man außerdem leicht,
+ (x))
2
dass die Folge (fm
m∈N für jedes x ∈ [0, 1] gegen x und somit gegen den Funktions+
+
wert f (x) konvergiert. Die Folge (fm )m∈N konvergiert also punktweise monoton wachsend
gegen f + . Die Funktion f ist demnach Lebesgue–messbar. Weiterhin gilt
Z
Z
+
f (x) dx = lim
[0,1]
m→∞ [0,1]
= lim
m→∞
= lim
m→∞
m −1
2X
k=1
1
23m
+
fm
(x) dx
= lim
m→∞
1
k2
= lim
23m m→∞ 23m
m −1
2X
k=1
m −1
2X
(m)
ak
k2
k=1
(2m − 1)2m (2m+1 − 1)
·
6
(m) meas Jk
174
KAPITEL 7. INTEGRALRECHNUNG
2 · 23m − 3 · 22m + 2m
m→∞
6 · 23m
2 − 3 · 2−m + 2−2m
= lim
m→∞
6
1
= ,
3
= lim
sowie
Z
f − (x) dx = 0,
[0,1]
da der Negativteil f − von f die Nullfunktion ist. Die Funktion f ist also Lebesgue–
integrierbar, und ihr Lebesgue–Integral über dem Intervall [0, 1] ist durch
Z
Z
Z
1
+
f − (x) dx =
f (x) dx −
f (x) dx =
3
[0,1]
[0,1]
[0,1]
gegeben.
♦
Natürlich ist die im Beispiel verwendete Methode zur Berechnung des Lebesgue–Integrals
für die meisten Funktionen eher ungeeignet. In vielen Fällen kann man ein Lebesgue–
Integral nämlich mittels bestimmter Integrationsregeln berechnen. Einige dieser Integrationsregeln werden wir im nachfolgenden Abschnitt kennen lernen. Im Folgenden gehen wir
zunächst auf grundlegende Eigenschaften des Lebesgue–Integrals ein. Der nachfolgende
Satz zählt die wichtigsten Eigenschaften auf.
Satz 7.7. Sei n ∈ N eine natürliche Zahl, und seien D ∈ L(Rn ) und Ω ∈ L(Rn ) zwei
Lebesgue–messbare Mengen mit Ω ⊆ D. Seien ferner f ∈ L1 (D) und g ∈ L1 (D) zwei
Lebesgue–integrierbare Funktionen, und sei α ∈ R eine reelle Zahl. Dann gelten die folgenden Aussagen:
(1) Das Lebesgue–Integral ist linear, d.h. es gilt
Z
Z
Z
f (x) + g(x) dx =
f (x) dx +
g(x) dx,
Ω
Ω
Ω
Z
Z
αf (x) dx = α f (x) dx.
Ω
Ω
(2) Wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) ≤ g(x)
für alle x ∈ Ω \ N gilt, dann gilt auch
Z
Z
f (x) dx =
g(x) dx.
Ω
Ω
(3) Sei (Ωk )k∈N eine Folge paarweise disjunkter Mengen in L(Rn ), d.h. es gelte Ωk ∩Ωl =
∅ für alle k, l ∈ N mit k 6= l. Wenn außerdem
Ω=
∞
[
Ωk
k=1
gilt, dann gilt auch
Z
f (x) dx =
Ω
∞ Z
X
k=1
Ωk
f (x) dx.
7.2. DAS LEBESGUE–INTEGRAL
175
(4) Für jede Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D gilt
Z
f (x) dx = 0.
N
Die Aussage (1) in Satz 7.7 ( Das Lebesgue–Integral ist linear.“) kann noch etwas präziser
”
gefasst werden: Definiert man zu je zwei Lebesgue–messbaren Mengen D ∈ L(Rn ) und
Ω ∈ L(Rn ) mit Ω ⊆ D die Abbildung I : L1 (D) → R durch
Z
f (x) dx
I(f ) :=
Ω
für alle Lebesgue–integrierbaren Funktionen f ∈ L1 (D), so ist I eine lineare Abbildung.
Die Aussage impliziert auch, dass die Menge L1 (D) ein Vektorraum über R ist.
Gemäß Aussage (2) in Satz 7.7 ist die Abbildung I im folgenden Sinn monoton wach˙ definieren, indem man
send: Auf der Menge L1 (D) kann man eine Ordnungsrelation ≤
1
für jede zwei Lebesgue–integrierbare Funktionen f ∈ L (D) und g ∈ L1 (D) festlegt, dass
˙ g genau dann gelten soll, wenn eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D
f ≤
˙ g besteht also
existiert, so dass f (x) ≤ g(x) für alle x ∈ D \ N gilt. Die Relation f ≤
genau dann, wenn die Funktionswerte von f fast überall auf D kleiner oder gleich den
˙ g folgt dann stets I(f ) ≤ I(g).
entsprechenden Funktionswerten von g sind. Aus f ≤
Die Aussagen (3) und (4) in Satz 7.7 sind für die Berechnung von Lebesgue–Integralen
oft nützlich. Aus der Aussage (3) folgt insbesondere, dass für je zwei disjunkte Mengen
A ⊆ L(Rn ) und B ⊆ L(Rn ) mit A ⊆ D und B ⊆ D stets
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx
A∪B
A
B
gilt. Um dies zu sehen, definiert man die Menge Ω in Aussage (3) einfach durch Ω := A∪B
und die Folge (Ωk )k∈N durch Ω1 := A, Ω2 := B und Ωk := ∅ für alle k ≥ 3. Dann nutzt
man aus, dass gemäß Aussage (4) die Gleichung
Z
f (x) dx = 0
∅
gilt. Eine weitere wichtige Folgerung aus Satz 7.7 ist durch das nachfolgende Lemma
gegeben.
Lemma 7.8. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare
Menge. Seien fernen f ∈ L1 (D) und g ∈ L1 (D) zwei Lebesgue–integrierbare Funktionen
derart, dass eine Lebesgue–Nullmenge N ∈ L(Rn ) mit N ⊆ D existiert, so dass f (x) =
g(x) für alle x ∈ D \ N gilt. Dann gilt
Z
Z
f (x) dx =
g(x) dx.
Ω
Ω
Das Lebesgue–Integral zweier Funktionen stimmt also immer dann überein, wenn die Funktionen fast überall dieselben Funktionswerte annehmen.
Zum Abschluss dieses Abschnitts führen wir noch einige häufig verwendete Schreibweise
für Lebesgue–Integrale über eindimensionalen Intervallen ein. Sind a ∈ R ∪ {−∞} und
b ∈ R ∪ {∞} zwei Zahlen, für die a ≤ b gilt, so definiert man
Z b
Z
f (x) dx :=
f (x) dx.
a
(a,b)
176
KAPITEL 7. INTEGRALRECHNUNG
Den Ausdruck auf der linken Seite bezeichnet man als das Integral von f von a nach b.
Laut den Aussagen (3) und (4) von Satz 7.7 stimmt dieses Integral mit dem Integral von
f über dem abgeschlossenen Intervall [a, b] überein, sofern a und b reelle Zahlen sind. Es
gilt dann nämlich
Z
Z
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx +
f (x) dx =
f (x) dx,
{a}
[a,b]
{b}
(a,b)
(a,b)
da die einpunktigen Mengen {a} und {b} Lebesgue–Nullmengen sind. Falls a < b gilt,
definiert man außerdem
Z b
Z a
f (x) dx.
f (x) dx := −
a
b
Übungsaufgaben
1. Die einfache Funktion f : R → R sei durch f := χ[0,1) + 2χ[1,2) + 3χ[2,3) + 4χ[3,4] definiert.
Berechnen Sie das (Lebesgue–)Integral
Z
f (x) dx.
R
2. Die Heaviside–Funktion H : R → R, die charakteristische Funktion χ{0} : R → R, die
Dirichlet–Funktion D : R → R und die Signumfunktion sgn : R → R sind einfache Funktionen. Berechnen die die folgenden (Lebesgue–)Integrale:
Z
1
Z
1
H(x) dx,
−1
Z
χ{0} (x) dx,
1
Z
1
D(x) dx,
−1
sgn(x) dx.
−1
0
3. Sei n ∈ N eine natürliche Zahl, sei D ∈ L(Rn ) eine Lebesgue–messbare Menge, und sei
f : D → R eine Lebesgue–messbare Funktion. Zeigen Sie, dass f genau dann Lebesgue–
integrierbar ist, wenn die Funktion |f | Lebesgue–integrierbar ist.
4. Seien n ∈ N eine natürliche Zahl, seien A ∈ L(Rn ) und B ∈ L(Rn ) zwei Lebesgue–messbare
Mengen, und sei f ∈ L1 (A ∪ B) eine Lebesgue–integrierbare Funktion. Zeigen Sie, dass dann
Z
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx −
f (x) dx
A∪B
A
B
A∩B
gilt.
5. Sei n ∈ N eine natürliche Zahl, und sei D ∈ L(Rn ) eine Lebesgue–messbare Menge. Sei
außerdem f ∈ L1 (D) eine Lebesgue–integrierbare Funktion mit der Eigenschaft, dass die
Menge S := {x ∈ D | f (x) 6= 0} eine Lebesgue–Nullmenge ist. Zeigen Sie, dass dann
Z
|f (x)| dx = 0
D
gilt.
7.3. BERECHNUNG VON INTEGRALEN
7.3
177
Berechnung von Integralen
Nachdem in den voran gegangenen beiden Abschnitten definiert wurde, was das Lebesgue–
Integral einer Lebesgue–integrierbaren Funktion über einer Lebesgue-messbaren Menge ist,
wenden wir uns in diesem Abschnitt einigen Methoden zu, mit denen bestimmte Lebesgue–
Integrale explizit berechnet werden können. Im Folgenden wird dabei nur noch von Inte”
gralen“, integrierbaren Funktionen“ und messbaren Mengen“ die Rede sein. Gemeint sind
”
”
damit jeweils Lebesgue–Integrale“, Lebesgue–integrierbare Funktionen“ und Lebesgue–
”
”
”
messbare Mengen“.
Es ist wichtig zu wissen, dass ist es nicht immer möglich ist, das Integral einer integrierbaren Funktion explizit zu berechnen. Auch die in diesem Abschnitt vorgestellten
Integrationsmethoden lassen sich bei weitem nicht auf alle integrierbaren Funktionen anwenden. Das wichtigste Hilfsmittel für die explizite Berechnung von Integralen ist der so
genannt Fundamentalsatz der Analysis. Bevor wir diesen Satz jedoch formulieren können,
müssen wir zunächst definieren, was Stammfunktionen sind.
Definition (Stammfunktion). Sei D ⊆ R eine nichtleere, offene Menge. Seien außerdem
f : D → R und F : D → R zwei Funktionen, so dass F 0 = f gilt. Dann heißt F eine
Stammfunktion von f .
Man beachte, dass Stammfunktionen nicht eindeutig bestimmt sind. Sei beispielsweise F
eine Stammfunktion von f , und sei α ∈ R eine reelle Zahl. Dann ist die Funktion G := F +α
ebenfalls eine Stammfunktion von f . Es gilt nämlich
G0 = (F + α)0 = F 0 = f.
Stammfunktionen sind also nur bis auf additive Konstanten eindeutig bestimmt. Dies
bereitet in der Regel jedoch keine Schwierigkeiten. Tatsächlich eröffnet sich dadurch die
Möglichkeit, eine solche Konstante passend“ zur jeweiligen Anwendung zu wählen.
”
Satz 7.9 (Fundamentalsatz der Analysis). Sei [a, b] ⊂ R ein nichtleeres, abgeschlossenes Intervall. Sei außerdem f ∈ L1 ([a, b]) eine integrierbare Funktion, und sei F : [a, b] → R
eine Stammfunktion von f . Dann gilt
Z b
h
ib
f (x) dx = F (x)
:= F (b) − F (a).
a
x=a
Üblicherweise bezeichnet man die Funktion, deren Integral berechnet werden soll, als Integrand. Der Fundamentalsatz der Analysis besagt, dass man das Integral einer integrierbaren Funktion über einem eindimensionalen Intervall immer dann explizit berechnen kann,
wenn eine Stammfunktion des Integranden existiert. Es ist dabei üblich, die Differenz der
Funktionswerte der Stammfunktion an den Integrationsgrenzen a und b mit
h
ib
F (x)
x=a
zu bezeichnen. Oft wird auch einfach die Schreibweise
h
ib
F (x)
a
verwendet, wenn klar ist, dass x die Variable der Stammfunktion ist. In den nachfolgenden
Beispielen wird demonstriert, wie der Fundamentalsatz der Analysis angewendet wird.
178
KAPITEL 7. INTEGRALRECHNUNG
Beispiele.
(a) Es soll das Integral
π
Z
sin(3x + π) dx
0
berechnet werden. Die Funktion f : R → R, welche durch f (x) := sin(3x + π) für
alle x ∈ R gegeben ist, kann hierbei als Integrand angesehen werden. Wie man leicht
erkennt, ist die Funktion F : R → R, welche durch F (x) := − cos(3x + π)/3 für alle
x ∈ R definiert ist, eine Stammfunktion von f . Es gilt nämlich F 0 = f . Nach dem
Fundamentalsatz der Analysis erhält man also
Z π
cos(3x + π) π
cos(3π + π)
cos(0 + π)
sin(3x + π) dx = −
=−
− −
3
3
3
0
x=0
1 1
cos(4π) cos(π)
=−
+
=− −
3
3
3 3
2
=− .
3
(b) Man betrachte das Integral
Z
1
3x2 − 1 dx.
−1
Der Integrand ist offenbar durch das Polynom f : R → R gegeben, welches durch
f (x) := 3x2 − 1 für alle x ∈ R definiert ist. Man rechnet leicht nach, dass das
Polynom F : R → R, welches durch F (x) = x3 − x für alle x ∈ R definiert ist, eine
Stammfunktion von f ist. Daher erhält man
1
Z 1
= 13 − 1 − (−1)3 − (−1) = 1 − 1 + 1 − 1 = 0
3x2 − 1 dx = x3 − x
−1
−1
nach dem Fundamentalsatz der Analysis.
♦
Es gibt bestimmte Klassen von Funktionen, für die man immer eine Stammfunktion angeben kann. Das bekannteste Beispiel für eine solche Klasse von Funktionen sind die Polynome. Für jedes Polynom f : R → R, welches durch
f (x) := a0 + a1 x + a2 x2 + · · · + an xn
für alle x ∈ R gegeben ist, ist nämlich das Polynom F : R → R, welches durch
a1
a2
an n+1
F (x) := a0 x + x2 + x3 + · · · +
x
2
3
n+1
für alle x ∈ R gegeben ist, eine Stammfunktion. Für Polynome existiert also eine Regel
für die Bildung von Stammfunktionen. In den nachfolgenden Beispielen werden weitere
Regeln für die Bildung von Stammfunktionen aufgeführt.
Beispiele.
(a) Für jede reelle Zahl α ∈ R\{−1} sei die Funktion pα : (0, ∞) → R durch pα (x) := xα
für alle x ∈ R definiert. Wie man leicht nachrechnet, ist für alle α ∈ R \ {−1} die
Funktion Pα : R → R, welche durch Pα (x) := xα+1 /(α + 1) für alle x ∈ R definiert
ist, eine Stammfunktion von pα . Nach dem Fundamentalsatz der Analysis gilt also
α+1 b
Z b
x
α
x dx =
α + 1 x=a
a
für alle a, b ∈ R mit 0 < a ≤ b.
7.3. BERECHNUNG VON INTEGRALEN
179
(b) Für jede positive Zahl α > 0 sei die Funktion fα : R → R durch fα (x) := αx für
alle x ∈ R definiert. Für alle α > 0 ist dann die Funktion Fα : R → R, welche durch
Fα (x) := αx / ln(α) für alle x ∈ R definiert ist, eine Stammfunktion von fα . Laut
Fundamentalsatz der Analysis gilt somit
b
Z
αx
α dx =
ln(α)
x
a
b
x=a
für alle a, b ∈ R mit a ≤ b. Insbesondere erhält man für den Fall, dass α = e gilt, die
Gleichung
Z b
h ib
ex dx = ex
x=a
a
für alle a, b ∈ R mit a ≤ b.
(c) Sei D ⊆ R eine nichtleere, offene Menge, und sei f ∈ C 1 (D) eine stetig differenzierbare Funktion, welche ausschließlich positive Funktionswerte besitzt. Die Funktion
g : D → R sei durch g(x) := f 0 (x)/f (x) für alle x ∈ D definiert. Dann ist die Funktion G : D → R, welche durch G(x) := ln(f (x)) für alle x ∈ R definiert ist, eine
Stammfunktion von g. Entsprechend gilt
Z
b
a
h
i b
f 0 (x)
dx = ln f (x)
f (x)
x=a
für alle a, b ∈ R mit a ≤ b und [a, b] ⊆ D. Wenn D = (0, ∞) und f (x) = x für alle
x ∈ D gilt, erhält man insbesondere
Z
a
b
h
ib
1
dx = ln x
x
x=a
für alle a, b ∈ R mit 0 < a ≤ b.
(d) Die Funktionen − cos und sin sind Stammfunktionen von sin bzw. cos.
♦
Für die Berechnung von Integralen über unbeschränkten Intervallen ist das nachfolgende
Lemma nützlich.
Lemma 7.10. Sei (a, b) ⊂ R ein nichtleeres, offenes Intervall, wobei auch a = −∞ oder
b = ∞ zugelassen sei. Seien außerdem f ∈ L1 ((a, b)) eine integrierbare Funktionen. Dann
gilt
Z b
Z z
Z b
f (x) dx = lim
f (x) dx = lim
f (x) dx.
z→b− a
a
z→a+ z
Aus Lemma 7.10 und dem Fundamentalsatz der Analysis kann man sehr leicht die folgende Aussage herleiten: Ist (a, b) ⊆ R ein offenes Intervall, und ist f ∈ L1 ((a, b)) eine
integrierbare Funktion, die eine Stammfunktion F : (a, b) → R besitzt. Dann gilt
Z
b
f (x) dx = lim F (x) − lim F (x).
a
x→b−
x→a+
Die Stammfunktion F muss also an denen Intervallgrenzen a und b nicht notwendigerweise
definiert sein. Sie muss dort lediglich einen Grenzwert besitzen. Diese Tatsache macht
180
KAPITEL 7. INTEGRALRECHNUNG
man sich insbesondere bei der Berechnung von Integralen über unbeschränkten Intervallen
zunutze. Es gilt nämlich
Z ∞
h
i∞
:= lim F (x) − F (a),
f (x) dx = f (x)
bzw.
Z
b
x→∞
a
a
h
i∞
f (x) dx = f (x)
:= F (b) − lim F (x),
x→∞−
−∞
−∞
sofern die die Funktion f auf dem Intervall [a, ∞) bzw. (−∞, b] definiert und integrierbar
ist. Man betrachte dazu die nachfolgenden Beispiele.
Beispiele.
(a) Das Integral
Z
∞
e−x dx
0
soll berechnet werden. Der Integrand ist offenbar durch die Funktion f : R → R
gegeben, welche durch f (x) := e−x für alle x ∈ R definiert ist. Die Funktion F : R →
R, welche durch F (x) := −ex für alle x ∈ R definiert ist, ist eine Stammfunktion
von f . Nach Lemma 7.10 erhält man
Z ∞
i∞
h
e−x dx = −e−x
= lim −e−x − −e0 = 0 + 1 = 1.
0
0
x→∞
√
(b) Wie man leicht erkennt, ist die Funktion f : (0, 1) → R, welche durch f (x) := 1/ x
für alle x ∈ (0, 1) definiert ist, nicht beschränkt. Sie ist aber dennoch integrierbar,
denn nach Lemma 7.10 gilt
Z
0
1
1
√ dx = lim
z→0+
x
Z
z
1
h √ i1
√
√
1
√ dx = lim 2 x = 2 1 − lim 2 z = 2.
z→0+
z→0+
x
z
(c) Es soll untersucht werden, ob die Funktion f : (1, ∞) → R, welche durch f (x) := 1/x
für alle x ∈ R definiert ist, integrierbar ist. Dies ist genau dann der Fall, wenn das
Integral von f über dem Definitionsbereich (1, ∞) endlich. Tatsächlich erhält man
aber
Z ∞
h
i∞
1
dx = ln(x)
= lim ln(x) − ln(1) = lim ln(x) − 0 = ∞.
x→∞
x→∞
x
1
1
Die Funktion f ist demnach nicht integrierbar.
♦
Als nächstes betrachten wir eine Integrationsmethode, die oft hilfreich ist, wenn der Integrand als Produkt zweier Funktionen darstellbar ist. Diese Methode wird die Methode der
partiellen Integration genannt. Die Grundlage für diese Methode liefert der folgende Satz.
Satz 7.11. Sei (a, b) ⊆ R ein nichtleeres, offenes Intervall, und seien u ∈ C 1 ((a, b)) und
v ∈ C 1 ((a, b)) zwei stetig differenzierbare Funktionen. Dann gilt
Z
a
b
h
ib
u0 (x)v(x) dx = u(x)v(x)
x=a
Z
−
a
b
u(x)v 0 (x) dx.
7.3. BERECHNUNG VON INTEGRALEN
181
Grundsätzlich ist es bei der Berechnung eines Integrals
Z b
f (x) dx
a
immer dann sinnvoll, die Methode der partiellen Integration anzuwenden, wenn sich der
Integrand f als Produkt zweier Funktionen w und v schreiben lässt, so dass w eine Stammfunktion W besitzt und die Ableitung v 0 von v einfacher“ ist als die Funktion v selbst.
”
Man erhält dann die Gleichung
Z b
Z b
Z b
h
ib
W (x)v 0 (x) dx,
w(x)v(x) dx = W (x)v(x)
−
f (x) dx =
a
x=a
a
a
v0
und hofft, dass man das Integral des Produkts von W und
explizit bestimmen kann.
Sollte dies nicht möglich sein, kann man erneut versuchen partiell zu integrieren. Es kann
auch vorkommen, dass die Methode der partiellen Integration eine Gleichung für das gesuchte Integral liefert, die man entsprechend lösen kann. In den nachfolgenden Beispielen
wird die Methode der partiellen Integration demonstriert.
Beispiele.
(a) Es soll das Integral
Z
1
ex x dx
0
bestimmt werden. Da sich der Integrand als Produkt zweier Funktionen darstellen
lässt, ist es nahe liegend die Methode der partiellen Integration anzuwenden. Definiert man die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) := ex und v(x) := x
für alle x ∈ R, so ist der Integrand gerade durch das Produkt von u0 und v gegeben.
Man erhält also
Z 1
Z 1
h
i1 Z 1
ex x dx =
u0 (x)v(x) dx = u(x)v(x) −
u(x)v 0 (x) dx
0
0
0
0
h
i1 h i1
h
i1 Z 1
ex · 1 dx = ex x − ex
= ex x −
0
0
0
0
= 1.
(b) Mit der Methode der partiellen Integration können auch Integrale der Form
Z b
ln(x) dx
a
mit a > 0 und b ≥ 0 bestimmt werden. Definiert man nämlich die Funktionen
u ∈ C 1 ([a, b]) und v ∈ C 1 ([a, b]) durch u(x) := x und v(x) := ln(x) für alle x ∈ [a, b],
so erhält man
Z b
Z b
Z b
h
ib Z b
0
ln(x) dx =
1 · ln(x) dx =
u (x)v(x) dx = u(x)v(x) −
u(x)v 0 (x) dx
a
a
a
a
a
h
ib Z b
h
ib h ib
= x ln(x) −
1 dx = x ln(x) − x
a
a
a
a
Insgesamt erhält man also
Z
a
b
h
ib
ln(x) dx = x(ln(x) − 1) .
a
182
KAPITEL 7. INTEGRALRECHNUNG
(c) In bestimmten Fällen kann man mit der Methode der partiellen Integration auch
eine Gleichung für ein Integral herleiten. Man betrachte etwa das Integral
2π
Z
sin(x) cos(x) dx.
0
Wir definieren zunächst die Funktionen u ∈ C 1 (R) und v ∈ C 1 (R) durch u(x) :=
− cos(x) und v(x) := cos(x) für alle x ∈ R. Es gilt dann
Z
0
2π
h
i2π Z 2π
u(x)v 0 (x) dx
−
u (x)v(x) dx = u(x)v(x)
sin(x) cos(x) dx =
0
0
0
h
i2π Z 2π
cos(x) sin(x) dx
−
= − cos(x) cos(x)
0
0
Z 2π
=−
sin(x) cos(x) dx.
Z
2π
0
0
Wie man sieht, liefert die Methode der partiellen Integration eine Gleichung von der
Form I = −I, wobei I das gesuchte Integral ist. Löst man diese Gleichung nach I
auf, so erhält man I = 0 und somit
Z
2π
sin(x) cos(x) dx = 0.
0
(d) Manchmal ist es notwendig, die Methode der partiellen Integration mehrfach anzuwenden, um ein Integral zu bestimmen. Dies ist beispielsweise beim Integral
Z π
cos(x)x2 dx
0
der Fall. Durch einmaliges partielles Integrieren erhält man
Z π
Z π
2
cos(x)x dx = −2
sin(x)x dx
0
0
Integriert man die rechte Seite der Gleichung erneut partiell, so erhält man
h
Z π
iπ Z π
2
cos(x)x dx = −2 − cos(x)x −
− cos(x) dx
0
0
0
h
iπ
h
iπ
= −2 − cos(x)x + 2 − sin(x)
0
0
= 2π cos(π)
= −2π
als Ergebnis.
♦
Am Ende dieses Abschnitts wollen wir uns noch mit der Berechnung von Integralen über
mehrdimensionalen Intervallen befassen. Dazu definieren wir zunächst die so genannten
mehrdimensionalen, abgeschlossenen Intervalle wie folgt.
7.3. BERECHNUNG VON INTEGRALEN
183
Definition (n-dimensionales, abgeschlossenes Intervall). Sei n ∈ N eine natürliche
Zahl, und seien a = (a1 , a2 , . . . , an )T ∈ Rn und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren.
Dann nennt man die Menge
[a, b] := [a1 , b1 ] × [a2 , b2 ] × · · · × [an , bn ]
= x = (x1 , x2 , . . . , xn )T ∈ Rn ai ≤ xi ≤ bi für alle i = 1, 2, . . . , n
ein n-dimensionales, offenes Intervall.
Für die Berechnung von Integralen über mehrdimensionalen Intervallen ist der folgende
Satz entscheidend, welcher als Satz von Fubini bekannt ist.
Satz 7.12 (Fubini). Sei n ∈ N eine natürliche Zahl, seien a = (a1 , a2 , . . . , an )T ∈ Rn
und b = (b1 , b2 , . . . , bn )T ∈ Rn zwei Vektoren, und sei f ∈ L1 ((a, b)) eine integrierbare
Funktion. Dann gilt
Z
Z
bπ(n)
Z
bπ(n−1)
Z
bπ(1)
···
f (x) dx =
aπ(n)
[a,b]
bπ(2)
Z
f (x) dxπ(1) dxπ(2) · · · dxπ(n−1) dxπ(n)
aπ(n−1)
aπ(2)
aπ(1)
für jede n-stellige Permutation π ∈ Sn .
Die Aussage des Satzes von Fubini kann man folgendermaßen zusammenfassen: Man berechnet das Integral einer Funktion mit vektorwertiger Variable, indem man nacheinander
nach jeder einzelnen Vektorkomponente integriert. Die Reihenfolge, in welcher man nach
den einzelnen Vektorkomponenten integriert, spielt dabei keine Rolle. Es gilt also insbesondere die Identität
Z bn Z bn−1 Z b2 Z b1
Z
···
f (x) dx =
f (x) dx1 dx2 · · · dxn−1 dxn ,
[a,b]
an
an−1
a2
a1
wobei die eindimensionalen Integrale von innen nach außen“ zu berechnen sind.
”
Natürlich gilt eine analoge Regel auch für Integrale von Funktionen, die von mehreren
reellwertigen Variablen abhängen. Seien etwa a, b, c, d ∈ R reelle Zahlen, und sei f : (a, b)×
(c, d) → R eine Funktion, deren Variablen mit x und y bezeichnet werden, so gilt
Z
dZ b
Z
f (x, y) d(x, y) =
[a,b]×[c,d]
Z bZ
f (x, y) dxdy =
c
a
d
f (x, y) dydx.
a
c
Die eindimensionalen Integrale werden wiederum falls möglich mit Hilfe des Fundamentalsatzes der Analysis, oder aber mit der Methode der partiellen Integration bestimmt. Bei
der Bestimmung von Stammfunktionen wird nur diejenige Variable berücksichtigt, nach
der jeweils integriert wird. Die Anwendung des Satzes von Fubini wird in den nachfolgenden Beispielen erläutert.
Beispiele.
(a) Das Integral
Z
[a,b]
2x1 x22 + 4x32 dx
184
KAPITEL 7. INTEGRALRECHNUNG
soll berechnet werden, wobei die Vektoren a ∈ R2 und b ∈ R2 durch a := (1, 2)T und
b := (3, 4)T gegeben seien. Nach dem Satz von Fubini gilt
Z
2x1 x22
+
4x32 dx
Z
4Z 2
=
3
[a,b]
Z
2x1 x22
+
4x32 dx1 dx2
Z 4h
i2
=
x21 x22 + 4x1 x32
x1 =1
3
1
dx2
4
22 x22 + 4 · 2x32 − 12 x22 + 4 · 1x32 dx2
=
3
Z
4
h
i4
3x22 + 4x32 dx2 = x32 + x42
=
x2 =3
3
= 43 + 4 4 − 33 + 3 4
= 212.
(b) Wir betrachten das Integral
Z
sin(x + y) d(x, y).
[−π,π]×[0,π]
Nach dem Satz von Fubini gilt
Z
Z πZ π
Z πh
iπ
sin(x + y) d(x, y) =
sin(x + y) dxdy =
− cos(x + y)
dy
x=−π
[−π,π]×[0,π]
0
−π
0
Z π
=
− cos(π + y) + cos(−π + y) dy
0
h
= − sin(π + y) + sin(−π + y)
iπ
y=0
= − sin(2π) + sin(0) − − sin(π) + sin(−π)
= 0.
Das Integral verschwindet also.
♦
Übungsaufgaben
1. Berechnen Sie die folgenden Integrale:
Z
1
Z
3
x − 5x dx,
−1
Z √
0
1
Z
2x
dx,
2
x +1
e−2x dx,
cos(πx + π/2) dx,
0
e−1
√
ln( 2)
Z
0
π/3
Z
tan(x) dx,
0
0
√
Z
2
2x3 − x2 dx,
1
7
√
3x
dx,
3x2 + 4
2. Untersuchen Sie, ob die folgenden Funktionen integrierbar sind:
f1 : [1, ∞) → R, x 7→ 1/x,
f2 : [1, ∞) → R, x 7→ 1/x2 ,
f3 : (0, 1] → R, x 7→ 1/x,
√
f4 : (0, 1] → R, x 7→ 1/ 3 x.
Z
0
1/2
x
dx.
2x + 1
7.3. BERECHNUNG VON INTEGRALEN
185
3. Berechnen Sie die folgenden Integrale mit der Methode der partiellen Integration:
Z
π/2
Z
x sin(x) dx,
0
2
Z
x ln(x) dx,
1
2 −x
x e
1
0
Z
2π
dx,
sin2 (x) dx.
0
4. Zeigen Sie mittels vollständiger Induktion, sowie der Methode der partiellen Integration, dass
die Gleichung
Z ∞
n!
xn e−αx dx = n+1
α
0
für alle positiven Zahlen α > 0 und alle natürlichen Zahlen n ∈ N gilt.
5. Berechnen Sie die folgenden Integrale:
Z
2 − x2 − y 2 d(x, y),
[−1,1]×[−1,1]
Z
4x3 y − y d(x, y),
[−1,1]×[0,2]
Z
sin(x) sin(y) d(x, y),
[0,π]×[0,π]
Z
x(1 − x)(y − 1)(y − 2) d(x, y).
[0,1]×[1,2]
186
7.4
KAPITEL 7. INTEGRALRECHNUNG
Der Transformationssatz
Bisher haben wir lediglich Methoden für die Berechnung von Integralen über eindimensionalen und mehrdimensionalen Intervallen kennen gelernt. In diesem Abschnitt wenden wir
uns der Berechnung von Integralen über allgemeineren Mengen zu. Das wichtigste Hilfsmittel ist hierbei der so genannte Transformationssatz. Um diesen formulieren zu können,
führen wir zunächst den Begriff des Diffeomorphismus ein.
Definition (Diffeomorphismus). Sei n ∈ N eine natürliche Zahl, und seien D ⊆ Rn und
E ⊆ Rn zwei nichtleere Mengen. Eine Funktion f : D → E wird ein Diffeomorphismus von
D nach E genannt, wenn f bijektiv ist, und wenn sowohl f als auch die Umkehrabbildung
f −1 : E → D stetig differenzierbar sind.
Nachfolgend geben wir einige wichtige Beispiele für Diffeomorphismen an.
Beispiele.
(a) Seien [a, b] ⊂ R und [c, d] ⊂ R zwei nichtleere, beschränkte Intervalle. Dann ist die
Funktion g : [a, b] → [c, d], welche durch
g(x) :=
d−c
(x − a) + c
b−a
für alle x ∈ [a, b] definiert ist, ein Diffeomorphismus von [a, b] nach [c, d]. Die Umkehrabbildung g −1 : [c, d] → [a, b] ist durch
g −1 (x) =
b−a
(x − c) + a
d−c
für alle x ∈ [c, d] gegeben.
(b) Die Menge P ⊆ R2 sei durch P := ((0, ∞) × (−π, π]) ∪ {0} gegeben. Ferner sei die
Funktion g : I → R2 durch
x1 cos(x2 )
g(x) :=
x1 sin(x2 )
für alle x = (x1 , x2 )T ∈ I definiert. Man kann zeigen, dass g bijektiv ist, und dass
die entsprechende Umkehrabbildung g −1 : R2 → P durch
2
x1 + x22
−1
g (x) =
Φ(x1 , x2 )
für alle x = (x1 , x2 )T ∈ B1 (0) gegeben ist. Die Funktion Φ : R × R → R ist hierbei
durch


arctan(x2 /x1 )
falls x1 > 0,



arctan(x /x ) + π falls x < 0, x ≥ 0,
2
1
1
2
Φ(x1 , x2 ) :=

arctan(x2 /x1 ) − π falls x1 < 0, x2 < 0,



sgn(x )π/2
sonst
2
für alle x1 ∈ R und alle x2 ∈ R definiert. Die Funktionen g und g −1 sind beide stetig
differenzierbar, weshalb g ein Diffeomorphismus ist.
Die Funktion g spielt in verschiedenen Anwendungen eine wichtige Rolle. Sie realisiert nämlich die Koordinatentransformation von Polarkoordinaten in kartesische
Koordinaten. Die Umkehrabbildung realisiert entsprechend die Rücktransformation
von kartesischen Koordinaten in Polarkoordinaten.
7.4. DER TRANSFORMATIONSSATZ
187
(c) Sei n ∈ N eine natürliche Zahl, sei A ∈ Rn×n eine reguläre (d.h. invertierbare) Matrix,
und sei b ∈ Rn ein beliebiger Vektor. Dann ist die affine Abbildung g : Rn → Rn ,
welche durch
g(x) := Ax + b
für alle x ∈ Rn bestimmt ist, ein Diffeomorphismus von Rn nach Rn . Die Umkehrabbildung g −1 : Rn → Rn ist durch
g −1 (x) = A−1 x − A−1 b
für alle x ∈ Rn gegeben. Die Jacobi–Matrizen beider Abbildungen sind durch g 0 (x) =
A bzw. (g −1 )0 (x) = A−1 für alle x ∈ Rn gegeben.
♦
Wie im Beispiel (b) bereits angedeutet wurde, treten Diffeomorphismen häufig bei so genannten Koordinatentransformationen auf. In zwei Raumdimensionen kann man die Lage
eines Punktes beispielsweise mit dem kartesischen Koordinatensystem durch Angabe zweier Zahlen x ∈ R und y ∈ R definieren. Diese beiden Zahlen bestimmen die horizontale und
die vertikale Position des Punktes relativ zum Ursprung des Koordinatensystems. Eine
weitere Möglichkeit die Lage des Punktes zu definieren besteht in der Verwendung des so
genannten Polarkoordinatensystems. Im Polarkoordinatensystem wird die Lage des Punktes durch zwei Zahlen r ≥ 0 und ϕ ∈ (−π, π] definiert, wobei r den Abstand des Punktes
zum Ursprung angibt, und ϕ den Winkel zwischen der x-Achse und der Verbindungsstrecke zwischen dem Punkt und dem Ursprung (siehe Abbdilung ??). Die Umrechnung
zwischen kartesischen Koordinaten und Polarkoordinaten erfolgt mittels dem im Beispiel
(b) definierten Diffeomorphismus g gemäß g((r, ϕ)T ) = (x, y)T bzw. g −1 ((x, y)T ) = (r, ϕ)T .
Im folgenden soll noch auf eine weitere Aufgabe von Diffeomorphismen eingegangen
werden. Definiert man die Menge I ⊆ R2 durch I := ((0, 1) × (−π, π]) ∪ {0}), und die
Funktion g : I → B1 (0) durch
g(x) :=
x1 cos(x2 )
x1 sin(x2 )
für alle x ∈ R2 , so ist g ein Diffeomorphismus von I nach B1 (0), wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Die Einheitskugel kann also
als das Bild der Menge I unter dem Diffeomorphismus g charakterisiert werden. Die Menge
I ist dabei im wesentlichen ein zweidimensionales Intervall. Wir erinnern uns, dass Integrale über mehrdimensionalen Intervallen mit Hilfe des Satzes von Fubini (siehe Satz 7.12)
berechnet werden können. Die Frage ist, ob man den Diffeomorphismus g dazu verwenden
kann, Integrale über der Einheitskugel B1 (0) zu berechnen. Die Antwort darauf lautet:
Ja. Man muss dazu lediglich den folgenden Satz anwenden, der als Transformationssatz
bekannt ist.
Satz 7.13 (Transformationssatz). Sei n ∈ N eine natürliche Zahl, seien D ⊆ Rn und
E ⊆ Rn zwei nichtleere, offene Mengen, und sei g : D → E ein Diffeomorphismus von D
nach E. Sei ferner f ∈ L1 (E) eine integrierbare Funktion. Dann gilt
Z
Z
f (x) dx =
(f ◦ g)(x)|det g 0 (x)| dx.
E
D
Hierbei bezeichnet g 0 die Jacobi–Matrix von g.
188
KAPITEL 7. INTEGRALRECHNUNG
Der Transformationssatz wird in der Regel wie folgt angewendet: Gesucht sei das Integral einer Funktion f über einer Menge E, die kein mehrdimensionales Intervall ist.
Man überlegt sich dann, ob ein Intervall I und ein Diffeomorphismus g existiert, so dass
E = g(I) gilt. Wenn ja, kann das Integral von f über E gemäß dem Transformationssatz als Integral der Funktion h über I berechnet werden, wobei die Funktion h durch
h(x) := (f ◦ g)(x)|det g 0 (x)| für alle x ∈ I definiert ist. Dieses Vorgehen wird noch einmal
in den nachfolgenden zwei Beispielen demonstriert.
Beispiele.
(a) Es soll das Integral
Z
x1 + 1 dx
B1 (0)
berechnet werden, wobei B1 (0) die offene Einheitskugel in R2 bezüglich der euklidischen Norm bezeichnet. Der Integrand ist hierbei durch die Funktion f : R2 → R
gegeben, welche durch f (x) := x1 + 1 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Sei
I := ((0, 1) × (−π, π]) ∪ {0}. Wir wissen bereits, dass die Funktion g : I → B1 (0),
welche durch
x1 cos(x2 )
g(x) :=
x1 sin(x2 )
für alle x = (x1 , x2 )T ∈ R2 definiert ist, ein Diffeomorphismus von I nach B1 (0) ist.
Man rechnet außerdem leicht nach, dass
|det g 0 (x)| = x1
für alle x = (x1 , x2 )T ∈ R2 gilt. Nach dem Transformationssatz erhält man also
Z
Z
Z
x1 + 1 dx =
f (x) dx = (f ◦ g)(x)|det g 0 (x)| dx
B1 (0)
B1 (0)
Z
=
I
x21 cos(x2 )
I
Z
1Z π
+ x1 dx =
0
−π
x21 cos(x2 ) + x1 dx2 dx1
Z 1h
Z 1
iπ
2
=
x1 sin(x2 ) + x1 x2
dx1 =
2πx1 dx1
x2 =−π
0
0
h
i1
= πx21
x1 =0
= π.
(b) Es soll das Integral
Z
x21 − 2x2 dx,
P
berechnet werden. Die Menge P := {α1 p(1) + α2 p(2) | α1 , α2 ∈ [0, 1]} ist dabei das
von den Vektoren u(1) := (3, 0)T und u(2) := (1, 1)T aufgespannte Parallelogramm.
Der Integrand ist durch die Funktion f : R2 → R gegeben, welche durch f (x) :=
x21 − 2x2 für alle x = (x1 , x2 )T ∈ R2 definiert ist. Man erkennt leicht, dass P das
Bild des Einheitsquadrats [0, 1]2 ⊂ R2 unter dem Diffeomorphismus g : [0, 1]2 → P
ist, welcher durch
3 1
α1
g(α) :=
0 1
α2
7.4. DER TRANSFORMATIONSSATZ
189
für alle α = (α1 , α2 )T ∈ [0, 1]2 definiert ist. Ferner gilt
|det g 0 (α)| = 3
für alle α ∈ (0, 1)2 . Man erhält also
Z
Z
Z
2
(f ◦ g)(α)|det g 0 (α)| dα
f (x) dx =
x1 − 2x2 dx =
2
(0,1)
P
P
Z
3(2α1 + α2 )2 − 6α2 dα
=
(0,1)2
1Z 1
Z
=
0
12α12 + 12α1 α2 + 3α22 − 6α2 dα1 dα2
0
Z 1h
i1
=
dα2
4α13 + 6α12 α2 + 3α1 α22 − 6α1 α2
α1 =0
0
Z 1
=
4 + 12α2 + 3α22 dα2
0
h
i1
= 4α2 + 6α22 + α23
0
= 11
nach dem Transformationssatz.
♦
Wird der Transformationssatz auf Integrale über eindimensionalen Intervallen angewendet,
so ergeben sich gewisse Vereinfachungen. Man erhält dann die so genannte Substitutionsregel für Integrale.
Satz 7.14. Seien a ∈ R und b ∈ R zwei reelle Zahlen mit a ≤ b, sei I ⊆ R ein Intervall,
sei g : I → [a, b] ein Diffeomorphismus, und sei f ∈ L1 ((a, b)) eine integrierbare Funktion.
Dann gilt
Z b
Z g−1 (b)
f (x) dx =
(f ◦ g)(x) g 0 (x) dx.
g −1 (a)
a
Hierbei bezeichnet g 0 die erste Ableitung von g.
Die Substitutionsregel kann bei der Berechnung bestimmter Integrale hilfreich sein, wie
die nachfolgenden Beispiele zeigen.
Beispiele.
(a) Das Integral
Z
π2
sin
√ x dx
0
√
soll berechnet werden. Offenbar bereitet dabei vor allem der Ausdruck xp
Schwierigkeiten. Es ist daher sinnvoll, einen Diffeomorphismus g zu finden, so dass g(x) = x
gilt. Ein solcher Diffeomorphismus g : [0, π] → [0, π 2 ] ist durch g(x) := x2 für alle
x ∈ [0, π] gegeben. Die entsprechende Umkehrabbildung g −1 : [0, π 2 ] → [0, π] ist
√
durch g −1 (x) := x für alle x ∈ [0, π 2 ] definiert. Gemäß Substitutionsregel (siehe
Satz 7.14) erhält man
Z π2
Z g−1 (π2 )
Z π
p
0
√ sin x dx =
sin g(x) g (x) dx =
2x sin(x) dx.
0
g −1 (0)
0
190
KAPITEL 7. INTEGRALRECHNUNG
Das Integral auf der rechten Seite kann mit Hilfe der Methode der partiellen Integration bestimmt werden. Man erhält
Z π2
√
sin( x) dx = 2π.
0
(b) Wir betrachten das Integral
Z
1p
1 − x2 dx.
0
Definiert man den Diffeomorphismus g : [0, π/2] → [0, 1] durch g(x) := sin(x) für alle
x ∈ [0, π/2], so erhält man gemäß Substitutionsregel (siehe Satz 7.14) die Gleichung
Z π/2 p
Z π/2 p
Z 1p
2
2
1 + x dx =
1 − (sin(x)) cos(x) dx =
(cos(x))2 cos(x) dx
0
0
Z
=
0
π/2
(cos(x))2 dx.
0
Hierbei wurde das Additionstheorem für die Sinus- und die Cosinusfunktion verwendet, welches besagt, dass für alle x ∈ R die Identität (sin(x))2 + (cos(x))2 = 1 gilt.
Das Integral über die quadrierte Cosinusfunktion kann mit Hilfe der Methode der
partiellen Integration berechnet werden. Als Ergebnis erhält man
Z 1p
π
1 + x2 dx = .
4
0
(c) Für a, b ∈ R mit a ≤ b soll das Integral
Z b
a
1
dx
1 + x2
bestimmt werden. Die Tangensfunktion tan : (−π/2, π/2) → R ist bekanntlich streng
monoton wachsend und stetig differenzierbar, wobei tan0 = 1 + tan2 gilt. Ferner
ist sie ein Diffeomorphismus von (−π/2, π/2) nach R, wobei die Umkehrabbildung
durch die Arcustangensfunktion arctan : R → (−π/2, π/2) gegeben ist. Nach der
Substitutionsregel erhält man daher
Z b
Z arctan(b)
Z arctan(b)
1
tan0 (x)
dx =
dx =
1 dx
2
2
a 1+x
arctan(a) 1 + (tan(x))
arctan(a)
= arctan(b) − arctan(a).
Offenbar ist das gesuchte Integral also durch
Z b
h
ib
1
dx
=
arctan(x)
2
x=a
a 1+x
gegeben.
♦
Bei der Anwendung der Substitutionsregel ist es nicht immer offensichtlich, wie der Diffeomorphismus g gewählt werden muss, damit das resultierende Integral explizit berechnet
werden kann. Eine Standardvorgehensweise besteht darin, im Integranden einen Ausdruck
auszuwählen, den man gerne durch die Integrationsvariable ersetzen möchte. Diesen Ausdruck nutzt man zu Definition von g −1 und wendet damit die Substitutionsregel an. Diese
Vorgehensweise wurde auch im zuvor genannten Beispiel (a) gewählt.
7.4. DER TRANSFORMATIONSSATZ
191
Übungsaufgaben
1. Berechnen Sie mit Hilfe des Transformationssatzes die folgenden Integrale:
Z
Z
q
2
2
1 − x1 − x2 dx,
cos π x21 + x22 dx,
B (0)
B (0)
Z 1
Z 1
2
2
e−x1 −x2 dx,
2 − x2 dx.
R2
P
Hierbei bezeichnet B1 (0) die offene Einheitskugel in R2 , und
P := α1 u(1) + α2 u(2) α1 , α2 ∈ [0, 1]
das von den Vektoren u(1) := (1, 1)T und u(2) = (−1, 1)T aufgespannte Parallelogramm.
2. Berechnen Sie die folgenden Integrale:
Z
0
π 2 /4
√ cos x dx,
Z
√
3
π
x5 sin(x3 ) dx,
0
Verwenden Sie dazu die Substitutionsregel.
Z
0
1
1
√ dx,
1+ x
Z
1 √
e
0
2x
dx.
Lernzielkontrolle
Nach dem Durcharbeiten dieses Kapitels sollten Sie ...
... wissen, dass man das Volumen bestimmter Teilmengen des Rn durch das n-dimensionalen
Lebesgue–Maßes definiert.
... wissen, dass nur den Lebesgue–messbaren Teilmengen des Rn in sinnvoller Weise ein
Volumen zugeordnet werden kann.
... wissen, dass alle Intervalle, alle offenen Mengen und alle abgeschlossenen Mengen
Lebesgue–messbar sind.
... wissen, wie das Lebesgue–Maß eines n-dimensionalen Intervalls definiert ist.
... wissen, was eine Lebesgue–Nullmenge ist.
... wissen, was die Formulierung fast überall“ bedeutet.
”
... wissen, was die charakteristische Funktion einer Teilmenge des Rn ist.
... wissen, was eine Lebesgue–messbare Funktion, und was eine Lebesgue–integrierbare
Funktion ist.
... wissen, dass jede stetige Funktion Lebesgue–messbar ist.
... den Fundamentalsatz der Analysis kennen und anwenden können.
... die Methode der partiellen Integration anwenden können.
... Integrale über mehrdimensionalen Intervallen berechnen können.
... den Transformationssatz und die Substitutionsregel kennen.
192
Anhang A
Wichtige Resultate
Wichtige Gleichungen und Ungleichungen
Dreiecksungleichung: Für jede Norm k · k gilt
kx + yk ≤ kxk + kyk
(siehe Seite 8)
Umgekehrte Dreiecksungleichung: Für jede Norm k · k gilt
kxk − kyk ≤ kx − yk
(siehe Seite 12)
Orthogonalentwicklung: Für jede Orthonormalbasis {q1 , q2 , . . . , qn } gilt
x = hx , q1 iq1 + hx , q2 iq2 + · · · + hx , qn iqn
(siehe Seite 22)
Konvergenzverhalten wichtiger Folgen
α
= 0, α, β ∈ R
n→∞ n + β
n+α
lim
= 1, α, β ∈ R
n→∞ n + β
√
lim n n = 1
n→∞
√
n
lim n! = ∞
n→∞
x n
lim 1 +
= ex , x ∈ R
n→∞
n


=0
falls



= 1
falls
lim q n
n→∞

=∞
falls



existiert nicht falls
lim
(siehe Seite 47)
(siehe Seite 48)
(siehe Seite 48)
(siehe Seite 94)
(siehe Seite 73)
|q| < 1,
q = 1,
q > 1,
q ≤ −1
(siehe Seite 48)
193
194
ANHANG A. WICHTIGE RESULTATE
Konvergenzverhalten wichtiger Reihen
(
∞
X
konvergiert falls α > 1,
1
1
1
1
= 1 + α + α + α + ···
nα
2
3
4
=∞
falls α ≤ 1
n=1
(siehe Seite 82)
∞
X
1
1
1
1
= 1 + + + + ··· = e
n!
1! 2! 3!
(siehe Seite 76)
n=0
Harmonische Reihe:
∞
X
1
1 1 1
= 1 + + + + ··· = ∞
n
2 3 4
(siehe Seite 79)
n=1
Alternierende harmonische Reihe:
∞
X
(−1)n+1
=1−
n
n=1
1 1 1
+ − ± · · · = ln(2)
2 3 4
(siehe Seite 76)
Geometrische Reihe:
1
falls |q| < 1,
1−q
n
2
3
q = 1 + q + q + q + ··· = ∞
falls q ≥ 1,


n=0

divergiert falls q ≤ −1



=
∞
X
(siehe Seite 77)
Wichtige Potenzreihen
ex =
∞
X
xn
n=0
sin(x) =
cos(x) =
n!
=1+x+
x2 x3
+
+ ···
2!
3!
(siehe Seite 94)
∞
X
(−1)n
x3 x5 x7
x2n+1 = x −
+
−
± ···
(2n + 1)!
3!
5!
7!
(siehe Seite 96)
(−1)n 2n
x2 x4 x6
x =1−
+
−
± ···
(2n)!
2!
4!
6!
(siehe Seite 96)
n=0
∞
X
n=0
Wichtige Funktionsgrenzwerte
sin(x)
= 1,
x→0
x
lim
lim xn e−x = 0,
x→∞
lim x ln(x) = 0
x→0+
lim
x→0+
ln(x)
= −∞
x
(siehe Seite 101)
n ∈ N0
(siehe Seite 104)
(siehe Seite 128)
(siehe Seite 129)
195
Wichtige Aussagen über stetige Funktionen
f ist an der Stelle x0 stetig ⇐⇒ f (x0 ) = lim f (x).
(siehe Seite 105)
Zwischenwertsatz
(siehe Seite 111)
Nullstellensatz von Bolzano
(siehe Seite 112)
Satz vom Minimum und Maximum
(siehe Seite 114)
D ∈ L(Rn ) und f ∈ C(D) =⇒ f ist Lebesgue–messbar.
(siehe Seite 171)
x→x0
Wichtige Aussagen über differenzierbare Funktionen
f ist an der Stelle x0 differenzierbar =⇒ f ist an der Stelle x0 stetig.
(siehe Seite 122)
Satz von Rolle
(siehe Seite 127)
Mittelwertsatz
(siehe Seite 127)
Wichtige Ableitungen
f (x) = xα ,
f 0 (x) = αxα−1 ,
α∈R
(siehe Seite 125)
f (x) = αx ,
f 0 (x) = ln(α)αx ,
α>0
(siehe Seite 125)
f (x) = ln(x),
f 0 (x) =
f (x) = sin(x),
f 0 (x) = cos(x),
(siehe Seite 125)
f (x) = cos(x),
f 0 (x) = − sin(x),
(siehe Seite 125)
1
,
x
(siehe Seite 125)
Ableitungsregeln
Summenregel: (f + g)0 = f 0 + g 0
Regel des konstanten Faktors: (αf )0 = αf 0 ,
Produktregel: (f g)0 = f 0 g + f g 0
0
f 0g − f g0
f
Quotientenregel:
=
g
g2
(siehe Seite 123)
α∈R
(siehe Seite 123)
(siehe Seite 123)
(siehe Seite 123)
196
ANHANG A. WICHTIGE RESULTATE
Kettenregel: (f ◦ g)0 = (f 0 ◦ g)g 0
(siehe Seite 124)
Wichtige Stammfunktionen
f (x) = xα ,
f (x) = αx ,
xα+1
+ c,
α+1
αx
F (x) =
+ c,
ln(α)
F (x) =
α ∈ R \ {−1}, c ∈ R
(siehe Seite 178)
α > 0, c ∈ R
(siehe Seite 179)
f (x) = ln(x),
F (x) = x(ln(x) − 1) + c,
c∈R
(siehe Seite 181)
f (x) = sin(x),
F (x) = − cos(x) + c,
c∈R
(siehe Seite 179)
f (x) = cos(x),
F (x) = sin(x) + c,
c∈R
(siehe Seite 179)
F (x) = arctan(x) + c,
c∈R
(siehe Seite 190)
F (x) = ln(|g(x)|) + c,
c∈R
(siehe Seite 179)
1
,
1 + x2
g 0 (x)
f (x) =
,
g(x)
f (x) =
Integrationsregeln
Summenregel:
Z
Z
Z
f (x) + g(x) dx =
f (x) dx +
g(x) dx
Ω
Ω
Regel des konstanten Faktors:
Z
Z
αf (x) dx = α f (x) dx,
Ω
(siehe Seite 174)
Ω
α∈R
(siehe Seite 174)
Ω
Additivität:
Z
Z
Z
f (x) dx =
f (x) dx +
f (x) dx
A∪B
A
falls A ∩ B = ∅
(siehe Seite 174)
B
Integrale über Nullmengen:
Z
f (x) dx = 0 falls meas(N ) = 0
(siehe Seite 174)
N
Vertauschen der Integrationsgrenzen:
Z
a
Z
f (x) dx = −
b
b
f (x) dx,
a
(siehe Seite 175)
197
Methode der partiellen Integration:
Z
b
Z
ib
u (x)v(x) dx = u(x)v(x)
h
0
x=a
a
b
−
u(x)v 0 (x) dx
(siehe Seite 180)
a
Satz von Fubini:
Z bZ
Z
a
[a,b]×[c,d]
d
Z
dZ b
f (x, y) dxdy
f (x, y) dy dx =
f (x, y) d(x, y) =
c
c
(siehe Seite 183)
a
Transformationssatz: Für jeden Diffeomorphismus g : D → E gilt
Z
Z
(f ◦ g)(x)|det g 0 (x)|dx
f (x) dx =
(siehe Seite 187)
D
E
Substitutionsregel: Für jeden Diffeomorphismus g : I → [a, b] gilt
Z
b
Z
g −1 (b)
f (x) dx =
a
(f ◦ g)(x)g 0 (x)dx
(siehe Seite 187)
g −1 (a)
Weitere wichtige Resultate
Satz des Pythagoras
(siehe Seite 20)
Satz von Heine–Borel
(siehe Seite 63)
Satz von Taylor
(siehe Seite 136)
Satz von Schwarz
(siehe Seite 145)
Symbolverzeichnis
N
Menge der natürlichen Zahlen, 4
N0
Menge der natürlichen Zahlen mit Null, 4
Z
Menge der ganzen Zahlen, 4
Q
Menge der rationalen Zahlen, 4
R
Menge der reellen Zahlen, 4
C
Menge der komplexen Zahlen, 4
K
Platzhalter für R oder C, 4
Rn×n
sym
Menge aller symmetrischen Matrizen in Rn×n , 25
XN
Menge aller Folgen in X, 30
B(X, W )
Menge aller beschränkten Funktionen von X nach W , 61
C(D, W )
Menge aller stetigen Funktionen von D nach W , 105
C k (D, W )
Menge aller k-mal stetig (partiell) differenzierbaren Funktionen von D
nach W , 132
C ∞ (D, W )
Menge aller glatten Funktionen von D nach W , 132
E(D)
Menge aller einfachen Funktionen von D nach R, 169
L1 (D)
Menge aller Lebesgue–integrierbaren Funktionen von D nach R, 172
Lin(Rn , Rm )
Menge aller Linearen Abbildungen von Rn nach Rm , 154
k·k
Allgemeine Norm, 8
|·|
Betragsfunktion, euklidische Norm oder Standardnorm, 9
k · k1
Betragssummennorm, 9
k · k∞
Maximumnorm, 9
Br (v)
Offene Kugel mit Mittelpunkt v und Radius r, 11
Br (v)
Abgeschlossene Kugel mit Mittelpunkt v und Radius r, 11
Sr (v)
Sphäre mit Mittelpunkt v und Radius r, 12
h· , ·i
Allgemeines Skalarprodukt, 14
198
199
·
Multiplikation oder euklidisches Skalarprodukt, 14
∠(v, w)
Winkel zwischen den Vektoren v und w, 18
inf M
Infimum der Menge M , 37
max M
Maximum der Menge M , 38
min M
Minimum der Menge M , 38
sup M
Supremum der Menge M , 37
lim vn
Grenzwert einer Folge (vn )n∈N , 47
lim f (x)
Grenzwert einer Funktion f in x0 , 99
n→∞
x→x0
lim f (x)
Linksseitiger Grenzwert einer Funktion f in x0 , 102
lim f (x)
Rechtsseitiger Grenzwert einer Funktion f in x0 , 102
x→x0 −
x→x0 +
M◦
Inneres der Menge M , 53
∂M
Rand der Menge M , 53
M
Abschluss der Menge M , 54
f 0 (x0 )
Ableitung von f an der Stelle x0 , 119
f (k) (x0 )
k-te Ableitung von f an der Stelle x0 , 132
∂k f x(0)
∂f
(x0 , y0 , . . . )
∂x
∇f x(0)
∇2 f x(0)
Df x(0)
f 0 x(0)
Z
f (x) dx
Ω
Partielle Ableitung von f nach der k-ten Koordinate an der Stelle x(0) ,
139
Partielle Ableitung von f nach der Variable x an der Stelle x = x0 , y =
y0 , . . . , 141
Gradient von f an der Stelle x(0) , 147
Hesse–Matrix von f an der Stelle x(0) , 149
Totale Ableitung von f an der Stelle x(0) , 154
Jacobi–Matrix von f an der Stelle x(0) , 155
Lebesgue–Integral von f über Ω, 172
Index
ableiten, 119
Ableitung, 119
partielle, 139
partielle der Ordnung k, 142
totale, 154
Abrundungsfunktion, 40
Abschluss, 54
Abstand, 10
Addition, 6
Äquivalenzklasse, 7
Äquivalenzrelation, 7
Algebra, 34
Banach–Algebra, 66
normierte, 35
Approximationsfehler, 136
Aufrundungsfunktion, 40
Axiom
Vollständigkeitsaxiom, 38
Einsnorm, 9
Element
inverses, 6
neutrales, 6
Entwicklungsstelle
einer Potenzreihe, 93
Eulersche Zahl, 72
Exponentialfunktion, 94
Extremalstelle
lokale, 148
Extremum
lokales, 148
Faktormenge, 7
Familie, 32
fast überall, 167
Folge, 30
beschränkte, 60
bestimmt divergente, 50
Cauchy–Folge, 65
divergente, 47
explizit definierte, 31
gegen −∞ bestimmt divergente, 50
gegen ∞ bestimmt divergente, 50
konvergente, 47
monoton fallende, 44
monoton konvergente, 71
monoton wachsende, 44
nach oben beschränkte, 41
nach unten beschränkte, 41
Nullfolge, 47
rekursiv definierte, 31
streng monoton fallende, 45
streng monoton wachsende, 44
Folgenkriterium
für Abgeschlossenheit, 57
für Kompaktheit, 63
für Stetigkeit, 107
Formel
Eulersche, 97
Fundamentalsatz
Banach–Algebra, 66
Banach–Raum, 65
Basis, 6
Betrag, 4
Betragsfunktion, 4
Betragssummennorm, 9
Bild
einer linearen Funktion, 7
Cauchy–Folge, 65
Cauchy–Kriterium, 70
Cosinusfunktion, 96
hyperbolische, 96
Diffeomorphismus, 186
Dimension, 6
Dirichlet–Funktion, 167
Dreiecksungleichung, 8
für absolut konvergente Reihen, 83
umgekehrte, 12
Einheitskugel, 12
Einheitssphäre, 12
200
INDEX
der Analysis, 177
Funktion
k-mal differenzierbare, 132
k-mal partiell differenzierbare, 143
k-mal stetig differenzierbare, 132
k-mal stetig partiell differenzierbare,
143
Abrundungsfunktion, 40
Aufrundungsfunktion, 40
beschränkte, 61
Betragsfunktion, 4
charakteristische, 168
Cosinus, 96
Cosinus Hyperbolicus, 96
differenzierbare, 119
Dirichlet–Funktion, 167
einfache, 169
Exponentialfunktion, 94
glatte, 132
Heaviside–Funktion, 102
Lebesgue–integrierbare, 172
Lebesgue–messbare, 171
lineare, 7
Logarithmus, 97
monoton fallende, 44
monoton wachsende, 44
nach oben beschränkte, 40
nach unten beschränkte, 40
partiell differenzierbare, 139
Signumfunktion, 4
Sinus, 96
Sinus Cardinalis, 106
Sinus Hyperbolicus, 96
Stammfunktion, 177
stetig differenzierbare, 131
stetig partiell differenzierbare, 142
stetige, 105
streng monoton fallende, 44
streng monoton wachsende, 44
total differenzierbare, 154
vektorwertige, 5
Funktional, 23
Funktionenfolge
divergente, 88
gleichmäßig konvergente, 90
punktweise konvergente, 87
Ganzteil, 40
Gauß–Klammer, 40
Gleichung
201
Parallelogrammgleichung, 18
Parsevalsche, 22
Gradient, 147
Grenzfunktion, 87
Grenzwert
einer Folge, 47
einer Funktion, 99
einer Reihe, 76
gegen −∞, 103
gegen ∞, 103
linksseitiger, 102
rechtsseitiger, 102
Gruppe, 6
Hauptminor, 26
Heaviside–Funktion, 102
Hesse–Matrix, 149
Hilbert–Raum, 65
Hülle
abgeschlossene, 54
Infimum
einer Folge, 41
einer Funktion, 40
einer Menge, 37
Innenproduktraum, 15
Inneres, 53
Integrand, 177
Integration
partielle, 180
Intervall, 4
n-dimensionales, abgeschlossenes, 183
n-dimensionales, rechtsoffenes, 160
abgeschlossenes, 5
offenes, 5
Jacobi–Matrix, 155
Kern
einer linearen Funktion, 7
Kettenregel, 124
Koeffizient
einer Potenzreihe, 93
Körper, 6
Komponente
einer Matrix, 5
einer vektorwertigen Funktion, 5
eines Vektors, 5
Konvergenzbereich, 88
Konvergenzkriterium
Cauchy–Kriterium, 70
202
Leibniz–Kriterium, 79
Majorantenkriterium, 83
Monotoniekriterium, 71
Quotientenkriterium, 85
Wurzelkriterium, 84
Konvergenzradius
einer Potenzreihe, 95
Konvergenzverhalten, 48
Koordinatentransformation, 186
Kugel
abgeschlossene, 11
offene, 11
Lebesgue–fast überall, 167
Lebesgue–Integral
des Negativteils, 172
des Positivteils, 172
einer nichtnegativen, einfachen Funktion, 169
Lebesgue–Maß
äußeres, 161
Lebesgue–Nullmenge, 162
Leibniz–Kriterium, 79
linear abhängig, 6
linear unabhängig, 6
Linearisierung
einer Funktion, 121
Logarithmusfunktion, 97
Majorante, 83
Majorantenkriterium, 83
Matrix, 5
Hesse–Matrix, 149
Jacobi–Matrix, 155
negativ definite, 26
positiv definite, 26
symmetrische, 25
Maximalstelle
lokale, 148
Maximierer, 41
Maximum
einer Folge, 42
einer Funktion, 41
einer Menge, 38
lokales, 148
Maximumnorm, 9
Menge
abgeschlossene, 56
beschränkte, 59
kompakte, 62
INDEX
Lebesgue–messbare, 163
nach oben beschränkte, 37
nach unten beschränkte, 37
offene, 56
unvollständige, 65
vollständige, 65
zusammenhängende, 67
Minimalstelle
lokale, 148
Minimierer, 41
Minimum
einer Folge, 42
einer Funktion, 40
einer Menge, 38
lokales, 148
Minorante, 80
Minorantenkriterium, 80
Mittelwertsatz, 127
Monotoniekriterium, 71
Multiplikation, 6
skalare, 6
Nabla, 147
Nachkommaanteil, 40
Negativteil, 171
Norm, 8
Betragssummennorm, 9
Einsnorm, 9
euklidische, 9
Maximumnorm, 9
p-Norm, 9
Standardnorm auf Cn , 9
Standardnorm auf Rn , 9
submultiplikative, 35
Supremumsnorm, 91
Tschebychev–Norm, 9
Unendlichnorm, 9
Nullfolge, 47
Nullmenge, 162
Nullstellensatz von Bolzano, 112
Ordnungsrelation, 7
orthogonal, 20
Orthogonalbasis, 21
Orthogonalität, 20
Orthonormalbasis, 21
Parallelogrammgleichung, 18
Partialpolynom, 93
Partialsumme, 75
INDEX
p-Norm, 9
Polarkoordinaten, 186
Polynom
Taylor–Polynom, 134
Positivteil, 170
Potenzreihe, 93
Produkt
inneres, 14
Produktregel, 123
Punkt
innerer, 53
Randpunkt, 53
Quotientenkriterium, 85
Quotientenregel, 123
Rand, 53
Randpunkt, 53
Raum
Banach–Raum, 65
Hilbert–Raum, 65
Innenproduktraum, 15
normierter, 10
Untervektorraum, 6
Vektorraum, 6
Regel
des konstanten Faktors, 123
Kettenregel, 124
Produktregel, 123
Quotientenregel, 123
Summenregel, 123
von de l’Hôpital, 128
Reihe, 75
absolut konvergente, 82
alternierende, 78
alternierende harmonische, 76
divergente, 76
geometrische, 76
harmonische, 75
konvergente, 76
Leibniz–Reihe, 77
Taylor–Reihe, 134
Relation, 7
Äquivalenzrelation, 7
antisymmetrische, 7
Ordnungsrelation, 7
reflexive, 7
symmetrische, 7
Totalordnung, 7
transitive, 7
203
Rieszscher Darstellungssatz, 24
Sandwichtheorem, 71
Satz
des Pythagoras, 20
Fundamentalsatz der Analysis, 177
Mittelwertsatz, 127
Nullstellensatz von Bolzano, 112
Riemannscher Umordnungssatz, 83
Rieszscher Darstellungssatz, 24
Sandwichtheorem, 71
Umordnungssatz, 83
vom Minimum und Maximum, 114
von Bolzano–Weierstraß, 64
von Fubini, 183
von Heine–Borel, 63
von Rolle, 127
von Schwarz, 145
von Taylor, 136
Zwischenwertsatz, 111
Schranke
obere, 37
untere, 37
Signumfunktion, 4
Sinusfunktion, 96
hyperbolische, 96
Skalarprodukt, 14
euklidisches, 14
Sphäre, 12
Stammfunktion, 177
Standardnorm
auf Cn , 9
auf Rn , 9
Standardskalarprodukt
auf Rn , 14
Steigung, 119
Stelle
stationäre, 149
Subtitutionsregel, 189
Summenregel, 123
Supremum
einer Folge, 42
einer Funktion, 41
einer Menge, 37
Supremumsnorm, 91
Taylor–Polynom, 134
Taylor–Reihe, 134
Teilfamilie, 33
Teilfolge, 45
204
Totalordnung, 7
Tschebychev–Norm, 9
Überdeckung, 62
offene, 62
Umordnungssatz, 83
Riemannscher, 83
Unendlichnorm, 9
Ungleichung
Cauchy–Schwarzsche, 18
Dreiecksungleichung, 8
umgekehrte Dreiecksungleichung, 12
Untervektorraum, 6
Variable
einer Potenzreihe, 93
Vektor, 5
Vektoraddition, 6
Vektorraum, 6
endlichdimensionaler, 6
Verknüpfung, 6
Vollständigkeitsaxiom, 38
Volumen
eines rechtsoffenen Intervalls, 160
Vorzeichen, 4
Winkel, 18
Wurzelkriterium, 84
Zahl
Eulersche, 72
Zwischenwertsatz, 111
INDEX
Herunterladen