Grundkurs Analysis

Werbung
Prof. Dr. Helga Baum
Grundkurs Analysis
Skript zur Vorlesung Analysis I* und II*
im Studienjahr 2006/2007
26. Oktober 2009
Vorwort
Dieses Skript dient als begleitendes Lehrmaterial für meinen Grundkurs Analysis für die Studienanfänger des Wintersemesters 2006/07. Es soll Ihnen nicht
den Gang in die Bibliothek ersetzen. Gehen Sie bei Gelegenheit dort hin und
blättern Sie in den vielen dort stehenden Lehrbüchern zum Grundkurs Analysis. Sie werden dann selbst feststellen, welches dieser Bücher Ihnen am besten
gefällt und Ihnen am meisten hilft. Dieses Skript enthält den Stoff des Grundkurses Analysis, so wie ich ihn in den nächsten vier Semestern lesen werde und
soll Ihnen die Nacharbeit der Vorlesung erleichtern. Es soll Sie auf keinen Fall
davon abhalten, während der Vorlesung mitzuschreiben. Erfahrungsgemäß ist
das Mitschreiben einer Vorlesung (auch dann, wenn man ab einer bestimmten
Stelle nicht mehr alles oder nichts mehr versteht) etwas, das vielen von Ihnen
am Anfang schwer fällt. Es ist aber eine Fähigkeit, die Sie für Ihr Studium
benötigen und lernen müssen.
Mathematik lernt man nur, wenn man sich selbst mit ihr beschäftigt. Es reicht
also nicht, sich in die Vorlesung zu setzen. Die wenigsten von Ihnen werden
nach den 90 Minuten rausgehen und alles verstanden haben. Das ist völlig normal. Arbeiten Sie die Vorlesung zu Hause an Hand Ihrer Mitschriften nach
und versuchen Sie, die nicht verstandenen Stellen zu klären. Wenn Ihnen das
allein nicht gelingt, nutzen Sie die Übung und die Sprechstunden dazu. Den
sicheren Umgang mit dem gelernten Stoff erwerben Sie nur durch das Lösen
der Übungsaufgaben, die Sie jede Woche bekommen. Die Aufgaben sind nicht
nur ein Selbsttest oder ein lästiges Übel, um den Übungsschein zu bekommen
– sie sind das entscheidende Mittel, mit dem Sie zunehmend Routine im Umgang mit Mathematik bekommen.
Möchte man verstehen, “was in der Welt vorgeht” und dies genauer analysieren, so stellt man schnell fest, daß man dazu die funktionalen Abhängigkeiten von Ursachen und Wirkungen geeignet modellieren muß. Die Analysis
beschäftigt sich mit der Frage, wie man das Änderungsverhalten von Funktionen verstehen, beschreiben und beherrschen kann. Sie stellt Begriffe bereit,
mit denen man die Änderung einer Funktion “im Kleinen” (also bei gerin-
VIII
Vorwort
gen Änderungen ihrer unabhängigen Variablen) erfassen kann und untersucht,
wann und auf welche Weise man aus diesen Eigenschaften “im Kleinen” globale Eigenschaften der Funktion bestimmen kann. Das wichtigste und unverzichtbare Hilfsmittel für solche Untersuchungen ist der Begriff des Grenzwertes. Man muß exakt formulieren können, was es in dem jeweils benutzten
Modell bedeutet, daß man sich an einen Punkt annähert.
Ich beginne deshalb den Grundkurs Analysis I/II mit dem Studium einer
Klasse von Räumen, in denen man einen solchen Grenzwertbegriff formulieren
kann, mit den metrischen Räumen. Anschließend werden verschiedene Klassen von Funktionen zwischen allgemeinen oder speziellen metrischen Räumen
behandelt, insbesondere die stetigen, die differenzierbaren, die meßbaren, die
integrierbaren und die holomorphen Funktionen. Als Anwendung der grundlegenden Eigenschaften verschiedener Funktionenklassen wird in Analysis IIIa
und IIIb eine Einführung in die Lösungstheorie gewöhnlicher Differentialgleichungen, in die Maßtheorie und in die Analysis auf Untermannigfaltigkeiten
gegeben.
Im Einzelnen werden wir in den 4 Teilen der Vorlesung folgende Schwerpunkte
behandeln:
Analysis I* (Wintersemester 2006/07):
•
•
•
•
Reelle und komplexe Zahlen
Metrische Räume und ihre topologischen Eigenschaften
Folgen und Reihen in Banachräumen
Stetige Abbildungen zwischen metrischen Räumen
Analysis II* (Sommersemester 2007):
•
•
•
Differentialrechnung für Funktionen einer reellen Variablen
Differentialrechnung für Funktionen mehrerer reeller Variablen
Integralrechnung für Funktionen einer reellen Variablen
Analysis IIIa (Wintersemester 2007/08):
•
•
•
Mehrdimensionales Riemann-Integral
Analysis auf Untermannigfaltigkeiten
Gewöhnliche Differentialgleichungen
Analysis IIIb (Sommersemester 2008):
•
•
Maß- und Integrationstheorie
Funktionentheorie
Vorwort
IX
Einige Lehrbücher zum Analysis-Grundkurs
•
•
•
•
•
•
•
•
•
•
H. Amann, J. Escher: Analysis I, II und III, Birkhäuser- Verlag
M. Barner, F. Flohr: Analysis I und II, de Gruyter-Verlag
Th. Bröcker: Analysis I, II und III, Wissenschaftsverlag Mannheim
J. Dieudonne: Grundzüge der modernen Analysis, Deutscher Verlag der
Wissenschaften
K. Endl, W. Luh: Analysis I, II und III, Aula-Verlag Wiesbaden
O. Forster: Analysis 1, 2 und 3, Vieweg-Verlag
H. Heuser: Lehrbuch der Analysis, Teil 1 und 2, Teubner-Verlag Stuttgart
St. Hildebrandt: Analysis 1 und 2, Springer-Verlag
K. Königsberger: Analysis 1 und 2, Springer-Verlag
W. Walter: Analysis 1 und 2, Springer-Verlag
Häufig benutzte Bezeichnungen und Abkürzungen
∀ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . für alle
∃ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es existiert
∃! . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . es existiert genau ein
⇔ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . genau dann, wenn
⇒ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . daraus folgt
:= . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ist definiert als (auch :↔)
x ∈ M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .x ist Element der Menge M
∅ . . . . . . . . . . . . . . . . . . . . . . . . . . . leere Menge (Menge, die kein Element enthält)
A ⊂ M . . . . . . . . . . . . . . . . . . . . . . . A ist Teilmenge von M , d.h. x ∈ A ⇒ x ∈ M
A und B seien Mengen.
A ∪ B := {x | x ∈ A oder x ∈ B} heißt die Vereinigung von A und B.
A ∩ B := {x | x ∈ A und x ∈ B} heißt der Durchschnitt von A und B. Falls
˙ bezeichnet dann die disjunkte
A ∩ B = ∅, heißen A und B disjunkt; A∪B
Vereinigung von A und B.
A \ B = {x | x ∈ A und x ∈
/ B} heißt Differenzmenge.
A × B = {(x, y) | x ∈ A und y ∈ B} heißt das Produkt von A und B.
Für eine endliche Menge A bezeichnet ♯A die Anzahl ihrer Elemente.
Inhaltsverzeichnis
1
Reelle und komplexe Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Das Beweisprinzip der vollständigen Induktion . . . . . . . . . . . . . .
1.2 Die reellen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Die Körpereigenschaften von R . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Die Anordnungseigenschaften von R . . . . . . . . . . . . . . . . .
1.2.3 Vollständigkeitseigenschaft der reellen Zahlen . . . . . . . . .
1.2.4 Die Überabzählbarkeit der Menge der reellen Zahlen . . .
1.2.5 Wurzeln und Potenzen reeller Zahlen . . . . . . . . . . . . . . . .
1.3 Die komplexen Zahlen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Die Vektorräume Rn und Cn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2
6
7
8
11
16
19
26
34
2
Metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Definition und Beispiele metrischer Räume . . . . . . . . . . . . . . . . .
2.2 Offene und abgeschlossene Mengen in metrischen Räumen . . . .
2.3 Folgen in metrischen Räumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Allgemeine Eigenschaften konvergenter Folgen . . . . . . . .
2.3.2 Spezielle Eigenschaften von konvergenten Folgen im
Vektorraum Ck bzw. Rk . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Spezielle Eigenschaften konvergenter Folgen in R . . . . . .
2.4 Vollständige metrische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
2.6 Zusammenhängende Teilmengen eines metrischen Raumes . . . .
2.7 Banachräume und Hilberträume . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
39
42
53
54
3
57
62
68
75
84
87
Reihen in Banachräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
3.1 Konvergenzkriterien für Reihen in Banachräumen . . . . . . . . . . . . 94
3.2 Komplexe Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
3.3 Exponentialfunktion, Logarithmusfunktion und komplexe
Potenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
XII
Inhaltsverzeichnis
4
Stetige Abbildungen zwischen metrischen Räumen . . . . . . . . 119
4.1 Der Grenzwert einer Abbildung in einem Punkt . . . . . . . . . . . . . 119
4.2 Stetige Abbildungen (Definition und Beispiele) . . . . . . . . . . . . . . 126
4.3 Eigenschaften stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . 135
4.4 Folgen stetiger Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
4.5 Funktionenreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.6 Die trigonometrischen und die Hyperbelfunktionen . . . . . . . . . . 152
4.7 Der metrische Raum der stetigen Abbildungen . . . . . . . . . . . . . . 162
5
Differentialrechnung für Funktionen einer reellen
Veränderlichen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
5.1 Differenzierbare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
5.2 Der Mittelwertsatz der Differentialrechnung . . . . . . . . . . . . . . . . . 185
5.3 Differentiation von Funktionenfolgen und -Reihen . . . . . . . . . . . . 196
5.4 Taylorreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
6
Differentialrechnung für Abbildungen mehrerer reeller
Variablen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung . 211
6.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 222
6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer
reeller Veränderlicher . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6.4 Der Satz über die Umkehrabbildung . . . . . . . . . . . . . . . . . . . . . . . 232
6.5 Implizite Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
6.6 Extrema unter Nebenbedingungen . . . . . . . . . . . . . . . . . . . . . . . . . 246
7
Integralrechnung für Funktionen einer reellen Variablen . . . 253
7.1 Stammfunktionen und ihre Berechnung . . . . . . . . . . . . . . . . . . . . . 253
7.2 Das Riemannsche Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
7.3 Hauptsatz der Differential- und Integralrechnung . . . . . . . . . . . . 282
7.4 Der Mittelwertsatz der Integralrechnung . . . . . . . . . . . . . . . . . . . . 286
7.5 Parameterabhängige Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
7.6 Uneigentliche Riemannsche Integrale . . . . . . . . . . . . . . . . . . . . . . . 292
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete . 299
Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
1
Reelle und komplexe Zahlen
Wir gehen davon aus, daß der Aufbau der Zahlbereiche bis zu den reellen
Zahlen bekannt ist. Man findet dies zum Beispiel in dem Buch von J. Kramer:
Zahlen für Einsteiger (Vieweg-Verlag, 2006).
Wir benutzen in dieser Vorlesung die folgenden Bezeichnungen für die Zahlbereiche:
N . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller natürlichen Zahlen: 1, 2, 3, . . .
N0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . N ∪ {0}
Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge aller ganzen Zahlen: 0, ±1, ±2, . . .
Q . . . . . . . . . . . . . . . . . . . . . . . Menge aller rationalen Zahlen: { m
n | m ∈ Z, n ∈ N}
Q+ . . . . . . . . . . . . . . . . . . Menge der positiven rationalen Zahlen: {q ∈ Q | q > 0}
R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der reellen Zahlen
R\Q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der irrationalen Zahlen
C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Menge der komplexen Zahlen
Offensichtlich gilt: N ⊂ Z ⊂ Q ⊂ R.
Die Zahlbereiche werden bekanntlich aus folgendem Grund erweitert:
N ⊂ Z: Die Subtraktion ist durch die Erweiterung immer ausführbar. Seien
a, b ∈ N. Die Gleichung x + a = b ist in Z immer lösbar, aber nicht in N.
Z ⊂ Q: Die Division ist durch die Erweiterung immer ausführbar. Seien
a, b ∈ Z, a 6= 0. Die Gleichung x · a = b ist in Q immer lösbar, aber nicht in Z.
Q ⊂ R: Die Erweiterung ist nötig, damit Wurzeln positiver Zahlen existieren.
Sei q ∈ Q+ , n ∈ N. Die Gleichung xn = q ist in R immer lösbar, aber nicht in
Q.
Im Abschnitt 1.1. werden wir zunächst ein wichtiges und oft benutztes Beweisprinzip wiederholen und an Beispielen demonstrieren: das der vollständigen
Induktion. Im Abschnitt 1.2. fassen wir die grundlegenden, die Menge der reellen Zahlen charakterisierenden Eigenschaften (ihre Axiome) zusammen und
2
1 Reelle und komplexe Zahlen
leiten wesentliche, aus den Axiomen folgende Eigenschaften her. Der Abschnitt
1.3. enthält die Definition und die grundlegenden Eigenschaften der komplexen Zahlen. In Abschnitt 1.4. betrachten wir die Vektorräume Rn und Cn und
definieren den Abstand von Vektoren in diesen Vektorräumen.
1.1 Das Beweisprinzip der vollständigen Induktion
Die natürlichen Zahlen werden durch auf Peano zurückgehende Axiome (die
Peano-Axiome) eingeführt. Aus diesen Axiomen folgt die Induktionseigenschaft für die natürlichen Zahlen, die folgendes besagt:
Ist M ⊂ N0 eine Teilmenge der (um Null ergänzten) natürlichen Zahlen, die
die folgenden beiden Eigenschaften erfüllt:
(1) n0 ∈ M ,
(2) Ist k ∈ M , so ist auch (k + 1) ∈ M .
Dann gilt für diese Menge: {n ∈ N0 | n ≥ n0 } ⊂ M .
Als Umformulierung dieser Induktionseigenschaft erhalten wir das Beweisprinzip der vollständigen Induktion.
Beweisprinzip der vollständigen Induktion
Sei n0 ∈ N0 eine fixierte natürliche Zahl.
Für jede Zahl n ∈ N0 mit n ≥ n0 sei eine Aussage A(n) gegeben.
Wir setzen voraus, dass die folgenden beiden Bedingungen erfüllt sind:
(1) A(n0 ) ist richtig (Induktionsanfang).
(2) Falls A(k) richtig ist für eine Zahl k ≥ n0 , so ist auch A(k + 1) richtig.
(Induktionsschritt).
Dann ist die Aussage A(n) für alle Zahlen n ∈ N0 mit n ≥ n0 richtig.
Um einzusehen, dass das Prinzip der vollständigen Induktion aus der Induktionseigenschaft der natürlichen Zahlen folgt, setzen wir
M := {n ∈ N0 | Aussage A(n) ist richtig}.
Dann gilt:
n0 ∈ M (nach Induktionsanfang).
Ist k ∈ M , so ist (k + 1) ∈ M (nach Induktionsschritt).
Aus der Induktionseigenschaft der natürlichen Zahlen folgt nun, dass A(n) für
alle n ≥ n0 richtig ist.
1.1 Das Beweisprinzip der vollständigen Induktion
3
Beispiel 1:
Satz 1.1 Für jede natürliche Zahl n ∈ N gilt
n
X
j = 1 + 2 + ... + n =
j=1
n(n + 1)
.
2
(Aussage A(n))
Beweis. Durch vollständige Induktion.
.
Induktionsanfang: Die Aussage A(1) ist richtig, denn 1 = 1(1+1)
2
Induktionsschritt : Sei nun eine natürliche Zahl k ≥ 1 gegeben. Wir setzen voraus, dass die Aussage A(k) richtig ist (Induktionsvoraussetzung) und behaupten, dass dann auch die Aussage A(k + 1) richtig ist (Induktionsbehauptung).
Induktionsbeweis:
k+1
X
k
X
A(k) k(k + 1)
+ (k + 1)
j + (k + 1) =
2
j=1
k
(k + 1)(k + 2)
= (k + 1)
+1 =
.
2
2
j=
j=1
⊓
⊔
Beispiel 2:
Satz 1.2 Für jede natürliche Zahl n ∈ N gilt
n
X
j=1
(2j − 1) = n2 .
(Aussage A(n))
Beweis. Durch vollständige Induktion.
Induktionsanfang: A(1) ist richtig, denn 1 = 1.
Induktionsschritt :
Induktionsvoraussetzung: A(k) sei richtig.
Induktionsbehauptung: A(k + 1) ist richtig.
Induktionsbeweis:
k+1
X
j=1
(2j − 1) =
k
X
j=1
A(k)
(2j − 1) + (2(k + 1) − 1) = k 2 + 2k + 1 = (k + 1)2 .
⊓
⊔
Beispiel 3: Die Fakultät einer natürlichen Zahl.
Definition 1.1. Sei n ∈ N. Die Zahl
n! :=
n
Y
j=1
j = 1 · 2 · 3 · ... · n
heißt n–Fakultät. Weiterhin setzen wir 0! := 1 .
4
1 Reelle und komplexe Zahlen
Satz 1.3 Die Anzahl an aller Anordnungen von n verschiedenen Objekten ist
n!.
Beweis. Durch vollständige Induktion.
Induktionsanfang: Für n = 1 gilt a1 = 1 = 1!.
Induktionsschritt :
Induktionsvoraussetzung: Es gelte ak = k!.
Induktionsbehauptung: ak+1 = (k + 1)!.
Induktionsbeweis:
Wir betrachten (k + 1) Objekte O1 , . . . , Ok+1 . Die möglichen Anordnungen
dieser Objekte kann man in (k + 1) Klassen Kj mit j ∈ {1, . . . , k + 1} unterteilen: Kj sei die Menge derjenigen Anordnungen, in denen Oj als erstes
Element steht, das heißt
Kj := {(Oj , Oi1 , . . . , Oik ) | {i1 , i2 , . . . , ik } = {1, . . . , k + 1} \ {j} }.
Zj sei die Anzahl der Elemente in Kj . Folglich ist Zj gleich der Anzahl der
Anordnungen der k Objekte O1 , . . . , Oj−1 , Oj+1 , . . . , Ok+1 . Nach Induktionsvoraussetzung ist aber die Anzahl der Anordnungen von k Objekten gleich
ak = k! . Also gilt
ak+1 =
k+1
X
Zj =
j=1
k+1
X
j=1
ak =
k+1
X
j=1
k! = (k + 1) · k! = (k + 1)! .
⊓
⊔
Beispiel 4: Die Binomialkoeffizienten.
Definition 1.2. Sei x ∈ R und k ∈ N. Die Zahl
x · (x − 1) · (x − 2) · ... · (x − (k − 1))
x
:=
k!
k
x
k heißt
Binomialkoeffizient. Man nennt sie “x über k”. Für k = 0 setzt
x
man 0 := 1.
Satz 1.4 Seien n, k ∈ N und x ∈ R. Dann gilt
(1) Ist k > n, so folgt nk = 0.
(2) Für 0 ≤ k ≤ n gilt
n!
n
n
=
=
.
k!(n − k)!
k
n−k
1.1 Das Beweisprinzip der vollständigen Induktion
5
(3) Es gilt
x
x
x+1
+
=
.
k
k−1
k
Beweis. Ist k > n, so tritt im Zähler 0 als Faktor auf. Folglich ist
n
k
= 0.
n · (n − 1) · . . . · (n − (k − 1))
n
=
k!
k
n!
n · (n − 1) · . . . · (n − (k − 1)) · (n − k) · . . . · 2 · 1
=
=
k! · (n − k)!
k! · (n − k)!
n
=
.
n−k
x · (x − 1) · . . . · (x − (k − 1)) x · (x − 1) · . . . · (x − (k − 2))
x
x
+
=
+
k!
(k − 1)!
k
k−1
x − (k − 1)
x · (x − 1) · . . . · (x − (k − 2))
·
+1
=
(k − 1)!
k
|
{z
}
= x+1
= x−(k−1)+k
k
k
x · (x − 1) · . . . · ((x + 1) − (k − 1)) (x + 1)
·
(k − 1)!
k
(x + 1) · ((x + 1) − 1) · ((x + 1) − 2) · . . . · ((x + 1) − (k − 1))
=
k!
x+1
=
.
k
=
⊓
⊔
Satz 1.5 Seien k und n natürliche Zahlen und sei 1 ≤ k ≤ n. Es bezeichne
cnk die Anzahl aller k–elementigen Teilmengen einer n–elementigen Menge.
Dann gilt
n
n
ck =
.
k
Insbesondere ist nk ∈ N .
Beweis. Der Beweis von Satz 1.5 erfolgt
duch vollständige Induktion über n.
Induktionsanfang: Es gilt c11 = 1 = 11 , denn aus einer einelementigen Menge
kann nur ein Element ausgewählt werden.
Induktionsschritt :
6
1 Reelle und komplexe Zahlen
Induktionsvoraussetzung: Es gelte cnk = nk
∀ k ∈ {1, . . . , n}.
n+1
Induktionsbehauptung: cn+1
=
∀
k
∈
{1,
· · · , n + 1}.
k
k
Induktionsbeweis: Bei der Auswahl einer einelementigen Teilmenge aus einer
(n + 1)–elementigen Menge hat man (n + 1) verschiedene Möglichkeiten. Es
gilt somit:
n+1
cn+1
=
(n
+
1)
=
.
1
1
Betrachtet man die Anzahl aller (n+1)–elementigen Teilmengen einer (n+1)–
elementigen Menge, so gilt offensichtlich
n+1
n+1
cn+1 = 1 =
.
n+1
Es genügt also, die Behauptung für k ∈ {2, · · · , n} zu zeigen. Betrachten wir
eine Menge M = {E1 , · · · , En+1 } mit (n + 1) Elementen. Dann zerfallen die
k–elementigen Teilmengen von M in zwei disjunkte Klassen:
K0 : alle Teilmengen, die En+1 nicht enthalten, und
K1 : alle Teilmengen, die En+1 enthalten.
Somit ergibt sich: die Anzahl der k–elementigen Teilmengen in Klasse K0
ist gleich der Anzahl der k–elementigen Teilmengen von {E
1 , · · · , En }, also
entsprechend der Induktionsvoraussetzung gleich cnk = nk . Die Anzahl der
k–elementigen Teilmengen in Klasse K1 ist gleich der Anzahl der (k − 1)–
elementigen Teilmengen von {E1 , · · · , En }, also nach Induktionsvoraussetn
zung gleich cnk−1 = k−1
. Folglich gilt nach Satz 1.4
cn+1
=
k
n
n
n+1
+
=
.
k
k−1
k
⊓
⊔
1.2 Die reellen Zahlen
Im Folgenden setzen wir voraus, dass die reellen Zahlen existieren und dass
sie dem Leser bereits bekannt sind. Das Ziel dieses Abschnittes besteht darin,
noch einmal die grundlegenden, die reellen Zahlen eindeutig charakterisierenden Eigenschaften (ihre sogenannten “Axiome”) zusammenzustellen und
daraus wichtige Rechenregeln abzuleiten. Diese grundlegenden Eigenschaften
sind
•
•
•
die Körperaxiome,
die Anordnungsaxiome und
das Vollständigkeitsaxiom.
1.2 Die reellen Zahlen
7
Wir werden in dieser Vorlesung nicht darauf eingehen, ob überhaupt eine
Menge existiert, die die obigen drei Axiome erfüllt, und wie und woraus man
sie ggf. konstruieren kann. Wir werden auch nicht untersuchen, ob eine Menge, die die obigen Axiome erfüllt, eindeutig bestimmt ist. Für diese Fragen
verweisen wir auf eines der Bücher
•
•
•
J. Kramer: Zahlen für Einsteiger, Vieweg-Verlag, 2006
H.-D. Ebinghaus: Zahlen, Grundwissen Mathematik, Springer, 2. Aufl.
1988
A. Oberschelp: Aufbau des Zahlensystems, Vandenhoeck & Ruprecht,
Göttingen 1976.
1.2.1 Die Körpereigenschaften von R
Man kann reelle Zahlen addieren und multiplizieren:
(x, y) ∈ R × R 7−→ x + y ∈ R
Addition,
(x, y) ∈ R × R 7−→ x · y ∈ R
Multiplikation.
Addition und Multiplikation haben folgende Eigenschaften K1 - K9:
Addition:
K1: x + y = y + x ∀ x, y ∈ R
(Kommutativgesetz der Addition)
K2: (x + y) + z = x + (y + z) ∀ x, y, z ∈ R (Assoziativgesetz der Addition)
K3: 0 + x = x + 0 = x ∀ x ∈ R
(0 ist neutrales Element der Addition)
K4: Zu zwei reellen Zahlen x, y ∈ R existiert genau eine reelle Zahl z ∈ R, so
dass
x + z = y = z + x.
Diese Zahl z heißt Differenz zwischen x und y, z := y − x. Insbesondere
existiert zu jedem x ∈ R genau ein −x ∈ R mit x + (−x) = 0. (Existenz
des negativen Elements).
Multiplikation:
K5: x · y = y · x ∀ x, y ∈ R
(Kommutativgesetz der Multiplikation)
K6: (x · y) · z = x · (y · z) ∀ x, y, z ∈ R (Assoziativgesetz der Multiplikation)
K7: 1 · x = x · 1 = x ∀ x ∈ R
(1 ist das neutrale Element der Multiplikation)
K8: Zu jedem x ∈ R, x 6= 0 und jedem y ∈ R existiert genau ein z ∈ R mit
x · z = y.
Diese Zahl z heißt Quotient von y und x, z := xy . Insbesondere existiert
zu jedem x 6= 0 ein inverses Element x1 , so dass x · ( x1 ) = 1.
K9: (x + y) · z = x · z + y · z
∀ x, y, z ∈ R
(Distributivgesetz).
8
1 Reelle und komplexe Zahlen
Definition 1.3. Eine Menge K, auf der zwei Operationen + und ·
+ : K × K −→ K
(x, y) 7−→ x + y
· : K × K −→ K
(x, y) 7−→ x · y
mit den Eigenschaften K1 bis K9 gegeben sind, heißt Körper.
Wir schreiben den Körper K mit seinen beiden Operationen + und · oft in der
Form [K, +, ·]. Der Begriff des Körpers ist ein zentraler algebraischer Begriff
und wird in der Algebra-Vorlesung ausführlich behandelt.
Körperaxiom der reellen Zahlen
[ R, +, · ] ist ein Körper.
[ Q, +, · ] ist ebenfalls ein Körper, während [ Z, +, · ] kein Körper ist (zum Beispiel besitzt 2 kein multiplikativ inverses Element in Z). Ein Körper mit
zwei Elementen ist durch K := {0, 1} und die Operationen 0 + 0 := 0,
0 + 1 = 1 + 0 := 1, 1 + 1 := 0, 0 · 0 := 0, 0 · 1 = 1 · 0 := 0 und 1 · 1 := 1 gegeben.
Bezeichnungen: Für n reelle Zahlen x1 , · · · , xn werden die Summe und das
Produkt folgendermaßen abgekürzt:

n
P

xi := x1 + x2 + . . . + xn 

i=1
Klammern sind wegen K2 und K6 nicht nötig.
n
Q


xi := x1 · x2 · . . . · xn

i=1
Für zwei Teilmengen A, B ⊂ R sei
A + B := {a + b | a ∈ A, b ∈ B} ⊂ R
A · B := {a · b | a ∈ A, b ∈ B} ⊂ R
−A := {−a | a ∈ A} ⊂ R.
1.2.2 Die Anordnungseigenschaften von R
Außer [ R, +, · ] gibt es noch viele andere Körper. Die Körperaxiome K1-K9
reichen also nicht aus, um R eindeutig zu beschreiben. Auf dem Körper der
reellen Zahlen kann man im Gegensatz zu einigen anderen Körpern zusätzlich
eine Anordnung einführen.
Anordnungseigenschaften von R
Der Körper der reellen Zahlen [ R, +, · ] enthält eine Teilmenge von (positiven)
reellen Zahlen R+ mit folgenden Eigenschaften:
1.2 Die reellen Zahlen
9
A1: Für jede reelle Zahl x gilt entweder x = 0 oder x ∈ R+ oder x ∈ −R+ ,
das heißt R ist die disjunkte Vereinigung
R = −R+ ∪˙ {0} ∪˙ R+ .
A2: Ist x, y ∈ R+ , so gilt x + y ∈ R+ und x · y ∈ R+ .
Definition 1.4. Ein Körper [ K, +, · ], in dem eine Teilmenge “positiver Elemente” K+ ⊂ K existiert, so dass A1 und A2 gelten, heißt angeordneter
Körper.
Anordnungsaxiom der reellen Zahlen
Die reellen Zahlen [R, + , · ] sind ein angeordneter Körper.
Mittels der Eigenschaften A1 und A2 kann man Elemente von R vergleichen.
Definition 1.5. Man sagt “x ist kleiner gleich y” und schreibt x ≤ y, falls
y − x ∈ R+ ∪˙ {0}.
Aus den Anordnungseigenschaften A1 und A2 erhält man die folgenden Eigenschaften der Relation ≤:
O1 : Für alle x, y ∈ R gilt x ≤ y oder y ≤ x.
O2 : Für alle x ∈ R gilt x ≤ x
Reflexivität
O3 : Aus x ≤ y und y ≤ x folgt x = y
Antisymmetrie
O4 : Aus x ≤ y und y ≤ z folgt x ≤ z
Transitivität
Bemerkung: Sei M eine Menge und ≤ eine Relation zwischen Elementen
von M . Gelten O1 − O4 für ≤, so heißt ≤ reflexive Ordnung auf M . ,
Aus A1 und A2 folgen außerdem folgende Monotonieeigenschaften von ≤:
M1: Aus x ≤ y folgt x + z ≤ y + z für alle z ∈ R.
M2: Aus x ≤ y folgt x · z ≤ y · z für alle z ∈ R+ .
Bezeichnung:
•
•
Gilt x ≤ y und x 6= y, so schreibt man auch x < y
(sprich: “x kleiner als y”).
x ≥ y :⇐⇒ y ≤ x bzw. x > y :⇐⇒ y < x.
Mittels der Ordnungsrelation können wir Intervalle definieren:
Für a ≤ b, a, b ∈ R sei
10
1 Reelle und komplexe Zahlen
[a, b] := {x ∈ R | a ≤ x ≤ b}
(abgeschlossenes Intervall)
(a, b) := {x ∈ R | a < x < b}
(offenes Intervall)
[a, b) := {x ∈ R | a ≤ x < b}
(a, b] := {x ∈ R | a < x ≤ b}
(halboffenes Intervall)
(halboffenes Intervall)
Des Weiteren seien
[a, ∞) := {x ∈ R | a ≤ x}
(a, ∞) := {x ∈ R | a < x}
(−∞, a) := {x ∈ R | x < a}
(−∞, a] := {x ∈ R | x ≤ a}
R := (−∞, ∞).
Sei I eines der Intervalle [a, b], (a, b), [a, b), oder (a, b]. Dann heißt die Zahl
L(I) := b − a Länge des Intervalls I.
Definition 1.6. Unter dem Betrag einer reellen Zahl x ∈ R versteht man die
Zahl
x falls x ≥ 0
|x| :=
−x falls x < 0.
Ist I ein Intervall der Länge L, so gilt für x, y ∈ I : |x − y| ≤ L.
Satz 1.6 Für den Betrag einer reellen Zahl gelten folgende Eigenschaften:
(1)
(2)
(3)
(4)
|x| ≥ 0 ∀ x ∈ R, |x| = 0 ⇔ x = 0.
|x · y| = |x| · |y| ∀ x, y ∈ R.
|x + y| ≤ |x| + |y|.
(Dreiecksungleichung)
||x| − |y|| ≤ |x + y|.
Beweis. (1) und (2) folgen unmittelbar aus der Definition des Betrages | · | .
Zum Beweis von (3) benutzen wir die Monotonieeigenschaften. Wegen x ≤ |x|
und −x ≤ |x| bzw. y ≤ |y| und −y ≤ |y| folgt nach Addition dieser
Gleichungen x + y ≤ |x| + |y| und −(x + y) ≤ |x| + |y| und folglich
|x + y| ≤ |x| + |y| .
Zum Beweis von (4) benutzen wir die Dreiecksungleichung und |x| = | − x|:
|x| = |(x + y) − y| ≤ |x + y| + |y|, und daher |x| − |y| ≤ |x + y|,
|y| = |(x + y) − x| ≤ |x + y| + |x|,
Somit erhalten wir ||x| − |y|| ≤ |x + y|.
und daher |y| − |x| ≤ |x + y|.
⊓
⊔
1.2 Die reellen Zahlen
11
Die bisherigen Eigenschaften (Körpereigenschaften K1-K9, Anordnungseigenschaften A1-A2) bestimmen [ R, +, · ] noch immer nicht eindeutig. Sie gelten
zum Beispiel auch für den Körper der rationalen Zahlen [ Q, +, · ]. Die reellen
Zahlen R haben aber eine grundsätzlich andere Eigenschaft als die rationalen
Zahlen Q : die Vollständigkeit.
1.2.3 Vollständigkeitseigenschaft der reellen Zahlen
Es gibt viele verschiedene Möglichkeiten die Vollständigkeitseigenschaft der
reellen Zahlen zu beschreiben. Alle diese sind äquivalent. Wir benutzen hier
die Existenz der Schnittzahl von Dedekindschen Schnitten.
Definition 1.7. Ein Dedekindscher Schnitt von R ist eine Zerlegung
˙
R = A∪B
der reellen Zahlen in zwei disjunkte, nichtleere Teilmengen A und
B mit der Eigenschaft, dass jedes Element a ∈ A kleiner als jedes Element
b ∈ B ist, das heißt
a<b
∀ a ∈ A, ∀ b ∈ B.
Bezeichnung für Dedekindsche Schnitte: (A | B)
Bemerkung: Die Definition eines Dedekindschen Schnittes ist in jedem angeordneten Körper möglich, da eine Relation “<” definiert ist; zum Beispiel
in [Q, +, · ].
Beispiel: Sei a ∈ R eine reelle Zahl.
A = (−∞, a], B = (a, ∞)
A = (−∞, a), B = [a, ∞)
(A | B) Dedekindsche Schnitte.
Definition 1.8. Sei (A | B) ein Dedekindscher Schnitt von R. Eine Zahl
s ∈ R heißt Schnittzahl von (A | B), falls a ≤ s ≤ b für alle a ∈ A und
b ∈ B.
˙ , ist s entweder das größte Element von A (falls s ∈ A) oder
Wegen R = A∪B
das kleinste Element von B (falls s ∈ B).
Vollständigkeitsaxiom (V) der reellen Zahlen
Jeder Dedekindsche Schnitt (A | B) von R besitzt eine eindeutig bestimmte
Schnittzahl
Bemerkungen:
Die Vollständigkeitseigenschaft gilt nicht in jedem angeordneten Körper, zum
12
1 Reelle und komplexe Zahlen
√
Beispiel√nicht im Körper [ Q, +, · ]: Seien nämlich A = (−∞, 2] ∩ Q und
˙ . Somit bilden A und B einen
B = ( 2, +∞) ∩ Q. Dann gilt Q = A∪B
Dedekindschen Schnitt von Q. Dieser hat
√ aber in Q keine Schnittzahl.
(Wir werden noch sehen, dass die Zahl 2 nicht rational ist).
Definition 1.9. Ein angeordneter Körper [ K, +, · ] mit der Eigenschaft (V),
das heißt in dem jeder Dedekindsche Schnitt eine Schnittzahl hat, heißt
vollständig.
Zusammenfassung:
Die reellen Zahlen [R, +, · ] bilden einen vollständigen, angeordneten Körper.
Bemerkung: Zwei vollständige, angeordnete Körper [ K1 , +, · ] und [ K2 , +, · ]
sind isomorph (dies beweisen wir hier nicht). Somit sind die reellen Zahlen
[R, +, ·] (bis auf Isomorphie) der einzige vollständige, angeordnete Körper.
Die reellen Zahlen R sind somit durch die Körpereigenschaften K1-K9, die
Anordnungseigenschaften A1, A2 und die Vollständigkeitseigenschaft V (bis
auf Isomorphie) eindeutig bestimmt.
Wir beweisen nun einige Eigenschaften der reellen Zahlen, die aus der Vollständigkeitseigenschaft (V) folgen.
Definition 1.10.
1. Eine Teilmenge A ⊂ R heißt von oben beschränkt, falls eine Zahl M ∈ R
existiert, so dass a ≤ M für alle a ∈ A gilt. Eine solche Zahl M heißt
obere Schranke von A.
2. Eine Teilmenge A ⊂ R heißt von unten beschränkt, falls eine Zahl m ∈ R
existiert, so dass m ≤ a für alle a ∈ A gilt. Eine solche Zahl m heißt
untere Schranke von A.
3. Eine Teilmenge A ⊂ R heißt beschränkt, falls sie sowohl von unten als
auch von oben beschränkt ist.
Definition 1.11. Sei A ⊂ R.
1. Eine Zahl M0 ∈ R heißt Supremum von A, falls sie die kleinste obere
Schranke von A ist, das heißt falls
a) a ≤ M0 ∀ a ∈ A ,
b) für jedes ε > 0 existiert ein a ∈ A, so dass M0 − ε < a .
2. Eine Zahl m0 ∈ R heißt Infimum von A, falls sie die größte untere Schranke von A ist, das heißt falls
a) m0 ≤ a ∀a ∈ A ,
b) für jedes ε > 0 existiert ein a ∈ A, so dass a < m0 + ε .
1.2 Die reellen Zahlen
13
Bezeichnung: Falls das Supremum bzw. das Infimum einer Menge A ⊂ R
existiert, so bezeichnen wir es mit
sup A := Supremum von A
inf A := Infimum von A.
Offensichtlich existiert höchstens ein Supremum und höchstens ein Infimum
einer Menge A ⊂ R.
Aus der Vollständigkeitseigenschaft von R erhält man die folgende Aussage
über die Existenz von Supremum bzw. Infimum.
Satz 1.7 Jede nach oben beschränkte, nichtleere Menge A ⊂ R besitzt ein
Supremum. Jede nach unten beschränkte, nichtleere Menge A ⊂ R besitzt ein
Infimum.
Beweis. (1) Sei A ⊂ R von oben beschränkt. Wir betrachten die Menge
X := {M ∈ R | a ≤ M ∀ a ∈ A}.
Da A von oben beschränkt ist, ist X 6= ∅. Es sei Y := R \ X. Dann gilt:
˙
a) R = Y ∪X.
b) Sei y ∈ Y und x ∈ X. Da y ∈
/ X, existiert ein a ∈ A mit y < a. Andererseits
ist a ≤ x nach Definition von X. Folglich gilt y < x für alle y ∈ Y und
x ∈ X.
Also ist (Y | X) ein Dedekindscher Schnitt von R. Nach dem Vollständigkeitsaxiom (V) von R existiert eine Schnittzahl M0 dieses Dedekindschen
Schnittes, also eine Zahl M0 ∈ R mit
y ≤ M0 ≤ x
∀ y ∈ Y, x ∈ X.
Wir zeigen, dass die Schnittzahl M0 in X liegt. Wir führen diesen Beweis
indirekt. Wir nehmen an, dass M0 ∈
/ X und führen dies zum Widerspruch.
Ist M0 ∈
/ X, so ist M0 das größte Element von Y . Nach Definition von Y gibt
es ein a0 ∈ R mit M0 < a0 . Dann ist wegen der Monotonieeigenschaft von <
aber auch
a0
a0
M 0 + a0
<
+
= a0
M0 <
2
2
2
und folglich
M 0 + a0
∈ Y.
2
Dann kann M0 aber nicht das größte Element von Y sein, d.h. wir erhalten
wir einen Widerspruch. Unsere Annahme war demnach falsch. Folglich ist
M0 ∈ X, also eine obere Schranke von A. Als Schnittzahl von (Y | X) ist
M0 das kleinste Element von X, also die kleinste obere Schranke von A. Das
zeigt, dass M0 = sup A.
Der Beweis der 2. Aussage des Satzes wird analog geführt.
⊓
⊔
14
1 Reelle und komplexe Zahlen
Definition 1.12.
1. Sei A ⊂ R eine nach oben beschränkte Menge. Liegt das Supremum von
A in A, so nennt man es auch das Maximum von A und schreibt dafür
max A.
2. Sei A ⊂ R eine nach unten beschränkte Menge. Liegt das Infimum von
A in A, so nennt man es auch das Minimum von A und schreibt dafür
min A.
Wir leiten aus Satz 1.7 einige Folgerungen ab.
Folgerung 1.1 (Archimedisches Axiom der reellen Zahlen)
Die Menge der natürlichen Zahlen N ⊂ R ist nicht nach oben beschränkt, das
heißt zu jedem x ∈ R existiert ein n ∈ N mit x < n. Das gleiche gilt auch für
jede unendliche Teilmenge N von N.
Beweis. Wir führen den Beweis indirekt. Angenommen N (bzw. N ) ist nach
oben beschränkt. Dann existiert nach Satz 1.7 das Supremum M0 = sup N.
Es sei M := M0 − 21 . Da M0 die kleinste obere Schranke ist, existiert ein
m ∈ N, mit M0 − 12 < m. Folglich ist
M0 < m +
1
< m + 1.
2
Da aber m + 1 ∈ N ist, kann M0 keine obere Schranke sein. Dies ergibt den
Widerspruch.
⊓
⊔
Folgerung 1.2
1. Zu jedem ε ∈ R+ existiert ein n ∈ N mit n1 < ε.
2. Zu jedem q ∈ N, q 6= 1, und ε ∈ R+ existiert ein n ∈ N mit
1
qn
<ε
Beweis. Zu 1) Zur Zahl 1ε ∈ R existiert nach dem Archimedischen Axiom ein
n ∈ N mit 1ε < n. Folglich gilt n1 < ε.
Zum Beweis der 2. Aussage setzen wir
N := {q n | n ∈ N}.
N ist eine unendliche Teilmenge von N. Den Beweis kann man dann analog
zu 1) führen.
⊓
⊔
Folgerung 1.3 Sei A ⊂ Z eine nichtleere, nach oben (unten) beschränkte
Menge ganzer Zahlen. Dann besitzt A ein Maximum (Minimum).
1.2 Die reellen Zahlen
15
Beweis. Sei A nach unten beschränkt und d = inf A. Nach dem Archimedischen Axiom existiert ein n0 ∈ N mit |d| < n0 . Das heißt, es gilt −n0 < d
und somit 0 < d + n0 < a + n0 für alle a ∈ A. Betrachten wir nun die Menge
A0 := {a + n0 | a ∈ A} ⊂ N. Wir zeigen, dass diese Menge ein kleinstes Element besitzt. Sei k ∈ A0 und bezeichne (A0 )k := {x ∈ A0 | x ≤ k}. Die Menge
(A0 )k ist endlich und besitzt deshalb ein kleinstes Element m0 (siehe Übungsaufgabe 5). Dann ist m0 auch das kleinste Element von A0 und m0 − n0 das
kleinste Element von A . Folglich gilt m0 − n0 = min A.
Ist A von oben beschränkt, so ist max A = − min(−A).
⊓
⊔
Satz 1.8 (Q liegt dicht in R)
Seien x, y ∈ R und x < y. Dann existiert eine rationale Zahl q ∈ Q mit
x<q<y.
Beweis. Wir wählen ein n ∈ N mit
1
n
< y − x und setzen
A := {z ∈ Z | z > n · x}.
Wiederum nach dem Archimedischen Axiom ist A nicht leer und besitzt, da
von unten beschränkt, ein Minimum (Folgerung 1.3). Sei m0 = min A. Dann
gilt m0 ∈ A und m0 − 1 ∈
/ A. Folglich ist mn0 > x und m0n−1 ≤ x. Wir erhalten
somit
m0
m0 − 1
1
x<
=
+ < x + (y − x) = y
n
n
n
⊓
⊔
und folglich liegt die rationale Zahl q := mn0 im Intervall (x, y).
Definition 1.13. Eine Familie abgeschlossener Intervalle In ⊂ R, n ∈ N,
heißt Intervallschachtelung, wenn gilt:
1. In ⊂ Im ∀ n > m
2. Zu jeder positiven Zahl ε ∈ R+ existiert ein n ∈ N mit L(In ) < ε.
Satz 1.9 (Prinzip der Intervallschachtelung)
Sei I1 ⊃ I2 ⊃ I3 ⊃ · · · eine Intervallschachtelung. Dann existiert genau eine
reelle Zahl x ∈ R, so dass x ∈ In für alle n ∈ N, das heißt
∞
\
n=1
In = {x}.
Beweis.
1. Existenz: Sei In = [an , bn ]. Da In ⊂ Im für alle n ≥ m, folgt
am ≤ an ≤ bn ≤ bm . (∗)
16
1 Reelle und komplexe Zahlen
Wir betrachten die Menge der unteren Intervallgrenzen
A := {an | n ∈ N} ⊂ R.
A ist nach oben beschränkt, zum Beispiel durch b1 , hat also nach Satz 1.7
ein Supremum. Sei x = sup A. Wir zeigen, dass x ∈ In für alle n ∈ N.
Nach Definition ist an ≤ x. Es bleibt zu zeigen, dass x ≤ bn für alle n ∈ N.
Angenommen x > bm für ein m ∈ N. Da x die kleinste obere Schranke von
A ist, kann bm keine obere Schranke von A sein. Somit existiert ein an ∈ A,
so dass an > bm . Dies widerspricht aber der Schachtelungseigenschaft (∗).
Folglich war die Annahme falsch, das heißt x ≤ bn für alle n ∈ N und somit
gilt an ≤ x ≤ bn , also x ∈ In für alle n ∈ N.
2. Eindeutigkeit: Angenommen es gäbe zwei Zahlen x, y ∈ R mit x 6= y und
x, y ∈ In für alle n ∈ N. Sei ε = |x − y| > 0. Dann existiert ein Intervall In0
mit L(In0 ) < ε. Da |x − y| > L(In0 ), können aber nicht beide Zahlen x, y in
⊓
⊔
In0 liegen. Damit ist die Eindeutigkeit von x gezeigt.
Bemerkung: Die Vollständigkeitseigenschaft eines angeordneten Körpers
kann man durch das Intervallschachtelungsprinzip oder die Existenz des Supremums ersetzen.
Es gilt: Sei [K, +, ·] ein angeordneter Körper. Dann sind folgende Aussagen
äquivalent:
1. Jeder Dedekindsche Schnitt von K besitzt eine Schnittzahl.
2. Jede nach oben beschränkte Teilmenge von K besitzt ein Supremum.
3. Es gilt das Intervallschachtelungsprinzip und das Archimedische Axiom.
Die Implikation: 1. =⇒ 2. =⇒ 3. haben wir bewiesen. Die Umkehrung werden
wir hier nicht beweisen.
1.2.4 Die Überabzählbarkeit der Menge der reellen Zahlen
Wir beweisen mit Hilfe des Vollständigkeitsaxioms, dass die Menge der reellen
Zahlen nicht abzählbar ist.
Dazu zunächst einige Definitionen.
Definition 1.14. Seien X und Y zwei nichtleere Mengen. Eine Abbildung
f : X −→ Y heißt
•
•
•
injektiv, falls f (x1 ) 6= f (x2 ) für alle x1 , x2 ∈ X mit x1 6= x2 .
surjektiv, falls für jedes y ∈ Y ein x ∈ X mit f (x) = y existiert.
bijektiv, falls f injektiv und surjektiv ist, d.h. falls für jedes y ∈ Y genau
ein x ∈ X mit f (x) = y existiert.
Definition 1.15. Eine Menge A heißt abzählbar, wenn es eine bijektive Abbildung
f : N −→ A
von der Menge der natürlichen Zahlen auf die Menge A gibt.
(Es existiert also zu jedem a ∈ A genau ein n ∈ N mit f (n) = a).
1.2 Die reellen Zahlen
17
Die bijektive Abbildung f liefert uns eine Abzählvorschrift für A: Mit der
Bezeichnung an := f (n) ist nämlich
A = {a1 , a2 , a3 , . . .}
mit ai 6= aj für i 6= j.
Eine Menge A heißt überabzählbar, wenn sie weder leer, noch endlich oder
abzählbar ist. Wir sagen, die Menge A ist höchstens abzählbar, wenn sie leer,
endlich oder abzählbar ist.
Beispiele:
1. Die Menge der natürlichen Zahlen N und die Menge N0 sind abzählbar.
2. Die Menge der ganzen Zahlen Z ist abzählbar, denn
fZ :
N −→ Z
2k 7−→ k
2k + 1 7−→ −k
ist eine bijektive Abbildung zwischen N und Z.
Satz 1.10 Die Menge Q der rationalen Zahlen ist abzählbar.
Beweis. (1. Cantorsches Diagonalisierungsverfahren).
Wir geben zunächst eine Abzählvorschrift der Menge Q+ der positiven rationalen Zahlen an. Jede Zahl q ∈ Q+ sei als Bruch dargestellt:
q=
n
,
m
n, m teilerfremde, natürliche Zahlen.
Wir betrachten das folgende Schema, das die Paare (n, m) als Punkte eines
ebenen Gitters darstellt. Dabei werden Punkte ausgelassen, für die m und n
nicht teilerfremd sind.
18
1 Reelle und komplexe Zahlen
m6
5
4
3
2
1
1
6
I
1
5
6
1
4
I
1
3
6
1
2
I
1
1
2
5
I
R
3
4
2
3
I
R
I
R
4
3
3
2
I
I
R
I
5
2
2
R
3
4
R
5
2
3
4
5
6
n
Die Gitterpunkte werden nun längs des im Gitter gezeichneten Streckenzuges
nummeriert. Dadurch erreicht man alle Punkte des konstruierten Gitters und
erhält somit eine bijektive Abbildung ϕ : N −→ Q+ .
Diese Abzählung beginnt offensichtlich mit:
1, 2,
3 2 1 1
1 1
, , 3, 4, , , , , 5, · · ·
2 3
2 3 4 5
Wir erweitern nun ϕ zu einer bijektiven

 ϕ(n)
0
φ(n) :=

−ϕ(−n)
Abbildung φ : Z −→ Q mittels
falls n ∈ N
falls n = 0
falls n ∈ Z, n < 0.
Die Abbildung φ ◦ fZ : N −→ Z −→ Q bildet N bijektiv auf Q ab. Somit
ist Q abzählbar.
⊓
⊔
Satz 1.11 Die Menge R der reellen Zahlen ist überabzählbar.
Beweis. Angenommen, es existiert eine Abzählung von R, d.h. es gilt
R = {x1 , x2 , x3 , . . .}.
Zu dieser Abzählung konstruieren wir induktiv eine Intervallschachtelung
1.2 Die reellen Zahlen
19
I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ I5 ⊃ . . .
Es sei
I1 := [ x1 + 1, x1 +
4
].
3
Offensichtlich ist x1 ∈
/ I1 und L(I1 ) = 13 . Aus einem schon vorhandenen
Intervall In konstruieren wir In+1 wie folgt: Wir teilen In in drei gleichlange,
abgeschlossene Intervalle und wählen als In+1 eines dieser Teilintervalle, das
xn+1 nicht enthält. Für die so konstruierte Folge von Intervallen gilt
I1 ⊃ I2 ⊃ I3 ⊃ I4 ⊃ . . .
xn ∈
/ In
L(I1 ) = 31 , L(I2 ) = 312 , . . . , L(In ) =
1
3n .
Somit ist I1 ⊃ I2 ⊃ I3 ⊃ . . . eine Intervallschachtelung. Sei nun x ∈
∞
T
In .
n=1
Nach Annahme war R = {x1 , x2 , x3 , x4 , . . .}. Es muß also ein k0 ∈ N mit
x = xk0 geben. Dann ist xk0 ∈ Ik0 . Dies widerspricht aber der Konstruktion
der Intervalle. Somit war die Annahme der Abzählbarkeit von R falsch.
⊓
⊔
Definition 1.16. Zwei Mengen A und B heißen gleichmächtig, falls eine bijektive Abbildung f : A −→ B existiert. Die Menge B hat eine größere
Mächtigkeit als A, falls A zu einer Teilmenge von B gleichmächtig ist, aber
B zu keiner Teilmenge von A.
Die Mengen N, Z und Q sind gleichmächtig. Die Menge R hat eine größere
Mächtigkeit als diese drei Mengen.
Kontinuumshypothese (1878): (Georg Cantor [1845–1918]) Es gibt keine
Menge A, deren Mächtigkeit größer als die von N und kleiner als die von R
ist.
Diese Hypothese leitete die Entwicklung der Mengenlehre ein. Sie ist (auf der
Basis der heute zugrundegelegten Axiome der Mengenlehre) weder beweisbar
noch widerlegbar. Solche Fragen werden in den Vorlesungen über mathematische Logik behandelt.
1.2.5 Wurzeln und Potenzen reeller Zahlen
In diesem Abschnitt behandeln wir einige wichtige Gleichungen und Ungleichungen für Potenzen und Wurzeln reeller Zahlen.
Sei x ∈ R eine reelle Zahl. Die Potenz xn für n ∈ N0 definieren wir induktiv
durch:
x0 := 1, x1 := x, x2 := x · x , . . . , xn+1 := xn · x.
20
1 Reelle und komplexe Zahlen
Für x 6= 0 setzen wir
x−n :=
1
.
xn
Damit ist die k–te Potenz xk für jede ganze Zahl k ∈ Z und jede reelle Zahl
x ∈ R, x 6= 0, definiert. Aus den Körper- und Anordnungseigenschaften der
reellen Zahlen folgt sofort
1. Für x ∈ R mit x 6= 0 und k, l ∈ Z gilt
xk · xl = xk+l , xk·l = (xk )l und (x · y)k = xk · y k .
2. Ist 0 < x < y, dann gilt xn < y n für alle n ∈ N.
Satz 1.12 (Binomischer Satz) Seien x, y ∈ R. Dann gilt für jedes n ∈ N
(x + y)n =
n X
n k n−k
x ·y
.
k
k=0
Beweis. Wir führen den Beweis durch vollständige Induktion über n:
Induktionsanfang: n = 1:
1 0 1
1 1 0
x ·y +
x · y = x + y.
0
1
Induktionsschritt :
Induktionsvoraussetzung: Für ein fixiertes n ∈ N gilt
(x + y)n =
n X
n k n−k
x ·y
.
k
k=0
Induktionsbehauptung:
(x + y)n+1 =
n+1
X
k=0
Induktionsbeweis:
n + 1 k n−k+1
x ·y
.
k
1.2 Die reellen Zahlen
21
(x + y)n+1 = (x + y)n · (x + y)
!
n X
n k n−k
IV
· (x + y)
=
x ·y
k
k=0
n n X
X
n k
n k n+1−k
n−k
=
x ·x·y
+
x ·y
k
k
k=0
k=0
n n X
n k+1 n+1−(k+1) X n k n+1−k
=
x
·y
+
x ·y
k
k
k=0
=
k=0
n+1
X
n X
n
n l (n+1)−l
xl · y (n+1)−l +
x ·y
l−1
l
l=1
=
l=1
1.4
=
l=0
n X
n
n
n n+1 0
n 0 n+1
+
xl · y (n+1)−l +
x
y +
x y
l
l−1
n
0
n+1
X
n + 1 l (n+1)−l
x ·y
.
l
l=0
⊓
⊔
Aus dem Binomischen Satz 1.12 ergibt sich die
Folgerung 1.4
n
P
1. (1 + x)n =
2.
3.
n
P
k=0
n
P
k=0
n
k
k=0
= 2n ,
(−1)k
n
k
k
x ,
n
k
= 0.
Beweis. (1) ist der Binomische Satz für y = 1, (2) ist der Binomischer Satz
für x = y = 1 und (3) ist der Binomischer Satz für x = −1, y = 1.
⊓
⊔
Satz 1.13 (Bernoullische Ungleichung) Für jede reelle Zahl x ≥ −1 und
für jedes n ∈ N gilt:
(1 + x)n ≥ 1 + n x.
Beweis. Beweis durch vollständige Induktion über n.
Induktionsanfang: Die Aussage gilt offensichtlich für n = 1.
Induktionsschritt :
Induktionsvoraussetzung: Für ein fixiertes n ∈ N gilt (1 + x)n ≥ 1 + nx.
Induktionsbehauptung: (1 + x)n+1 ≥ 1 + (n + 1) x.
Induktionsbeweis:
22
1 Reelle und komplexe Zahlen
IV
(1+x)n+1 = (1+x)n (1+x) ≥ (1+n x)(1+x) = 1+(n+1) x+n
x2 ≥ 1+(n+1) x.
|{z}
≥0
Als Anwendung erhält man unmittelbar
⊓
⊔
Folgerung 1.5
1. Sei y ∈ R, y > 1, und r ∈ R+ . Dann existiert ein n ∈ N, so daß y n > r.
2. Sei y ∈ R, 0 < y < 1 und r ∈ R+ . Dann existiert ein n ∈ N mit y n < r.
Beweis. Sei r ∈ R+ und y > 1. Nach dem Archimedischen Axiom für reelle
r
Zahlen existiert eine natürliche Zahl n ∈ N, so daß n > y−1
. Dann folgt mit
der Bernoullischen Ungleichung
y n = (1 + (y − 1))n ≥ 1 + n (y − 1) ≥ n (y − 1) > r.
Ist 0 < y < 1, so wenden wir das eben Bewiesene auf die reelle Zahl y1 > 1 an
⊔
und erhalten eine natürliche Zahl n ∈ N mit ( y1 )n > r1 und somit y n < r. ⊓
Satz 1.14 (Geometrische Summe) Für jede reelle Zahl x 6= 1 und jede
natürliche Zahl n gilt:
n
X
1 − xn+1
xk =
.
1−x
k=0
Beweis. Beweis durch vollständige Induktion über n.
Induktionsanfang: n = 1:
(1 − x)(1 + x)
1 − x2
=
= 1 + x = x0 + x1 .
1−x
1−x
Induktionsschritt :
Induktionsvoraussetzung: Die Behauptung ist für ein fixiertes n richtig.
Induktionsbehauptung:
n+1
X
xk =
k=0
Induktionsbeweis:
n+1
X
k=0
xk =
n
X
k=0
1 − xn+2
.
1−x
xk + xn+1
n+1
IV 1 − x
=
+ xn+1
1−x
1 − xn+1 + xn+1 (1 − x)
=
1−x
n+2
1−x
=
.
1−x
1.2 Die reellen Zahlen
23
⊓
⊔
Wir beweisen nun die Existenz der n-ten Wurzel einer positiven reellen Zahl.
Satz 1.15 Sei x ∈ R+ eine positive reelle Zahl und n ∈ N. Dann existiert
genau eine positive reelle Zahl y ∈ R+ mit y n = x.
√
Bezeichnung: y := n x heißt die n–te Wurzel aus x.
Beweis. Zum Beweis benutzen wir das Intervallschachtelungsprinzip. Es genügt, den Fall x > 1 zu behandeln. Den Fall x < 1 führt man durch Übergang
zu x′ = x1 darauf zurück.
Wir definieren induktiv die folgende Folge abgeschlossener Intervalle: Wir setzen I1 := [1, x]. Sei Ik := [ak , bk ] bereits konstruiert. Dann definieren wir Ik+1
k
der Mittelpunkt von Ik . Wir setzen
durch Halbierung von Ik : Sei m = ak +b
2
dann
[ak , m] falls mn ≥ x
Ik+1 = [ak+1 , bk+1 ] :=
[m, bk ] falls mn < x.
Dann gilt nach Konstruktion:
1. I1 ⊃ I2 ⊃ I3 ⊃ . . ..
k−1
2. L(Ik ) = (x − 1) · 12
für alle k ∈ N.
3. ank ≤ x ≤ bnk für alle k ∈ N.
Wir erhalten also ineinander geschachtelte Intervalle, deren Längen nach Folgerung 1.2 beliebig klein werden. Nach dem Intervallschachtelungsprinzip existiert genau eine reelle Zahl y ∈ R mit y ∈ Ik für jedes k ∈ N. Wir zeigen
nun, dass y n = x gilt.
Dazu betrachten wir die Intervalle
Jk := [ank , bnk ].
Da Ik ⊃ Ik+1 , gilt wegen der Monotonie der Potenzen auch Jk ⊃ Jk+1 . Für
die Länge von Jk erhalten wir
L(Jk ) = bnk − ank
= (bk − ak )(bkn−1 + bkn−2 ak + . . . + bk akn−2 + akn−1 )
akn−1
a2k
ak
n−1
+ 2 + . . . + n−1
= L(Ik ) · bk
1+
bk
bk
bk
1
≤ (x − 1) · k−1 · b1n−1 · n
2
Nach Folgerung 1.2 gibt es zu jedem ε > 0 ein k ∈ N mit L(Jk ) ≤ ε. Die Folge
der Intervalle Jk ist also eine Intervallschachtelung. Nach Konstruktion gilt
aber sowohl x ∈ Jk (Eigenschaft 3.) als auch y n ∈ Jk für alle k ∈ N. Da der
∞
T
Jk nur ein Element enthält, folgt x = y n .
Durchschnitt
k=1
Die Eindeutigkeit der Zahl y ∈ R+ mit y n = x ist klar, denn ist z.B. y1 < y2 ,
so folgt y1n < y2n .
⊓
⊔
24
1 Reelle und komplexe Zahlen
Bemerkung: Die Gleichung y n = x hat für gerade n zwei reelle Lösungen
√
√
y1 = n x und y2 = − n x.
Die Eindeutigkeitsaussage von Satz 1.15 gilt also nur in R+ .
Die Gleichung y n = x ist in Q im allgemeinen nicht lösbar.
√
Satz 1.16 Seien n und k natürliche Zahlen. Dann ist n k genau dann eine
rationale Zahl, falls k die n–te Potenz einer natürlichen Zahl ist, das heißt
falls k = mn für ein m ∈ N. Insbesondere gilt:
√
• Für jede Primzahl p und jedes n > 1 ist die Zahl n p irrational.
√
√
n
n
• Wenn k rational ist, so ist k sogar eine natürliche Zahl.
Beweis.
√
1. (⇐=): Sei k√= mn mit m ∈ N. Dann ist per Definition m := n k ∈ N ⊂ Q.
2.
(=⇒): Sei n k ∈ Q. Dann existieren teilerfremde Zahlen m, q ∈ N, so dass
√
n
m n
mn
n
n
k= m
q . Nach Definition erhält man k = ( q ) = qn und somit kq = m .
Wir zeigen nun, dass q = 1 gilt. Angenommen q > 1. Dann existiert eine
Primzahl p > 1, die q teilt. Folglich teilt p auch kq n = mn , das heißt p teilt
auch m. Das ist aber ein Widerspruch dazu, dass q und m teilerfremd sind.
Somit ist q = 1 und k = mn für m ∈ N.
⊓
⊔
Wir können jetzt die Potenzen mit rationalen Exponenten definieren.
Definition 1.17. Sei x ∈ R+ eine positive reelle Zahl und q ∈ Q eine rationale
n
, n ∈ Z, m ∈ N. Dann sei
Zahl mit der Darstellung q = m
√ n
xq := m x .
Diese Definition ist korrekt, d.h. unabhängig von der Wahl der Darstellung
von q.
Die folgenden Eigenschaften für die Potenzen mit rationalen Exponenten sind
leicht nachzuprüfen: Seien p, q ∈ Q und x, y ∈ R+ . Dann erhält man:
1. xq · xp = xp+q , (xq )p = xp·q , xq · y q = (xy)q .
2. Sei p < q. Dann gilt xp < xq falls x > 1 und xp > xq falls 0 < x < 1.
3. Sei 0 < x < y. Dann gilt xq < y q falls q > 0 und xq > y q falls q < 0.
Wir werden auf die Potenzen und ihre Eigenschaften später zurückkommen.
Abschließend beweisen wir eine Ungleichung zwischen dem geometrischen und
dem arithmetischen Mittel von n positiven reellen Zahlen.
1.2 Die reellen Zahlen
25
Definition 1.18. Seien a1 , a2 , . . . , an positive reelle Zahlen. Dann heißen die
Zahlen
a1 + a2 + . . . + a n
n
√
G(a1 , . . . , an ) := n a1 · a2 · . . . · an
A(a1 , . . . , an ) :=
arithmetisches Mittel
geometrisches Mittel
von a1 , a2 , . . . , an .
Satz 1.17 Für alle positiven reellen Zahlen a1 , a2 , . . . , an gilt
√
a1 + a2 + . . . + a n
n
.
a1 · a2 · . . . · an ≤
n
Die Gleichheit tritt nur dann auf, wenn a1 = a2 = . . . = an .
Beweis. Das arithmetische und das geometrische Mittel ist homogen, d.h. für
ein λ ∈ R+ gilt
A(λa1 , . . . , λan ) = λ · A(a1 , . . . , an )
und
G(λa1 , . . . , λan ) = λ · G(a1 , . . . , an ).
Es genügt deshalb, den Beweis für den Fall A(a1 , . . . , an ) = 1 zu führen. (Wir
setzen im anderen Fall λ = A−1 ).
Wir zeigen mit vollständiger Induktion über n: Sind a1 , . . . , an positive reelle
Zahlen mit a1 + a2 + . . . + an = n, so gilt a1 · a2 · . . . · an ≤ 1 und die Gleichheit
tritt nur auf, wenn a1 = a2 = . . . = an = 1.
Induktionsanfang: n = 1. In diesem Fall gilt die Behauptung offensichtlich.
Induktionsschritt :
Die Aussage gelte für ein n ∈ N. Wir müssen sie dann für n + 1 beweisen. Für
a1 = a2 = . . . = an+1 = 1 gilt die Aussage. Seien also a1 , a2 , . . . , an+1 positive
Zahlen mit a1 + a2 + . . . + an+1 = n + 1, von denen eine von 1 verschieden
ist. OBdA sei a1 < 1 und a2 > 1. Dann ist
0 < (1 − a1 )(a2 − 1) = a1 + a2 − 1 − a1 · a2
und somit
a1 · a2 < a1 + a2 − 1.
(∗)
Außerdem gilt
(a1 + a2 − 1) + a3 + . . . + an+1 = n.
Wir wenden die Induktionsvoraussetzung auf die n Summanden der letzten
Gleichung an und erhalten mit (*)
(∗)
1 ≥ (a1 + a2 − 1) · a3 · . . . · an+1 > (a1 · a2 ) · a3 · . . . · an+1 .
Damit ist der Satz bewiesen.
⊓
⊔
26
1 Reelle und komplexe Zahlen
1.3 Die komplexen Zahlen
Für jede von Null verschiedene reelle Zahl x gilt x2 > 0. Man kann im Zahlbereich der reellen Zahlen also keine Wurzeln aus negativen Zahlen ziehen.
Insbesondere gibt es keine reelle Lösung der Gleichung x2 = −1.
Die komplexen Zahlen sind eine Erweiterung der reellen Zahlen, die es möglich
macht, auch Wurzeln aus negativen Zahlen zu ziehen.
Dazu betrachten wir die Menge der Paare reeller Zahlen
R2 := R × R := {(a, b) | a, b ∈ R}
und führen auf dieser Menge eine Addition + : R2 × R2 −→ R2 und eine
Multiplikation · : R2 × R2 −→ R2 ein.
Zwei Paare z1 = (a1 , b1 ) und z2 = (a2 , b2 ) aus R2 addieren bzw. multiplizieren
wir nach folgenden Regeln:
z1 + z2 := (a1 , b1 ) + (a2 , b2 ) = (a1 + a2 , b1 + b2 )
z1 · z2 := (a1 , b1 ) · (a2 , b2 ) = (a1 a2 − b1 b2 , a1 b2 + a2 b1 ).
(1.1)
(1.2)
Die mit dieser Addition und Multiplikation ausgestattete Menge R2 bezeichnet man mit dem neuen Symbol C, d.h. C := R2 , um auszudrücken, dass man
außer der üblichen Addition (1.1) der reellen Paare auch noch die Multiplikation (1.2) festgelegt hat. Die Elemente von C heißen komplexe Zahlen.
Satz 1.18 Die komplexen Zahlen [C, +, ·] bilden einen Körper. Es gelten also
folgende Rechenregeln für die Addition + und die Multiplikation ·
K1: z1 + z2 = z2 + z1 für alle z1 , z2 ∈ C.
K2: (z1 + z2 ) + z3 = z1 + (z2 + z3 ) für alle z1 , z2 , z3 ∈ C.
K3: Die komplexe Zahl 0 := (0, 0) ist das neutrale Element der Addition, das
heißt es gilt 0 + z = z + 0 = z für alle z ∈ C.
K4: Zu je zwei komplexen Zahlen z1 , z2 ∈ C existiert eine komplexe Zahl
w ∈ C mit w + z2 = z1 .
K5: z1 · z2 = z2 · z1 für alle z1 , z2 ∈ C.
K6: (z1 · z2 ) · z3 = z1 · (z2 · z3 ) für alle z1 , z2 .z3 ∈ C.
K7: Die komplexe Zahl 1 := (1, 0) ist das neutrale Element der Multiplikation, das heißt es gilt 1 · z = z · 1 = z für alle z ∈ C.
K8: Zu je zwei komplexen Zahlen z1 und z2 6= 0 existiert eine komplexe Zahl
v ∈ C mit v · z2 = z1 .
K9: (z1 + z2 ) · z3 = z1 · z3 + z2 · z3 für alle z1 , z2 , z3 ∈ C.
Beweis. Diese Eigenschaften folgen direkt aus den Körpereigenschaften von
R und den Definitionen von + und ·. Wir überprüfen K4 und K8:
Seien z1 = (x1 , y1 ) und z2 = (x2 , y2 ) zwei komplexe Zahlen. Dann gilt für
w := (x1 − x2 , y1 − y2 ) die Gleichung w + z2 = z1 . Sei zusätzlich z2 6= 0. Wir
betrachten
1.3 Die komplexen Zahlen
v :=
x1 x2 + y1 y2 y1 x2 − x1 y2
,
x22 + y22
x22 + y22
27
∈ C.
Man rechnet leicht nach, dass für diese komplexe Zahl v die Geichung v·z2 = z1
erfüllt ist.
⊓
⊔
Die komplexe Zahl w mit w + z2 = z1 , so heißt Differenz von z1 und z2 und
wird mit w := z1 − z2 bezeichnet. Die komplexe Zahl v mit v · z2 = z1 heißt
Quotient von z1 und z2 und wird mit v := zz12 bezeichnet. Für z ∈ C mit
z 6= 0 sei z −1 := 1z . Die Potenzen z n für n ∈ N seinen induktiv durch z 1 := z,
n
z n+1 := z n · z erklärt. Weiterhin sei z −n := 1z = z1n .
Bemerkung: Im Gegensatz zum Körper der reellen Zahlen ist der Körper
der komplexen Zahlen nicht angeordnet (Übungsaufgabe 15).
Bezeichnungen:
Für den bequemen Umgang mit den komplexen Zahlen eignet sich die nun
folgende Vereinbarung.
Nach Definition gilt für die komplexen Zahlen (a, 0) und (b, 0)
(a, 0) + (b, 0) = (a + b, 0)
und
(a, 0) · (b, 0) = (a · b, 0).
Die Zuordnung a ∈ R 7−→ (a, 0) ∈ C ist also eine Einbettung der Menge
der reellen Zahlen in die Menge der komplexen Zahlen, die mit den jeweiligen Körperoperationen + und · verträglich ist. Wir können deshalb R als
Teilkörper von C auffassen. Dies werden wir in Zukunft tun und die komplexe
Zahl (a, 0) einfach mit a bezeichnen. Dies rechtfertigt auch die Bezeichnung
0 := (0, 0) für das neutrale Element der Addition und 1 := (1, 0) für das neutrale Element der Multiplikation (siehe Satz 1.18).
Die komplexe Zahl (0, 1) bezeichnen wir mit i und nennen sie die imaginäre
Einheit. Für i = (0, 1) gilt
i2 = (0, 1) · (0, 1) = (−1, 0) = −1.
Die Gleichung x2 = −1 ist also im Körper der komplexen Zahlen lösbar.
Ist z = (a, b) eine beliebige komplexe Zahl, so gilt mit unseren Vereinbarungen
z = (a, b) = (a, 0) + (0, b) = (a, 0) + (0, 1)(b, 0) = a + i · b.
Jede komplexe Zahl z ∈ C ist also in der Form
z = a + ib
a, b ∈ R
(1.3)
darstellbar. Dies ist die übliche Darstellung der komplexen Zahlen. Man kann
dann mit den komplexen Zahlen wie mit den reellen rechnen, indem man
i2 = −1 berücksichtigt. Es gilt also für z1 = a1 + i b1 und z2 = a2 + i b2
28
1 Reelle und komplexe Zahlen
z1 + z2 = (a1 + ib1 ) + (a2 + ib2 ) = (a1 + a2 ) + i (b1 + b2 )
(1.4)
z1 · z2 = (a1 + ib1 ) · (a2 + ib2 ) = (a1 a2 − b1 b2 ) + i (a1 b2 + b1 a2 ) (1.5)
Ist z = a + ib ∈ C, so heißt Re(z) := a der Realteil von z und Im(z) := b der
Imaginärteil von z. Ist Re(z) = 0, so heißt z rein imaginär, ist Im(z) = 0, so
heißt z reell.
Beispiel: Sei z = a + ib 6= 0 . Dann ist
a
b
1
a − ib
a − ib
1
= 2
−i 2
,
=
=
= 2
z
a + ib
(a + ib)(a − ib)
a + b2
a + b2
a + b2
also gilt
1
a
b
1
Re
= 2
=− 2
bzw. Im
.
2
z
a +b
z
a + b2
Definition 1.19. Ist z = a + ib ∈ C eine komplexe Zahl, so heißt z := a − ib
die konjugiert komplexe Zahl zu z.
Es gelten folgende, leicht zu überprüfende Rechenregeln:
Satz 1.19 Für alle komplexen Zahlen z und w gilt:
1.
2.
3.
4.
z + w = z + w, z · w = z · w, z = z .
z + z = 2 · Re(z) , z − z = 2i · Im(z) .
z = z ⇐⇒ z ∈ R.
z · z = Re(z)2 + Im(z)2 . Insbesondere ist 0 ≤ z · z ∈ R.
⊓
⊔
Definition 1.20. Sei z = a + ib ∈ C eine komplexe Zahl. Der Betrag von z
ist die reelle Zahl
p
√
|z| := a2 + b2 = z · z.
Satz 1.20 (Eigenschaften des Betrages komplexer Zahlen)
Seien z und w komplexe Zahlen. Dann gilt:
1.
2.
3.
4.
5.
|z| ≥ 0 , wobei |z| = 0 genau dann, wenn z = 0.
|z · w| = |z| · |w|.
|z + w| ≤ |z| + |w| (Dreiecksungleichung)
|z| = |z|
|Re(z)| ≤ |z|, |Im(z)| ≤ |z|.
1.3 Die komplexen Zahlen
29
Beweis. 1., 4. und 5. folgen trivialerweise aus der Definition. Formel 2. folgt
aus
|z · w|2 = (zw)(zw) = zz · ww = |z|2 · |w|2 .
Die Dreiecksungleichung folgt aus
|z + w|2 = (z + w)(z + w)
= (z + w)(z + w)
= zz + ww + wz + zw
= zz + ww + wz + wz
= |z|2 + |w|2 + 2 · Re(wz)
≤ |z|2 + |w|2 + 2 · |wz|
= |z|2 + |w|2 + 2 · |w| · |z|
= (|z| + |w|)2 .
⊓
⊔
Die geometrische Interpretation der komplexen Zahlen
Der Darstellung der reellen Zahlen auf einer Geraden entspricht die Darstellung der komplexen Zahlen in der Ebene, die man dann oft Gaußsche Zahlenebene oder komplexe Zahlenebene nennt.
Wir wählen ein kartesisches Koordinatensystem in der Ebene und stellen die
komplexe Zahl z = (a, b) = a + ib ∈ C als Punkt der Ebene mit den Koordinaten (a, b) dar.
imaginäre Achse (y-Achse)
iR
6
3
ib
z = (a, b) = a + bi
|z|
i
ϕ
1
a
R
reelle Achse (x-Achse)
Die reellen Zahlen R entsprechen der x–Achse, die rein imaginären Zahlen iR
der y–Achse.
30
1 Reelle und komplexe Zahlen
√
Nach dem Satz von Pythagoras ist |z| = a2 + b2 gleich dem Abstand des
Punktes z = (a, b) zum Ursprung des Koordinatensystems. Die komplexe Zahl
z = (a, −b) = a − ib entsteht durch Spiegelung von z an der reellen Achse. Für
z 6= 0 sei ϕ der Winkel zwischen der x–Achse und dem Strahl vom Ursprung
durch z, gemessen in positiver Richtung (entgegen dem Uhrzeigersinn). Dann
gilt im rechtwinkligen Dreieck
cos ϕ =
a
|z|
und
sin ϕ =
b
|z|
.
Die Darstellung
z = |z| (cos ϕ + i · sin ϕ)
(1.6)
heißt trigonometrische Darstellung der komplexen Zahl z 6= 0. Der Winkel ϕ
heißt Argument von z und wird mit arg(z) bezeichnet. Das Argument ϕ ist
bis auf ganzzahlige Vielfache von 2π eindeutig bestimmt.
Geometrische Deutung von z1 + z2 :
Die Summe z1 + z2 entspricht dem Endpunkt der vom Nullpunkt ausgehenden
Diagonalen im von z1 und z2 gebildeten Parallelogramm.
iR
6
i(b1 + b2 )
ib2
ib1
3
z2
z1 + z2 = (a1 + a2 , b1 + b2 )
z2 = (a2 , b2 )
1 z1
z1 = (a1 , b1 )
-
a2
a1
a1 + a2
R
Geometrische Deutung von z1 · z2 :
Wir betrachten die trigonometrische Darstellung von z1 und z2
z1 = |z1 |(cos ϕ1 + i sin ϕ1 )
z2 = |z2 |(cos ϕ2 + i sin ϕ2 )
Nach den Additionstheoremen für cos und sin gilt
1.3 Die komplexen Zahlen
31
z1 · z2 = |z1 ||z2 | · {(cos ϕ1 · cos ϕ2 − sin ϕ1 · sin ϕ2 )
+ i · (sin ϕ1 · cos ϕ2 + sin ϕ2 · cos ϕ1 )}
= |z1 · z2 | · (cos(ϕ1 + ϕ2 ) + i · sin(ϕ1 + ϕ2 ))
und folglich |z1 · z2 | = |z1 | · |z2 | und arg(z1 · z2 ) = arg(z1 ) + arg(z2 ).
Nach diesen Formeln kann z1 · z2 gezeichnet werden.
z1 · z2
w
z2
ϕ1 + ϕ2
z1
ϕ1
ϕ2
1
|w| = |z1 · z2 |
Für die Winkel gilt ϕ1 = arg(z1 ) und ϕ2 = arg(z2 ). Der Punkt z1 · z2 liegt
auf dem vom Ursprung ausgehenden Strahl, der mit der reellen Achse R den
Winkel ϕ1 + ϕ2 einnimmt. Mittels des Strahlensatzes erhält man einen Punkt
w auf dem Strahl durch den Ursprung und z2 mit |w| = |z1 ·z2 |. Man dreht diesen Punkt w um den Winkel ϕ1 um den Ursprung und erhält den Punkt z1 ·z2 .
Beispiele:
a) Die Abbildung z ∈ C 7−→ iz ∈ C beschreibt die Drehung um den Ursprung
um den Winkel π2 (entgegen dem Uhrzeigersinn).
b) Die Abbildung z ∈ C 7−→ rz ∈ C, r ∈ R+ , ist die Streckung von z um den
Faktor r auf dem durch den Ursprung und z gehenden Strahl.
c) Was bedeutet die Inversion z ∈ C 7−→ z −1 = z1 ∈ C geometrisch?
Betrachten wir den Kreis K1 = {z ∈ C | |z|2 = 1} vom Radius 1. Sei z ∈ C
ein vom Ursprung verschiedener Punkt. Der Punkt ẑ ∈ C heißt Spiegelpunkt
von z an K1 , falls ẑ auf dem von 0 ausgehenden Strahl durch z liegt und
|z| · |ẑ| = 1 gilt. Dann existiert ein c ∈ R+ mit ẑ = cz. Setzen wir das in
1
|z| · |ẑ| = 1 ein, so erhalten wir c = |z|1 2 = z·z
. Folglich ist der Spiegelpunkt
1
1
ẑ = z = z . Die Inversionsabbildung z ∈ C 7−→ z −1 ∈ C ist also die Hintereinanderausführung der Spiegelung am Kreis K1 und der Spiegelung an der
32
1 Reelle und komplexe Zahlen
reellen Achse.
iR
z
z −1
1
R
z −1
Wir erklären nun Wurzeln aus komplexen Zahlen: Wie wir gerade gesehen
haben, gelten für eine komplexe Zahl z die Formeln
|z n | = |z|n
und
arg(z n ) = n · arg(z).
Daraus folgt
Satz 1.21 Sei w ∈ C eine von Null verschiedene komplexe Zahl mit den
Betrag r := |w| und dem Argument ϕ =: arg(w) ∈ [0, 2π). Dann hat die
Gleichung z n = w genau n verschiedene komplexe Lösungen, nämlich
√
ϕ k · 2π
ϕ k · 2π
+ i sin
+
+
zk := n r · cos
n
n
n
n
wobei k ∈ {0, 1, 2, . . . , n − 1}.
Beweis. Für die komplexen Zahlen zk gilt nach Definition
|zk | =
√
n
r
und
arg (zk ) =
ϕ 2πk
+
=: ϕk .
n
n
Hieraus folgt
√
zkn = ( n r)n (cos(ϕ + 2πk ) + i sin(ϕ + 2πk)) = |w|(cos ϕ + i sin ϕ) = w.
| {z }
| {z }
|zk |n
n·arg (zk )
1.3 Die komplexen Zahlen
33
Wir haben also n verschiedene Lösungen der Gleichung z n = w gefunden. Wir
zeigen, dass es keine weiteren Lösungen gibt. Sei z eine beliebige Lösung von
z n = w und z = |z|(cos ψ + i · sin ψ) p
die trigonometrische Darstellung von z.
Es gilt |z|n = |w| und folglich |z| = n |w|. Weiterhin ist n · ψ = ϕ + 2πl, für
2πl
ein l ∈ Z und somit ψ = ϕ
n + n . Wir teilen l durch n mit Rest: l = k + rn,
r ∈ Z und 0 ≤ k ≤ n − 1. Dann gilt ψ = ϕk + r · 2π und folglich z = zk .
⊓
⊔
Geometrische Deutung der Wurzeln:
Die Lösungen zk von z np
= w bilden die Ecken eines regelmäßigen n-Ecks auf
dem Kreis vom Radius n |w|.
iR
n=4
6
w
z1
M
1 z0
ϕ
z2 )
ϕ
4
π
2
R
N
z3
Wir formulieren abschließend den Fundamentalsatz der Algebra, der eine der
wichtigsten Aussagen über komplexe Zahlen enthält.
Satz 1.22 (Fundamentalsatz der Algebra)
Es seien a0 , a1 , . . . , an−1 komplexe Zahlen. Dann besitzt die Gleichung
z n + an−1 z n−1 + . . . + a1 z + a0 = 0
eine Lösung z ∈ C.
⊓
⊔
34
1 Reelle und komplexe Zahlen
Der Beweis dieses Satzes für allgemeine n erfolgt später. Wir beweisen den
Fundamentalsatz der Algebra hier zunächst nur für n = 2. In diesem Fall
erhält man alle komplexen Lösungen z der quadratischen Gleichung
z 2 + a1 z + a0 = 0 mittels quadratischer Ergänzung. Es gilt
⇐⇒
⇐⇒
z 2 + a1 z + a0 = 0
a2
a1 2
+ a0 − 1 = 0
z+
2
4
w2 = c
wobei w := z +
a2
a1
und c = 1 − a0 .
2
4
Für c 6= 0 können wir die Gleichung w2 = c nach Satz 1.21 lösen und erhalten
genau 2 verschiedene komplexe Lösungen von z 2 + a1 z + a0 = 0. Für c = 0
a2
gilt a0 = 41 und deshalb
a1 a1 z+
.
z 2 + a1 z + a0 = z +
2
2
In diesem Fall ist z = − a21 eine 2-fache Lösung von z 2 + a1 z + a0 = 0.
1.4 Die Vektorräume Rn und Cn
Definition 1.21. Mit Rn bezeichnen wir die Menge aller n–Tupel reeller
Zahlen. Mit Cn bezeichnen wir die Menge aller n–Tupel komplexer Zahlen.
Wir addieren zwei n-Tupel x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) aus Rn (Cn )
mittels:
x + y := (x1 , . . . , xn ) + (y1 , . . . , yn ) = (x1 + y1 , . . . , xn + yn ).
Wir multiplizieren ein n-Tupel x = (x1 , . . . , xn ) ∈ Rn (Cn ) mit einer Zahl
λ ∈ R (C) mittels:
λ · z := λ · (x1 , . . . , xn ) = (λx1 , . . . , λxn ).
Satz 1.23 Rn ist ein n–dimensionaler Vektorraum über dem Körper der reellen Zahlen R. Cn ist ein n–dimensionaler Vektorraum über dem Körper der
komplexen Zahlen C.
Beweis. Siehe Algebra–Vorlesung
Die Elemente von Rn und Cn bezeichnet man deshalb auch als Vektoren.
⊓
⊔
1.4 Die Vektorräume Rn und Cn
35
Definition 1.22. (1) Unter dem Skalarprodukt zweier Vektoren x = (x1 , . . . , xn ), y =
(y1 , . . . , yn ) aus Rn versteht man die Zahl
hx, yi :=
n
X
j=1
xj · yj ∈ R.
(2) Unter dem Skalarprodukt zweier Vektoren z = (z1 , . . . , zn ), w = (w1 , . . . , wn )
aus Cn versteht man die Zahl
hz, wi :=
n
X
j=1
zj · w j ∈ C.
(3) Die Norm eines Vektors x ∈ Rn bzw. z ∈ Cn ist die Zahl
v
v
uX
uX
p
p
u n 2
u n
t
kxk := hx, xi =
xj ∈ R, bzw. kzk := hz, zi = t
|zj |2 ∈ R.
j=1
j=1
Satz 1.24 (Eigenschaften des Skalarprodukts und der Norm)
Seien x, y ∈ Rn , z, w ∈ Cn , λ ∈ R und µ ∈ C. Dann gilt
1. hx, yi = hy, xi
hz, wi = hw, zi.
2. hx + x̂, yi = hx, yi + hx̂, yi
hz + ẑ, wi = hz, wi + hẑ, wi.
3. hλx, yi = hx, λyi = λhx, yi
hµz, wi = µhz, wi und hz, µwi = µhz, wi.
4. kxk ≥ 0 , wobei kxk = 0 ⇐⇒ x = (0, . . . , 0).
kzk ≥ 0 , wobei kzk = 0 ⇐⇒ z = (0, . . . , 0).
5. kλxk = |λ| · kxk
kµzk = |µ| · kzk.
6. Cauchy–Schwarzsche Ungleichung (CSU):
|hx, yi| ≤ kxk · kyk
bzw.
|hz, wi| ≤ kzk · kwk
Die Gleichheit gilt genau dann, wenn x und y, bzw. z und w linear
abhängig sind.
7. Dreiecksungleichung:
kx + yk ≤ kxk + kyk
bzw.
kz + wk ≤ kzk + kwk.
Beweis. Die Aussagen 1.–5. folgen unmittelbar aus der Definition.
Beweis der Cauchy-Schwarzschen Ungleichung:
Da das Skalarprodukt auf Rn ein Spezialfall desjenigen auf Cn ist, genügt es,
36
1 Reelle und komplexe Zahlen
|hz, wi| ≤ kzk · kwk
für alle komplexen Vektoren z und w zu beweisen. Da die Norm nichtnegativ
ist, gilt
0 ≤ k kwk2 z − hz, wiw k2 .
(∗)
Daraus folgt
und wir erhalten
0 ≤ h kwk2 z − hz, wiw, kwk2 z − hz, wiw i
0 ≤ kwk4 kzk2 − hz, wikwk2 hw, zi − kwk2 hz, wihz, wi + hz, wihz, wikwk2 .
Folglich gilt
kwk4 kzk2 ≥ |hz, wi|2 kwk2 .
OBdA sei w 6= 0, ansonsten ist die Behauptung sofort erfüllt. Dann folgt
|hz, wi|2 ≤ kwk2 kzk2
und somit
|hz, wi| ≤ kzk · kwk.
Die Gleichheit kann nur gelten, wenn in (*) die Gleichheit steht. Dies ist aber
genau dann der Fall, wenn kwk2 z − hz, wiw = 0, dh. wenn z und w linear
abhängig sind.
Beweis der Dreiecksungleichung: Es genügt abermals kz + wk ≤ kzk + kwk für
alle z, w ∈ Cn zu beweisen. Es gilt
kz + wk2 = hz + w, z + wi
= hz, zi + hw, wi + hz, wi + hw, zi
= kzk2 + kwk2 + hz, wi + hz, wi
= kzk2 + kwk2 + 2Rehz, wi
≤ kzk2 + kwk2 + 2|Rehz, wi|
≤ kzk2 + kwk2 + 2|hz, wi|
≤ kzk2 + kwk2 + 2kzk · kwk
= (kzk + kwk)2 .
⊓
⊔
Definition 1.23. Seien x und y zwei Vektoren aus Rn bzw. Cn . Die Zahl
d(x, y) := kx − yk
heißt Euklidischer Abstand zwischen x und y.
1.4 Die Vektorräume Rn und Cn
37
Satz 1.25 Für alle Vektoren x, y, u ∈ Rn (Cn ) gilt
1. d(x, y) ≥ 0 , wobei d(x, y) = 0 ⇐⇒ x = y.
2. d(x, y) = d(y, x).
3. d(x, y) ≤ d(x, u) + d(u, y).
Beweis. Die Behauptungen folgen sofort aus Satz 1.24.
⊓
⊔
Im folgenden Kapitel betrachten wir Eigenschaften von Rn bzw. Cn , die sich
aus der Existenz des Euklidischen Abstandes ergeben. Dabei ist oft nicht wichtig, dass es sich bei der zugrundeliegenden Menge um Rn oder Cn handelt und
dass der Abstand d der konkrete Euklidische Abstand ist. Man benötigt oft
nur seine drei in Satz 1.25 formulierten Eigenschaften. Wir können deshalb
die gleichen Untersuchungen für beliebige Mengen X machen, auf denen eine
Abstandsfunktion, d.h. eine Funktion d : X × X −→ R mit den drei in Satz
1.25 formulierten Eigenschaften gegeben ist.
Eine solche Abstandsfunktion d gibt uns ein Maß dafür, wie weit zwei Punkte
in X voneinander entfernt sind. Ein solches Abstandsmaß möchte man z.B.
auf der Erdoberfläche haben, um anzugeben, wie weit zwei Orte voneinander
entfernt sind. Man benötigt solche Abstandsmaße auch für Funktionenräume,
z.B. in der Lösungstheorie von Differentialgleichungen, die viele Prozesse der
Natur mathematisch beschreiben. Es gibt sehr viele weitere Gründe, sich bei
den betrachteten Mengen X nicht auf die Vektorräume Rn und Cn zu beschränken.
2
Metrische Räume
In diesem Kapitel betrachten wir Mengen X, auf denen ein Abstand d :
X × X −→ R mit den Eigenschaften aus Satz 1.25 gegeben ist. Mit Hilfe
eines solchen Abstandes können wir erklären, was es bedeutet, dass eine Folge
von Punkten xn ∈ X, n = 1, 2, . . ., gegen einen Punkt x ∈ X konvergiert. Der
Konvergenzbegriff ist grundlegend für das Studium des lokalen Änderungsverhaltens von Funktionen, die auf der Menge X erklärt sind.
2.1 Definition und Beispiele metrischer Räume
Definition 2.1. Ein metrischer Raum ist ein Paar (X, d) bestehend aus einer
nichtleeren Menge X und einer Abbildung d : X × X −→ R mit folgenden
Eigenschaften
1. d(p, q) ≥ 0 ∀ p, q ∈ X und d(p, q) = 0 ⇐⇒ p = q
(Positivität),
2. d(p, q) = d(q, p) ∀ p, q ∈ X
(Symmetrie),
3. d(p, q) ≤ d(p, r) + d(r, q) ∀ p, q, r ∈ X
(Dreiecksungleichung).
Die Elemente von X heißen Punkte des metrischen Raumes, d(p, q) nennt man
Abstand zwischen p und q. Die Abbildung d heißt Metrik (oder Abstandsfunktion) auf X.
Beispiel 1: Aus Kapitel 1 wissen wir, dass folgende Räume metrische Räume
sind:
•
•
•
•
R
C
Rn
Cn
mit
mit
mit
mit
d(x, y) := |x − y|
d(z, v) := |z − v|
d(p, q) := kp − qk
d(r, s) := kr − sk
für x, y ∈ R
für z, v ∈ C
für p, q ∈ Rn
für r, s ∈ Cn ,
wobei | · | den Betrag der rellen bzw. komplexen Zahl und k · k die Euklidische
Norm auf Rn bzw. Cn bezeichnen. Diese Metriken nennen wir die Standardmetrik auf R, C, Rn bzw. Cn . Ist nichts anderes vereinbart, so seien R, C, Rn
40
2 Metrische Räume
bzw. Cn mit dieser Metrik versehen.
Beispiel 2: Auf einer Menge können verschiedene Metriken existieren:
Die folgenden 3 Abbildungen d1 , d2 , d3 sind z.B. Metriken auf R2 :
•
•
Der “Luftlinienabstand“(Standardmetrik):
p
d1 (x, y) := kx−yk := (x1 − y1 )2 + (x2 − y2 )2 ,
wobei x = (x1 , x2 ), y = (y1 , y2 )
Die “Mannheimer-Metrik“ (in Mannheim muß man rechtwinklige Straßen
langlaufen, um von einem Punkt zum anderen zu kommen) :
d2 (x, y) := |x1 − y1 | + |x2 − y2 |
•
Die “Metrik der französischen Eisenbahn“ (um von einer Stadt zur anderen
zu kommen, muß man über Paris fahren): Sei p ein fixierter Punkt.
d1 (x, p) + d1 (p, y)
falls x 6= y
d3 (x, y) :=
0
falls x = y
Beispiel 3: Auf jeder nichtleeren Menge X existiert eine Metrik.
Wir definieren d : X × X −→ R durch
0 falls x = y
d(x, y) :=
1 falls x 6= y.
Dann ist (X, d) ein metrischer Raum. (X, d) heißt diskreter metrischer Raum
und d die diskrete Metrik.
Beispiel 4: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge.
Dann ist (A, d|A×A ) ebenfalls ein metrischer Raum. Hierbei bezeichnet d|A×A
die Einschränkung der Abbildung d auf die Menge A × A. Sie heißt durch d
induzierte Metrik auf A.
Beispiel 5: Seien (X1 , d1 ), . . . , (Xn , dn ) metrische Räume. Wir betrachten die
Menge
X = X1 × X2 × . . . × Xn = {(p1 , . . . , pn ) | pi ∈ Xi , i ∈ {1, . . . , n}}
2.1 Definition und Beispiele metrischer Räume
41
und definieren die Produktmetrik
v
uX
u n
d((p1 , . . . , pn ), (q1 , . . . , qn )) := t
dj (pj , qj )2 .
j=1
Dann ist (X, d) ein metrischer Raum und heißt das kartesische Produkt der
metrischen Räume (X1 , d1 ), . . . , (Xn , dn ).
Beweis: Die Positivität und Symmetrie sind aus der Definition sofort ersichtlich. Wir zeigen die Dreiecksungleichung. Seien dazu p = (p1 , . . . , pn ),
q = (q1 , . . . , qn ) und r = (r1 , . . . , rn ) drei beliebige Punkte in X. Unter
Benutzung der Dreiecksungleichung für die Metriken dj und der CauchySchwarzschen Ungleichung (CSU, siehe Kapitel 1.4) erhalten wir
2
d(p, q)
=
≤
=
n
X
dj (pj , qj )2
j=1
n X
j=1
n
X
j=1
2
dj (pj , rj ) + dj (rj , qj )
dj (pj , rj )2 + 2dj (pj , rj ) · dj (rj , qj ) + dj (rj , qj )2
= d(p, r)2 + d(r, q)2 + 2
n
X
j=1
dj (pj , rj ) · dj (rj , qj )
v
v
uX
uX
n
u n
u
d(pj , rj )2 · t
d(rj , qj )2
≤ d(p, r)2 + d(r, q)2 + 2 t
CSU
j=1
2
j=1
2
= d(p, r) + d(r, q) + 2 d(p, r) · d(r, q)
= (d(p, r) + d(r, q))
2
Da der Abstand nicht-negativ ist, können wir in der Ungleichung auf beiden
Seiten die Wurzel ziehen und erhalten die Dreiecksungleichung für d.
⊓
⊔
Insbesondere gilt Rn = R × . . . × R und Cn = C × . . . × C (versehen mit der
Standardmetrik bzw. der Produktmetrik).
ˆ heißen isometrisch,
Definition 2.2. Zwei metrische Räume (X, d) und (Y, d)
wenn eine bijektive Abbildung f : X −→ Y existiert, so dass
ˆ (x), f (y))
d(x, y) = d(f
∀ x, y ∈ X
ˆ
gilt. Die Abbildung f heißt dann Isometrie zwischen (X, d) und (Y, d).
42
2 Metrische Räume
2.2 Offene und abgeschlossene Mengen in metrischen
Räumen
Definition 2.3. Sei (X, d) ein metrischer Raum, x ∈ X und ε ∈ R+ .
Die Menge
K(x, ε) := {y ∈ X | d(x, y) < ε}
heißt ε–Kugel in X um x.
Beispiel 1: Sei X = Rn mit der Standardmetrik d(x, y) = kx − yk versehen.
Dann ist
K(0, ε) = {x ∈ Rn | kxk < ε} = {x ∈ Rn | x21 + . . . + x2n < ε2 }
die Kugel vom Radius ε um den Nullpunkt im Rn ohne ihren Rand.
Ist n = 1, so ist jedes offene Intervall eine ε–Kugel.
(
ε)
x
a+b
2
-
K(x, ε) = (x − ε, x + ε)
(
a
R
)
b
a−b
(a, b) = K( a+b
2 , 2 )
R
Für n = 2 sind die ε–Kugeln gerade die Kreisscheiben vom Radius ε ohne
ihren Rand.
R
K((a, b), ε)
6 = {(x, y) ∈ R2 | (x − a)2 + (y − b)2 < ε2 }
R
6 K(0, ε)
ε 3
-
ε3
b
•
(a, b)
R
a
Beispiel 2: Sei X = R2 mit folgender Metrik versehen:
d((x1 , x2 ), (y1 , y2 )) = max(|x1 − y1 |, |x2 − y2 |).
R
2.2 Offene und abgeschlossene Mengen in metrischen Räumen
43
Dann ist (X, d) ein metrischer Raum (Übungsaufgaben 16). Die ε–Kugel um
den Nullpunkt ist für diese Metrik ein Quadrat mit der Seitenlänge 2ε ohne
seinen Rand:
K(0, ε) = {(x1 , x2 ) ∈ R2 | |x1 | < ε, |x2 | < ε}.
R
ε 6
ε
R
−ε
−ε
Beispiel 3: Sei (X, d) ein diskreter metrischer Raum. Dann gilt für die εKugeln
(
{x} falls ε ≤ 1
K(x, ε) =
X falls ε > 1.
Definition 2.4. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X. Ein Punkt x ∈ A heißt innerer Punkt von A, falls eine ε–Kugel
K(x, ε) um x existiert, die vollständig in A liegt.
Int(A) bezeichne die Menge aller inneren Punkte von A ⊂ X.
A
K(x, ε)
x•
Satz 2.1 (Eigenschaften des Inneren einer Menge)
Sei (X, d) ein metrischer Raum und seien A und B Teilmengen von X. Dann
gilt:
1.
2.
3.
4.
5.
Int(X) = X, Int(∅) = ∅.
Int(A) ⊂ A.
Int(Int(A)) = Int(A).
A ⊂ B =⇒ Int(A) ⊂ Int(B)
Int(A ∩ B) = Int(A) ∩ Int(B) .
(Monotonie).
44
2 Metrische Räume
6. Für beliebig viele Teilmengen Ai ⊂ X, i ∈ Λ, gilt
[
[
Int(Ai ) ⊂ Int(
Ai )
i∈Λ
i∈Λ
Beweis. Die Eigenschaften 1. und 2. folgen unmittelbar aus der Definition des
Inneren einer Menge.
Zu 3. Aus der 2. Eigenschaft des Inneren folgt
Int(Int(A)) ⊂ Int(A).
Es bleibt somit noch
Int(A) ⊂ Int(Int(A))
zu zeigen. Sei x ∈ Int(A). Nach Definition von Int(A) existiert eine ε–Kugel
um x mit K(x, ε) ⊂ A. Wir zeigen nun, dass K(x, ε) ⊂ Int(A) gilt.
Sei y ∈ K(x, ε) beliebig gewählt. Wir betrachten die Kugel um y mit dem Radius ε−d(x, y).
Dann gilt
A
K(x, ε)
•y
x•
K(y, ε − d(x, y)) ⊂ K(x, ε) ⊂ A.
Ist nämlich z ∈ K(y, ε − d(x, y)), so gilt
d(y, z) < ε − d(x, y)
K(y, ε − d(x, y))
x•
•y
ε
R
und wir erhalten
d(x, z) ≤ d(x, y) + d(y, z) < ε.
Folglich liegt z in K(x, ε).
Nach Definition ist somit jeder Punkt y von K(x, ε) ein innerer Punkt von A,
also K(x, ε) ⊂ Int(A). Daraus folgt wiederum, dass x ein innerer Punkt der
Menge Int(A) ist. Damit haben wir Int(A) ⊂ Int(Int(A)) bewiesen.
Zu 4. Wir zeigen A ⊂ B =⇒ Int(A) ⊂ Int(B):
Sei x ∈ Int(A). Dann existiert eine ε-Kugel K(x, ε) mit K(x, ε) ⊂ A. Da
A ⊂ B folgt K(x, ε) ⊂ B. Folglich ist x ∈ Int(B).
Zu 5. Wir zeigen Int(A ∩ B) = Int(A) ∩ Int(B):
Sei x ∈ Int(A ∩ B). Dann existiert eine ε–Kugel um x mit K(x, ε) ⊂ A ∩ B
und es folgt, dass sowohl K(x, ε) ⊂ A als auch K(x, ε) ⊂ B. Somit ist x ∈
Int(A) und x ∈ Int(B) und wir erhalten x ∈ Int(A) ∩ Int(B). Es gilt folglich
Int(A ∩ B) ⊂ Int(A) ∩ Int(B). Sei nun x ∈ Int(A) ∩ Int(B), das heißt
x ∈ Int(A) und x ∈ Int(B). Folglich existieren ε1 , ε2 ∈ R+ , so dass
K(x, ε1 ) ⊂ A und K(x, ε2 ) ⊂ B.
Wir betrachten ε := min(ε1 , ε2 ). Dann ist
2.2 Offene und abgeschlossene Mengen in metrischen Räumen
45
K(x, ε) ⊂ K(x, ε1 ) ⊂ A, bzw. K(x, ε) ⊂ K(x, ε2 ) ⊂ B.
Also gilt K(x, ε) ⊂ A ∩ B, somit ist x ∈ Int(A ∩ B). Dies zeigt, dass
Int(A) ∩ Int(B) ⊂ Int(A ∩ B).
Zu 6. Wir betrachten eine Familie {Ai }i∈Λ aus beliebig vielen Teilmengen
S
Ai . Aus
Ai ⊂ X. Sei Aj eine fixierte Menge dieser Familie. Dann ist Aj ⊂
i∈Λ
der Monotonieeigenschaft des Inneren folgt
[
Int(Aj ) ⊂ Int(
Ai ).
i∈Λ
Da dies für alle j ∈ Λ gilt, erhalten wir
[
[
Int(Aj ) ⊂ Int(
Ai ).
j∈Λ
i∈Λ
⊓
⊔
Bemerkung: Im allgemeinen ist
Int(A) ∪ Int(B) 6= Int(A ∪ B).
Wir betrachten dazu als metrischen Raum X = R mit der Standardmetrik
und die Teilmengen A = Q und B = R \ Q. Dann ist A ∪ B = R und
Int(A ∪ B) = R. Da in jedem Intervall sowohl eine eine rationale als auch
eine irrationale Zahl liegt, gilt K(x, ε) 6⊆ Q, und K(x, ε) 6⊆ R \ Q. Also ist
Int(Q) = Int(R \ Q) = ∅.
Definition 2.5. Eine Teilmenge A eines metrischen Raumes (X, d) heißt offen, falls Int(A) = A gilt, dh. falls zu jedem x ∈ A eine ε–Kugel K(x, ε)
existiert, die vollständig in A liegt.
Beispiele:
1. Das Innere Int(A) jeder Teilmenge A eines metrischen Raumes ist offen.
(Nach Satz 2.1, Punkt 3.).
2. Die ε–Kugeln K(x, ε) eines metrischen Raumes (X, d) sind offen. Ist
nämlich y ∈ K(x, ε), dann gilt K(y, ε − d(x, y)) ⊂ K(x, ε) (siehe Beweis von 3. in Satz 2.1).
Insbesondere sind die Intervalle (a, b) im metrischen Raum R (mit der
Standardmetrik) offen.
46
2 Metrische Räume
Satz 2.2 Die offenen Teilmengen eines metrischen Raumes (X, d) haben folgende Eigenschaften:
1. Die Mengen X und ∅ sind offen.
2. Der Durchschnitt endlich vieler offener Mengen ist offen.
3. Die Vereinigung beliebig vieler offener Mengen ist offen.
Beweis. Zu 1: Siehe Satz 2.1, Punkt 1.
Zu 2: Seien U1 und U2 offen. Dann gilt Int(U1 ) = U1 und Int(U2 ) = U2 . Aus
Satz 2.1 folgt
Int(U1 ∩ U2 ) = Int(U1 ) ∩ Int(U2 ) = U1 ∩ U2
und somit ist U1 ∩ U2 offen. Induktiv schließt man auf die Behauptung für
endlich viele Mengen.
Zu 3: Seien Ui , i ∈ Λ, beliebig viele offene Mengen. Dann gilt Int(Ui ) = Ui
für alle i ∈ Λ. Wegen Satz 2.1 ist
[
[
[
[
Ui =
Int(Ui ) ⊂ Int(
Ui ) ⊂
Ui
i∈Λ
und somit
S
i∈Λ
Ui = Int(
S
Ui ). Also ist
i∈Λ
Ui offen.
i∈Λ
i∈Λ
i∈Λ
i∈Λ
S
⊓
⊔
Beispiele: Sei X = R mit der Standardmetrik d(x, y) = |x − y|.
1. Für jeden Punkt a ∈ R sind (a, ∞) und (−∞, a) offen, denn:
[
[
(−n, a)
(a, n), (−∞, a) =
(a, ∞) =
n∈N
−n∈N
n>a
−n<a
2. Der Durchschnitt beliebig vieler offener Mengen ist im allgemeinen nicht
offen. Sei zum Beispiel
1 1
Un = (− , ) , n ∈ N.
n n
Dann ist
T
n∈N
Un = {0} nicht offen in R.
Als nächstes wollen wir beschreiben, wie offenen Mengen in Teilräumen aussehen. Ist (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X,
so ist die Menge A selbst ein metrischer Raum mit der induzierten Metrik
d|A×A : A × A −→ R.
2.2 Offene und abgeschlossene Mengen in metrischen Räumen
47
Satz 2.3 Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige Teilmenge. Eine Menge B ⊂ A ist im metrischen Raum (A, d|A×A ) genau dann offen,
wenn es in (X, d) eine offene Menge U ⊂ X gibt, so daß B = U ∩ A gilt.
Beweis. Wir vergleichen zunächst die Kugeln des metrischen Raumes (A, d|A×A )
mit denen des metrischen Raumes (X, d). Es gilt
KA (b, ε) = {a ∈ A | d(b, a) < ε} = KX (b, ε) ∩ A.
(1) Sei B ⊂ A im metrischen Raum (A, d|A×A ) offen. Nach Definition existiert
für jedes b ∈ B eine Zahl ε(b) > 0, so dass
KA (b, ε(b)) = KX (b, ε(b)) ∩ A ⊂ B.
Wir betrachten die Menge
U :=
[
b∈B
KX (b, ε(b)) ⊂ X.
Da U die Vereinigung von Kugeln in X ist, ist U nach Satz 2.2, Punkt 3. offen
in X. Da B ⊂ A und B ⊂ U , ist B ⊂ U ∩ A. Andererseits gilt
!
[
U ∩A =
KX (b, ε(b)) ∩ A
b∈B
[
=
KX (b, ε(b)) ∩ A
b∈B
=
[
b∈B
KA (b, ε(b)) ⊂ B,
denn jede der Kugeln KA (b, ε(b)) liegt in B. Folglich gilt B = U ∩ A.
(2) Sei nun B = U ∩ A, wobei U ⊂ X eine offene Menge in (X, d) ist. Es ist zu
zeigen, dass B offen im metrischen Raum (A, d|A×A ) ist. Sei b ∈ B. Da b ∈ U
und U in (X, d) offen ist, existiert ein ε(b) > 0 mit KX (b, ε(b)) ⊂ U . Folglich
gilt
KA (b, ε(b)) = KX (b, ε(b)) ∩ A ⊂ U ∩ A = B.
Somit ist B offen in (A, d|A×A ).
⊓
⊔
Definition 2.6. Sei (X, d) ein metrischer Raum und A ⊂ X eine beliebige
Teilmenge. Der Abschluss von A ist die Menge
cl(A) := {x ∈ X | ∀ ε > 0 gilt K(x, ε) ∩ A 6= ∅}.
48
2 Metrische Räume
Beispiel: Sei X = R mit der Standardmetrik d(x, y) = |x − y|.
Für A = [a, b) erhalten wir Int(A) = (a, b) und cl(A) = [a, b].
Satz 2.4 Sei (X, d) ein metrischer Raum. Für den Abschluss einer Teilmenge
A ⊂ X gilt:
cl(A) = X \ Int(X \ A).
Beweis. Die Aussage folgt aus folgenden Äquivalenzen:
x ∈ X \ Int(X \ A) ⇐⇒ x ∈ X und x ∈
/ Int(X \ A)
⇐⇒ ∀ ε > 0 gilt K(x, ε) 6⊂ X \ A
⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ A 6= ∅
⇐⇒ x ∈ cl(A).
⊓
⊔
Satz 2.5 (Eigenschaften des Abschlusses)
Sei (X, d) ein metrischer Raum und A, B Teilmengen von X. Dann gilt:
1.
2.
3.
4.
5.
6.
cl(∅) = ∅ und cl(X) = X.
A ⊂ cl(A).
A ⊂ B ⇒ cl(A) ⊂ cl(B).
cl(cl(A)) = cl(A).
cl(A ∪ B) = cl(A) ∪ cl(B).
Seien Ai , i ∈ Λ , beliebig viele Teilmengen von X. Dann gilt
\ \
cl(Ai ).
cl
Ai ⊂
i∈Λ
i∈Λ
Beweis. Das überlassen wir dem Leser als Übungsaufgabe 21. Man verwende
dazu die Sätze 2.4 und 2.1.
⊓
⊔
Beispiel: Im allgemeinen gilt nicht cl(A ∩ B) = cl(A) ∩ cl(B).
Wir betrachten dazu den metrischen Raum X = R mit der Standardmetrik.
Für A = (0, 1) und B = (1, 2) gilt A ∩ B = ∅. Folglich ist cl(A ∩ B) = ∅.
Da cl(A) = [0, 1] und cl(B) = [1, 2], erhält man andererseits den nichtleeren
Durchschnitt cl(A) ∩ cl(B) = {1}.
Definition 2.7. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X
heißt abgeschlossen, falls cl(A) = A gilt.
2.2 Offene und abgeschlossene Mengen in metrischen Räumen
49
Satz 2.6 Sei (X, d) ein metrischer Raum und A ⊂ X. Dann gilt:
1.
2.
3.
4.
A ⊂ X ist genau dann abgeschlossen, wenn X \ A offen ist.
X und ∅ sind abgeschlossen.
Der Durchschnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen.
Die Vereinigung endlich vieler abgeschlossener Mengen ist abgeschlossen.
Beweis. (1) Wir benutzen Satz 2.4 und erhalten
A ⊂ X ist abgeschlossen ⇐⇒ A = cl(A)
⇐⇒ A = X \ Int(X \ A)
⇐⇒ X \ A = Int(X \ A)
⇐⇒ X \ A ist offen
(2)–(4) folgen aus (1), Satz 2.1 und den Beziehungen zwischen Vereinigung
und Durchschnitt bei der Komplementbildung:
(2) X = X \ ∅. Da ∅ offen ist, ist X abgeschlossen.
∅ = X \ X. Da X offen ist, ist ∅ abgeschlossen.
(3) Seien Ai , i ∈ Λ, beliebig viele abgeschlossene Teilmengen von X. Dann
gilt nach den bekannten Regeln der Mengenlehre
\ [
X\
(X \ Ai ).
(⋆)
Ai =
i∈Λ
i∈Λ
Da Ai abgeschlossen ist, ist X \Ai offen. Die Vereinigung beliebig vieler offener
Mengen ist offen, folglich ist die rechte Seite von (⋆) ebenfalls
offen. Wenden
T
A
abgeschlossen
wir (1) auf die linke Seite von (⋆) an, so folgt, dass
i
i∈Λ
ist.
(4) Es genügt, die Behauptung für zwei abgeschlossene Mengen zu beweisen.
Die Gültigkeit für endlich viele Teilmengen erhält man dann durch Induktion.
Seien A und B zwei abgeschlossene Teilmengen von X. Nach den bekannten
Regeln der Mengenlehre gilt:
X \ (A ∪ B) = (X \ A) ∩ (X \ B).
Da A und B abgeschlossen sind, sind X \ A und X \ B offen und somit deren
Durchschnitt ebenfalls offen. Dann ist nach (1) aber A ∪ B abgeschlossen. ⊓
⊔
Beispiel: Sei X = R2 mit der Standardmetrik d(x, y) = kx − yk.
Für die Menge A = {x ∈ R2 | kxk < 1} gilt Int(A) = A. Folglich ist
R2 \ A = {x ∈ R2 | kxk ≥ 1} abgeschlossen in R2 .
Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d). Dann gilt
Int(A) ⊂ A ⊂ cl(A).
Wir wollen nun die Punkte studieren, die in cl(A) \ Int(A) liegen.
50
2 Metrische Räume
Definition 2.8. Sei A ⊂ X eine Teilmenge eines metrischen Raumes (X, d).
Unter dem Rand von A versteht man die Menge
∂A := cl(A) \ Int(A).
Ein Punkt x ∈ ∂A heißt Randpunkt von A.
Satz 2.7 (Charakterisierung des Randes)
Sei (X, d) ein metrischer Raum und A ⊂ X.
1. ∂A = X \ Int(A) ∪ Int(X \ A) .
Insbesondere ist ∂A abgeschlossen.
2. Ein Punkt x ∈ X ist genau dann ein Randpunkt von A, wenn für alle
ε > 0 gilt
K(x, ε) ∩ A 6= ∅ und K(x, ε) ∩ (X \ A) 6= ∅.
Beweis. Sei A ⊂ X. Dann gilt
∂A = cl(A) \ Int(A) = (X \ Int(X \ A)) \ Int(A) = X \ (Int(X \ A) ∪ Int(A)).
Daraus erhalten wir
x ∈ ∂A ⇐⇒ x ∈
/ Int(A) und x ∈
/ Int(X \ A)
⇐⇒ ∀ ε > 0 gilt K(x, ε) ∩ (X \ A) 6= ∅ und K(x, ε) ∩ A 6= ∅.
⊓
⊔
Bezeichnung: Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge.
Dann bezeichnet Int(A) die inneren Punkte von A. Die Punkte in Int(X \ A)
nennen wir auch die äußeren Punkte Punkt einer Menge von A. Dann sagt
uns Satz 2.7 insbesondere, dass sich X in die Menge der inneren Punkte von
A, die Menge der äußeren Punkte von A und den Rand von A zerlegt, d.h. es
gilt
X = Int(A) ∪˙ Int(X \ A) ∪˙ ∂A.
Beispiel 1: Sei X = R1 mit der Standardmetrik d(x, y) = |x − y|.
Für A = [a, b) gilt Int(A) = (a, b), Int(X \ A) = (−∞, a) ∪ (b, ∞) ,
cl(A) = [a, b] und ∂A = {a} ∪ {b}.
Beispiel 2: Sei X eine nichtleere Menge mit der diskreten Metrik d.
Im metrischen Raum (X, d) gilt für die Kugeln von Radius 1/2
1
K(x, ) = {x}.
2
Da die Kugeln eines beliebigen metrischen Raumes offene Mengen sind, ist
im diskreten metrischen Raum (X, d) jede 1-elementige Teilmenge {x} ⊂ X
2.2 Offene und abgeschlossene Mengen in metrischen Räumen
51
S
offen. Sei nun A ⊂ X eine beliebige Teilmenge. Da A = x∈A {x} und die
Vereinigung beliebig vieler offener Mengen offen ist, ist A offen. Insbesondere
gilt A = Int(A). Weiternin ist A = X \ (X \ A). Da X \ A offen ist, ist nach
Satz 2.5 A auch abgeschlossen. Insbesondere ist cl(A) = A. Daraus folgt dann
für den Rand der Menge A bzgl. der diskreten Metrik
∂A = cl(A) \ Int(A) = A \ A = ∅ .
Definition 2.9. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge.
Ein Punkt x ∈ X heißt Häufungspunkt von A, falls in jeder ε-Kugel K(x, ε)
ein von x verschiedener Punkt von A liegt, d.h. falls
(K(x, ε) \ {x}) ∩ A 6= ∅.
Die Menge der Häufungspunkte von A wird mit HP (A) bezeichnet.
Satz 2.8 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge.
Dann gilt
1. x ∈ X ist genau dann ein Häufungspunkt von A, wenn in jeder ε-Kugel
K(x, ε) unendlich viele voneinander verschiedene Punkte von A liegen.
2. cl(A) = A ∪ HP (A).
3. A ist genau dann abgeschlossen, wenn HP (A) ⊂ A.
Beweis. (1) Sei x ∈ X ein Häufungspunkt von A und ε > 0 eine beliebig fixierte Zahl. Wir müssen zeigen, dass die Kugel K(x, ε) unendlich viele voneinander verschiedene Punkte von A enthält. Aus der Definition des Häufungspunktes erhalten wir zunächst, dass ein von x verschiedener Punkt a1 ∈ K(x, ε)
existiert mit a1 ∈ A. Wir betrachten ε1 := d(x, a1 ) > 0. Dann ist ε1 < ε.
Wiederum aus der Häufungspunkt-Eigenschaft von x, erhalten wir einen weiteren von a1 und x verschiedenen Punkt a2 ∈ K(x, ε1 ) mit a2 ∈ A. Wir
betrachten dann ε2 := d(x, a2 ) und erhalten einen von a1 , a2 und x verschiedenen Punkt a3 ∈ K(x, ε2 ) mit a3 ∈ A. Fahren wir so fort, so ergibt
sich induktiv eine Folge unendlich vieler voneinander verschiedener Punkte
a1 , a2 , a3 , a4 , . . . ∈ A ∩ K(x, ε).
(2) Wir zeigen zuerst, dass A ∪ HP (A) ⊂ cl(A):
Da A ⊂ cl(A), ist dazu nur zu zeigen, dass HP (A) ⊂ cl(A). Sei x ∈ HP (A).
Dann gilt (K(x, ε) \ {x}) ∩ A 6= ∅ für alle ε > 0. Folglich ist K(x, ε) 6⊂ X \ A
für alle ε > 0 und damit x ∈
/ Int(X \ A). Also gilt x ∈ X \ Int(X \ A) = cl(A).
Wir zeigen nun cl(A) ⊂ A ∪ HP (A):
Sei x ∈ cl(A) \ A. Wir müssen zeigen, dass x ein Häufungspunkt von A ist.
Aus Satz 2.4 folgt x ∈
/ Int(X \ A) ∪ A. Insbesondere gilt für alle ε-Kugeln
K(x, ε) 6⊂ X \ A. Somit ergibt sich K(x, ε) ∩ A 6= ∅ und da x 6∈ A ist, gilt
(K(x, ε) \ {x}) ∩ A 6= ∅. Also ist x ein Häufungspunkt von A.
52
2 Metrische Räume
(3) A ist genau dann abgeschlossen, wenn A = cl(A), also wegen (2) genau
dann wenn A = A ∪ HP (A). Dies ist aber äquivalent dazu, dass HP (A) ⊂ A.
⊓
⊔
Definition 2.10. Sei (X, d) metrischer Raum und A ⊂ X Teilmenge. Ein
Punkt x ∈ A heißt isolierter Punkt von A, falls ein ε > 0 existiert, so daß
K(x, ε) ∩ A = {x} gilt.
Mit Iso(A) bezeichnen wir die Menge der isolierten Punkte von A.
Beispiel: Sei X = R1 versehen mit der Standardmetrik.
Für die Menge A = (0, 1) ∪ { 23 } ∪ (2, 3) ⊂ R gilt
3
Iso(A) = { }
2
HP (A) = [0, 1] ∪ [2, 3]
3
∂A = {0, 1, , 2, 3}
2
Int(A) = (0, 1) ∪ (2, 3)
3
cl(A) = [0, 1] ∪ { } ∪ [2, 3].
2
Für die Menge B = {1,
1 1 1
2 , 3 , 4 , . . .}
⊂ R gilt
Iso(B) = B
HP (B) = {0}
∂B = cl(B) = B ∪ {0}
Int(B) = ∅.
Definition 2.11. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X
heißt dicht in X, wenn cl(A) = X gilt.
Satz 2.9 Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge von X.
Dann sind die folgenden Aussagen äquivalent:
1. A ist dicht in X.
2. A besitzt keine äußeren Punkte , d.h. Int(X \ A) = ∅.
3. X \ A enthält keine ε–Kugel.
Beweis. Es gelten die folgenden äquivalenten Ausagen
A ⊂ X dicht ⇐⇒ cl(A) = X
⇐⇒ X \ Int(X \ A) = X
⇐⇒ Int(X \ A) = ∅
⇐⇒ X \ A enthält keine ε–Kugel.
⊓
⊔
2.3 Folgen in metrischen Räumen
53
Beispiel: Wir betrachten wieder X = R mit der Standardmetrik.
Die Menge der rationalen Zahlen Q und die Menge der irrationalen Zahlen
R \ Q sind dicht in R.
Um das einzusehen, erinnern wir uns an Kapitel 1. Wir wissen, dass in jedem
Intervall (a, b) eine rationale Zahl liegt. Folglich enthält R \ Q keine offenen
Intervalle, das heißt keine Kugeln des metrischen Raumes R. Somit ist Q nach
Satz 2.9 dicht in R. Analog schließen wir für R \ Q, da jedes offene Intervall
auch eine irrationale Zahl enthält.
Definition 2.12. Sei (X, d) ein metrischer Raum und x ∈ X. Unter einer
Umgebung von x verstehen wir eine offene Menge U ⊂ X, die x enthält.
Bemerkung:
•
•
•
Jede Kugel K(x, ε) ist eine Umgebung von x.
Jede Umgebung U von x enthält eine ε–Kugel um x.
Jede Umgebung U von x ist die Vereinigung von Kugeln.
Da U offen ist, existiert nämlich für
S jedes y ∈ U ein ε(y) > 0, so daß
K(y, ε(y)).
K(y, ε(y)) ⊂ U . Folglich gilt U =
y∈U
Man kann deshalb in allen obigen Definitionen (innerer Punkt, Abschluss,
Randpunkt, Häufungspunkt, isolierter Punkt, . . .) den Begriff “Kugeln um x”
durch “Umgebungen von x” ersetzen.
2.3 Folgen in metrischen Räumen
Definition 2.13. Sei X eine nichtleere Menge. Unter einer Folge in X versteht man eine Abbildung
F : N −→ X
n 7−→ F (n) =: xn ,
die jeder natürlichen Zahl n einen Punkt xn ∈ X zuordnet.
Eine Folge ist also eine durch die Abbildung F gegebene Aufzählung von
Punkten in X. Wir geben künftig lediglich die Bildwerte der Abbildung F an
und benutzen für die Folge die nachstehenden Schreibweisen:
x1 , x2 , x3 , . . .
oder
(xn )∞
oder kurz
(xn ).
n=1
Definition 2.14. Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X.
Wir sagen, dass (xn ) gegen x ∈ X konvergiert, falls zu jedem ε > 0 ein (von
ε-abhängiger) Index n0 ∈ N existiert, so dass xn ∈ K(x, ε) für alle n ≥ n0 .
Der Punkt x heißt Grenzwert (GW) der Folge (xn ).
Besitzt eine Folge (xn ) einen Grenzwert, so heißt sie konvergent. Besitzt die
Folge (xn ) keinen Grenzwert, so heißt sie divergent.
54
2 Metrische Räume
Bezeichnung: Für eine gegen x konvergente Folge (xn ) schreiben wir
lim xn = x
n→∞
n→∞
xn −→ x
oder
xn −→ x.
oder kurz
Es gilt also
•
•
lim xn = x ⇐⇒ ∀ ε > 0 ∃ n0 mit d(x, xn ) < ε
n→∞
∀ n ≥ n0 .
Sei speziell X = R mit der Standardmetrik d(x, y) = |x − y|. Dann gilt
lim xn = x ⇐⇒ ∀ ε > 0 ∃ n0 mit | x − xn | < ε ∀ n ≥ n0 .
n→∞
Wir erhalten daraus die folgende Charakterisierung der Konvergenz von Folgen
Satz 2.10 Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Dann
konvergiert die Folge (xn ) im metrischen Raum (X, d) genau dann gegen
x ∈ X, wenn die Folge der Abstände (d(x, xn )) im metrischen Raum R gegen
Null konvergiert:
xn −→ x in (X, d) ⇐⇒ d(x, xn ) −→ 0 in R.
2.3.1 Allgemeine Eigenschaften konvergenter Folgen
Satz 2.11 (Eindeutigkeit des Grenzwerts) Konvergiert eine Folge (xn )
im metrischen Raum (X, d) gegen x ∈ X und gegen x∗ ∈ X, so gilt x = x∗ .
Beweis. Angenommen x 6= x∗ . Dann ist ε := d(x, x∗ ) > 0. Also existieren n0
und n∗0 mit
d(x, xn ) <
ε
2
∀ n ≥ n0 , d(x∗ , xn ) <
Somit gilt d(x, xn ) < 2ε und d(x∗ , xn ) <
Dreiecksungleichung folgt
ε
2
ε
2
für alle n ≥ max(n0 , n∗0 ). Nach
ε = d(x, x∗ ) ≤ d(x, xn ) + d(xn , x∗ ) <
Dies ist aber ein Widerspruch.
∀ n ≥ n∗0 .
ε ε
+ =ε
2 2
⊓
⊔
Definition 2.15. Sei (X, d) ein metrischer Raum und A ⊂ X. A heißt beschränkt, falls es eine Kugel K(x0 , M ) des metrischen Raumes (X, d) gibt,
die A enthält. Eine Folge (xn ) in (X, d) heißt beschränkt, wenn die Menge
der Folgenglieder {x1 , x2 , x3 , . . .} beschränkt ist.
Satz 2.12 Jede konvergente Folge (xn ) eines metrischen Raumes (X, d) ist
beschränkt.
2.3 Folgen in metrischen Räumen
55
Beweis. Sei (xn ) eine konvergente Folge und x = lim xn . Nach Definition
n→∞
der Konvergenz existiert ein n0 ∈ N, so dass d(xn , x) < 1 für alle n ≥ n0 .
Wir setzen nun M := max( d(x, x1 ), d(x, x2 ), . . . , d(x, xn0 −1 ) ) + 1. Dann gilt
d(x, xn ) < M für alle n ∈ N. Damit liegt die Menge {x1 , x2 , . . .} in der Kugel
K(x, M ) und ist somit beschränkt.
⊓
⊔
Als nächstes wollen wir ein Kriterium für die Konvergenz von Folgen in Produkträumen behandeln. Wir erinnern nochmal an die Definition der Produktmetrik. Seien (X1 , d1 ), (X2 , d2 ), . . . , (Xk , dk ) metrische Räume. Das Produkt
dieser k metrischen Räume ist das Paar (X, d) mit
X : = X1 × X2 × . . . × Xk
v
u k
uX
dj (aj , bj )2
wobei a = (a1 , . . . , ak ), b = (b1 , . . . , bk ).
d(a, b) := t
j=1
Satz 2.13 Seien (X1 , d1 ), . . . , (Xk , dk ) metrische Räume und (X, d) das Produkt dieser Räume. Eine Folge (xn = (xn1 , . . . , xnk ))∞
n=1 von Punkten im
Produktraum X konvergiert genau dann gegen y = (y1 , . . . , yk ) ∈ X, wenn
lim xnj = yj in (Xj , dj ) für jedes j ∈ {1, . . . , k} gilt.
n→∞
Beweis. Nach Definition der Produktmetrik ist
v
u k
uX
d((xn1 , . . . , xnk ), (y1 , . . . , yk )) = t
di (xni , yi )2 ≥ dj (xnj , yj )
|
{z
} |
{z
}
xn
(∗)
i=1
y
für jedes j ∈ {1, . . . , k}.
Sei nun (xn ) gegen y in (X, d) konvergent. Dann existiert für jedes ε > 0 ein
n0 ∈ N mit d(y, xn ) < ε für alle n ≥ n0 . Nach Abschätzung (*) folgt daraus
dj (yj , xnj ) < ε für alle n ≥ n0 und jedes j ∈ {1, . . . , k}. Somit konvergiert
xnj gegen yj in (Xj , dj ) für jedes j ∈ {1, . . . , k}.
Sei umgekehrt lim xnj = yj für jedes j ∈ {1, . . . , k} und ε > 0. Dann existien→∞
ren n0j ∈ N so dass dj (yj , xnj ) <
√ε
k
für alle n ≥ n0j . Es folgt
v
v
u k
u k
uX ε2
uX
t
2
=ε
dj (xnj , yj ) < t
d(xn , y) =
k
j=1
j=1
für alle n ≥ m0 = max(n01 , . . . , n0k ). Also konvergiert xn gegen y im Produktraum (X, d).
⊓
⊔
Wir charakterisieren nun den Abschluß einer Teilmenge eines metrischen
Raumes durch konvergente Folgen.
56
2 Metrische Räume
Satz 2.14 Sei A eine beliebige Teilmenge eines metrischen Raumes (X, d).
Dann gilt für den Abschluß von A
x ∈ cl(A) ⇐⇒ Es existiert eine Folge (an ) mit an ∈ A, so dass lim an = x.
n→∞
Beweis. (=⇒) Sei x ∈ cl(A). Dann gilt K(x, ε) ∩ A 6= ∅ für alle ε > 0. Sei
n ∈ N und ε = n1 . Dann existiert ein Element an ∈ K(x, n1 ) ∩ A. Wir erhalten
also eine Folge a1 , a2 , a3 . . . in A mit d(x, an ) < n1 . Die Folge der Abstände
(d(x, an )) konvegiert gegen Null (Archimedisches Axiom) , somit konvergiert
die Folge (an ) gegen x.
(⇐=) Sei (an ) eine Folge in A, die gegen x konvergiert und ε > 0. Dann
existiert ein n0 ∈ N, so dass an ∈ K(x, ε) für alle n ≥ n0 . Folglich ist K(x, ε)∩
A 6= ∅, also x ∈ cl(A).
⊓
⊔
Folgerung 2.1 Sei (X, d) ein metrischer Raum. Dann gilt:
1. Eine Teilmenge A ⊂ X ist genau dann abgeschlossen, wenn der Grenzwert
jeder konvergenten, vollständig in A liegenden Folge gleichfalls in A liegt.
2. Eine Teilmenge A ⊂ X ist genau dann dicht im metrischen Raum (X, d),
wenn für jedes x ∈ X eine Folge (an ) von Punkten aus A existiert, die
gegen x konvergiert.
Beweis. A ⊂ X ist genau dann abgeschlsooen, wenn cl(A) = A. A ⊂ X ist
genau dann dicht, wenn cl(A) = X. Die Charakterisierung von cl(A) aus Satz
2.14 liefert dann die Behauptung.
⊓
⊔
Definition 2.16. Sei (xn ) eine Folge in einer Menge X. Unter einer Teilfolge
von (xn ) verstehen wir eine unendliche Auswahl von Elementen dieser Folge,
d.h. eine Folge (xnj )∞
j=1 , wobei {n1 , n2 , n3 , . . .} eine Teilmenge vonN mit n1 <
n2 < n3 < . . . ist.
Offensichtlich gilt
Satz 2.15 Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente Folge. Dann konvergiert jede Teilfolge von (xn ) ebenfalls gegen x.
Definition 2.17. Sei (xn ) eine Folge im metrischen Raum (X, d). Ein Punkt
x ∈ X heißt Häufungspunkt der Folge (xn ), wenn es eine Teilfolge (xnj )∞
j=1
von (xn ) gibt mit lim xnj = x.
j→∞
Die Menge der Häufungspunkte von (xn ) bezeichnen wir mit HP (xn ).
Beispiele:
1. Sei (X, d) ein metrischer Raum und (xn ) eine gegen x ∈ X konvergente
Folge. Dann gilt nach Satz 2.15, dass HP (xn ) = {x}.
2.3 Folgen in metrischen Räumen
57
2. Sei X = R mit der Standardmetrik und (xn ) die folgende Folge
1
falls n gerade
xn := n
1 falls n ungerade
Dann gilt HP (xn ) = {0, 1}.
Satz 2.16 Sei (X, d) ein metrischer Raum und (xn ) eine Folge in X. Die
Menge der Häufungspunkte von (xn ) ist abgeschlossen.
Beweis. Das überlassen wir dem Leser als Übungsaufgabe 26.
⊓
⊔
2.3.2 Spezielle Eigenschaften von konvergenten Folgen im
Vektorraum Ck bzw. Rk
In diesem Abschnitt betrachten wir spezielle Eigenschaften konvergenter Folgen im Vektorraum Ck bzw. Rk , den wir mit der in Kapitel 1.4 eingeführten
Standardmetrik
p
d(z, w) := kz − wk := |z1 − w1 |2 + . . . + |zk − wk |2
z = (z1 , . . . , zk ) , w = (w1 , . . . , wk ) ∈ Ck bzw. Rk
versehen. Da der metrische Raum Rk ein Teilraum des metrischen Raumes
Ck ist, gelten alle Eigenschaften, die wir im folgenden für Folgen in Ck formulieren, auch für Folgen in Rk . Aus Satz 2.13 folgt als Spezialfall sofort
Satz 2.17
k
1. Eine Folge von Vektoren (zn = (zn1 , . . . , znk ))∞
n=1 aus C konvergiert ge∗
∗
∗
k
nau dann gegen den Vektor z = (z1 , . . . , zk ) ∈ C , wenn die Folge der
∗
Komponenten (znj )∞
n=1 für jedes j ∈ {1, ..., k} in C gegen zj konvergiert.
2. Eine Folge komplexer Zahlen (wn ) konvergiert genau dann gegen w ∈ C,
wenn die Folge der Realteile (Re(wn )) gegen Re(w) und die Folge der
Imaginärteile (Im(wn )) gegen den Imaginärteil Im(w) konvergiert.
3. Eine Folge komplexer Zahlen (wn ) konvergiert genau dann gegen w ∈ C,
wenn die Folge (w n ) gegen w konvergiert.
Der folgende Satz fasst die wichtigsten Rechenregeln für Folgen in Ck (bzw.
in Rk ) zusammen.
58
2 Metrische Räume
Satz 2.18 (Rechenregeln für konvergente Folgen in Ck )
1. Seien (zn ) und (wn ) zwei konvergente Folgen in Ck mit den Grenzwerten
lim zn = z ∈ Ck und lim wn = w ∈ Ck . Dann gilt:
n→∞
n→∞
(a) lim (zn + wn ) = lim zn + lim wn = z + w
n→∞
n→∞
n→∞
(b) lim µ · zn = µ · lim zn = µ · z
n→∞
n→∞
∀µ∈C
(c) lim hzn , wn i = h lim zn , lim wn i = hz, wi
n→∞
n→∞
n→∞
(d) lim kzn k = k lim zn k = kzk.
n→∞
n→∞
2. Seien (zn ) und (wn ) zwei konvergente Folgen komplexer Zahlen mit den
Grenzwerten lim zn = z und lim wn = w in C. Dann gilt:
n→∞
n→∞
(a) lim zn · wn = lim zn · lim wn = z · w
n→∞
n→∞
n→∞
(b) Ist w 6= 0, so ist auch wn 6= 0 für alle n größer als ein n0 ∈ N, und es
gilt
lim zn
zn
z
lim
= n→∞
= .
n→∞ wn
lim wn
w
n→∞
3. Seien (xn ) und (yn ) zwei konvergente Folgen reeller Zahlen mit den Grenzwerten lim xn = x und lim yn = y.
n→∞
n→∞
(a) Gilt xn ≤ yn für fast alle1 n ∈ N, so folgt x ≤ y.
(b) Sei (un ) eine weitere Folge reeller Zahlen mit xn ≤ un ≤ yn für fast
alle n ∈ N und sei x = y. Dann ist die Folge (un ) ebenfalls konvergent
und es gilt lim un = x.
n→∞
Beweis. Zu 1. (a) Es gilt
k(zn + wn ) − (z + w)k ≤ kzn − zk + kwn − wk
und für alle ε > 0 existieren n0 , n∗0 ∈ N, so dass
kzn − zk <
ε
2
∀ n ≥ n0 und kwn − wk <
ε
2
∀ n ≥ n∗0 .
Daraus folgt k(zn + wn ) − (z + w)k < ε für alle n ≥ max(n0 , n∗0 ) und somit
lim (zn + wn ) = (z + w).
n→∞
(b) Ist µ = 0, so gilt die Behauptung trivialerweise. Sei µ 6= 0. Dann gilt
kµz − µzn k = |µ| · kz − zn k.
Da (zn ) gegen z konvergiert, existiert für ε > 0 ein n0 ∈ N, so dass
1
für fast alle n ∈ N bedeutet, dass die Aussage mit eventueller Ausnahme von
endlich vielen naürlichen Zahlen gilt
2.3 Folgen in metrischen Räumen
kz − zn k <
ε
|µ|
59
∀ n ≥ n0 .
Folglich gilt kµz − µzn k = |µ| · kz − zn k < ε für alle n ≥ n0 , und somit
lim µzn = µz.
n→∞
(c) Mittels der Cauchy-Schwarzschen Ungleichung erhält man die folgende
Abschätzung
|hzn , wn i − hz, wi| = |hzn − z, wn i − hz, wn − wi|
≤ |hzn − z, wn i| + |hz, wn − wi|
≤ kzn − zk kwn k + kzk kwn − wk.
(∗)
Da die Folge (wn ) konvergiert, ist die Menge {w1 , w2 , . . .} beschränkt. Somit
existiert ein M ∈ R+ mit kwn k ≤ M für alle n ∈ N. Sei nun ε > 0 gegeben.
Dann existieren n0 und n∗0 , so dass
kz − zn k <
ε
2M
∀ n ≥ n0 und kw − wn k ≤
ε
2M
∀ n ≥ n∗0 .
OBdA sei z 6= 0, denn ansonsten tritt der letzte Summand in (∗) nicht auf.
Wir erhalten
|hzn , wn i − hz, wi| ≤
ε ε
+ =ε
2 2
∀ n ≥ max(n0 , n∗0 ).
Daraus folgt lim hzn , wn i = hz, wi.
n→∞
(d) Sei zn −→ z. Aus der Dreiecksungleichung für die Norm in Ck folgt
| kzn k − kzk | ≤ kzn − zk < ε
∀ n ≥ n0 .
Also konvergiert (kzn k) gegen kzk.
(1c)
Zu 2. (a) zn · wn = hzn , w n i −→ hz, wi = z · w.
(b) Da w 6= 0 und (wn ) gegen w konvergiert, existiert eine positive reelle Zahl
η so dass 0 < η < |wn | für alle n größer als ein n0 . Man erhält
zn
zn · w − wn · z |(zn − z)w − (wn − w)z|
z =
wn − w = wn · w
|wn | · |w|
|zn − z||w| + |wn − w||z|
.
≤
|wn | · |w|
Daraus folgt
zn
|w|
z |z|
≤ |zn − z| ·
−
+ |wn − w| ·
≤ε
wn
w
η|w|
η|w|
Also konvergiert die Folge ( wznn ) gegen
z
w.
∀ n ≥ n0 .
60
2 Metrische Räume
Zu 3. (a) Angenommen, es wäre x > y. Wir setzen ε = x − y > 0. Dann
existiert ein n0 ∈ N, so dass
|xn − x| <
ε
ε
und |yn − y| <
2
2
∀ n ≥ n0 .
Deshalb ist xn > x − 2ε = y + 2ε > yn für alle n ≥ n0 . Dies steht aber im
Widerspruch zur Voraussetzung und somit ist die Annahme x > y falsch.
(b) Den Beweis dieser Aussage überlassen wir dem Leser als Übungsaufgabe
(Übungsaufgabe 28).
⊓
⊔
k
Definition 2.18. Eine Folge (zn )∞
n=1 in C , die gegen den Nullvektor
0 = (0, . . . , 0) konvergiert, heißt Nullfolge.
Bemerkung: Aus Satz 2.18 folgt dann
•
•
•
•
•
•
Eine Folge von Vektoren (zn ) in Ck ist genau dann eine Nullfolge, wenn
die Folge der reellen Zahlen (kzn k) eine Nullfolge ist.
Eine Folge von Vektoren (zn ) konvergiert genau dann gegen den Vektor z,
wenn (zn − z) eine Nullfolge ist.
Ist (zn ) eine Nullfolge von Vektoren und µ ∈ C, so ist auch (µ · zn ) eine
Nullfolge.
Sind (zn ) und (wn ) Nullfolgen von Vektoren, so ist auch (zn + wn ) eine
Nullfolge.
Ist (zn ) eine Nullfolge und (wn ) eine konvergente Folge von Vektoren, so
ist die Folge der Skalarprodukte (hzn , wn i) ebenfalls eine Nullfolge.
Ist (yn ) eine Nullfolge reller Zahlen und xn eine weitere Folge reeller Zahlen
mit 0 ≤ xn ≤ yn für fast alle n ∈ N, dann ist (xn ) ebenfalls eine Nullfolge.
Wichtige Beispiele konvergenter Folgen in R bzw. C:
1. Sei q eine positive rationale Zahl. Dann gilt in R
q
1
lim
= 0.
n→∞ n
Dies gilt, da nach dem Archimedischen Axiom zu jedem ε > 0 ein n0 ∈ N
q
1
existiert, so dass n10 ≤ ε q . Folglich ist | n1 | < ε für alle n ≥ n0 , woraus die
Behauptung folgt.
2. Sei x eine positive reelle Zahl. Dann gilt in R
√
lim n x = 1.
n→∞
√
Um dies einzusehen, betrachten wir zunächst x > 1. Sei xn := n x − 1. Dann
gilt xn > 0 und aus der Bernoullischen Ungleichung erhalten wir
2.3 Folgen in metrischen Räumen
61
x = (1 + xn )n ≥ 1 + n · xn .
( x−1
Also gilt 0 < xn ≤ x−1
n . Da
n ) eine Nullfolge ist, konvergiert (xn ) ebenfalls
√
n
gegen Null, und somit ( x) gegen 1.
Ist 0 < x < 1, so folgt x1√ > 1 und wir erhalten mittels Satz 2.18 und dem
1
= 1.
gerade Bewiesenen lim n x = lim √
n 1
n→∞
n→∞
x
3. Im metrischen Raum R gilt
lim
n→∞
√
n
n = 1.
Zum Beweis betrachten wir die Folge xn :=
binomischen Formel folgt
√
n
n − 1. Es gilt xn ≥ 0. Aus der
1
n(n − 1)x2n .
2
q
q
2
2
.
Nach
1.
ist
(
Folglich gilt 0 ≤ xn ≤
n−1
n−1 ) eine Nullfolge, somit ist
√
(xn ) ebenfalls eine Nullfolge und folglich gilt lim n n = 1.
n = (1 + xn )n ≥
n→∞
4. Sei z ∈ C mit |z| < 1. Dann gilt im metrischen Raum C
lim z n = 0.
n→∞
Dies sieht man folgendermaßen: Da 0 ≤ |z| < 1, existiert für jedes ε > 0 ein
n0 ∈ N mit |z|n0 < ε. Da | z | < 1 ist, erhält man |z|n < |z|n0 für alle n ≥ n0 ,
das heißt |z|n = |z n | < ε für alle n ≥ n0 . Folglich gilt lim z n = 0.
n→∞
5. Sei k ∈ N eine fixierte natürliche Zahl und z ∈ C mit |z| > 1. Dann gilt im
metrischen Raum C
nk
lim n = 0.
n→∞ z
Dies bedeutet, dass für |z| > 1 die Folge der Potenzen |z|n schneller wächst
als jede noch so große Potenz von n.
Zum Beweis setzen wir x := |z| − 1 und wählen eine natürliche Zahl p > k.
Für jedes n > 2p folgt aus der binomischen Formel
p−Faktoren
z
}|
{
n(n − 1) · . . . · (n − (p − 1)) p
n
n
p
(1 + x) >
·x =
·x .
p!
p
Da p < n2 , ist jeder der Faktoren n, (n − 1), . . . , (n − (p − 1)) größer als
p
Es folgt (1 + x)n > ( n2 )p · xp! und somit
0<
nk
2p · p!
2p · p! 1
<
≤
· .
p
|z|n
xp · np−k
|x
{z } n
konstant
n
2.
62
2 Metrische Räume
nk
n
n→∞ z
Auf der rechten Seite steht eine Nullfolge, also ist lim
= 0.
2.3.3 Spezielle Eigenschaften konvergenter Folgen in R
In diesem Abschnitt betrachten wir spezielle Eigenschaften von Folgen im
metrischen Raum R, der immer mit der Standardmetrik d(x, y) := |x − y| versehen sei. Wir nutzen dabei aus, dass R ein vollständiger angeordneter Körper
ist.
Um später Formulierungen vereinheitlichen zu können, betrachten wir zunächst
eine spezielle Sorte von divergenten Folgen reeller Zahlen und ordnen diesen
den Grenzwert +∞ oder −∞ zu.
Definition 2.19. Sei (xn ) eine Folge reeller Zahlen.
Wir sagen, dass (xn ) gegen +∞ strebt, falls zu jedem M ∈ R ein n0 ∈ N
existiert mit xn ≥ M für alle n ≥ n0 .
Wir sagen, dass (xn ) gegen −∞ strebt, falls zu jedem M ∈ R ein n0 ∈ N
existiert mit xn ≤ M für alle n ≥ n0 .
Für Folgen reeller Zahlen, die gegen +∞ bzw. −∞ streben, benutzen wir die
Schreibweise
lim xn = +∞
bzw.
lim xn = −∞.
n→∞
n→∞
Man nennt diese Sorte divergenter Folgen reeller Zahlen oft auch bestimmt divergent oder uneigentlich konvergent (je nach Autor des benutzten Buches)
und ±∞ den uneigentlichen Grenzwert.
Beispiele:
•
•
•
•
•
•
Ist xn = n oder xn = n2 , so gilt lim xn = +∞
n→∞
Die Folge 1, 0, 2, 0, 3, 0, 4, 0, . . . ist in R divergent und konvergiert
nicht gegen +∞, obwohl sie beliebig große Glieder enthält.
Aus xn −→ +∞ und yn −→ +∞ folgt xn + yn −→ +∞ und xn · yn −→
+∞.
Aus xn −→ +∞ und yn −→ a für a > 0 folgt xn + yn −→ +∞ und
xn · yn −→ +∞ .
Wenn xn −→ +∞ , so x1n −→ 0 .
Wenn xn −→ 0 und xn > 0, so x1n −→ +∞ .
Bemerkung: Aus xn −→ +∞ und yn −→ 0 kann man i.a. nichts über das
Verhalten von xn · yn folgern, wie die folgenden Beispiele zeigen.
•
•
Sei xn = n2 und yn =
2
Sei xn = n und yn =
1
n , so gilt
1
n2 , so gilt
xn · yn = n −→ +∞.
xn · yn = 1 −→ 1.
2.3 Folgen in metrischen Räumen
•
Sei xn = n2 und yn =
•
Für xn = n und yn =
1
n3 ,
(
so gilt xn · yn =
1
n
1
2n
1
n
n gerade
n ungerade
xn · yn =
63
−→ 0.
gilt
1 n gerade
.
1
2 n ungerade
Folglich konvergiert xn · yn überhaupt nicht.
Eine wichtige Folgerung aus dem Vollständigkeitsaxiom der reellen Zahlen ist
die folgende Eigenschaft beschränkter Folgen.
Satz 2.19 (Satz von Bolzano/Weierstraß2 ) Jede beschränkte Folge reeller Zahlen (xn ) besitzt einen Häufungspunkt, d.h. eine konvergente Teilfolge.
Beweis. Nach Voraussetzung existiert ein M > 0 mit −M < xn < M für alle
n ∈ N. Wir betrachten die folgende Menge A ⊂ R:
A := {x ∈ R1 | x ≤ xn für unendlich viele n}.
1. A ist nicht leer, da −M ∈ A.
2. A ist nach oben beschränkt, da zum Beispiel M eine obere Schranke ist.
Nach dem Satz 1.7 existiert ein Supremum g = sup A der Menge A. Sei ε > 0.
Aus der Definition des Supremums erhalten wir
(i) g + ε 6∈ A.
D.h. für höchstens endlich viele xn gilt die Ungleichung g + ε ≤ xn .
(ii) Es existiert ein x ∈ A mit g − ε < x.
Somit sind unendlich viele Folgenglieder xn größer oder gleich x, also
größer als g − ε.
Insgesamt folgt also, dass unendlich viele Glieder der Folge (xn ) im Intervall
(g − ε, g + ε) liegen.
Wir konstruieren jetzt eine Teilfolge (xnk ) von (xn ) auf folgende Weise.
ε = 1 =⇒ ∃ xn1 : g − 1 < xn1 < g + 1
1
1
1
ε = =⇒ ∃ xn2 : g − < xn2 < g + , n2 > n1 ,
2
2
2
..
.
1
1
1
ε = =⇒ ∃ xnk : g − < xnk < g + , nk > nk−1 . . .
k
k
k
Damit haben wir eine Teilfolge (xnk ) von (xn ) gefunden mit |xnk − g| <
alle k ∈ N. Somit ist lim xnk = g.
k→∞
1
k
für
⊓
⊔
64
2 Metrische Räume
Definition 2.20. Eine Folge reeller Zahlen (xn ) heißt monoton wachsend,
falls
x1 ≤ x2 ≤ x3 ≤ . . .
und monoton fallend, falls
x1 ≥ x2 ≥ x3 ≥ . . .
Eine Folge heißt monoton, wenn sie monoton wachsend oder monoton fallend
ist.
Satz 2.20 Jede monoton wachsende, nach oben beschränkte Folge reller Zahlen (xn )∞
n=1 konvergiert gegen sup{xn | n ∈ N}.
Jede monoton fallende, nach unten beschränkte Folge reeller Zahlen (xn )∞
n=1
konvergiert gegen inf{xn | n ∈ N}.
Beweis. Sei (xn ) monoton wachsend und nach oben beschränkt. Nach Satz
1.7 existiert das Supremum g = sup{xn | n ∈ N}. Wir zeigen, dass xn −→ g.
Sei ε > 0. Nach Definition des Supremums existiert ein m0 ∈ N mit xm0 >
g − ε, also mit xm0 ∈ (g − ε, g]. Da (xn ) monoton wachsend ist, gilt xn ≥ xm0
für alle n ≥ m0 . Folglich konvergiert (xn ) gegen g.
Den Beweis für monoton fallende, nach unten beschränkte Folgen führt man
analog.
⊓
⊔
Das Supremum und das Infimum einer beschränkten Teilmenge A ⊂ R liegt
im Abschluss cl(A). Ist A ⊂ R beschränkt und abgeschlossen, so existiert folglich das Maximum max(A) und das Minimum min(A) von A.
Sei nun (xn ) eine beschränkte Folge reeller Zahlen. Dann ist die Menge der
Häufungspunke HP (xn ) nicht leer (Satz 2.19) und abgeschlossen (Satz 2.16).
Folglich existiert das Maximum max HP (xn ), d.h. ein größter Häufungspunkt
von (xn ), und das Minimum min HP (xn ), d.h. ein kleinster Häufungspunkt
von (xn ).
Definition 2.21. Sei (xn ) eine beschränkte Folge reeller Zahlen. Man nennt
den größten Häufungspunkt von (xn ) auch limes superior von (xn ) und bezeichnet ihn mit
lim sup xn := lim xn := max HP (xn ).
n→∞
Den kleinsten Häufungspunkt von (xn ) nennt man auch limes inferior von
(xn ) und bezeichnet ihn mit
lim inf xn := lim xn := min HP (xn ).
n→∞
2.3 Folgen in metrischen Räumen
65
Ist (xn ) nicht nach oben beschränkt, so setzen wir lim sup xn := +∞.
n→∞
Ist (xn ) nicht nach unten beschränkt, so setzen wir lim inf xn := −∞.
n→∞
Satz 2.21 Sei (xn ) eine beschränkte Folge reeller Zahlen. Dann gilt
lim xn = g ⇐⇒ lim sup xn = lim inf xn = g.
n→∞
n→∞
n→∞
Beweis. (1) Sei (xn ) gegen g ∈ R konvergent. Dann gilt HP (xn ) = {g} und
somit lim inf xn = lim inf xn = g.
n→∞
n→∞
(2) Sei umgekehrt lim sup xn = lim inf xn = g Dann gilt HP (xn ) = {g}, das
n→∞
n→∞
heißt jede konvergente Teilfolge von (xn ) konvergiert gegen g. Angenommen
(xn ) würde nicht gegen g konvergieren. Dann existiert ein ε > 0, so daß gilt
∀ n0 ∃ n ≥ n0 mit |xn − g| ≥ ε.
Wir konstruieren jetzt eine Teilfolge von (xn ) folgendermaßen:
n0 = 1 =⇒ ∃ n1 ≥ 1 : |xn1 − g| ≥ ε,
n0 = n1 + 1 =⇒ ∃ n2 > n1 : |xn2 − g| ≥ ε, . . . ,
n0 = nk−1 + 1 =⇒ ∃ nk > nk−1 : |xnk − g| ≥ ε, . . .
Dadurch erhalten wir eine Teilfolge (xnk ) von (xn ) mit |xnk − g| ≥ ε, die
ebenfalls beschänkt ist. Nach Satz von Bolzano–Weierstraß enthält sie eine
konvergente Teilfolge (xnki ), deren Grenzwert g ∗ nach Konstruktion von g
verschieden ist. Dies ist ein Widerspruch zu unserer Voraussetzung.
⊓
⊔
Anwendung: Die Eulerzahl e
Satz 2.22 Die Folge der reellen Zahlen (an ) mit
n
1
an := 1 +
n
ist in R konvergent.
Der Grenzwert der Folge (an ) heißt Eulerzahl e.
Beweis. Wir zeigen, dass (an ) eine monoton wachsende, nach oben beschränkte Folge ist. Nach Satz 2.20 existiert dann ein Grenzwert für (an ).
1. Beschränktheit von (an ): Aus der binomischen Formel folgt
n X
n k
n
1
1
=
.
·
an = 1 +
n
n
k
k=0
66
2 Metrische Räume
Wir schätzen den Term
n
k
·
1 k
n
für 1 ≤ k ≤ n ab:
k−Faktoren
}|
{
z
k
n
1
n(n − 1) · . . . · (n − (k − 1))
·
=
k
n
k! · n
· . . . · n}
| · n {z
k−mal
2
(k − 1)
1
1
· 1−
· ...· 1 −
·1· 1−
=
k!
n
n
n
{z
}
|
(∗)
≤1
1
≤
k!
Folglich gilt für alle n ∈ N
n
1
an = 1 +
n
1
1
1
1
≤ 1 + + + + ... +
1! 2! 3!
n!
1
1
1
1
+
+ ...+
= 1+ +
1 2·3 2·3·4
2 ·3 · ...· n
1
1
1
1
1
≤ 1 + 0 + 1 + 2 + 3 + . . . + n−1
2
2
2
2
2
n−1
X 1 k
= 1+
2
k=0
= 1+
1 − ( 12 )n
1
2
(geometrische Summe)
< 3.
2. Monotonie von (an ): Gleichung (∗) zeigt, dass
k k
n
1
n+1
1
·
<
.
·
k
n
n+1
k
Somit gilt an < an+1 für alle n ∈ N.
⊓
⊔
Satz 2.23 Die Folge der rellen Zahlen (bn ) mit
n
bn := 1 +
X 1
1
1
1
1
+ + + ...+
=
1! 2! 3!
n!
k!
k=0
konvergiert in R und es gilt
2.3 Folgen in metrischen Räumen
67
n
1
= e.
lim bn = lim 1 +
n→∞
n→∞
n
Beweis. Aus dem Beweis von Satz 2.22 folgt an ≤ bn < 3 für alle n ∈ N.
Folglich ist (bn ) eine nach oben beschränkte, monoton wachsende Folge. Nach
Satz 2.20 existiert deshalb ein Grenzwert von (bn ) und es gilt
e = lim an ≤ lim bn .
n→∞
n→∞
Andererseits gilt für m ≤ n wegen Formel (∗) aus dem Beweis von Satz 2.22
n
n k
X
1
n
1
an = 1 +
=
n
n
k
k=0
(1 − n1 ) · . . . · (1 − n−1
(1 − n1 ) (1 − n1 )(1 − n2 )
n )
+
+ ...+
= 1+1+
2!
3!
n!
(1 − n1 )
)
(1 − n1 ) · . . . · (1 − m−1
n
≥ 1+1+
+ ...+
.
2!
m!
Wir halten m fest und gehen in dieser Ungleichung mit n gegen +∞. Dann
folgt
1
1
e = lim an ≥ 1 + 1 + + . . . +
= bm
∀ m ∈ N.
n→∞
2!
m!
Deshalb gilt lim bm ≤ e und wir erhalten zusammenfassend e = lim bn . ⊓
⊔
m→∞
n→∞
Um die Eulerzahl genauer berechnen zu können, beweisen wir die folgende
Fehlerabschätzung.
Satz 2.24 Es sei
bn =
n
P
k=0
1
k!
. Dann gilt für jedes n ∈ N die folgende
Abschätzung für die Eulerzahl e:
1
n · n!
Beweis. Für festes n gilt e − bn = lim (bk − bn ) . Für k > n erhalten wir
bn < e < bn +
k→∞
1
1
+ ...+
(n + 1)!
k!
1
1
1
1
=
1+
+
+ ... +
(n + 1)!
(n + 2) (n + 2)(n + 3)
(n + 2) · . . . · k
1
1
1
1
1+
+
.
.
.
+
+
<
(n + 1)!
(n + 2) (n + 2)2
(n + 2)k−n−1
bk − bn =
=
<
1
1 − ( n+2
)k−n
1
·
1
(n + 1)!
)
1 − ( n+2
(geometrische Summe)
1
1
n+2
1
n(n + 2)
1
=
.
·
·
=
·
1
(n + 1)! 1 − n+2
(n + 1)! n + 1
n · n! (n + 1)2
68
2 Metrische Räume
Der Grenzübergang in dieser Ungleichung für k gegen +∞ liefert
e − bn ≤
1
n(n + 2)
1
<
·
n · n! (n + 1)2
n · n!
∀ n ∈ N.
⊓
⊔
Bemerkung: Mittels der Fehlerabschätzung aus Satz 2.24 kann man Näherungswerte für e angeben. Man erhält zum Beispiel für n = 10:
b10 =
10
X
1
= 2.7182815 . . .
k!
k=0
1
= 0.00000002 . . .
10 · 10!
Folglich ist 2.7182815 < e < 2.7182815 + 0.00000002 und somit
e ≈ 2.7182815 .
Als weitere Anwendung der Fehlerabschätzung beweisen wir
Satz 2.25 Die Eulerzahl e ist irrational.
Beweis. Angenommen e wäre eine rationale Zahl. Dann können wir e in der
Form e = pq für p, q ∈ N darstellen. Für q ∈ N gilt nach Satz 2.24
0 < e − bq <
1
.
q · q!
Daraus folgt 0 < e · q! − bq · q! < 1q . Da e = pq , ist e · q! ganzzahlig. Wegen
bq =
1
1
1
1
+ + + ...+
0! 1! 2!
q!
ist bq · q! ganzzahlig. Somit ist auch e · q! − bq · q! ganzzahlig. Das ist aber ein
Widerspruch zu 0 < e · q! − bq · q! < 1q < 1.
⊓
⊔
2.4 Vollständige metrische Räume
In diesem Abschnitt lernen wir eine Klasse von metrischen Räumen kennen,
in denen man die Konvergenz einer Folge überprüfen kann, ohne ihren Grenzwert zu kennen.
2.4 Vollständige metrische Räume
69
Definition 2.22. Sei (X, d) ein metrischer Raum. Eine Folge (xn ) in (X, d)
heißt Cauchy–Folge, wenn zu jedem ε > 0 ein (von ε abhängiges) n0 ∈ N
existiert, so dass d(xn , xm ) < ε für alle n, m ≥ n0 .
Satz 2.26 Jede konvergente Folge in einem metrischen Raum ist eine Cauchy–
Folge.
Beweis. Sei (xn ) eine gegen x konvergente Folge und ε > 0. Dann existiert
ein n0 ∈ N mit d(xn , x) < 2ε für alle n ≥ n0 . Für n, m ≥ n0 folgt dann aus
der Dreiecksungleichung
d(xn , xm ) ≤ d(xn , x) + d(x, xm ) <
ε ε
+ = ε.
2 2
Somit ist (xn ) eine Cauchy-Folge.
⊓
⊔
Bemerkung: Die Umkehrung gilt i.a. nicht. Wir betrachten dazu den metrischen Raum (X, d) mit X = (0, 1) ⊂ R und der Metrik d(x, y) = |x − y|. Sei
xn := n1 . Dann existiert für jedes ε > 0 ein n0 ∈ N mit
1
1 1
< ε ∀ n, m ≥ n0 .
d(xn , xm ) = − ≤
n m
min (n, m)
Die Folge (xn ) ist also eine Cauchy-Folge in (X, d). Sie konvergiert aber in
(X, d) nicht.
Satz 2.27 Jede Cauchy-Folge in einem metrischen Raum ist beschränkt.
Beweis. Sei ε = 1. Dann existiert ein n0 ∈ N so dass d(xn , xm ) < 1 für alle
n, m ≥ n0 . Insbesondere bedeutet das, dass xn ∈ K(xn0 , 1) für alle n ≥ n0 .
Wir setzen
r := max { d(xn0 , x1 ), d(xn0 , x2 ), . . . , d(xn0 , xn0 −1 ) } + 1.
Dann gilt xn ∈ K(xn0 , r) für alle n ∈ N. Folglich ist die Folge (xn ) beschränkt.
⊓
⊔
Definition 2.23. Ein metrischer Raum (X, d) heißt vollständig, wenn jede
Cauchy–Folge in (X, d) konvergiert.
Bemerkung: In einem vollständigen, metrischen Raum kann man also die
Konvergenz einer Folge untersuchen, ohne ihren Grenzwert zu kennen. Man
prüft dafür die Cauchy–Bedingung
∀ ε > 0 ∃ n0 ∈ N mit d(xn , xm ) < ε ∀ n, m ≥ n0 .
70
2 Metrische Räume
Satz 2.28 Der metrische Raum (R, d(x, y) = |x − y|) ist vollständig.
Beweis. Sei (xn ) eine Cauchy–Folge reeller Zahlen. Dann ist (xn ) beschränkt.
Nach dem Satz von Bolzano-Weierstraß existiert eine konvergente Teilfolge
(xnk ) von (xn ). Sei x = lim xnk und ε > 0. Dann existieren k0 , n0 ∈ N, so
dass
k→∞
|x − xnk | <
|xn − xm | <
ε
2
ε
2
∀ k ≥ k0
∀ n, m ≥ n0 .
Sei nun n ≥ n0 . Wir wählen ein k ≥ k0 mit nk ≥ n0 . Dann folgt aus der
Dreiecksungleichung
|xn − x| ≤ |xn − xnk | + |xnk − x| <
ε ε
+ <ε.
2 2
Also konvergiert die Folge (xn ) gegen x.
⊓
⊔
Bemerkung: Der metrische Raum der rationalen Zahlen Q (mit der Standardmetrik) ist nicht vollständig.
•
•
Wir betrachten die Folge rationaler Zahlen (xn ), definiert durch
2
1
xn +
∀ n ∈ N.
x0 := 1 und xn+1 :=
2
xn
√
Wir wissen, dass (xn ) in R gegen 2 konvergiert (siehe Übungsaufgabe
31). Die
√ Folge (xn ) ist also eine Cauchy–Folge in R und somit auch in Q.
Aber 2 ist keine rationale Zahl. Folglich konvergiert (xn ) nicht in Q.
n
Wir betrachten die Folge der rationalen Zahlen yn := 1 + n1 . (yn ) ist
eine Cauchyfolge in Q, konvergiert aber in Q nicht, da die Eulerzahl e
irrational ist.
Satz 2.29 Sind (X1 , d1 ), . . . , (Xk , dk ) vollständige metrische Räume, so ist
auch das Produkt (X, d) dieser metrischen Räume vollständig.
Beweis. Sei (xn := (xn1 , . . . , xnk )) eine Cauchy–Folge im Produktraum
(X = X1 × . . . × Xk , d) und ε > 0. Dann existiert ein n0 ∈ N, so dass
v
u k
uX
di (xni , xmi )2 < ε
∀ n, m ≥ n0 .
d(xn , xm ) = t
i=1
Daraus erhalten wir di (xni , xmi ) < ε für alle n, m ≥ n0 und jedes i ∈
{1, . . . , k}. Folglich sind die Folgen (xni )∞
n=1 Cauchy–Folgen in (Xi , di ) für
jedes i ∈ {1, . . . , k}. Da (Xi , di ) vollständige metrische Räume sind, konvergieren die Folgen (xni )∞
n=1 gegen ein yi ∈ Xi . Somit gilt nach Satz 2.13
2.4 Vollständige metrische Räume
71
lim xn = (y1 , . . . , yk ) ∈ X1 × . . . × Xk .
n→∞
⊓
⊔
Folgerung 2.2 Die metrischen Räume C, Rn und Cn (jeweils mit der Standardmetrik) sind vollständig.
Satz 2.30 Sei (X, d) ein vollständiger metrischer Raum und A ⊂ X eine
Teilmenge. Dann ist der metrische Raum (A, d|A×A ) genau dann vollständig,
wenn A abgeschlossen ist.
Beweis. (⇐=): Sei A abgeschlossen und (an ) eine Cauchy–Folge in (A, d) (Zur
Abkürzung bezeichnen wir die Einschränkung von d auf A × A ebenfalls mit
d). Dann ist (an ) auch Cauchy–Folge in (X, d), die, da (X, d) vollständig ist,
gegen ein x ∈ X konvergiert. Da A abgeschlossen ist, liegt jeder Grenzwert
einer Folge von Elementen aus A wieder in A. Somit ist x ∈ A, das heißt (an )
konvergiert in A. Folglich ist (A, d) ein vollständiger metrischer Raum.
(=⇒): Sei nun (A, d) vollständig. Wir zeigen, dass dann A abgeschlossen ist.
Sei x ∈ cl(A). Dann existiert eine Folge an ∈ A mit lim an = x. Damit ist
n→∞
(an ) eine Cauchy–Folge in (A, d) und somit in A konvergent. Das heißt, x liegt
in A. Folglich gilt cl(A) ⊂ A. Die Teilmenge A ⊂ X ist also abgeschlossen. ⊓
⊔
Folgerung 2.3 Jede abgeschlossene Teilmenge A ⊂ Rn bzw. A ⊂ Cn ist ein
vollständiger metrischer Raum (mit Standardmetrik).
Wir wissen, dass nicht jeder metrische Raum vollständig ist. Man kann aber
jeden metrischen Raum vervollständigen. Abschließend behandeln wir diese
Vervollständigungsprozedur, die uns zeigt, dass man jeden metrischen Raum
als dichten Teilraum eines gewissen vollständigen metrischen Raumes auffassen kann. Diese Prozedur wird in der Analysis vielfältig angewendet.
Satz 2.31 (Vervollständigung metrischer Räume)
Zu jedem metrischen Raum (X, d) gibt es einen vollständigen metrischen
e d)
˜ und eine Abbildung ϕ : X −→ X,
e für die gilt:
Raum (X,
˜ ist eine Isometrie.
1. ϕ : (X, d) −→ (ϕ(X), d)
e
2. ϕ(X) ⊂ X ist dicht.
˜ ist bis auf Isometrie eindeutig bestimmt, d.h. ist (X ′ , d′ ) ein weiterer
e d)
(X,
vollständiger metrischer Raum und ϕ′ : X −→ X ′ eine Abbildung mit den
˜ −→ (X ′ , d′ )
e d)
Eigenschaften 1. und 2., dann existiert eine Isometrie F : (X,
′
so dass F ◦ ϕ = ϕ .
72
2 Metrische Räume
˜ aus Satz 2.31 heißt Vervollständie d)
Definition 2.24. Der metrische Raum (X,
gung von (X, d).
Beweis. Den Beweis führen wir in mehreren Schritten.
e
1. Schritt: Definition der Menge X.
Dazu betrachten wir die Menge CF(X, d) der Cauchy-Folgen des metrischen
Raumes (X, d). Zwei Cauchy-Folgen (xn ), (yn ) ∈ CF(X, d) bezeichnen wir als
äquivalent (symbolisch: (xn ) ∼ (yn )), wenn
d(xn , yn ) → 0
für
n → +∞.
Dies definiert eine Äquivalenzrelation auf dem Raum CF(X, d).
Aus d(xn , xn ) = 0 und d(xn , yn ) = d(yn , xn ) ergeben sich unmittelbar die
Reflexität und die Symmetrie der Relation ∼. Aus der Dreiecksungleichung
0 ≤ d(xn , zn ) ≤ d(xn , yn ) + d(yn , zn )
folgt, dass mit d(xn , yn ) → 0 und d(yn , zn ) → 0 stets d(xn , zn ) → 0 gilt. Dies
e sei die Menge der Äquivalenzklaszeigt die Transitivität von ∼. Die Menge X
sen von Cauchy-Folgen bzgl. der Relation ∼:
e := CF(X, d)/ ∼ .
X
Die Äquivalenzklasse der Cauchy-Folge (xn ) ∈ CF(X, d) bezeichnen wir mit
[(xn )].
e
2. Schritt: Definition des Abstandes d˜ auf X.
Seien (xn ), (yn ) ∈ CF(X, d) zwei Cauchy-Folgen von (X, d). Nach der Vierecksungleichung gilt
|d(xm , ym ) − d(xn , yn )| ≤ d(xm , xn ) + d(ym , yn ) .
Folglich ist die Folge der reellen Zahlen (d(xn , yn )) eine Cauchy-Folge im metrischen Raum R. Da R vollständig ist, konvergiert diese Folge, d.h. es existiert
lim d(xn , yn ) . Wir definieren für zwei Elemente ξ = [(xn )] und η = [(yn )]
n→∞
e den Abstand
von X
˜ η) := lim d(xn , yn ) .
d(ξ,
n→∞
Diese Definition ist korrekt, d.h. sie hängt nicht von der Wahl der Repräsentanten (xn ) bzw. (yn ) in den Äquivalenzklassen ξ bzw. η ab. Sind nämlich
(xn ) ∼ (x′n ) und (yn ) ∼ (yn′ ), so gilt nach Vierecksungleichung
|d(x′n , yn′ ) − d(xn , yn )| ≤ d(x′n , xn ) + d(yn′ , yn ) .
Benutzt man nun die Definition von ∼, so folgt
lim d(xn , yn ) = lim d(x′n , yn′ ) .
n→∞
n→∞
2.4 Vollständige metrische Räume
73
e ×X
e → R ist ein Abstand auf X:
e Die Symmetrie und die
Die Abbildung d˜ : X
˜
Positivität von d sind offensichtlich wegen der analogen Eigenschaften von d.
Die Äquivalenzrelation ∼ auf CF(X, d) ist gerade so definiert, dass
˜ η) = 0 ⇐⇒ lim d(xn , yn ) = 0 ⇐⇒ (xn ) ∼ (yn ) ⇐⇒ ξ = η.
d(ξ,
n→∞
Die Dreiecksungleichung folgt ebenfalls aus derjenigen von d:
Seien ξ = [(xn )], η = [(yn )], ρ := [(wn )]. Dann gilt
˜ η) = lim d(xn , yn )
d(ξ,
n→∞
≤ lim (d(xn , wn ) + d(wn , yn ))
n→∞
˜ ρ) + d(ρ,
˜ η) .
= d(ξ,
˜ definiert.
e d)
Damit haben wir einen metrischen Raum (X,
3. Schritt: Definition der Abbildung ϕ:
Sei x ∈ X. Wir betrachten die konstante Folge (xn := x) in X und bezeichnen
˜ Die Abbildung ϕ
e ihre Äquivalenzklasse x̃ := [(xn := x)] in (X,
e d).
mit x̃ ∈ X
definieren wir durch
e
ϕ : X −→ X
x 7−→ x̃
Die Abbildung ϕ : X −→ ϕ(X) ist offensichtlich bijektiv und es gilt nach
Definition von d˜
˜
˜ ỹ) = lim d(x, y) = d(x, y).
d(ϕ(x),
ϕ(y)) = d(x̃,
n→∞
˜ von (X,
˜
e d).
(X, d) ist also isometrisch zum Teilraum (ϕ(X), d)
˜ ist vollständig.
e d)
4. Schritt: Der metrische Raum (X,
∞
˜ Wir zeigen, dass (ξk ) in
e d).
Sei (ξk )k=1 eine beliebige Cauchy-Folge aus (X,
˜ konvergiert. Zunächst wählen wir in jeder Äquivalenzklasse ξk einen
e d)
(X,
Repräsentanten (xkn )∞
n=1 ∈ CF(X, d). In jeder dieser Cauchy-Folgen wählen
wir dann ein Folgenglied xknk ∈ X so, dass
d(xkn , xknk ) <
1
k
∀ n > nk .
(∗)
Wir zeigen nun, dass die Folge (xknk )∞
k=1 eine Cauchy-Folge in (X, d) ist. Aus
˜ der Dreiecksungleichung und (∗)
der Isometrie zwischen (X, d) und (ϕ(X), d),
folgt
˜ kn , x̃k′ n ′ )
d(xknk , xk′ nk′ ) = d(x̃
k
k
˜ k′ , x̃k′ n ′ )
˜ kn , ξk ) + d(ξ
˜ k , ξk′ ) + d(ξ
≤ d(x̃
k
k
˜ k , ξk′ ) + lim d(xk′ n , xk′ n ′ )
= lim d(xknk xkn ) + d(ξ
k
n→∞
1
˜ k , ξk′ ) + 1 .
< + d(ξ
k
k′
n→∞
74
2 Metrische Räume
e ˜
Da (ξk )∞
k=1 eine Cauchy-Folge in (X, d) ist, existiert zu vorgegebenem ε > 0
ein Index k0 ∈ N, so dass
˜ k , ξk′ ) , 1 , 1 < ε
d(ξ
k k′
6
Folglich ist
d(xknk , xk′ nk′ ) <
ε
2
∀ k, k ′ ≥ k0 .
∀ k, k ′ ≥ k0 .
(∗∗)
und somit (xknk )∞
k=1 eine Cauchy-Folge in (X, d). Die Äquivalenzklasse dieser
˜ gegen ξ konvergiert.
e d)
Folge sei ξ := [(xknk )]. Wir zeigen, dass (ξk ) in (X,
Aus (∗) und (∗∗) folgt
˜ k , ξ) ≤ d(ξ
˜ k , x̃kn ) + d(x̃
˜ kn , ξ)
d(ξ
k
k
= lim d(xkn , xknk ) + ′lim d(xknk , xk′ nk′ )
n→∞
k →∞
∀ k > k0 .
< ε
e ˜
e
Folglich konvergiert die Cauchy-Folge (ξk )∞
k=1 im Raum (X, d) gegen ξ ∈ X.
e ist.
5. Schritt: Wir zeigen, dass die Menge ϕ(X) dicht in X
∞
e
Sei ξ ∈ X ein beliebiges Element und (xn )n=1 eine Cauchy-Folge in der Äquivalenzklasse ξ. Wir betrachten die entsprechende Folge (x̃n ) in ϕ(X). Für
ε > 0 existiert ein n0 ∈ N mit
˜ n , ξ) = lim d(xn , xm ) < ε
d(x̃
m→∞
∀ n > n0 .
e ist bewieFolglich konvergiert (x̃n ) gegen ξ und die Dichtheit von ϕ(X) in X
sen.
˜ ist bis auf Isometrie eindeutig bestimmt:
e d)
6. Schritt: (X,
Sei (X ′ , d′ ) ein weiterer vollständiger metrischer Raum und ϕ′ : X −→ X ′ eine
Abbildung, so dass ϕ′ : (X, d) −→ (ϕ′ (X), d′ ) eine Isometrie und ϕ′ (X) ⊂ X ′
dicht ist. Dann definiert die Abbildung
f : ϕ(X) −→ ϕ′ (X)
ϕ(x) 7−→ ϕ′ (x)
˜ und
offensichtlich eine Isometrie zwischen den metrischen Räumen (ϕ(X), d)
′
′
e
˜
(ϕ (X), d ). Wir erweitern f zu einer Isometrie F zwischen (X, d) und (X ′ , d′ ):
e und ξ = lim x̃n für eine Folge (x̃n ) aus ϕ(X). Da (x̃n ) eine CauchySei ξ ∈ X
n→∞
Folge in ϕ(X) ist, ist auch ihr Bild (f (x̃n )) eine Cauchy-Folge in ϕ′ (X). Sei
ξ ′ := lim f (x̃n ) ∈ X ′ . ξ ′ ist korrekt definiert, d.h. unabhängig von der Wahl
n→∞
der Folge (x̃n ). Sei nämlich (ỹn ) eine weitere Folge mit ξ = lim ỹn , so gilt
n→∞
˜ n , ỹn ) = d′ (f (x̃n ), f (ỹn )) → 0 , also lim f (ỹn ) = ξ ′ . Wir erhalten somit
d(x̃
n→∞
eine Fortsetzung von f zu einer Abbildung
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
e −→ X ′
F :X
75
ξ = lim x̃n 7−→ ξ ′ = lim f (x̃n ) .
n→∞
n→∞
e und η = lim ỹn ∈ X
e gilt
F ist offensichtlich bijektiv. Für ξ = lim x̃n ∈ X
n→∞
˜ η) = lim d(x̃
˜ n , ỹn ) = lim d′ (f (x̃n ), f (ỹn )) = d′ (ξ ′ , η ′ ) = d′ (F (ξ), F (η)).
d(ξ,
n→∞
n→∞
˜ und (X ′ , d′ ). Aus
e d)
Die Abbildung F ist folglich eine Isometrie zwischen (X,
′
der Definition von F folgt sofort, dass F ◦ ϕ = ϕ . Damit ist Satz 2.31
vollständig bewiesen.
⊓
⊔
Bemerkung: Eine Möglichkeit zur Konstruktion der reellen Zahlen aus den
rationalen Zahlen besteht darin, die in Satz 2.31 beschriebene Vervollständigungsprozedur für die Menge der rationalen Zahlen Q mit dem Abstand
e erfüllt dann die
d(x, y) = |x − y| auszuführen. Die entstehende Menge Q
Axiome der reellen Zahlen aus Kapitel 1.
2.5 Kompakte und folgenkompakte Teilmengen
metrischer Räume
Definition 2.25. Eine Teilmenge A eines metrischen Raumes (X, d) heißt
folgenkompakt, falls jede Folge (an ) von Punkten aus A einen Häufungspunkt
in A hat, d.h. eine in A konvergente Teilfolge besitzt.
Ist X ⊂ X folgenkompakt, so nennt man den metrischen Raum (X, d) folgenkompakt.
Bemerkung: Sei (X, d) ein metrischer Raum und A ⊂ X. Dann ist A ⊂ X
genau dann folgenkompakt, wenn der metrische Raum (A, d|A×A ) folgenkompakt ist.
Satz 2.32 Im metrischen Raum R (mit Standardmetrik) ist jede beschränkte
und abgeschlossene Menge folgenkompakt.
Beweis. Sei A ⊂ R eine abgeschlossene und beschränkte Menge und (an )
eine Folge in A. Dann ist (an ) ebenfalls beschränkt. Nach dem Satz von
Bolzano-Weierstraß existiert ein Häufungspunkt von (an ). Wir zeigen, dass jeder Häufungspunkt von (an ) in A liegt. Sei x ∈ HP (an ) und (anj ) eine gegen
x ∈ R konvergente Teilfolge von (an ). Dann gilt x = limsn→+∞ an ∈ cl(A).
Da A abgeschlossen ist, ist A = cl(A), also liegt x in A. Die Menge A ist
demnach folgenkompakt.
⊓
⊔
76
2 Metrische Räume
Beispiel: Die abgeschlossenen Intervalle [a, b] ⊂ R sind folgenkompakt.
Satz 2.33 Sei (X, d) das Produkt der metrischen Räume (X1 , d1 ), . . . , (Xk , dk )
und seien Aj ⊂ Xj folgenkompakte Mengen, j = 1, . . . k. Dann ist die Produktmenge A := A1 × A2 × . . . × Ak folgenkompakt in (X, d).
Beweis. Den Beweis überlassen wir dem Leser als Übungsaufgabe (Aufgabe
36).
⊓
⊔
Beispiel: Die ’Würfel’ W := [a1 , b1 ] × [a2 , b2 ] × . . . × [ak , bk ] ⊂ Rk sind folgenkompakte Teilmengen des metrischen Raumes Rk .
Satz 2.34 Sei (X, d) ein metrischer Raum und B ⊂ X folgenkompakt. Ist
A ⊂ X abgeschlossen und A ⊂ B, so ist A ebenfalls folgenkompakt.
Beweis. Sei (an ) eine beliebige Folge in A. Dann ist (an ) auch Folge in B und
besitzt, da B folgenkompakt ist, eine in B konvergente Teilfolge (anj ). Sei
b = lim anj ∈ cl(A). Da A abgeschlossen ist, ist cl(A) = A und somit b ∈ A.
j→∞
Also enthält (an ) eine in A konvergente Teilfolge. Damit ist A folgenkompakt.
⊓
⊔
Satz 2.35 Jede folgenkompakte Teilmenge eines metrischen Raumes (X, d)
ist beschränkt und abgeschlossen.
Beweis. Sei A ⊂ X folgenkompakt.
(1) Angenommen A wäre nicht abgeschlossen. Dann existiert ein Punkt
x ∈ cl(A) \ A. Sei (an ) eine Folge in A, die gegen x konvergiert. Dann konvergiert jede Teilfolge von (an ) ebenfalls gegen x 6∈ A, woraus HP (an ) ∩ A = ∅
folgt. Dies widerspricht der Vorraussetzung, dass A folgenkompakt ist.
(2) Angenommen A wäre nicht beschränkt. Wir fixieren einen Punkt x0 ∈ X.
Dann gilt A 6⊂ K(x0 , n) für alle n ∈ N. Folglich existiert eine Folge (an ) in
A, so dass d(x0 , an ) > n für alle n ∈ N. Damit ist jede Teilfolge von (an )
unbeschränkt und kann folglich nicht konvergieren, d.h. HP (an ) = ∅. Dies
widerspricht der Vorraussetzung, dass A folgenkompakt ist.
⊓
⊔
Bemerkung: Die Umkehrung von Satz 2.35 gilt im allgemeinen nicht. Um
das einzusehen, betrachten wir eine unendliche Menge X mit der diskreten
Metrik
0
x=y
d(x, y) =
1
x 6= y.
Jede Teilmenge A ⊂ X ist abgeschlossen und beschränkt. Eine abzählbar unendliche Teilmenge A = {a1 , a2 , . . . , } ⊂ X ist aber nicht folgenkompakt, da
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
77
eine Folge in (X, d) genau dann konvergiert, wenn sie ab einem bestimmten
Index konstant ist.
Satz 2.36 Eine Teilmenge im metrischen Raum Rn (mit Standardmetrik) ist
genau dann folgenkompakt, wenn sie abgeschlossen und beschränkt ist.
Beweis. Wegen Satz 2.35 genügt es zu zeigen, dass eine abgeschlossene, beschränkte Teilmenge A ⊂ Rn folgenkompakt ist. Da A beschränkt ist, existiert
ein Würfel W = [a1 , b1 ] × [a2 , b2 ] × . . . × [an , bn ] ⊂ Rn , der A enthält. W ist
folgenkompakt und A abgeschlossen, folglich ist A nach Satz 2.34 folgenkompakt.
⊓
⊔
Beispiele:
•
Die n–dimensionale Sphäre vom Radius r > 0
Srn := {x ∈ Rn+1 | kxk = r} ⊂ Rn+1
•
•
ist folgenkompakt.
Der n–dimensionale Torus T n := S 1 × . . . × S 1 ⊂ R2n ist folgenkompakt.
Die abgeschlossene Kugel Drn = {x ∈ Rn | kxk ≤ r} ⊂ Rn ist folgenkompakt.
Wir untersuchen nun weitere Eigenschaften folgenkompakter metrischer Räume.
Definition 2.26. Sei (X, d) ein metrischer Raum und A ⊂ X. A heißt total
beschränkt, falls es zu jedem ε > 0 endlich viele Punkte x1 , x2 , . . . , xk ∈ X
k
S
K(xi , ε).
gibt mit A ⊂
i=1
Ist die gesamte Menge X total beschränkt, so sagt man, dass der metrische
Raum (X, d) total beschränkt ist.
Satz 2.37 Jeder folgenkompakte metrische Raum ist total beschränkt.
Beweis. Sei (X, d) folgenkompakt. Angenommen (X, d) wäre nicht total beschränkt. Dann existiert ein ε0 > 0, so dass für alle k ∈ N und für alle
x1 , . . . , xk ∈ X
K(x1 , ε0 ) ∪ . . . ∪ K(xk , ε0 ) 6= X.
Wir betrachten zunächst k = 1 und x1 ∈ X beliebig. Dann ist K(x1 , ε0 ) 6= X.
Wir wählen einen Punkt x2 ∈ X \ K(x1 , ε0 ). Dann gilt d(x1 , x2 ) ≥ ε0 > 0.
Da K(x1 , ε0 ) ∪ K(x2 , ε0 ) 6= X, existiert ein x3 ∈ X \ (K(x1 , ε0 ) ∪ K(x2 , ε0 )).
Also gilt d(x3 , x1 ) ≥ ε0 > 0 und d(x3 , x2 ) ≥ ε0 > 0 . Wir führen dieses
Verfahren fort und erhalten eine Folge von Punkten x1 , x2 , x3 , . . . in X mit
der Eigenschaft d(xi , xj ) ≥ ε0 > 0 für alle i 6= j. Diese Folge kann aber keine
konvergente Teilfolge enthalten. Dies widerspricht der Folgenkompaktheit von
(X, d)
⊓
⊔
78
2 Metrische Räume
Definition 2.27. Ein metrischer Raum heißt separabel, falls eine abzählbare,
dichte Teilmenge A ⊂ X existiert.
Beispiele: R, C, Rn und Cn sind separable metrische Räume, denn Q ⊂ R,
(Q + iQ) ⊂ C, Qn ⊂ Rn und (Q + iQ)n ⊂ Cn sind jeweils dichte und abzählbare Teilmengen.
Satz 2.38 Jeder folgenkompakte metrische Raum (X, d) ist separabel.
Beweis. Sei (X, d) folgenkompakt. Nach Satz 2.37 ist (X, d) total beschränkt.
Wir verschaffen uns dadurch abzählbar viele Punkte von X:
ε=1
ε=
ε=
=⇒ ∃ x11 , . . . , x1k1 ∈ X : X =
k1
S
i=1
k2
S
1
2
=⇒ ∃ x21 , . . . , x2k2 ∈ X : X =
1
n
=⇒ ∃ xn1 , . . . , xnkn ∈ X : X =
Wir betrachten die abzählbare Menge A :=
∞ k
S
Sn
i=1
k
Sn
K(x1i , 1).
K(x2i , 21 )
i=1
...
K(xni , n1 ).
{xni } ⊂ X und zeigen, dass
n=1 i=1
A dicht in X ist. Wir müssen dazu zeigen, dass jedes x ∈ X der Grenzwert
einer Folge von Elementen aus A ist. Sei x ∈ X. Für jedes n ∈ N gilt x ∈
k
Sn
K(xni , n1 ). Demnach existiert ein in ∈ {1, . . . , kn } so dass x ∈ K(xnin , n1 ).
i=1
Wir setzen an := xnin ∈ A, und erhalten dadurch eine Folge (an ) in A mit
⊓
⊔
d(an , x) < n1 . Die Folge (an ) konvergiert somit gegen x.
Satz 2.39 (Satz von Cantor für folgenkompakte metrische Räume)
Sei (X, d) ein folgenkompakter metrischer Raum und (Fn ) eine Familie abgeschlossener Teilmengen von (X, d) mit F1 ⊃ F2 ⊃ F3 ⊃ . . . . Dann gilt
∞
\
n=1
Fn 6= ∅.
Beweis. Wir wählen aus jeder Menge Fn einen Punkt xn ∈ Fn . Da (X, d)
folgenkompakt ist, existiert eine Teilfolge (xnk ) von (xn ), die gegen einen
∞
T
Punkt x ∈ X konvergiert. Wir zeigen, dass x ∈
Fn .
n=1
Sei m ∈ N fixiert. Dann gilt xn ∈ Fm für alle n ≥ m. Insbesondere exisiert
ein km ∈ N so dass xnk ∈ Fm für alle k ≥ km . Daraus folgt wegen der
Abgeschlossenheit von Fm
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
79
x = lim xnk ∈ cl(Fm ) = Fm
k→∞
und somit x ∈
∞
T
⊓
⊔
Fm .
m=1
Bemerkung: Im Unterschied zum Satz von Cantor für vollständige metrische Räume (Übungsaufgabe 35) benötigt man nicht die Voraussetzung
∞
T
diam(Fn ) → 0. Die Menge
Fn kann aus mehreren Punkten bestehen.
n=1
Beispiel (Cantorsches Diskontinuum): Wir definieren die folgende Familie
von Teilmengen aus R
1 2
7 8
1 2
C0 := [0, 1], C1 := C0 \ ( , ), C2 := C1 \ (( , ) ∪ ( , )), . . .
3 3
9 9
9 9
(Es werden also immer die offenen, mittleren Drittel aus den abgeschlossenen
Intervallen entfernt). Damit sind die Voraussetzungen des Satzes 2.39 erfüllt:
X = [0, 1] ist folgenkompakt, C0 ⊃ C1 ⊃ C2 ⊃ . . . und alle Mengen Cn sind
abgeschlossen. (Der Durchmesser jeder Menge Cn ist 1). Wir betrachten
C :=
∞
\
n=1
Cn 6= ∅.
C wird das Cantorsche Diskontinuum genannt. C ist folgenkompakt, da C
beschränkt und als Durchschnitt abgeschlossener Mengen selbst abgeschlossen ist.
Nachdem wir bisher folgenkompakte Teilmengen betrachtet haben, die durch
spezielle Eigenschaften von Folgen definiert wurden, betrachten wir im Folgenden einen Kompaktheitsbegriff, der mit Hilfe von offenen Mengen definiert
wird.
Definition 2.28. Sei (X, d) ein metrischer Raum und A ⊂ X eine Teilmenge.
Eine Familie U = {Ui }i∈I von Teilmengen von X heißt offene Überdeckung
von A, falls die folgenden beiden Eigenschaften gelten
(1) Ui ⊂ S
X ist offen für alle i ∈ I.
Ui .
(2) A ⊂
i∈I
Eine Teilmenge Û ⊂ U der Überdeckung U heißt Teilüberdeckung, wenn
[
A⊂
U.
U∈Û
Eine Teilüberdeckung heißt endlich, wenn sie endlich viele Elemente enthält.
80
2 Metrische Räume
Definition 2.29. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X
heißt kompakt, wenn man aus jeder offenen Überdeckung von A eine endliche
Teilüberdeckung auswählen kann.
Ist die gesamte Menge X kompakt, so sagt man, dass der metrische Raum
(X, d) kompakt ist.
Es gilt wiederum, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann kompakt ist, wenn der metrische Raum (A, d|A×A ) kompakt ist.
Satz 2.40 Ein metrischer Raum (X, d) ist genau dann kompakt, wenn er
folgenkompakt ist.
Beweis. 1. (X, d) kompakt =⇒ (X, d) folgenkompakt:
Sei (X, d) kompakt und (xn ) eine Folge in X. Wir betrachten die Menge
Fn := cl({xn+1 , xn+2 , . . .}). Fn ist abgeschlossen für alle n ∈ N und es gilt
. . . ⊃ Fn ⊃ Fn+1 ⊃ Fn+2 ⊃ . . .
Dann ist Un := X \ Fn offen und
. . . ⊂ Un ⊂ Un+1 ⊂ Un+2 ⊂ . . .
(∗)
Im Folgenden zeigen wir, dass U := {Un } keine Überdeckung von X ist. Zum
Beweis nehmen wir an, dass U eine Überdeckung von X wäre. Da X kompakt
ist, würde eine endliche Teilüberdeckung existieren mit
X = Un1 ∪ . . . ∪ Unk (n1 < n2 < . . . < nk ).
Wegen (∗) folgt X = Unk = X \ Fnk . Also ist Fnk leer. Dies steht aber im
Widerspruch zur Definition der Mengen Fn . Die Annahme war also falsch, das
heißt U = {Un } ist keine Überdeckung von X. Es folgt
∞
[
n=1
Also gilt
∞
T
n=1
Un =
∞
[
(X \ Fn ) = X \ (
n=1
Fn 6= ∅. Sei nun x ∈
∞
\
n=1
∞
T
n=1
Fn ) 6= X.
Fn . Dann ist x ∈ Fn für alle n ∈ N. Wir
konstruieren uns nun eine gegen x konvergente Teilfolge:
x ∈ F1 = cl({x1 , x2 , . . .})
⇒ ∃ xn1 : d(x, xn1 ) < 1
x ∈ Fn1 = cl({xn1 +1 , xn1 +2 , . . .}) ⇒ ∃ xn2 : d(x, xn2 ) < 21 , n1 < n2
x ∈ Fn2 = cl({xn2 +1 , xn2 +2 , . . .}) ⇒ ∃ xn3 : d(x, xn3 ) < 31 , n2 < n3 . . .
∞
Folgern wir so weiter, so erhalten wir eine Teilfolge (xnk )∞
k=1 von (xn )n=1 mit
1
d(x, xnk ) < k . Demnach konvergiert (xnk ) gegen x ∈ X. Folglich ist (X, d)
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
81
folgenkompakt.
(2) (X, d) folgenkompakt =⇒ (X, d) kompakt:
Sei (X, d) folgenkompakt und U eine offene Überdeckung von X. Wir müssen
zeigen, dass U eine endliche Teilüberdeckung besitzt.
(a) Wir zeigen zunächst, dass U eine abzählbare Teilüberdeckung enthält.
Nach Satz 2.38 ist (X, d) separabel. Folglich existiert eine abzählbare Teilmenge A ⊂ X mit cl(A) = X. Wir definieren die Menge
Λ = {(a, q) ∈ A × Q+ | ∃ U ∈ U : K(a, q) ⊂ U } ⊂ A × Q+ .
Λ ist abzählbar, da A × Q+ abzählbar ist. Ist (a, q) ∈ Λ, so existiert ein U ∈ U
mit K(a, q) ⊂ U . Wir wählen eine dieser Mengen U und bezeichnen sie mit
U (a, q). Dann ist
U ∗ := {U (a, q)}(a,q)∈Λ
eine abzählbare Teilfamilie von U. Wir zeigen nun, dass U ∗ eine Überdeckung
von X ist, das heißt dass
[
U (a, q).
X=
(a,q)∈Λ
Sei x ∈ X. Da U eine Überdeckung von X ist, existiert ein U0 ∈ U mit
x ∈ U0 . Da U0 offen ist, gibt es eine Kugel K(x, ε0 ) ⊂ U0 . Da A ⊂ X dicht
liegt, enthält X \ A keine Kugel. Insbesondere liegt die Kugel K(x, ε30 ) nicht
vollständig in X \ A. Somit existiert ein a ∈ A ∩ K(x, ε30 ). Wir wählen eine
rationale Zahl q ∈ Q+ mit ε30 < q < 32 · ε0 . Wir zeigen nun, dass x ∈ U (a, q).
Wegen d(x, a) < ε30 < q folgt x ∈ K(a, q). Sei y ∈ K(a, q) ein beliebiges
Element dieser Kugel. Dann erhalten wir
d(x, y) ≤ d(x, a) + d(a, y) <
ε0
ε0
2
+q <
+ · ε0 < ε0 .
3
3
3
Demnach gilt y ∈ K(x, ε0 ) und somit K(a, q) ⊂ K(x, ε0 ) ⊂ U0 .
Die Definition von Λ besagt dann, dass
S (a, q) zu Λ gehört. Folglich ist
x ∈ K(a, q) ⊂ U (a, q). Damit ist X =
U (a, q) bewiesen.
(a,q)∈Λ
(b) Es bleibt zu zeigen, dass man in jeder abzählbaren, offenen Überdeckung
eine endliche Teilüberdeckung findet.
Sei U = {U1 , U2 , . . .} eine abzählbare, offene Überdeckung von X. Wir betrachten
Fn = X \ (U1 ∪ . . . ∪ Un ) .
{z
}
|
offen
Dann ist F1 ⊃ F2 ⊃ . . . eine absteigende Folge abgeschlossener Mengen. Wir
zeigen nun, dass ein n ∈ N existiert mit Fn = ∅. Wäre keine dieser Mengen
Fn leer, so hätte man nach dem Satz 2.39
82
2 Metrische Räume
∞
\
n=1
Fn 6= ∅.
Wegen
∅ 6=
∞
\
n=1
Fn =
∞
\
(X \
n=1
n
[
i=1
Ui ) = X \ (
∞ [
n
[
n=1 i=1
Ui ) = X \ (
∞
[
Un )
n=1
wäre U dann keine Überdeckung von X, was im Widerspruch zur Voraussetzung steht. Folglich ist Fn = ∅ für ein n ∈ N und es gilt X = U1 ∪ . . . ∪ Un .
Wir haben somit eine endliche Teilüberdeckung in U gefunden, das heißt (X, d)
ist kompakt.
⊓
⊔
Folgerung 2.4 Eine Teilmenge eines metrischen Raumes ist genau dann
kompakt, wenn sie folgenkompakt ist. Insbesondere gelten für kompakte Teilmengen metrischer Räume die folgenden Eigenschaften:
1.
2.
3.
4.
Jede kompakte Menge ist total beschränkt, insbesondere beschränkt.
Jede kompakte Menge ist abgeschlossen.
Jede abgeschlossene Teilmenge einer kompakten Menge ist selbst kompakt.
Eine Teilmenge im metrischen Raum Rn ist genau dann kompakt, wenn
sie beschränkt und abgeschlossen ist.
Weitere Eigenschaften kompakter Mengen findet man in den Übungsaufgaben.
Folgerung 2.5 (Klassischer Überdeckungssatz von Heine/Borel)
Sei [a, b] ⊂ R ein abgeschlossenes Intervall und U = {(ai , bi )}i∈I eine Familie
(beliebig vieler) offener Intervalle, deren Vereinigung [a, b] überdeckt:
[
[a, b] ⊂
(ai , bi ).
i∈I
Dann existieren endlich viele Intervalle (ai1 , bi1 ), . . . , (ain , bin ) ∈ U, die [a, b]
bereits überdecken, dh.
n
[
(aij , bij ).
[a, b] ⊂
j=1
Wir wissen, dass eine Teilmenge im Rn genau dann kompakt ist, wenn sie
beschränkt und abgeschlossen ist. Eine ähnliche Charakterisierung kompakter
Mengen in allgemeinen metrischen Räumen ist nicht möglich. Man hat aber
für vollständige metrische Räume das folgende Kriterium für Kompaktheit.
Satz 2.41 Sei (X, d) ein vollständiger metrischer Raum. Eine Teilmenge in
(X, d) ist genau dann kompakt, wenn sie abgeschlossen und total beschränkt
ist.
2.5 Kompakte und folgenkompakte Teilmengen metrischer Räume
83
Beweis. =⇒ folgt aus den Sätzen 2.40, 2.37 und 2.34
⇐= findet man z.B. im Buch von Dieudonné: Grundzüge der modernen Analysis, Bd. 1.
⊓
⊔
Abschließend sei noch ein Satz erwähnt, der oft als technisches Hilfsmittel bei
Beweisen und Konstruktionen in der Topologie benutzt wird.
Satz 2.42 (Die Lebesgue-Zahl einer Überdeckung)
Sei (X, d) ein metrischer Raum, A ⊂ X eine kompakte Teilmenge und U eine
offene Überdeckung von A. Dann existiert eine reelle Zahl ℓ(U) > 0, so dass
folgendes gilt: Jede Teilmenge B ⊂ A, deren Durchmesser kleiner als ℓ(U) ist,
liegt vollständig in einer der offenen Mengen U ∈ U.
ℓ(U) heißt Lebesgue-Zahl der Überdeckung U.
Beweis. Das überlassen wir dem Leser als Übungsaufgabe.
⊓
⊔
Bemerkung: Wenn man sich den Satz 2.40 ansieht, fragt man sich natürlich,
warum man denn überhaupt zwei verschiedene Kompaktheitsbegriffe definiert, wenn diese dann doch übereinstimmen. Ein Grund dafür ist, dass man
die kompakten Mengen dadurch auf zwei völlig verschiedene Weisen charakterieren kann (einmal durch Eigenschaften von Folgen, zum anderen durch
Eigenschaften offener Überdeckungen). Beide Varianten haben zum Nachweis
von Kompaktheit in verschiedenen Situationen jeweils Vorteile.
Der tieferliegende Grund ist aber der folgende: Die metrischen Räume sind
eine spezielle Klasse der sogenannten topologischen Räume, die wir hier kurz
ergänzend einführen wollen:
Sei X eine nichtleere Menge. Eine Topologie auf X ist eine Familie T von
Teilmengen von X, die folgende Eigenschaften hat:
1. X, ∅ ∈ T .
2. Die Vereinigung beliebig vieler Teilmengen aus T ist ebenfalls in T .
3. Der Durchschnitt endlich vieler Teilmengen aus T ist ebenfalls in T .
Das Paar (X, T ) nennt man dann topologischen Raum. Die Elemente in T
heißen die offenen Mengen des topologischen Raumes (X, T ).
Ist (X, d) ein metrischer Raum, so bilden die offenen Mengen des metrischen
Raumes nach Satz 2.2 eine Topologie auf X. Jeder metrische Raum ist folglich
ein spezieller topologischer Raum. In topologischen Räumen kann man kompakte und folgenkompakte Mengen auf die gleiche Weise definieren, wie im
metrischen Raum. Man kann dann zeigen, dass es sowohl topologische Räume
gibt mit kompakten Mengen, die nicht folgenkompakt sind als auch topologische Räume mit folgenkompakten Mengen, die nicht kompakt sind !!. Für
topologische Räume, die zu den Grundstrukturen der Analysis gehören, fallen
die beiden Kompaktheitsbegriffe also nicht mehr zusammen.
84
2 Metrische Räume
2.6 Zusammenhängende Teilmengen eines metrischen
Raumes
Definition 2.30. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X
heißt zusammenhängend, wenn es keine offenen und zueinander disjunkten
Teilmengen U, V ⊂ X gibt, so dass A ⊂ U ∪ V , A ∩ U 6= ∅ und A ∩ V 6= ∅.
Ist die Menge X selbst zusammenhängend, so nennt man den metrischen
Raum (X, d) zusammenhängend.
Beispiel: Sei X = R2 , U, V ⊂ X offene Teilmengen von X und A ⊂ X wie
im Bild. Dann ist A nicht zusammenhängend.
U
V
A
Bemerkung: Nach Definition ist ein metrischer Raum (X, d) zusammenhängend, wenn er sich nicht in die disjunkte Vereinigung zweier offener nichtleerer
Mengen zerlegt. Man kann wiederum zeigen, dass eine Teilmenge A eines metrischen Raumes (X, d) genau dann zusammenhängend ist, wenn der metrische
Raum (A, d|A×A ) zusammenhängend ist.
Wir beschreiben nun die zusammenhängenden Mengen im metrischen Raum
R mit der Standardmetrik d(x, y) = |x − y|.
Satz 2.43 Eine Teilmenge A ⊂ R ist genau dann zusammenhängend, wenn
sie mit je zwei Punkten a, b ∈ A auch das Intervall [a, b] vollständig enthält.
Die einzigen zusammenhängenden Teilmengen in R sind folglich R, (−∞, b),
(−∞, b], (a, ∞), [a, ∞), (a, b), [a, b], (a, b], [a, b) und {a}.
Beweis. (=⇒) Sei A ⊂ R zusammenhängend. Angenommen es existieren
a, b ∈ A mit [a, b] 6⊂ A. Dann gibt es ein x ∈ [a, b] mit x 6∈ A. Wir betrachten die Mengen U := (−∞, x) und V := (x, ∞). U und V sind disjunkte
offene Teilmengen in R mit A ⊂ U ∪ V = R \ {x}. Außerdem ist A ∩ U 6= ∅,
da a ∈ A ∩ U und A ∩ V 6= ∅, da b ∈ A ∩ V . Dies widerspricht aber der
Voraussetzung, dass A zusammenhängend ist.
(⇐=) Sei A ⊂ R eine Teilmenge, die mit 2 Punkten a, b ∈ A, a ≤ b, auch das
Intervall [a, b] enthält. Wir nehmen an, A sei nicht zusammenhängend. Dann
existieren offene disjunkte Teilmengen U, V ⊂ R mit A ⊂ U ∪ V , A ∩ U 6= ∅
und A ∩ V 6= ∅. Wir wählen a ∈ A ∩ U und b ∈ A ∩ V . OBdA gelte a < b. Wir
betrachten z := sup(U ∩ [a, b]). Dann gilt
2.6 Zusammenhängende Teilmengen eines metrischen Raumes
z ∈ cl(U ∩ [a, b]) ⊂ cl(R \ V ) = R \ V
85
(da V offen ist),
z ∈ cl(U ∩ [a, b]) ⊂ cl([a, b]) = [a, b] ⊂ A.
Da U ∪ V die Menge A überdeckt, liegt z in U . Da U offen ist, existiert ein
ε > 0 mit (z − ε, z + ε) ⊂ U . Also gilt (z − ε, z + ε) ∩ [a, b] ⊂ U ∩ [a, b]. Es
folgt min{z + ε, b} = sup((z − ε, z + ε) ∩ [a, b]) ≤ sup(U ∩ [a, b]) = z. Dann
muss b ≤ z gelten. Da andererseits z ∈ [a, b], folgt b = z und somit z ∈ V . Da
U und V disjunkt sind und z ∈ U , kann das nicht gelten. Damit war unsere
Annahme, dass A nicht zusammenhängend ist, falsch.
⊓
⊔
Bemerkung: Der analoge Beweis liefert, dass jede Verbindungstecke zwischen
zwei Punkten im metrischen Raum Rn zusammenhängend ist.
Weitere zusammenhängende Teilmengen erhält man durch die folgenden beiden Sätze.
Satz 2.44 Sei (X, d) ein metrischer Raum und A ⊂ X eine zusammenhängende Teilmenge. Gilt A ⊂ B ⊂ cl(A), so ist B ebenfalls zusammenhängend.
Insbesondere ist der Abschluss einer zusammenhängenden Menge selbst zusammenhängend.
Beweis. Angenommen B wäre nicht zusammenhängend. Dann existieren offene, disjunkte Mengen U, V ⊂ X mit B ⊂ U ∪ V, B ∩ U 6= ∅ und B ∩ V 6= ∅.
Wir zeigen nun, dass dann A auch nicht zusammenhängend ist. Wegen A ⊂ B
gilt A ⊂ U ∪ V . Es bleibt zu zeigen, dass A ∩ V 6= ∅ und A ∩ U 6= ∅. Wir
nehmen A ∩ U = ∅ an. Dann gilt A ⊂ X \ U und somit, da U offen ist,
B ⊂ cl(A) ⊂ cl(X \ U ) = X \ U . Dann wäre B ∩ U = ∅ im Gegensatz
zur Wahl von U . Folglich war unsere Annahme, dass A und U disjunkt sind,
falsch. Die analogen Betrachtungen beweisen A ∩ V 6= ∅. Somit ist A nicht
zusammenhängend, was den Voraussetzungen widerspricht.
⊓
⊔
Satz 2.45 Sei (X, d) ein metrischer Raum und Ai , i ∈ I, beliebig
T viele zuAi 6= ∅.
sammenhängende Teilmengen mit nichtleerem Durchschnitt B :=
i∈I
S
Ai zusammenhängend.
Dann ist auch die Vereinigung A :=
i∈I
Beweis. Wir nehmen an, A wäre nicht zusammenhängend. Dann existieren
offene, disjunkte Mengen U, V ⊂ X mit A ⊂ U ∪V, A∩U 6= ∅ und A∩V 6= ∅.
Für i ∈ I gilt dann auch Ai ⊂ U ∪ V . Da Ai zusammenhängend ist, muss
entweder Ai ∩ U = ∅ oder Ai ∩ V = ∅ gelten. Wir setzen
I1 := {i ∈ I | Ai ⊂ V } und I2 := {i ∈ I | Ai ⊂ U }.
Da A ∩ U 6= ∅ und A ∩ V 6= ∅ gilt I1 6= ∅ 6= I2 . Wir erhalten
86
2 Metrische Räume
A=
[
Ai =
i∈I
und
[
i∈I1
[
i∈I1
[ Ai ∪
Ai
i∈I2
[ Ai ∩
Ai ⊂ V ∩ U = ∅.
Da für alle i ∈ I gilt ∅ 6= B :=
B⊂
T
k∈I
[
i∈I1
i∈I2
Ak ⊂ Ai , folgt
[ Ai ∩
Ai = ∅.
i∈I2
Dies ist ein Widerspruch. Folglich war die Annahme falsch und A ist zusammenhängend.
⊓
⊔
Wir zeigen abschließend, dass sich jeder metrische Raum in disjunkte zusammenhängende Teilmengen zerlegt.
Definition 2.31. Sei (X, d) ein metrischer Raum und x ∈ X. Die Menge
[
C(x) :=
A
A
zush.
x∈A
heißt die durch x bestimmte Zusammenhangskomponente von X.
Bemerkung:
(1) Nach Satz 2.45 ist C(x) zusammenhängend. Somit ist C(x) die größte zusammenhängende Teilmenge von X, die x enthält.
(2) Jede Zusammenhangskomponente von (X, d) ist abgeschlossen.
Nach Satz 2.44 ist nämlich der Abschluss cl(C(x)) der Zusammenhangskomponente C(x) ebenfalls zusammenhängend. Folglich gilt cl(C(x)) ⊂ C(x), also
cl(C(x)) = C(x). Somit ist C(x) abgeschlossen.
(3) Sind x, y ∈ X, so gilt entweder C(x) = C(y) oder C(x) ∩ C(y) = ∅.
Wir betrachten den Fall, dass C(x) ∩ C(y) 6= ∅. Dann ist C(x) ∪ C(y) zusammenhängend (nach Satz 2.45) und enthält x und y. Folglich gilt C(x) ∪ C(y) ⊂
C(x) und C(x) ∪ C(y) ⊂ C(y) und somit C(x) = C(y) = C(x) ∪ C(y).
Dies beweist den folgenden Satz
Satz 2.46 Sei (X, d) ein metrischer Raum. Dann zerlegt sich X in disjunkte
Zusammenhangskomponenen, d.h.
[
X=
Ci ,
i∈I
wobei die Mengen Ci zusammenhängend, abgeschlossen und paarweise disjunkt
sind.
2.7 Banachräume und Hilberträume
87
2.7 Banachräume und Hilberträume
In diesem Abschnitt betrachten wir spezielle vollständige metrische Räume,
deren Basismenge Vektorräume sind und deren Metrik durch eine Norm bzw.
durch ein Skalarprodukt gegeben ist.
Definition 2.32. Ein Vektorraum über dem Körper K (oder ein K-Vektorraum)
ist ein Tripel [V, +, ·], wobei V eine nichtleere Menge und + und · zwei Operationen
+ : V × V −→ V
(v, w) 7−→ v + w
(Addition)
·:
(Multiplikation mit Skalaren)
K × V −→ V
(λ, v) 7−→ λ · v
mit den folgenden Eigenschaften sind:
1. [V, +] ist eine abelsche Gruppe.
2. Es gelten die Distributivgesetze:
λ · (v + w) = λ · v + λ · w und (λ + µ) · v = λ · v + µ · v
3. λ · (µ · v) = (λ · µ) · v und 1 · v = v,
wobei λ, µ ∈ K und v, w ∈ V .
Wir werden Vektorräume auch kurz mit V bezeichnen, wenn die Operationen
+ und · klar sind. Ist K der Körper der reellen Zahlen, so heißt V reeller
Vektorraum, ist K der Körper der komplexen Zahlen, so heißt V komplexer
Vektorraum. Die algebraische Theorie von Vektorräumen wird in der Vorlesung über lineare Algebra behandelt. Insbesondere wird dort erklärt werden,
was die Dimension eines Vektorraumes ist.
Definition 2.33. Sei V ein reeller oder komplexer Vektroraum. Eine Norm
auf V ist eine Abbildung k · k : V −→ R mit den folgenden Eigenschaften:
1. kxk ≥ 0 für alle x ∈ V und kxk = 0 ⇐⇒ x = 0.
2. kα · xk = |α| · kxk für alle α ∈ K und x ∈ V .
3. kx + yk ≤ kxk + kyk (Dreiecksungleichung).
Das Paar (V, k · k) heißt normierter Vektorraum.
Beispiele für normierte Vektorräume:
1. Die Vektorräume Rn bzw. Cn mit den folgenden Normen
kxkp :=
n
X
j=1
|xj |p
p1
, p ∈ N,
und
kxk∞ := max |xj | ,
j=1,...,n
88
2 Metrische Räume
wobei x = (x1 , . . . , xn ). Die Norm k · k2 auf dem Rn bzw. Cn ist die in Kapitel
1.4 betrachtete Euklidische Norm.
2. Sei X eine nichtleere Menge und bezeichne Fb (X) den Vektorraum aller
beschränkten reellwertigen Funktionen
Fb (X) := {f : X −→ R | f (X) ⊂ R beschränkt}.
Die Operationen + und · sind hierbei auf folgende Weise definiert:
Fb (X) × Fb (X) −→ Fb (X)
(f1 , f2 )
7−→ f1 + f2
R × Fb (X) −→ Fb (X)
(λ, f )
7−→ λ · f
mit (f1 + f2 )(x) := f1 (x) + f2 (x)
mit (λ · f )(x) := λ · f (x).
Dann ist durch
kf k∞ := sup |f (x)| ,
x∈X
f ∈ Fb (X)
eine Norm auf Fb (X) gegeben.
3. Sei BF(Rn ) der Vektorraum aller beschränkten Folgen (xn ) von Vektoren
im Rn mit den Operationen
(xn ) + (yn ) := (xn + yn )
λ · (xn ) := (λ · xn ) ,
wobei λ ∈ R, (xn ), (yn ) ∈ BF(Rn ). Dann ist durch
k(xn )k∞ := sup{kxn k2 | n ∈ N} ,
(xn ) ∈ BF(Rn )
eine Norm auf BF(Rn ) gegeben.
Auf jedem normierten Vektorraum ist auf kanonische Weise eine Metrik definiert, die wir im folgenden auch immer auf normierten Vektorräumen festlegen
werden:
Satz 2.47 Sei (V, k · k) ein normierter Raum. Dann ist die Abbildung
dk·k : V × V −→ R
(x, y) 7−→ dk·k (x, y) := kx − yk
eine Metrik auf V .
Beweis. Der Beweis wird genauso wie für die Euklidische Norm in Kapitel
1.4. geführt.
⊓
⊔
2.7 Banachräume und Hilberträume
89
Definition 2.34. Ein normierter Vektorraum (V, k · k) heißt Banachraum,
wenn er (als metrischer Raum) vollständig ist.
Beispiele:
1. Rn und Cn mit der Euklidischen Norm k · k2 sind endlich-dimensionale
Banachräume (siehe Kapitel 2.4).
2. Die Räume der beschränkten reellwertigen Funktionen Fb (X) und der beschränkten Folgen BF(Rn ) sind mit der Supremum-Norm k·k∞ unendlichdimensionale Banachräume (Übungsaufgabe 42).
Wir werden nun zeigen, dass die endlich-dimensionalen Vektorräume Rn und
Cn mit jeder Norm Banachräume sind. Dazu führen wir die folgende Äquivalenzrelation für Normen ein:
Definition 2.35. Sei V ein reeller oder komplexer Vektorraum. Zwei Normen
k·k1 und k·k2 auf V heißen äquivalent, wenn es positive Konstanten a, b ∈ R+
gibt, so dass gilt
a · kxk1 ≤ kxk2 ≤ b · kxk1
∀ x ∈ V.
(∗)
Satz 2.48 Seien k·k1 und k·k2 zwei äquivalente Normen auf dem Vektorraum
V . Dann stimmen alle topologischen Eigenschaften von (V, k·k1 ) und (V, k·k2 )
überein. Insbesondere gilt für Folgen (xn ) in V und für Teilmengen A ⊂ V :
1.
2.
3.
4.
5.
6.
(xn ) −→ x ∈ V bzgl. k · k1 gdw. (xn ) −→ x ∈ V bzgl. k · k2 .
(xn ) ist Cauchy-Folge bzgl. k · k1 gdw. (xn ) ist Cauchy-Folge bzgl. k · k2 .
A ist offen bzgl. k · k1 gdw. A ist offen bzgl. k · k2 .
A ist abgeschlossen bzgl. k · k1 gdw. A ist abgeschlossen bzgl. k · k2 .
A ist kompakt bzgl. k · k1 gdw. A ist kompakt bzgl. k · k2 .
A ist zusammenhängend bzgl. k · k1 gdw. A ist zusammenhängend bzgl.
k · k2 .
Beweis. Aus (∗) folgen für die Kugeln Ki (x, ε) bzgl. der Norm k · ki die folgenden Beziehungen
K1 (x, ε) ⊂ K2 (x, b · ε) ,
ε
K2 (x, ε) ⊂ K1 (x, )
a
∀ ε > 0.
Da alle topologischen Begriffe für metrische Räume mittels Kugeln definiert
sind, folgen die Behauptungen des Satzes unmittelbar aus diesen Beziehungen
der Kugeln zueineinander.
⊓
⊔
Satz 2.49 Alle Normen auf den Vektorräumen Rn bzw. Cn sind zueinander
äquivalent.
90
2 Metrische Räume
Beweis. Wir beweisen die Behauptung für den reellen Vektorraum Rn . Der
Beweis für Cn wird analog geführt.
Sei k · k2 : Rn −→ R die Euklidische Norm auf dem Rn und N : Rn −→ R
eine beliebige Norm. Da die Äquivalenz von Normen eine Äquivalenzrelation
ist, genügt es zu zeigen, dass die Normen k · k2 und N äquivalent sind. Wir
müssen also positive reelle Konstanten a und b finden, so dass
a · kxk2 ≤ N (x) ≤ b · kxk2
für alle x ∈ Rn .
n
(1) Es existiert ein b ∈ R+ mit N (x) ≤ b · kxk2 für alle x ∈
PRn :
n
Jeder Vektor x ∈ R hat die Form x = (x1 , . . . , xn ) =
j=1 xj ej , wobei
ej = (0, . . . , 0, 1, 0, . . . , 0) mit 1 an der j.-Stelle. Dann gilt wegen der Normeigenschaften und der Cauchy–Schwarzschen Ungleichung (siehe Satz 1.24)
N (x) = N
n
X
j=1
xj · ej
≤
n
X
j=1
N (xj · ej ) =
v
v
uX
uX
u n
u n
2
t
|xj | · t
N (ej )2
≤
j=1
= b · kxk2 .
|
j=1
{z
=:b>0
n
X
j=1
|xj | · N (ej )
}
(2) Es existiert ein a ∈ R+ mit a · kxk2 ≤ N (x) für alle x ∈ Rn :
Sei x ∈ Rn ein vom Nullvektor verschiedener Vektor. Dann gilt
x x = kxk2 · N
.
N (x) = N kxk2 ·
kxk2
kxk2
Wir setzen a := inf{N (y) | kyk2 = 1} ≥ 0 . Dann gilt N (x) ≥ a · kxk2 für alle
x ∈ Rn . Es bleibt zu zeigen, dass a > 0.
Angenommen a = 0. Sei S n−1 := {y ∈ Rn | kyk2 = 1 } die Sphäre vom
Radius 1 im Rn . Nach Definition von a existiert eine Folge (xn ) in S n−1 mit
N (xn ) −→ a = 0. Da die Sphäre S n−1 in Rn beschränkt und abgeschlossen bzgl. der Euklidischen Norm k · k2 ist, ist sie folgenkompakt bzgl. k · k2
(siehe Satz 2.36). Folglich existiert eine Teilfolge (xnk ) von (xn ), die gegen
einen Vektor y0 ∈ S n−1 bzgl. k · k2 konvergiert. Wir erhalten dann aus der
Dreiecksungleichung für N und der in (1) bewiesenen Ungleichung
0 ≤ N (y0 ) ≤ N (y0 − xnk ) + N (xnk ) ≤ b · ky0 − xnk k2 + N (xnk ).
Bei k gegen +∞ konvergiert die rechte Seite dieser Ungleichung gegen 0.
Folglich ist N (y0 ) = 0 und somit y0 = 0. Dies widerspricht y0 ∈ S n−1 . Somit
ist a > 0.
⊓
⊔
Da Rn und Cn mit der Euklidischen Norm vollständig sind, folgt aus den
2.7 Banachräume und Hilberträume
91
Sätzen 2.48 und 2.49, dass die Vektroräume Rn und Cn mit jeder Norm Banachräume sind. In der Vorlesung über lineare Algebra wird beweisen, dass
jeder reelle Vektorraum der Dimension n < +∞ isomorph zu Rn und jeder
komplexe Vektorraum der Dimension n < +∞ isomorph zu Cn ist. Dies liefert
Folgerung 2.6 Jeder endlich-dimensionale, reelle oder komplexe normierte
Vektorraum ist ein Banachraum.
Für ∞–dimensionale Vektorräume gilt Satz 2.49 und die daraus abgeleitete Folgerung nicht mehr. Im Laufe der Analysis-Vorlesung werden wir weitere vollständige und unvollständige unendlich-dimensionale normierte Vektorräume kennenlernen.
Abschließend befassen wir uns mit dem Begriff des Skalarproduktes auf einem
Vektorraum, den wir bereits in einem Spezialfall in Kapitel 1.4. betrachtet haben.
Definition 2.36. Sei H ein reeller oder komplexer Vektorraum und bezeichne
K den dazugehörigen Körper der reellen bzw. komplexen Zahlen. Ein Skalarprodukt auf H ist eine Abbildung h·, ·i : H × H −→ K mit
(1)
(2)
(3)
(4)
hx, yi = hy, xi für x, y ∈ H,
hx + y, zi = hx, zi + hy, zi für x, y, z ∈ H,
hλx, yi = λhx, yi = hx, λyi für λ ∈ K und x, y ∈ H,
hx, xi ≥ 0 und hx, xi = 0 ⇔ x = 0.
Satz 2.50 (Cauchy–Schwarzsche Ungleichung (CSU))
Sei h·, ·i ein Skalarprodukt auf dem Vektorraum H. Dann gilt
|hx, yi|2 ≤ hx, xi · hy, yi
Die Gleichheit tritt genau dann ein, wenn x und y linear abhängig sind.
Beweis. Für λ ∈ K und x, y ∈ H gilt
0 ≤ hx + λy, x + λyi = hx, xi + λhy, xi + |λ|2 hy, yi + λhx, yi.
(∗)
Es genügt, die Behauptung für y 6= 0 zu beweisen. Für y = 0 ist sie trivial.
Sei λ := − hx,yi
hy,yi . Dann folgt
0 ≤ hx, xi −
2hx, yihx, yi |hx, yi|2
|hx, yi|2
+
= hx, xi −
.
hy, yi
hy, yi
hy, yi
Daraus folgt |hx, yi|2 ≤ hx, xi · hy, yi . Nach (∗) gilt die Gleichheit genau dann
wenn x = −λy.
⊓
⊔
92
2 Metrische Räume
Satz 2.51 Ist h·, ·i ein Skalarprodukt auf H, so ist durch
p
kxk := hx, xi
eine Norm und durch
d(x, y) :=
eine Metrik auf H definiert.
p
hx − y, x − yi = kx − yk
Beweis. Wir müssen die Dreiecksungleichung für die Norm beweisen, der Rest
ist trivial bzw. schon bekannt.
kx + yk2 = hx + y, x + yi
= hx, xi + hy, yi + hx, yi + hy, xi
= hx, xi + hy, yi + 2 · Rehx, yi
≤ hx, xi + hy, yi + 2 · |hx, yi|
p
p
CSU
≤ hx, xi + hy, yi + hx, xi · hy, yi
= (kxk + kyk)2 .
⊓
⊔
Bemerkung: Ein Vektorraum (H, h·, ·i) mit Skalarprodukt istp
im Folgenden
immer mit der Topologie der von h·, ·i erzeugten Norm kxk = hx, xi versehen.
Ist eine Norm gegeben, so möchte man gern wissen, ob diese durch ein Skalarprodukt wie oben beschrieben definiert ist. Dies ist nicht immer der Fall.
Ein Kriterium dafür liefert der Satz
Satz 2.52 Sei (V, k·k) ein normierter Vektorraum. Die Norm k·k wird genau
dann durch ein Skalarprodukt h·, ·i definiert, wenn das Parallelogrammgesetz
gilt:
kx + yk2 + kx − yk2 = 2(kxk2 + kyk2 )
∀x, y ∈ E.
⊓
⊔
Beweis. Übungsaufgabe 43.
Definition 2.37. Ein Hilbertraum ist ein Vektorraum
p H mit Skalarprodukt
h·, ·i, dessen zugehöriger normierter Raum (H, k·k = h·, ·i) ein Banachraum
ist.
Beispiele für Hilberträume:
•
Rn mit dem Skalarprodukt hx, yi :=
•
Cn mit dem Skalarprodukt hz, wi :=
n
P
j=1
n
P
j=1
xj · yj
zj · w j
3
Reihen in Banachräumen
In diesem Kapitel werden wir Reihen in Banachräumen und Kriterien für
ihre Konvergenz behandeln. Reihen sind eines der wichtigsten Hilfsmittel zur
Konstruktion und Darstellung von Funktionen.
Im gesamten Kapitel bezeichnet E einen Banachraum über dem Körper der
reellen oder der komplexen Zahlen mit der Norm k·k. Als Spezialfall kann man
sich an Stelle von E z.B. die Banachräume R, C, Rn oder Cn (mit beliebiger
Norm) vorstellen.
In einem Vektorraum kann man jeder Folge von Vektoren eine neue Folge
zuordnen: die Folge der Partialsummen. Sei (xk )∞
k=1 eine Folge von Vektoren
aus E. Wir bilden daraus eine neue Folge
sn := x1 + x2 + · · · + xn =
s1 := x1
s2 := x1 + x2
n
X
k=1
xk ∈ E,
also
s3 := x1 + x2 + x3
s4 := x1 + x2 + x3 + x4
...
Definition 3.1. Die Folge (sn )∞
n=1 heißt Reihe in E mit den Gliedern xk .
Man schreibt für diese Reihe symbolisch
∞
X
xk
oder
x1 + x2 + x3 + . . .
k=1
Den Vektor sn := x1 + . . . + xn =
der Reihe.
n
P
k=1
xk nennt man die n-te Partialsumme
94
3 Reihen in Banachräumen
Eine Reihe
∞
P
xk in E heißt konvergent, falls die Folge der Partialsummen
k=1
(sn ) in E konvergiert. Ist (sn ) konvergent, so heißt s := lim sn Wert der
n→∞
Reihe und man schreibt
∞
X
s=
xk .
k=1
Eine Reihe, die in E nicht konvergiert, heißt divergent.
Das Symbol
∞
P
xk hat also zwei Bedeutungen: es bezeichnet symbolisch die
k=1
Folge (sn ) der Partialsummen und im Konvergenzfall auch ihren Grenzwert.
Sei speziell E = R. Wenn lim sn = +∞ oder lim sn = −∞ , so schreibt
n→∞
n→∞
man symbolisch
∞
∞
X
X
xk = +∞ oder
xk = −∞.
k=1
k=1
Die Reihe ist in diesem Fall in R divergent. Gilt xk ≥ 0 für alle k ∈ N, so
bedeutet die Schreibweise
∞
X
xk < +∞,
k=1
dass die Reihe in R konvergiert.
Definition 3.2. Eine Reihe
∞
P
xk im Banachraum E heißt absolut–konvergent,
k=1
wenn die Reihe der reellen Zahlen
∞
P
k=1
kxk k in R konvergiert.
Im nächsten Abschnitt behandeln wir wichtige Konvergenzkriterien für Reihen
in Banachräumen.
3.1 Konvergenzkriterien für Reihen in Banachräumen
Satz 3.1 (Cauchy–Kriterium) Eine Reihe
∞
P
k=1
xk in einem Banachraum
E ist genau dann konvergent, wenn zu jedem ε > 0 ein n0 ∈ N existiert, so
dass
kxn + . . . + xm k < ε
∀ m ≥ n ≥ n0
(∗)
gilt.
3.1 Konvergenzkriterien für Reihen in Banachräumen
95
Beweis. Da der Banachraum E vollständig ist, konvergiert die Folge der Partialsummen sn = x1 + . . . + xn genau dann, wenn sie eine Cauchy-Folge ist.
Dies ist nach Definition der Cauchy-Folge genau dann erfüllt, wenn zu jedem
ε > 0 ein n0 ∈ N existiert, so dass für alle m ≥ n ≥ n0 die Ungleichung
ksm − sn−1 k < ε gilt, was äquivalent zum Cauchy–Kriterium (∗) ist.
⊓
⊔
Der folgende Satz gibt ein nützliches notwendiges Kriterium für die Konvergenz einer Reihe an:
Satz 3.2 Ist eine Reihe
∞
P
xk im Banachraum E konvergent, so ist die Folge
k=1
der Reihenglieder (xk ) eine Nullfolge in E.
Beweis. Zum Beweis nutzen wir das Cauchy–Kriterium im Fall m = n. Kon∞
P
xk , dann existiert für alle ε > 0 ein n0 ∈ N, so dass kxn k < ε für
vergiert
k=1
alle n ≥ n0 . Daraus folgt lim xn = 0.
⊓
⊔
n→∞
Die Umkehrung dieses Satzes gilt im allgemeinen nicht.
Beispiel 1: Die harmonische Reihe
Sei E = R. Wir betrachten die harmonische Reihe
∞
X
1 1 1
1
= 1 + + + + ...
k
2 3 4
k=1
Behauptung: Die harmonische Reihe ist in R divergent und es gilt
∞
X
1
= +∞.
k
k=1
Beweis. Sei m ∈ N fixiert. Wir wählen ein n ∈ N mit n ≥ 2m . Dann gilt
1
1
+ ...+
2
n
1 1
1
1
1
1
1
+ ... + m)
≥ 1 + + ( + ) + ( + . . . + ) + . . . + ( m−1
2
3 4
5
8
2
+1
2
|
{z
}
sn = 1 +
2m−1 Summanden
1
1
1
1
≥ 1 + + 2 · + 4 · + . . . + 2m−1 · m
4
8 {z
2 }
|2
m Summanden
m
≥ 1+ .
2
Folglich existiert zu jedem M ∈ R eine Zahl m, so dass sn ≥ 1 + m
2 ≥ M für
alle n ≥ 2m . Somit strebt die Folge der Partialsummen (sn ) gegen +∞.
⊓
⊔
96
3 Reihen in Banachräumen
Beispiel 2: Die geometrische Reihe
Sei E = C und z ∈ C eine fixierte komplexe Zahl. Wir betrachten die geometrische Reihe
∞
X
zk = 1 + z + z2 + z3 + z4 + . . .
k=0
Behauptung:
1. Ist |z| < 1, so konvergiert die geometrische Reihe und es gilt
2. Ist |z| ≥ 1, so divergiert die geometrische Reihe
∞
P
zk .
∞
P
zk =
k=0
1
1−z .
k=0
Beweis. Sei |z| < 1. Für die Partialsumme gilt nach Satz 1.14
sn = 1 + z + . . . + z n =
1 − z n+1
.
1−z
Da |z| < 1, ist (z n+1 ) eine Nullfolge und somit gilt lim sn =
n→∞
1
1−z .
Im Falle |z| ≥ 1 ist |z k | ≥ 1 und somit (z k ) keine Nullfolge. Nach Satz 3.2 ist
∞
P
deshalb
z k divergent.
⊓
⊔
k=0
∞
P
Satz 3.3 Ist eine Reihe
xk im Banachraum E absolut–konvergent, so ist
k=1
sie auch konvergent und es gilt
∞
∞
X
X
kxk k. (∗∗)
xk ≤
k=1
Beweis. Sei
∞
P
k=1
k=1
kxk k konvergent. Entsprechend dem Cauchy-Kriterium gibt
es zu jedem ε > 0 ein n0 ∈ N, so dass
kxn k + . . . + kxm k < ε
für alle m ≥ n ≥ n0 .
Wegen der Dreiecksungleichung für die Norm
kxn + . . . + xm k ≤ kxn k + . . . + kxm k
P∞
gilt dann das Cauchy-Kriterium auch für die Reihe
k=1 xk , die folglich
konvergiert. Aus den Grenzwertsätzen (analog zu Satz 2.18) erhält man für
sn = x1 + . . . + xn
k lim sn k = lim ksn k ≤ lim (kx1 k + . . . + kxn k) =
n→∞
n→∞
Dies zeigt die Abschätzung (∗∗).
n→∞
∞
X
k=1
kxk k.
⊓
⊔
3.1 Konvergenzkriterien für Reihen in Banachräumen
97
Reihen im Banachraum E kann man addieren und mit reellen bzw. komplexen Zahlen multiplizieren. Im folgenden bezeichnet K den Körper der reellen
Zahlen, falls E ein reeller Banachraum ist, bzw. den Körper der komplexen
Zahlen, falls E ein komplexer Banachraum ist.
Satz 3.4 Seien (xk ) und (yk ) Folgen im Banachraum E und λ, µ ∈ K. Kon∞
∞
P
P
vergieren die Reihen
xk und
yk gegen x bzw. y , so konvergiert die
Reihe
∞
P
k=1
k=1
(λxk + µyk ) gegen λx + µy.
k=1
Beweis. Seien
sn :=
n
X
xk
sˆn :=
k=1
n
X
s∗n :=
yk
k=1
n
X
(λxk + µyk ).
k=1
Dann gilt s∗n = λsn + µsˆn . Die Behauptung folgt dann aus den Grenzwertsätzen für Folgen in Vektorräumen (analog zu Satz 2.18).
⊓
⊔
Satz 3.5 (Majorantenkriterium)
∞
P
Sei
xk eine Reihe im Banachraum E und (ck ) eine Folge reeller Zahlen,
k=1
so dass kxk k ≤ ck für alle k ∈ N. Konvergiert die Reihe
die Reihe
∞
P
∞
P
ck in R, so ist
k=1
xk in E absolut–konvergent und es gilt
k=1
∞
∞
∞
X
X
X
kxk k ≤
ck .
xk ≤
k=1
k=1
k=1
(∗ ∗ ∗)
Beweis. Wir nutzen wiederum das Cauchy–Kriterium. Sei
Dann gibt es für alle ε > 0 ein n0 ∈ N, so dass
cn + . . . + c m < ε
∞
P
ck konvergent.
k=1
∀ m ≥ n ≥ n0 .
Nach Voraussetzung ist kxn k + . . . + kxm k ≤ cn + . . . + cm . Folglich gilt das
∞
∞
P
P
xk
kxk k . Somit ist die Reihe
Cauchy-Kriterium auch für die Reihe
k=1
k=1
absolut–konvergent, also auch konvergent. Die Ungleichung (∗ ∗ ∗) folgt wie
im Beweis von Satz 3.3.
⊓
⊔
98
3 Reihen in Banachräumen
Beispiel 3: Sei E = C. Wir betrachten eine Folge komplexer Zahlen ak ∈ C
mit |ak | ≤ 1 für alle k ∈ N und z ∈ C mit |z| < 1.
∞
P
ak z k ist absolut–konvergent und es gilt:
Behauptung: Die Reihe
k=0
∞
X
1
k
.
ak z ≤
1 − |z|
k=0
Beweis. Dies folgt aus dem Majorantenkriterium und der Konvergenz der
geometrischen Reihe, da
k
k
k
|ak z | = |ak | · |z| ≤ |z|
und
∞
X
k=0
|z|k =
1
.
1 − |z|
⊓
⊔
Satz 3.6 (Wurzelkriterium)
∞
p
P
xk eine Reihe im Banachraum E und α := lim sup k kxk k .
Sei
k→∞
k=1
1. Ist α < 1, so ist die Reihe
2. Ist α > 1, so ist die Reihe
∞
P
k=1
∞
P
xk absolut–konvergent.
xk divergent.
k=1
p
Beweis. 1. Sei α = lim sup k kxk k < 1. Da α der größte Häufungspunkt der
k→∞
p
Folge ( k kxk k) ist, sind höchstens endlich viele dieser Folgeglieder größer als
α. Es existiert folglich ein k0 ∈ N so dass
p
1+α
k
kxk k ≤ α <
<1
∀ k ≥ k0 .
2
Somit gilt
kxk k <
Da
1+α
2
1+α
2
k
∀ k ≥ k0 .
< 1, konvergiert die geometrische Reihe
∞
P
k=1
1+α k
.
2
Aus dem Majo-
∞
P
rantenkriterium folgt dann die absolute Konvergenz der Reihe
xk .
k=1
p
2. Sei α = lim sup k kxk k > 1. Dann existiert eine Teilfolge (xkj ) von (xk ) mit
k→∞
∞
p
P
kj
kxkj k ≥ 1, also mit kxkj k ≥ 1. Somit ist (xk ) keine Nullfolge und
xk
k=1
konvergiert nicht (Satz 3.2).
⊓
⊔
3.1 Konvergenzkriterien für Reihen in Banachräumen
99
Satz 3.7 (Quotientenkriterium)
∞
P
xk eine Reihe im Banachraum E, deren Glieder xk alle vom NullvekSei
k=1
tor verschieden sind.
1. Ist α := lim sup
k→∞
2. Ist β := lim inf
k→∞
kxk+1 k
kxk k
kxk+1 k
kxk k
> 1, so ist die Reihe
Beweis. 1. Sei α = lim sup
k→∞
∞
P
< 1, so ist die Reihe
kxk+1 k
kxk k
Folglich gilt
< 1 . Dann existiert ein k0 ∈ N, so dass
kxk+1 k ≤
1+α
2
kxk0 +j k ≤
1+α
2
j
und somit
α+1
2
xk divergent.
k=1
kxk+1 k
1+α
≤α<
<1
kxk k
2
Da
xk absolut–konvergent.
k=1
∞
P
kxk k
∀ k ≥ k0 .
∀ k ≥ k0
kxk0 k
∀j ≥ 0.
< 1, konvergiert die geometrische Reihe
∞
P
j=0
rantenkriterium folgt dann, dass die Reihe
∞
P
j
( α+1
2 ) . Aus dem Majo-
xk absolut konvergiert.
k=1
2. Sei nun β = lim inf
k→∞
kx
k
kxk+1 k
kxk k
> 1 . Dann sind höchstens endlich viele der
Zahlen kxk+1
kleiner als 1. Folglich existiert ein k0 ∈ N, so dass 0 < kxk k ≤
kk
kxk+1 k für alle k ≥ k0 gilt. Also ist (xk ) keine Nullfolge. Nach Satz 3.2 ist
∞
P
xk divergent.
⊓
⊔
deshalb die Reihe
k=1
Beispiel 4: Ob man das Wurzel- oder das Quotientenkriterium anwendet,
muß man anhand der Gestalt der Reihenglieder entscheiden. Das Wurzelkriterium ist leistungsfähiger als das Quotientenkriterium. Betrachten wir
∞
P
xk , wobei xk := 2−k für gerade k und
z.B. E = R und die Reihe
k=1
xk := 8−k für ungerades k sei. Das Wurzelkriterium zeigt Konvergenz an,
√
da lim sup k xk = 21 gilt, während das Quotientkriterium keine Aussage lie= 0 und lim sup xxk+1
= +∞ gilt.
fert, da lim inf xxk+1
k
k
Beispiel 5: Für jede komplexe Zahl z ∈ C ist die Reihe
∞
X
zk
k=0
k!
=1+z+
z2 z3
z4
+
+
+ ...
2!
3!
4!
100
3 Reihen in Banachräumen
absolut–konvergent.
Beweis. Wir benutzen das Quotientenkriterium mit xk =
zk
k! :
xk+1 z k+1 · k! |z|
=
xk z k · (k + 1)! = k + 1 −→ 0
Beispiel 6: Sei E = C, z ∈ C eine fixierte komplexe Zahl und p ∈ Q+ eine
positive rationale Zahl. Die Reihe
∞
X
kp
k=1
zk
ist für |z| > 1 absolut-konvergent und für |z| < 1 divergent.
Beweis. Wir benutzen das Quotientenkriterium mit xk =
kp
.
zk
p
xk+1 (k + 1)p · z k 1
1
= k+1
=
·
−→
.
xk k p · z k+1 k
|z|
|z|
x xk+1 xk+1 1
Es gilt also lim xk+1
=
lim
sup
=
lim
inf
xk
xk = |z| . Die Behauptung
k
folgt dann aus dem Quotientenkriterium.
⊓
⊔
Beispiel 7: Sei E = C und z ∈ C. Die Reihe
∞
X
zk
k
k=1
ist absolut-konvergent, falls |z| < 1 und divergent, falls |z| > 1.
p
k
|z|
Beweis. Wir benutzen das Wurzelkriterium. Mit xk := zk ist k |xk | = √
.
k
k
p
p
√
k
k
k
Da lim k = 1 gilt, konvergiert |xk | gegen |z|. Damit ist lim sup |xk | = |z|
k→∞
und das Wurzelkriterium liefert die Behauptung.
⊓
⊔
Wir interessieren uns natürlich auch dafür, was mit der Konvergenz für z ∈ C
mit |z| = 1 passiert. Für z = 1 ist die obige Reihe gerade die harmonische
Reihe, also divergent. Um die anderen Fälle mit |z| = 1 behandeln zu können,
beweisen wir ein weiteres Kriterium.
3.1 Konvergenzkriterien für Reihen in Banachräumen
101
Satz 3.8 (Abel–Dirichlet–Kriterium)
Sei x1 , x2 , x3 , . . . eine Folge im Banachraum E, deren Partialsummenfolge
(sn = x1 + x2 + . . . + xn ) beschränkt ist. Sei weiterhin a1 , a2 , a3 , . . . eine monoton fallende Nullfolge positiver reeller Zahlen. Dann konvergiert die Reihe
∞
X
ak xk
k=1
im Banachraum E.
Beweis. Seien sn = x1 + x2 + . . . + xn und σn = a1 x1 + . . . + an xn . Nach
Voraussetzung existiert eine reelle Zahl C, so dass ksn k ≤ C für alle n ∈ N.
Für m > n erhalten wir
σm − σn = an+1 xn+1 + an+2 xn+2 + . . . + am xm
= an+1 (sn+1 − sn ) + an+2 (sn+2 − sn+1 ) + . . . + am (sm − sm−1 )
= −an+1 sn + (an+1 − an+2 )sn+1 + . . . + (am−1 − am )sm−1 + am sm .
Da nach Voraussetzung ak − ak+1 ≥ 0 gilt, folgt
kσm − σn k ≤ C · an+1 + (an+1 − an+2 ) + (an+2 − an+3 ) + . . .
+(am−1 − am ) + am
= 2C · an+1 .
Da (an ) eine Nullfolge ist, existiert zu jedem ε > 0 ein n0 ∈ N, so dass
kσm − σn k < ε für alle m > n ≥ n0 . Damit ist (σn ) eine Cauchy–Folge und
konvergiert im Banachraum E.
⊓
⊔
Beispiel 7 (Fortsetzung):
∞ k
P
z
Die Reihe
k ist konvergent für z ∈ C mit |z| = 1 und z 6= 1.
k=1
Beweis. Seien ak := k1 , xk := z k und sn := z + z 2 + . . . + z n . Es gilt
1 − zn
2
n
sn = z + z + . . . + z = z
.
1−z
n
|
2
Da |z| = 1, folgt |sn | = |z| · |1−z
|1−z| ≤ |1−z| . Somit ist die Folge der Partialsummen (sn ) beschränkt. Aus dem Abel-Dirichlet-Kriterium folgt dann, dass
∞ k
P
z
⊓
⊔
die Reihe
k konvergiert.
k=1
102
3 Reihen in Banachräumen
Das folgende Bild zeigt das Konvergenzverhalten der Reihe
∞
P
k=1
iR 6
divergent i
zk
k .
konvergent
1
R
absolut konvergent
Spezialfall (z = −1): Die alternierende harmonische Reihe
∞
X
(−1)k
k=1
1
1 1 1
= −1 + − + ± . . .
k
2 3 4
ist konvergent. Wir werden später sehen, dass ihr Wert ln 2 ist.
Als nächstes betrachten wir Reihen reeller Zahlen, die sich so verhalten wie
die alternierende harmonische Reihe.
Definition 3.3. Eine Reihe
∞
P
xk reeller Zahlen heißt alternierend, wenn
k=1
xk+1 > 0 ⇐⇒ xk < 0
∀ k ∈ N.
Satz 3.9 (Leibnitz–Kriterium für alternierende Reihen)
Sei (bk ) eine monoton fallende Nullfolge positiver reeller Zahlen. Dann gilt:
1. Die alternierende Reihe
∞
P
(−1)k bk konvergiert.
k=1
2. Es gilt die folgende Fehlerabschätzung für den Wert s der Reihe
∞
P
(−1)k bk :
k=1
n
X
k (−1) bk ≤ bn+1
s −
k=1
Beweis. Zum Beweis benutzen wir das Abel–Dirichlet–Kriterium. Wir setzen
in Satz 3.8 xk := (−1)k und ak := bk . Dann ist sn = x1 + . . . + xn ∈ {0, −1},
also beschränkt, und (ak ) eine monoton fallende Nullfolge. Folglich konvergiert
n
P
(−1)k bk . Für den Wert s dieser Reihe gilt
k=1
3.1 Konvergenzkriterien für Reihen in Banachräumen
103
s = s2m − b2m+1 + b2m+2 − b2m+3 + . . .
= s2m+1 + b2m+2 − b2m+3 + b2m+4 − . . . .
Da die Folge (bk ) monoton fallend ist, gilt
s2m+1 < s < s2m
und somit
|s − sn | < |sn+1 − sn | = bn+1 .
⊓
⊔
Dies zeigt die Fehlerabschätzung.
Beispiel 8: Die Leibnitz-Reihe
Die Reihe
∞
X
1 1 1 1
1
= 1 − + − + − ...
(−1)k
2k + 1
3 5 7 9
k=0
konvergiert nach dem Leibnitz-Kriterium. Wir werden später sehen, dass der
Grenzwert π4 ist.
Satz 3.10 (Cauchysches Verdichtungskriterium)
Sei (xk ) eine monoton fallende Folge positiver reeller Zahlen. Dann gilt
∞
X
k=1
xk konvergiert ⇐⇒
∞
X
2j x2j konvergiert.
j=0
Beweis. Wir betrachten die Partialsummen beider Reihen
sn := x1 + . . . + xn
tm := x1 + 2x2 + 4x4 + . . . + 2m x2m .
Zunächst schätzen wir diese beiden Partialsummen gegeneinander ab. Nach
Voraussetzung ist die Folge (xk ) monoton fallend. Somit gilt für alle n < 2m+1
2m Summanden
}|
{
z
sn = x1 + . . . + xn ≤ x1 + (x2 + x3 ) + . . . + (x2m + . . . + x2m+1 −1 )
≤ x1 + 2x2 + . . . + 2m x2m = tm .
Folglich gilt
s n ≤ tm
Andererseits folgt für n ≥ 2m
∀ n < 2m+1
(∗).
104
3 Reihen in Banachräumen
sn = x1 + . . . + x2k + . . . + xn
2m−1 Summanden
z
}|
{
≥ x1 + x2 + (x3 + x4 ) + . . . + (x2m−1 +1 + . . . + x2m )
1
1
≥ x1 + x2 + 2x4 + . . . + 2m−1 x2m = tm .
2
2
Folglich gilt
2sn ≥ tm
∀ n ≥ 2m
(∗∗).
Nun zum Beweis der behaupteten Äquivalenz:
∞
P
xk konvergent. Dann ist die Folge (sn ) konvergent und folglich
(=⇒): Sei
k=1
beschränkt. Wegen (∗∗) ist dann auch die Folge (tm ) beschränkt. Außerdem
ist (tm ) monoton wachsend. Nach Satz 2.20 konvergiert dann die Folge (tm ),
∞
P
2j x2j .
also die Reihe
j=0
(⇐=): Sei
∞
P
2j x2j konvergent. Dann ist die Folge (tm ) konvergent und folg-
j=0
lich beschränkt. Wegen (∗) ist dann auch die Folge (sn ) beschränkt. Außerdem
ist (sn ) monoton wachsend. Nach Satz 2.20 konvergiert dann die Folge (sn ),
∞
P
xk .
⊓
⊔
also die Reihe
k=1
Beispiel 9: Sei p eine positive rationale Zahl. Die Reihe
∞
X
1
kp
k=1
ist genau dann konvergent, wenn p > 1.
Beweis. Da p > 0, sind die Voraussetzungen von Satz 3.10 erfüllt. Dann gilt
∞
∞
∞
X
X
X
1
j 1
2 j p =
(2(1−p) )j konvergiert.
konvergiert ⇐⇒
kp
(2
)
j=0
j=0
k=1
Die geometrische Reihe
∞
P
(2(1−p) )j konvergiert genau dann, wenn 2(1−p) < 1
j=0
d.h. genau dann, wenn p > 1 gilt.
⊓
⊔
Das Cauchy–Produkt von Reihen komplexer Zahlen
Wir haben bereits gesehen, dass man konvergente Reihen in Banachräumen
addieren und mit Skalaren multiplizieren kann. Betrachtet man nur Reihen
im Banachraum der komplexen Zahlen (E = C), so kann man sie auch auf
bestimmte Weise multiplizieren.
3.1 Konvergenzkriterien für Reihen in Banachräumen
Definition 3.4. Seien
eine neue Reihe
∞
P
∞
P
ak und
∞
P
105
bk zwei Reihen in C. Wir betrachten
k=0
k=0
ck mit den Reihengliedern
k=0
ck :=
k
X
j=0
Die Reihe
∞
P
aj · bk−j = a0 bk + a1 bk−1 + · · · + ak−1 b1 + ak b0
ck heißt Cauchy–Produkt der Reihen
∞
P
ak und
bk .
k=0
k=0
k=0
∞
P
Wir wollen die Frage behandeln, unter welchen Bedingungen aus der Kon∞
∞
P
P
bk die Konvergenz des Cauchy-Produktes
ak und
vergenz der Reihen
∞
P
k=0
k=0
ck folgt. Im allgemeinen folgt sie nicht.
k=0
Beispiel 10: Wir betrachten die alternierenden Reihen
∞
X
ak =
k=0
∞
X
k=0
bk =
∞
X
1
1
1
(−1)k
√
= 1 − √ + √ − √ ± ....
k+1
2
3
4
k=0
Diese Reihen konvergieren nach dem Leibnitz–Kriterium für alternierende Reik
P
aj bk−j , so erhalten wir
hen. Betrachten wir aber die Folge ck =
j=0
ck =
Es gilt
k
k
X
X
(−1)j
(−1)k−j
(−1)k
√
p
·√
.
=
j+1
k − j + 1 j=0 (j + 1)(k − j + 1)
j=0
(k − j + 1)(j + 1) =
1
k+1
2
2
−
1
k−j
2
2
≤
1
k+1
2
2
und folglich
|ck | ≥
k+1
2(k + 1)
−→ 2.
=
k+2
+1
1
2k
Damit ist (ck ) keine Nullfolge und die Reihe
∞
P
k=0
ck somit divergent.
106
3 Reihen in Banachräumen
Satz 3.11 Seien
∞
P
ak und
∞
P
bk konvergente Reihen komplexer Zahlen und
k=0
k=0
sei mindestens eine der beiden Reihen absolut–konvergent. Dann konvergiert
∞
P
ck und es gilt
ihr Cauchy–Produkt
k=0
∞
X
ck =
k=0
∞
P
Beweis. Sei OBdA
∞
X
ak
k=0
!
·
∞
X
k=0
bk
!
.
ak absolut–konvergent. Wir setzen
k=0
An =
n
X
ak
Bn :=
k=0
n
X
bk
Cn =
k=0
n
X
ck .
k=0
Weiterhin bezeichne A := lim An , B = lim Bn und βn = Bn − B . Dann
n→∞
n→∞
erhalten wir
Cn = c0 + c1 + . . . + cn
= a0 b0 + (a0 b1 + a1 b0 ) + . . . + (a0 bn + a1 bn−1 + . . . + an b0 )
= a0 · Bn + a1 · Bn−1 + . . . + an · B0
= a0 (βn + B) + a1 (βn−1 + B) + . . . + an (β0 + B)
= An · B + a0 βn + a1 βn−1 + . . . + an β0 .
|
{z
}
=:γn
Es bleibt somit γn −→ 0 zu zeigen, da An · B gegen A · B konvergiert.
Sei ε > 0 gegeben. Da Bn gegen B konvergiert, existiert ein n0 ∈ N so dass
|βn | = |Bn − B| < ε
∀ n ≥ n0 .
Damit schätzen wir |γn | ab.
|γn | = |a0 βn + a1 βn−1 + . . . + an β0 |
≤ |a0 βn + . . . + an−n0 βn0 | + |an−n0 +1 βn0 −1 + . . . + an β0 |
≤ ε(|a0 | + . . . + |an−n0 |) + |an−n0 +1 βn0 −1 + . . . + an β0 |
!
∞
X
≤ ε·
|ak | +|an−n0 +1 ||βn0 −1 | + . . . + |an ||β0 |
|
k=0
{z
=:A∗
}
≤ εA∗ + |an−n0 +1 ||βn0 −1 | + . . . + |an ||β0 |
A∗ ist endlich, da die Reihe
∞
P
∀ n ≥ n0 .
ak nach Voraussetzung absolut konvergiert.
k=0
Da (an ) eine Nullfolge ist, erhalten wir
3.1 Konvergenzkriterien für Reihen in Banachräumen
lim |γn | ≤ εA∗
n→∞
107
∀ ε > 0.
Somit konvergiert γn gegen 0 und Cn = An · B + γn gegen A · B.
⊓
⊔
Satz 3.12 Das Cauchy-Produkt zweier absolut-konvergenter Reihen ist absolut konvergent.
⊓
⊔
Beweis. Übungsaufgabe.
Beispiel 11:
∞
X
k=1
k · z k−1 =
1
(1 − z)2
Beweis. Wir betrachten die Reihen
für |z| < 1.
∞
P
k=0
Dann ist ck =
k
P
j=0
∞
P
k=0
ck =
∞
P
k=1
ak und
∞
P
bk mit ak = bk = z k .
k=0
z j · z k−j = (k + 1) · z k . Also ist das Cauchy–Produkt
k · z k−1 . Da die geometrische Reihe
∞
P
k=0
z k für |z| < 1 absolut
1
konvergiert und ihr Wert 1−z
ist, konvergiert das Cauchy–Produkt für |z| < 1
gegen den oben angegebenen Wert. (Die Konvergenz folgt zwar auch aus dem
Quotientenkriterium, aber auf diese Weise kann man auch den Wert der Reihe
bestimmen).
⊓
⊔
Der Umordnungssatz
In einer endlichen Summe kann man die Summanden beliebig umordnen, ohne
den Wert der Summe zu verändern. Dies ist für Reihen (“unendliche Summen“) nicht mehr der Fall. Abschließend untersuchen wir deshalb die Frage,
unter welchen Bedingungen man Reihenglieder umordnen kann, ohne die Konvergenz zu verlieren.
Definition 3.5. Sei
∞
P
k=1
xk eine Reihe im Banachraum E und f : N −→ N
eine bijektive Abbildung. Die Reihe
∞
P
xf (k) heißt Umordnung von
k=1
∞
P
xk .
k=1
Man kann die Glieder einer Reihe nicht beliebig umordnen. Betrachten wir
z.B. die Reihe
1
1
1
1
1
1
√ − √ + √ − √ + √ − √ ± . . . (∗)
1
1
2
2
3
3
Die Reihe (∗) ist konvergent, denn für die Partialsummen gilt
108
3 Reihen in Banachräumen
s2m = 0
1
s2m+1 = √m+1
dh. sm −→ 0.
Betrachten wir nun folgende Umordnung der obigen Reihe (∗)
1
1
1
1
1
1
1
1
1
√ +√ −√
+ √ +√ −√
+ √ +√ −√
+ . . . (∗∗)
1
3
4
2
3
1
2
5
6
Für die 3n-ten Partialsummen s∗3n dieser Reihe (∗∗) gilt
s∗3n
1
1
1
n
1
= √
≥ √ + ... + √ = √ =
+ ...+ √
n+1
2n
2n
2n
2n
|
{z
} |
{z
}
n Summanden
r
n
−→ ∞.
2
n Summanden
Somit ist diese Reihe (**) nicht konvergent.
Satz 3.13 (Umordnungssatz) Sei
∞
P
xk eine absolut–konvergente Reihe
k=1
im Banachraum E. Dann ist jede Umordnung von
∞
X
xk =
k=1
Beweis. Sei
k=1
xk konvergent und es
k=1
gilt
∞
P
∞
P
∞
P
∞
X
xf (k) .
k=1
xf (k) eine Umordnung von
∞
P
xk . Nach Voraussetzung ist
k=1
k=1
xk absolut-konvergent, also auch konvergent, d.h. es existiert ein s ∈ E
mit s =
∞
P
xk . Es bezeichne
k=1
sn := x1 + . . . + xn und s∗n := xf (1) + . . . + xf (n) .
Sei nun eine Zahl ε > 0 gegeben. Da
∞
P
xk absolut konvergiert, existiert nach
k=1
dem Cauchy-Kriterium ein n0 ∈ N, so dass
m
X
j=n
kxj k < ε.
∀ m > n ≥ n0
(∗)
Da die Umordnung f : N −→ N bijektiv ist, gibt es ein p0 ∈ N, so dass
{1, . . . , n0 } ⊂ f ({1, . . . , p0 }). Für p ≥ p0 ergibt sich dann
sp − s∗p = x1 + . . . + xp − (xf (1) + . . . + xf (p) )
= Summe gewisser xi für i > n0 .
3.1 Konvergenzkriterien für Reihen in Banachräumen
109
Aus (∗) folgt ksp − s∗p k < ε ∀ p ≥ p0 . Da sp gegen s konvergiert, gibt es auch
ein n∗0 ∈ N so dass
ksp − sk < ε
∀ p > n∗0 .
Damit erhalten wir
ks∗n − sk ≤ ks∗n − sn k + ksn − sk < 2ε
∀ n ≥ max{p0 , n∗0 }.
Folglich konvergiert die Folge (s∗n ) gegen s, also gilt
∞
P
xf (k) = s.
k=1
⊓
⊔
Ohne die Voraussetzung der absoluten Konvergenz gilt Satz 3.13 nicht mehr.
Es gilt sogar
Satz 3.14 (Riemannscher Umordnungssatz)
∞
P
ak eine konvergente, aber nicht absolut konvergente Reihe reeller ZahSei
k=1
len und sei s ∈ R eine beliebig (!) vorgegebene Zahl. Dann existiert eine bijekti∞
P
af (k) gegen s konvergiert.
ve Abbildung f : N → N, so dass die Umordnung
k=1
Beweis. Sei oBdA ak 6= 0 für alle k ∈ N. Wir setzen
|ak | + ak
ak falls ak > 0
+
ak :=
=
0 falls ak < 0
2
|ak | − ak
0
falls ak > 0
=
a−
:=
k
−ak falls ak < 0
2
−
+
−
Dann gilt ak = a+
k − ak und |ak | = ak + ak . Aus der Voraussetzung des Sat∞
∞
P −
P +
ak divergent sind. Wäre nämlich
ak und
zes folgt, dass beide Reihen
k=1
k=1
eine dieser beiden Reihen konvergent, so würde wegen der Konvergenz von
∞
P
ak auch die andere dieser beiden Reihen konvergieren und die Konver-
k=1
genz von
∞
P
k=1
|ak | folgen (Satz 3.4).
Sei nun (pm ) die Teilfolge aller positiven Zahlen von (ak ) und (qm ) die Teilfolge aller negativen Zahlen von (ak ). Offensichtlich entsteht die Folge (pm ),
wenn man aus der Folge (a+
k ) alle Nullen streicht und (−qm ), wenn man aus
der Folge (a−
)
alle
Nullen
streicht.
Nach dem oben Gesagten sind die Reihen
k
∞
∞
P
P
pm und
qm divergent und es gilt
m=1
m=1
∞
X
m=1
pm = +∞ ,
∞
X
m=1
qm = −∞
(∗)
110
3 Reihen in Banachräumen
kann man schrittweise eine Folge jeweils kleinster
der folgenden Eigenschaft wählen:
n0
P
n0 so dass
n1 so dass
n2 > n0 so dass
n3 > n1 so dass
m=1
n0
P
m=1
n0
P
m=1
n0
P
pm
> s
pm +
pm +
pm +
m=1
..
.
∞
P
ak . Wegen (∗)
k=1
Indizes n0 , n1 , n2 , . . . mit
Wir konstruieren nun die gesuchte Umordnung der Reihe
n1
P
m=1
n1
P
m=1
n1
P
m=1
qm
< s
n2
P
qm +
qm +
pm
m=n0 +1
n2
P
pm +
m=n0 +1
> s
n3
P
qm < s
m=n1 +1
Die Reihe
p1 + . . . + pn0 + q1 + . . . + qn1 + pn0 +1 + . . . + pn2 + qn1 +1 + . . . + qn3 + . . .
ist eine Umordnung von
∞
P
(∗∗)
ak . Aus der Minimalitätseigenschaft der Wahl
k=1
der Indizes nj erhält man folgende Abschätzung für die Partialsumme s∗n der
Reihe (∗∗):
|s − s∗n | ≤ pn2j
|s −
Da die Reihe
s∗n |
∞
P
k=1
≤ −qn2j+1
∀ n2j−1 + n2j ≤ n < n2j + n2j+1
∀ n2j + n2j+1 ≤ n < n2j+1 + n2j+2
∞
ak konvergiert, sind die Teilfolgen (pn2j )∞
j=0 und (qn2j+1 )j=0
von (an ) Nullfolgen. Folglich konvergiert die Folge der Partialsummen (s∗n ) der
Umordnung (∗∗) gegen s.
⊓
⊔
3.2 Komplexe Potenzreihen
Als Anwendung der Konvergenzkriterien aus Kapitel 3.1 betrachten wir in
diesem Abschnitt spezielle Reihen im Banachraum der komplexen Zahlen, die
sogenannten Potenzreihen.
Definition 3.6. Sei z0 ∈ C und (an ) eine Folge komplexer Zahlen. Eine Potenzreihe mit dem Zentrum z0 ist eine Reihe komplexer Zahlen der Form
P (z) :=
∞
X
n=0
an (z − z0 )n ,
z ∈ C.
3.2 Komplexe Potenzreihen
111
Wir wollen die Frage untersuchen, für welche z ∈ C die Potenzreihe P (z)
konvergiert. Offensichtlich konvergiert die Potenzreihe P (z) für z = z0 .
Satz 3.15 Sei P (z) =
∞
P
n=0
und sei z1 6= z0 .
an (z − z0 )n eine Potenzreihe mit dem Zentrum z0
1. Ist P (z1 ) konvergent, so ist P (z) für jedes z ∈ C mit |z − z0 | < |z1 − z0 |
absolut-konvergent.
2. Ist P (z1 ) divergent, so ist P (z) für jedes z ∈ C mit |z − z0 | > |z1 − z0 |
divergent.
Beweis. Zu 1: Da die Reihe P (z1 ) =
∞
P
n=0
an (z1 − z0 )n konvergiert, ist die
Folge (an (z1 − z0 )n ) eine Nullfolge, also insbesondere beschränkt. Sei C ∈ R
so gewählt, dass |an (z1 − z0 )n | ≤ C für alle n ∈ N0 . Dann gilt
n
z − z0 n
n
n z − z0 .
≤C·
|an (z − z0 ) | = |an (z1 − z0 ) | z1 − z0 z1 − z0 0
Für z ∈ C mit |z − z0 | < |z1 − z0 | folgt | zz−z
| < 1. Aus dem Majorantenkri1 −z0
terium und dem Grenzwert der geometrischen Reihe erhält man
∞
∞ X
X
z − z0 n
1
n
|an (z − z0 ) | ≤ C
z1 − z0 = C · 1 − | z−z0 | .
z1 −z0
n=0
n=0
Insbesondere ist
∞
P
n=0
an (z − z0 )n absolut-konvergent.
Zu 2: Sei P (z1 ) divergent und |z − z0 | > |z1 − z0 |. Wäre P (z) konvergent, so
würde aus 1. folgen, dass P (z1 ) absolut-konvergent wäre, was einen Widerspruch liefert.
⊓
⊔
Definition 3.7. Die Zahl R := sup{|z−z0 | P (z) ist konvergent} ∈ R∪{+∞}
heißt Konvergenzradius der Potenzreihe P (z). Die Kreisscheibe K(z0 , R) ⊂ C
heißt Konvergenzkreis von P (z).
Nach Satz 3.15 ist die Potenzreihe P (z) für z ∈ K(z0 , R) absolut-konvergent
und für z ∈ C \ cl(K(z0 , R)) divergent. Aus Kapitel 3.1. wissen wir bereits
•
Für P (z) =
•
Für P (z) =
•
Für P (z) =
∞
P
n=0
∞
P
n=0
∞
P
n=0
z n ist R = 1.
zn
n
ist R = 1.
zn
n!
ist R = +∞.
112
3 Reihen in Banachräumen
Die nächsten beiden Sätze zeigen, wie man den Konvergenzradius einer Potenzreihe bestimmen kann.
∞
P
Satz 3.16 Sei P (z) =
an (z − z0 )n eine Potenzreihe und
n=0
p
λ := lim sup n |an |. Dann gilt für den Konvergenzradius R von P (z)
n→∞
1
+

 λ falls λ ∈ R
R = 0 falls λ = +∞


∞ falls λ = 0.
Beweis. Sei
α := lim sup
n→∞
p
p
n
|an (z − z0 )n | = lim sup n |an | · |z − z0 | = λ · |z − z0 |.
n→∞
Nach dem Wurzelkriterium konvergiert P (z) für α < 1 und divergiert für
α > 1.
(1) Sei 0 < λ < +∞. Dann gilt
(
konvergiert für alle z mit |z − z0 | < λ1
P (z)
divergiert für alle z mit |z − z0 | > λ1
Folglich ist R = λ1 .
(2) Sei λ = 0, dann ist auch α = 0. Somit konvergiert P (z) für alle z ∈ C und
der Konvergenzradius R ist +∞.
(3) Sei λ = +∞. Dann gilt
0 z = z0
α=
+∞ z 6= z0 .
Die Reihe P (z) divergiert also für alle z 6= z0 . Somit ist R = 0.
⊓
⊔
Auf analoge Weise erhält man aus dem Quotientenkriterium
Satz 3.17 Sei P (z) =
∞
P
n=0
an (z − z0)n eine Potenzreihe und seien alle an von
Null verschieden. Wir setzen µ := lim | an+1
an |. Dann gilt für den Konvergenzradius R von P (z)
n→∞
1
+

 µ falls µ ∈ R
R = 0 falls µ = +∞


∞ falls µ = 0.
3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen
113
3.3 Exponentialfunktion, Logarithmusfunktion und
komplexe Potenzen
In Kapitel 1.2 haben wir Potenzen aq definiert, wobei a eine positive reelle
Zahl und der Exponent q eine rationale Zahl bezeichnet. In diesem Abschnitt
wollen wir Potenzen az für komplexe Exponenten z ∈ C erklären und die
Eigenschaften dieser Potenzen untersuchen.
Dazu betrachten wir zunächst die folgende komplexe Potenzreihe:
E(z) :=
∞
X
z2
z3
zn
=1+z+
+
+ ...
n!
2!
3!
n=0
Die Reihe E(z) hat folgende Eigenschaften:
(1) E(z) ist für jedes z ∈ C absolut-konvergent.
∞
P
1
(2) Es gilt E(0) = 1 und E(1) =
n! = e, wobei e die Eulerzahl bezeichnet.
n=0
(3) Es gilt E(z1 ) · E(z2 ) = E(z1 + z2 ) für alle z1 , z2 ∈ C.
Dies läßt sich mit der Formel für das Cauchy–Produkt aus Abschnitt
3.1 zeigen. Das Cauchy-Produkt der beiden absolut-konvergenten Reihen
E(z1 ) und E(z2 ) ist
!
!
n
∞
∞
n X
X
X
1 X n k n−k
z1k
z2n−k
=
·
z ·z
k! (n − k)!
n!
k 1 2
n=0
n=0
k=0
k=0
∞
X
(z1 + z2 )n
=
n!
n=0
= E(z1 + z2 ).
Folglich gilt nach Satz 3.11, dass E(z1 + z2 ) = E(z1 ) · E(z2 ).
Insbesondere ist E(z) 6= 0 und E(z) · E(−z) = E(0) = 1 für alle z ∈ C.
(4) Es gilt E(z) = E(z).
|z|
(5) Es gilt |E(z) − 1| ≤ 1−|z|
für alle z ∈ C mit 0 < |z| < 1:
Wir benutzen dazu die Konvergenzeigenschaften der geometrischen Reihe
und das Majorantenkriterium und erhalten
!
∞
∞
∞
∞
X
X
X
|z|
z n X |z|n
|z|n = |z|
≤
.
|z|n =
|E(z) − 1| = ≤
n!
n!
1
−
|z|
n=1
n=1
n=0
n=1
(6) Es gilt E(q) = eq für alle q ∈ Q:
Für n ∈ N ist
E(n) = E(1 + . . . + 1) = E(1) · . . . · E(1) = e| · .{z
. . · e} = en
| {z }
|
{z
}
n−mal
n−mal
n−mal
114
3 Reihen in Banachräumen
1
1
= e−n
= en . Folglich ist E(n) = en für
Für n ∈ −N gilt E(n) = E(−n)
n
alle n ∈ Z. Sei nun q ∈ Q und q = m , wobei n ∈ Z und m ∈ N. Dann ist
(eq )m = eq·m = en = E(n) = E(q · m) = E(q + . . . + q )
| {z }
m−mal
= E(q) · . . . · E(q) = E(q)m .
|
{z
}
m−mal
Da eq und E(q) positiv sind, folgt eq = E(q).
Die letzte Eigenschaft von E(z) rechtfertigt die folgende Definition:
Definition 3.8. Unter der komplexen Potenz ez der Eulerzahl e verstehen
wir den Wert der Potenzreihe E(z), d.h.
ez := E(z) =
Die Funktion
∞
X
zn
.
n!
n=0
exp : C −→ C
z 7−→ ez
heißt Exponentialfunktion.
Aus den Eigenschaften der Potenzreihe E(z) folgt
Satz 3.18 Die komplexen Potenzen der Eulerzahl erfüllen
1. ez+w = ez · ew
|z|
2. |ez − 1| ≤ 1−|z|
für alle z, w ∈ C.
für alle z ∈ C mit 0 ≤ |z| < 1.
Satz 3.19 Die Abbildung exp|R : R −→ R+ ist streng monoton wachsend und
bijektiv. Es gilt
1. 1 ≤ ex
2. 0 < ex ≤ 1
für alle x ∈ R mit x ≥ 0.
für alle x ∈ R mit x ≤ 0.
Beweis. Nach Definition ist ex = E(x) ≥ 1 für alle x ≥ 0. Da ex ·e−x = e0 = 1,
folgt daraus 0 < ex ≤ 1 für alle x ≤ 0.
Seien nun x und y zwei reelle Zahlen mit x < y. Dann ist
ey = ex+(y−x) = ex · ey−x > ex .
Somit ist die Funktion exp|R steng monoton wachsend. Insbesondere ist sie
deshalb injektiv. Es bleibt zu zeigen, dass exp|R : R → R+ surjektiv ist.
3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen
115
Sei y ∈ R+ . Wir suchen eine Zahl s ∈ R mit es = y. Dazu betrachten wir die
folgenden Mengen
A = {x ∈ R | ex < y}
und
B = {x ∈ R | y ≤ ex }.
Diese Mengen bilden einen Dedekindschen Schnitt (A|B) von R, denn
•
•
•
R ist die disjunkte Vereinigung von A und B.
y−1
A und B sind nichtleer, denn e y < y ≤ ey (Übungsaufgabe 55 (2)).
Für a ∈ A und b ∈ B gilt ea < y ≤ eb . Wegen der Monotonie der Exponentialfunktion folgt a < b.
Sei s ∈ R die auf Grund des Vollständigkeitsaxioms der reellen Zahlen existierende Schnittzahl des Dedekindschen Schnittes (A|B). Wir zeigen nun, dass
es = y gilt.
Wir wissen, dass a ≤ s ≤ b für alle a ∈ A, b ∈ B. Sei (an ) eine Folge in A,
die gegen s konvergiert. Dann gilt ean < y und
|es − ean | = |ean ||e(s−an ) − 1| < |y| ·
|s − an |
−→ 0.
1 − |s − an |
Daraus folgt lim ean = es ≤ y.
n→∞
Sei (bn ) eine Folge in B, die gegen s konvergiert. Dann gilt ebn ≥ y und
|ebn − es | = |es ||e(bn −s) − 1| ≤ |es | ·
|bn − s|
−→ 0.
1 − |bn − s|
Es folgt lim ebn = es ≥ y. Also ist y = es .
n→∞
⊓
⊔
Definition 3.9. Die Umkehrabbildung von exp|R bezeichnen wir mit
ln : R+ −→ R
und nennen ln(y) den natürlichen Logarithmus von y.
Die Zahl ln(y) ist also eindeutig bestimmt durch die Bedingung eln(y) = y.
Daraus ergeben sich folgende Eigenschaften für den natürlichen Logarithmus:
Satz 3.20 Es seien y, y1 , y2 ∈ R+ und q ∈ Q.
1.
2.
3.
4.
5.
6.
Die Funktion ln : R+ −→ R ist bijektiv und streng monoton wachsend.
ln(y1 · y2 ) = ln(y1 ) + ln(y2 ).
ln(y q ) = q · ln(y).
ln( yy12 ) = ln(y1 ) − ln(y2 ).
ln(1) = 0, ln(e) = 1.
ln(y) > 0 für alle y > 1 und ln(y) < 0 für alle 0 < y < 1.
116
3 Reihen in Banachräumen
Das folgende Bild zeigt den Funktionsverlauf der reellen Funktionen exp|R und
ln.
R6
.. ex
...
...
..
...
..
.
e
...
...
.
.
..
...
....
.
.
.
.
...........................
...
..............
......
..1
..........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
....
.....
.............
......
.................................
.....
.
.
.
...1
...
....
.
...
....
.
...
....
.
...
ln(x)
R
Sei a ∈ R+ . Dann gilt für die Potenz ax , x ∈ R, die Formel
ax = eln(a)·x =
∞
X
(x · ln(a))n
.
n!
n=0
Dies rechtfertigt die folgende Definition der komplexen Potenzen einer beliebigen positiven reellen Zahl:
Definition 3.10. Sei a ∈ R+ und z ∈ C. Unter der Potenz az verstehen wir
die komplexe Zahl
az := E(z · ln(a)) =
∞
X
(z · ln(a))n
= ez·ln(a) .
n!
n=0
Aus den Eigenschaften der Potenzreihe E(z) ergibt sich unmittelbar
Satz 3.21 (Potenzgesetze für komplexe Potenzen)
Es seien a, b ∈ R+ , x ∈ R und z, w ∈ C. Dann gilt:
1.
2.
3.
4.
5.
1z = 1 und a0 = 1.
az · bz = (ab)z .
az · aw = az+w .
a−z = a1z .
(ax )z = ax·z .
Sei a ∈ R+ \ {1}. Dann ist die Abbildung
3.3 Exponentialfunktion, Logarithmusfunktion und komplexe Potenzen
117
expa : R −→ R+
x 7−→ ax
bijektiv, streng monoton wachsend, falls a > 1, und streng monoton fallend,
falls 0 < a < 1. Die Umkehrabbildung zu expa bezeichnen wir mit
loga : R+ −→ R
und nennen loga (y) den Logarithmus von y zur Basis a. Aus den Potenzgesetzen folgen dann unmittelbar die Aussagen des folgenden Satzes.
Satz 3.22 Die Funktion loga : R+ −→ R ist bijektiv, streng monoton wachsend, falls a > 1, und streng monoton fallend, falls 0 < a < 1.
Es seien x, y ∈ R+ , ρ ∈ R und a ∈ R+ . Dann gilt:
1.
2.
3.
4.
5.
x
loga x = ln
ln a .
loga (x · y) = loga x + loga y.
loga (xρ ) = ρ · loga x.
loga ( xy ) = loga (x) − loga (y).
loga (1) = 0, loga (a) = 1.
4
Stetige Abbildungen zwischen metrischen
Räumen
4.1 Der Grenzwert einer Abbildung in einem Punkt
In diesem Abschnitt bezeichnen (X, dX ) und (Y, dY ) metrische Räume, A ⊂ X
eine Teilmenge von X und f : A ⊂ X −→ Y eine auf A definierte Abbildung.
Definition 4.1. Sei x ∈ X ein Häufungspunkt von A. Ein Punkt y ∈ Y heißt
Grenzwert der Abbildung f im Punkt x, falls für jede Folge (an ) von Punkten
aus A mit an 6= x und an −→ x, die Folge der Bildwerte (f (an )) gegen y
konvergiert. Wir schreiben dafür symbolisch:
y = lim f (a).
a→x
Bemerkung: Der Punkt x muss nicht unbedingt im Definitionsbereich A von
f liegen. Wir benötigen lediglich, dass er der Grenzwert einer Folge von Punkten aus A ist, d.h. dass x ∈ HP (A).
Beispiel 1: Es sei X = R2 , A = R2 \ {(0, 0)} und Y = R. Wir betrachten die
Abbildung f : A −→ R mit
f (x, y) :=
Behauptung:
lim
(x,y)→(0,0)
x3 − y 3
.
x2 + y 2
f (x, y) = 0.
Beweis. Sei (x, y) 6= (0, 0). Dann gilt
(x − y)(x2 + xy + y 2 )
xy
x3 − y 3
=
= (x − y)(1 + 2
).
2
2
2
2
x +y
x +y
x + y2
1
Wegen x2xy
+y 2 ≤ 2 , folgt
120
4 Stetige Abbildungen zwischen metrischen Räumen
3
|x − y|.
2
|f (x, y)| ≤
Sei nun ((xn , yn )) eine beliebige gegen (0, 0) konvergente Folge. Dann gilt
xn −→ 0 und yn −→ 0 , somit xn − yn −→ 0 und folglich |f (xn , yn )| −→ 0.
Also ist lim f (xn , yn ) = 0 für alle Folgen (xn , yn ) −→ (0, 0) und es gilt
n→∞
lim
(x,y)→(0,0)
⊓
⊔
f (x, y) = 0.
Beispiel 2: Es sei X = R2 , A = R2 \ {(0, 0)} und Y = R. Wir betrachten die
Abbildung f : A −→ R mit
f (x, y) =
Behauptung:
lim
(x,y)→(0,0)
xy 2
x2 + y 4
f (x, y) existiert nicht.
Beweis. Wir betrachten die Folgen (an ) und (bn ) im R2 mit
an :=
Dann gilt
1 1
,
n n
1 1
−→ (0, 0),
,
n n
1 1
−→ (0, 0),
,
bn =
n2 n
an =
und
f (an ) =
f (bn ) =
bn :=
1
n3
1
n2
+
1
n4
1
n4
1
n4
+
1
n4
1 1
.
,
n2 n
=
n
−→ 0
n2 + 1
=
1
1
−→ .
2
2
Folglich hat f in (0, 0) keinen Grenzwert.
⊓
⊔
Satz 4.1 Sei f : A ⊂ X −→ Y eine Abbildung und x ∈ HP (A). Dann sind
die folgenden Bedingungen äquivalent:
1. lim f (a) = y.
a→x
2. Für alle ε > 0 existiert ein δ > 0, so dass
f A ∩ KX (x, δ) \ {x} ⊂ KY (y, ε),
d.h. so dass für alle a ∈ A mit 0 < dX (x, a) < δ gilt dY (f (a), y) < ε.
Beweis. (1) =⇒ (2): Sei lim f (a) = y. Angenommen 2. gilt nicht, das heißt
a→x
es existiert ein ε0 > 0, so dass es zu jedem δ > 0 ein a ∈ A gibt mit
0 < dX (x, a) < δ und dY (f (a), y) ≥ ε0 . Wir wählen speziell δ = n1 . Dann
4.1 Der Grenzwert einer Abbildung in einem Punkt
121
erhalten wir eine Folge (an ) in A mit an 6= x, so dass dX (x, an ) < n1 und
dY (f (an ), y) ≥ ε0 gilt. Daraus folgt an −→ x aber f (an ) 6−→ y. Dies steht
aber im Widerspruch zu der Voraussetzung lim f (an ) = y.
n→∞
(2) =⇒ (1): Sei 2. erfüllt. Wir betrachten eine gegen x konvergente Folge (an )
in A mit an 6= x. Sei ε > 0. Nach Voraussetzung existiert ein δ > 0, so dass
f A ∩ KX (x, δ) \ {x} ⊂ KY (y, ε).
Da an gegen x konvergiert, existiert ein n0 ∈ N, so dass dX (x, an ) < δ für alle
n ≥ n0 . Folglich ist dY (y, f (an )) < ε für alle n ≥ n0 . Also konvergiert (f (an ))
gegen y und zwar für jede Folge (an ) in A mit an 6= x und an −→ x.
⊓
⊔
Wir betrachten nun den Fall, dass der metrische Raum Y ein Produktraum
ist.
Satz 4.2 Sei (Y, dY ) das Produkt von metrischen Räumen Y1 , Y2 , . . . , Yn und
f : A ⊂ X −→ Y = Y1 × Y2 × . . . × Yn . Wir bezeichnen mit fj : A −→ Yj die
durch
f (a) = (f1 (a), f2 (a), . . . , fn (a))
definierten Abbildungen. Dann gilt
lim fj (a) = yj ∀ j ∈ {1, . . . , n}
a→x
⇐⇒
lim f (a) = (y1 , . . . , yn ).
a→x
Beweis. Die Behauptung folgt aus dem Satz 2.13 über die Konvergenz von
Folgen in Produkträumen.
⊓
⊔
Spezialfall: Sei f : A ⊂ X −→ C eine Abbildung mit komplexen Werten.
Dann gilt
lim f (a) = lim Re(f (a)) + i · lim Im(f (a)).
a→x
a→x
a→x
Die speziellen Rechenregeln für konvergente Folgen im Vektorraum Rn bzw.
Cn , siehe Satz 2.18, liefern unmittelbar die folgenden Aussagen über Grenzwerte von Abbildungen mit Werten in Vektorräumen:
Satz 4.3 (Grenzwerte von Abbildungen mit Werten in Rn bzw. Cn )
Sei K der Körper der reellen bzw. der komplexen Zahlen und sei h·, ·i ein Skalarprodukt und k · k eine Norm auf Kn .
1. Seien f, g : A −→ Kn zwei Abbildungen, für die die Grenzwerte lim f (a)
a→x
und lim g(a) existieren. Dann gilt:
a→x
122
4 Stetige Abbildungen zwischen metrischen Räumen
(a) Es existiert lim (g + f )(a) und es gilt
a→x
lim (g + f )(a) = lim g(a) + lim f (a).
a→x
a→x
a→x
(b) Es existiert lim hf, gi(a) und es gilt:
a→x
lim hf, gi(a) = h lim f (a), lim g(a)i.
a→x
a→x
a→x
(c) Es existiert lim kf k(a) und es gilt:
a→x
lim kf k(a) = k lim f (a)k.
a→x
a→x
n
2. Seien f : A −→ K und h : A −→ K zwei Abbildungen, für die die
Grenzwerte lim f (a) und lim h(a) existieren. Dann existiert auch der
a→x
a→x
Grenzwert lim (h · f )(a) und es gilt
a→x
lim (h · f )(a) = lim h(a) · lim f (a).
a→x
a→x
a→x
3. Seien h : A −→ K und p : A −→ K zwei Abbildungen, für die die
Grenzwerte lim h(a) und lim p(a) existieren und sei h(a) 6= 0 für alle
a→x
a→x
a ∈ A und lim h(a) 6= 0 . Dann existiert der Grenzwert lim ( hp )(a) und
a→x
a→x
es gilt
p
lim p(a)
(a) = a→x
.
lim
a→x h
lim h(a)
a→x
⊓
⊔
Im metrischen Raum R hatten wir außer den konvergenten Folgen auch Folgen betrachtet, die gegen +∞ oder −∞ streben und diesen den uneigentlichen
Grenzwert ±∞ zugeordnet. Wir betrachten die analoge Situation für Grenzwerte von Abbildungen f : X −→ Y , wobei X = R oder Y = R ist.
1. Fall: Sei X ein beliebiger metrischer Raum, Y = R und
f : A ⊂ X −→ R.
Man sagt, dass der (uneigentliche) Grenzwert von f in x gleich +∞ ist, falls
lim f (an ) = +∞ für jede gegen x konvergente Folge (an ) in A mit an 6= x .
n→∞
Analog wird lim f (a) = −∞ definiert.
a→x
Satz 4.4 Sei f : A ⊂ X −→ R eine Abbildung von einer Teilmenge eines
metrischen Raumes X in die reellen Zahlen. Dann sind folgende Bedingungen
äquivalent:
1. lim f (a) = +∞.
a→x
4.1 Der Grenzwert einer Abbildung in einem Punkt
123
2. Für alle M > 0 existiert ein δ > 0 , so dass f (a) > M für alle a ∈ A mit
0 < dX (a, x) < δ.
Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt.
⊓
⊔
Beispiel: Wir betrachten die Funktion f : R2 \ {(0, 0)} −→ R definiert durch
f (x, y) =
Dann gilt
lim
(x,y)→(0,0)
x2
1
.
+ y2
f (x, y) = +∞.
2. Fall: Sei X = R, Y ein beliebiger metrischer Raum und
f : (c, +∞) ⊂ R −→ Y .
Man sagt, dass lim f (a) existiert und gleich y ∈ Y ist, falls
a→+∞
lim f (an ) = y für jede Folge (an ) in (c, +∞) mit an −→ +∞.
n→+∞
Wir schreiben in diesem Fall
lim f (a) = y .
a→+∞
Analog definiert man lim f (a) = y.
a→−∞
Satz 4.5 Mit den obigen Bezeichnungen sind folgende Bedingungen äquivalent:
1.
lim f (a) = y.
a→+∞
2. Für alle ε > 0 existiert ein M > 0 so dass dY (f (a), y) < ε für alle a > M .
Beweis. Der Beweis wird analog zum Beweis von Satz 4.1 geführt.
⊓
⊔
Beispiel: Seien f1 , f2 : (0, +∞) ⊂ R −→ C gegeben durch
1
(cos t + i sin t)
f2 (t) := cos t + i sin t
t
lim f1 (t) = 0 während der GW von f2 für t gegen +∞ nicht
f1 (t) :=
Dann gilt
t→+∞
existiert.
Beweis. Die erste Behauptung folgt, da |f (t)| = 1t . Für die 2. Behauptung
betrachte man die Folge tn = nπ. Da f2 (2kπ) = 1 und f2 ((2k + 1)π) = −1 ,
hat die Bildfolge f (tn ) zwei verschiedene Häufungspunkte.
⊓
⊔
3. Fall: Seien X = Y = R und f : (c, +∞) ⊂ R −→ R.
Dann gilt
lim f (a) = ±∞
a→+∞
genau dann, wenn für alle Folgen (an ) in
(c, +∞), die gegen +∞ streben, die Folge f (an ) gegen ±∞ strebt.
Analog wird der uneigentliche Grenzwert von f für a gegen −∞ definiert.
124
4 Stetige Abbildungen zwischen metrischen Räumen
Im Fall von reellen Funktionen f : A ⊂ R −→ R kann man einseitige Grenzwerte definieren.
Definition 4.2. Sei f : A ⊂ R −→ R und x ∈ (α, β) ⊂ A.
Man sagt, dass der linksseitige Grenzwert von f in x existiert und gleich
y ∈ R ist, falls lim f (an ) = y für jede gegen x konvergente Folge (an ) in A
n→∞
mit an < x.
Wir bezeichnen den linksseitigen Grenzwert mit lim− f (a) = y.
a→x
Man sagt, dass der rechtsseitige Grenzwert von f in x existiert und gleich
y ∈ R ist, falls lim f (an ) = y für jede gegen x konvergente Folgen (an ) in
n→∞
A mit an > x.
Wir bezeichnen den rechtsseitigen Grenzwert mit lim f (a) = y.
a→x+
Satz 4.6 Sei f : (α, β) ⊂ R −→ R eine monoton wachsende Funktion. Dann
existieren für jedes x ∈ (α, β) die einseitigen Grenzwerte und es gilt
lim f (a) = sup{f (t) | α < t < x},
a→x−
lim f (a) = inf{f (t) | x < t < β}.
a→x+
Die analoge Aussage gilt für monoton fallende Funktionen.
Beweis. Da f monoton wächst, ist die Menge {f (t) | α < t < x} von oben
durch f (x) beschränkt. Folglich existiert das Supremum
y := sup{f (t) | α < t < x} ≤ f (x).
Nach Definition des Supremums gibt es zu jedem ε > 0 ein t∗ ∈ (α, x), so dass
y − ε < f (t∗ ) ≤ y. Da f monoton wachsend ist, gilt desweiteren
y − ε < f (t∗ ) ≤ f (t) ≤ y
∀ t ∈ (t∗ , x)
(∗)
Sei nun δ := x − t∗ . Dann folgt aus (∗), dass für alle |x − t| < δ mit t < x
die Abschätzung |y − f (t)| < ε gilt. Somit ist lim− f (t) = y .
t→x
Analog beweist man limt→x+ f (t) = inf{f (t) | β > t > x}.
Beispiel 1: Sei a > 1 gegeben. Dann gilt
x
lim a
x→+∞ x
= +∞.
Beweis. Es ist
ax = ex·ln(a) = 1 + x · ln(a) +
x2 · ln2 (a)
+ ... .
2!
Für a > 1 ist ln(a) > 0. Für x > 0 erhalten wir somit
⊓
⊔
4.1 Der Grenzwert einer Abbildung in einem Punkt
ln2 (a)
1
ln2 (a)
ax
= + ln(a) +x ·
+ |{z}
... ≥
· x.
x
2!
2
|x {z }
>0
125
>0
ax
x→+∞ x
Da offensichtlich lim x = +∞, folgt lim
x→+∞
Beispiel 2: Es gilt
lim
x→0
ln(1+x)
x
⊓
⊔
= +∞.
=1.
Beweis. Für x > −1 gilt nach Übungsaufgabe 55
x
≤ ln(1 + x) ≤ x.
1+x
Daraus folgt
ln(1 + x)
1
≤
≤1
1+x
x
ln(1 + x)
1
≥
≥1
1+x
x
1
x→0 1+x
Da lim
falls x > 0.
falls − 1 < x < 0.
= 1, folgt aus den Grenzwertsätzen lim
x→0
Beispiel 3: Es gilt
1
lim (1 + x) x = e
= 1.
⊓
⊔
lim (1 + x1 )x = e .
und
x→0
ln(1+x)
x
x→+∞
Beweis. Nach Satz 3.18 gilt
|ex − 1| ≤
|x|
1 − |x|
∀ |x| < 1.
Folglich ist lim ean = 1 für jede Nullfolge (an ). Sei nun (xn ) eine beliebige
n→∞
Nullfolge in R mit xn 6= 0 und zn :=
dass (zn ) eine Nullfolge ist. Also gilt
ln(1+xn )
xn
− 1 . Aus Beispiel 2 ergibt sich,
1
1
1 = lim ezn = lim eln (1+xn )· xn · e−1 = lim (1 + xn ) xn · e−1
n→∞
n→∞
n→∞
und somit
1
lim (1 + xn ) xn = e.
n→∞
⊓
⊔
Beispiel 4: Es gilt
x
lim
x→+∞ ln(x)
= +∞ .
ln(x)
x
Beweis. Wir wissen, dass ln(x)
= eln(x) . Sei (xn ) eine gegen +∞ konvergente
Folge. Dann gilt yn := ln(xn ) −→ +∞, da ln streng monoton wachsend und
ln(xn )
⊓
⊔
bijektiv ist. Aus Beispiel 1 erhalten wir lim eln(xn ) = +∞.
n→+∞
126
4 Stetige Abbildungen zwischen metrischen Räumen
4.2 Stetige Abbildungen (Definition und Beispiele)
Definition 4.3. Es seien (X, dX ) und (Y, dY ) metrische Räume und
f : X −→ Y eine Abbildung.
1. f heißt stetig im Punkt x0 ∈ X, falls zu jedem ε > 0 ein δ > 0 existiert,
so dass
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε).
(Die Größe von δ hängt von ε und von x0 ab).
2. f heißt folgenstetig im Punkt x0 ∈ X, falls für jede Folge (xn ) in X, die
gegen x0 konvergiert, die Bildfolge (f (xn )) in Y gegen f (x0 ) konvergiert.
3. Die Abbildung f heißt stetig (folgenstetig), wenn sie in jedem Punkt x ∈ X
stetig (folgenstetig) ist.
Y
f (x0 )
6
graph(f )
62ε
?
•
x0
X
Satz 4.7 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen.
Dann sind folgende Bedingungen äquivalent:
1. f : X −→ Y ist in x0 ∈ X stetig.
2. f : X −→ Y ist in x0 ∈ X folgenstetig.
3. x0 ist ein isolierter Punkt von X oder x0 ist ein Häufungspunkt von X
und es gilt lim f (x) = f (x0 ).
x→x0
Beweis. (1) =⇒ (2) : Sei f : X −→ Y stetig in x0 ∈ X und (xn ) eine
(beliebige) gegen x0 konvergente Folge in X. Wir müssen zeigen, dass die
Folge (f (xn )) gegen f (x0 ) konvergiert.
Sei ε > 0. Nach Definition der Stetigkeit existiert ein δ > 0 , so dass
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε).
Da die Folge (xn ) gegen x0 konvergiert, existiert ein n0 ∈ N, so dass xn ∈
KX (x0 , δ) für alle n ≥ n0 . Folglich ist f (xn ) ∈ KY (f (x0 ), ε) für alle n ≥ n0 .
4.2 Stetige Abbildungen (Definition und Beispiele)
127
Also konvergiert (f (xn )) gegen f (x0 ).
(2) =⇒ (3) : Jeder Punkt x0 ∈ X ist entweder isoliert oder ein Häufungspunkt
von X. Ist der Punkt x0 ∈ HP (X), so existiert eine gegen x0 konvergente
Folge (xn ) in X mit xn 6= x0 . Nach (2) konvergiert dann für jede dieser
Folgen die Bildfolge (f (xn )) gegen f (x0 ), das heißt es gilt lim f (x) = f (x0 ).
x→x0
(3) =⇒ (1) : Wenn x0 ein isolierter Punkt ist, so existiert ein δ > 0, so dass
KX (x0 , δ) = {x0 }. Dann ist
f (KX (x0 , δ)) = {f (x0 )} ⊂ KY (f (x0 ), ε)
für alle ε > 0. Somit ist f in x0 stetig.
Sei nun x0 ein Häufungspunkt von X und lim f (x) = f (x0 ). Nach Satz 4.1
x→x0
existiert für alle ε > 0 ein δ > 0, so dass
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε).
⊓
⊔
Folglich ist f in x0 stetig.
Als nächstes betrachten wir spezielle Kriterien für die Stetigkeit reeller Funktionen f : A ⊂ R −→ R.
Satz 4.8 Sei f : A ⊂ R −→ R eine reelle Funktion und x0 ∈ (α, β) ⊂ A.
Dann ist f in x0 genau dann stetig, wenn die beiden einseitigen Grenzwerte
existieren und
lim f (x) = lim f (x) = f (x0 ).
x→x0 −
x→x0 +
Beweis. (=⇒) folgt aus Satz 4.7 als Spezialfall.
(⇐=) Wir setzen voraus, dass die beiden einseitigen Grenzwerte existieren
und dass
lim − f (x) = lim + f (x) = f (x0 ).
x→x0
x→x0
Angenommen, f sei in x0 nicht stetig. Dann existiert ein ε0 > 0, so dass es
zu jedem δ > 0 ein x ∈ A gibt mit der Eigenschaft, dass |x0 − x| < δ und
|f (x0 ) − f (x)| ≥ ε0 . Wählen wir speziell δ = n1 , so erhalten wir eine Folge
xn ∈ A mit |x0 − xn | < n1 und |f (x0 ) − f (xn )| ≥ ε0 . Insbesondere konvergiert
die Folge (xn ) gegen x0 und es existiert eine Teilfolge (xnk ) von (xn ) mit
xnk < x0 oder eine Teilfolge (xnk ) von (xn ) mit xnk > x0 , für die f (xnk )
nicht gegen f (x0 ) konvergiert. Betrachten wir diese Teilfolge, so erhalten wir
einen Widerspruch zur Voraussetzung lim f (x) = lim f (x) = f (x0 ). ⊓
⊔
x→x0 −
x→x0 +
Satz 4.8 zeigt, dass es genau drei verschiedene Typen von Unstetigkeitsstellen
einer reellen Funktion gibt. f : A ⊂ R −→ R ist genau dann in x0 ∈ (α, β) ⊂
A unstetig, wenn einer der folgenden Fälle vorliegt:
128
4 Stetige Abbildungen zwischen metrischen Räumen
(1) Hebbare Unstetigkeitsstelle
Beide einseitigen Grenzwerte von f in x0 existieren und stimmen überein,
sind aber ungleich f (x0 ). In diesem Fall kann man die Unstetigkeit von f
in x0 durch Abänderung von f (x0 ) beheben.
Beispiel:
f (x) :=
(
R
0
1
x=0
x 6= 0
6
f
)(
-
•
Der Punkt x0 = 0 ist eine hebbare Unstetigkeitsstelle.
R
(2) Sprungstelle
Die beiden einseitigen Grenzwerte von f in x0 existieren, sind aber voneinander verschieden. Unter dem Sprung σ(f, x0 ) von f in x0 verstehen
wir die Differenz der einseitigen Grenzwerte
σ(f, x0 ) := lim + f (x) − lim − f (x).
x→x0
R
Beispiel:
f (x) :=
x→x0
(
x+
0
x
|x|
x 6= 0
x=0
Dann ist der Punkt x0 = 0 eine
Sprungstelle und der Sprung
σ(f, x0 ) = 2.
6 f
1
(
•
)
−1
R
(3) Unstetigkeitsstelle 2. Art
Mindestens einer der beiden einseitigen Grenzwerte von f in x0 existiert
nicht in R.
Wir betrachten z.B. die Dirichlet-Funktion
(
1 x∈Q
h(x) :=
0 x 6∈ Q
Jeder Punkt x0 ∈ R ist eine Unstetigkeitsstelle zweiter Art von h.
4.2 Stetige Abbildungen (Definition und Beispiele)
129
Sei
f (x) :=
(
1
x
0
R
x 6= 0
x=0
6
f
Der Punkt x0 = 0 ist eine
Unstetigkeitsstelle zweiter Art,
denn lim+ f (x) = +∞
R
x→0
und lim− f (x) = −∞.
x→0
Satz 4.9
1. Eine monotone Funktion f : A ⊂ R −→ R ist in x0 ∈ (α, β) ⊂ A genau
dann stetig, wenn
lim f (x) = lim f (x).
x→x0 +
x→x0 −
2. Eine monotone Funtion f : (α, β) ⊂ R −→ R, −∞ < α < β < +∞, hat
höchstens abzählbar viele Unstetigkeitsstellen. Jede Unstetigkeitsstelle ist
eine Sprungstelle.
3. Sei A ⊂ R ein (verallgemeinertes) Intervall und f : A ⊂ R −→ R eine
streng monotone Funktion. Dann ist f : A −→ f (A) bijektiv und die
Umkehrabbildung f −1 : f (A) −→ A stetig.
Beweis. Übungsaufgabe 60.
⊓
⊔
Als nächstes stellen wir einige Eigenschaften stetiger Abbildungen zwischen
metrischen Räumen zusammen, die sich unmittelbar aus der Definition der
Stetigkeit, der Äquivalenz zur Folgenstetigkeit und den Rechenregeln für konvergente Folgen ergeben.
Satz 4.10 Seien f : X −→ Y und g : Y −→ Z zwei Abbildungen zwischen
metrischen Räumen, f in x0 ∈ X und g in f (x0 ) ∈ Y stetig. Dann ist g ◦ f
in x0 stetig. Insbesondere ist die Verknüpfung stetiger Abbildungen ebenfalls
stetig.
Beweis. Sei (xn ) eine Folge in X, die gegen x0 konvergiert. Da f in x0 stetig
und somit folgenstetig ist, konvergiert die Folge (f (xn )) in Y gegen f (x0 ).
Wegen der Stetigkeit von g in f (x0 ) konvergiert dann die Folge (g(f (xn )) =
(g ◦ f )(xn )) gegen g(f (x0 )) = (g ◦ f )(x0 ). Folglich ist g ◦ f in x0 folgenstetig
und somit stetig.
⊓
⊔
130
4 Stetige Abbildungen zwischen metrischen Räumen
Satz 4.11 Seien (X, dX ) und (Y, dY ) metrische Räume und A eine Teilmenge
von X. Ist f : X −→ Y stetig, so ist auch die Einschränkung f|A : A −→ Y
stetig bzgl. der auf A durch X induzierten Metrik dA := (dX )|A×A .
Beweis. Sei (an ) eine Folge in A, die im metrischen Raum (A, dA ) gegen a ∈ A
konvergiert. Dann konvergiert (an ) auch bzgl. der Metrik dX von X gegen a.
Nach Voraussetzung konvergiert (f (an )) gegen f (a) in Y , also ist f|A in a
folgenstetig und somit stetig.
⊓
⊔
Satz 4.12
1. Sei f : X −→ Y1 × . . . × Yn eine Abbildung in das Produkt metrischer
Räume und f = (f1 , . . . , fn ) die Komponentendarstellung von f . Die Abbildung f ist genau dann in x0 stetig, wenn jede Komponente
fj : X −→ Yj in x0 stetig ist, j = 1, . . . , n.
2. Sei f : X1 × X2 −→ Y stetig in (x1 , x2 ) ∈ X1 × X2 . Dann ist
h1 : X1 −→ Y
x 7→ f (x, x2 )
h2 : X2 −→ Y
in x1 stetig ,
in x2 stetig .
x 7→ f (x1 , x)
Satz 4.13 Sei X ein metrischer Raum und K der Körper der reellen oder
der komplexen Zahlen, h·, ·i ein Skalarprodukt und k · k eine Norm auf Kn .
1. Seien f, g : X −→ Kn in x0 ∈ X stetig. Dann gilt
(a) f + g : X −→ Kn ist in x0 stetig.
(b) hf, gi : X −→ K ist in x0 stetig.
(c) kf k : X −→ R ist in x0 stetig.
2. Seien f : X −→ Kn und h : X −→ K in x0 stetig. Dann ist auch
h · f : X −→ Kn in x0 stetig.
3. Seien h, p : X −→ K in x0 stetig und sei p(x0 ) 6= 0. Dann ist auch die
Abbildung hp : A = {x ∈ X | p(x) 6= 0} ⊂ X −→ K in x0 stetig.
4. Eine Abbildung f : X −→ C ist genau dann in x0 stetig, wenn sowohl der
Realteil Re(f ) als auch der Imaginarteil Im(f ) in x0 stetig sind.
f : X −→ C ist genau dann in x0 stetig, wenn die konjugiert-komplexe
Abbildung f¯ : X −→ C in x0 stetig ist.
4.2 Stetige Abbildungen (Definition und Beispiele)
131
Wir betrachten nun einige Beispiele für stetige Abbildungen:
Beispiel 1: Sei (X, d) ein metrischer Raum und x0 ∈ X.
(a) Die identische Abbildung idX : X −→ X , idX (x) := x , ist stetig.
(b) Die konstante Abbildung cx0 : X −→ X , cx0 (x) := x0 , ist stetig.
P
Beispiel 2: Sei P (z) = nk=0 ak z k ein Polynom mit komplexen Koeffizienten
a0 , a1 , . . . , an . Dann ist die polynomiale Funktion
P : C −→ C
z 7→ P (z) = an z n + an−1 z n−1 + . . . + a1 z + a0
stetig.
Beispiel 3: Seien P1 und P2 zwei Polynome mit komplexen Koeffizienten,
d.h.
P1 (z) = an z n + an−1 z n−1 + . . . + a1 z + a0
P2 (z) = bm z m + bm−1 z m−1 + . . . + b1 z + b0
wobei alle aj und bj komplexe Zahlen sind. Dann ist die rationale Funktion
P1
: A := {z ∈ C | P2 (z) 6= 0} ⊂ C −→ C
f := P
2
f (z) =
an z n + an−1 z n−1 + . . . + a1 z + a0
bm z m + bm−1 z m−1 + . . . + b1 z + b0
auf A stetig.
Beispiel 4: Die Abbildung ln : R+ −→ R ist stetig.
Beweis. Dies folgt aus Satz 4.9, denn die Logarithmus-Funktion ist die Umkehrfunktion der bijektiven und monotonen Exponentialfunktion exp : R −→
R+ .
⊓
⊔
Beispiel 5: Die Abbildung
f : R+ × C −→ C
(a, z) 7→ az
ist stetig.
Beweis. Sei (a0 , z0 ) ∈ R+ × C. Wir betrachten eine beliebige gegen (a0 , z0 )
konvergente Folge ((an , zn )). Dann gilt an −→ a0 und zn −→ z0 . Da nach
Beispiel 4 der natürliche Logarithmus stetig ist, folgt
132
4 Stetige Abbildungen zwischen metrischen Räumen
lim ln(an ) · zn = ln(a0 ) · z0 .
n→∞
Aus Satz 3.18 erhalten wir dann für n hinreichend groß
zn
an − az00 = eln(an )·zn − eln(a0 )·z0 = eln(a0 )·z0 eln(an )·zn −ln(a0 )·z0 − 1
| ln(a ) · z − ln(a ) · z |
n
n
0
0
≤ eln(a0 )·z0 1 − | ln(an ) · zn − ln(a0 ) · z0 |
(∗)
Die rechte Seite von (*) konvergiert bei n → +∞ gegen 0 und somit gilt
lim aznn = az00 . Folglich ist f in (a0 , z0 ) folgenstetig, also stetig.
⊓
⊔
n→∞
Beispiel 6: Seien a0 ∈ R+ und z0 ∈ C fixiert. Aus Satz 4.12 und Beispiel 5
folgt die Stetigkeit der Abbildungen
expa0 : C −→ C
z 7−→ az0
und
pz0 : R+ −→ C
a 7−→ az0 .
Beispiel 7: Sei (X, d) ein metrischer Raum. Die Abstandsfunktion
d : X × X −→ R
(x, y) 7→ d(x, y)
ist stetig.
Beweis. Sei (x, y) ∈ X × X und ((xn , yn )) eine Folge, die in X × X gegen
(x, y) konvergiert. In einem metrischen Raum gilt die Vierecksungleichung
|d(xn , yn ) − d(x, y)| ≤ d(xn , x) + d(yn , y).
Da xn −→ x und yn −→ y, folgt d(xn , x) −→ 0 und d(yn , y) −→ 0 und somit
d(xn , yn ) −→ d(x, y).
⊓
⊔
Beispiel 8: Sei V ein Vektorraum über dem Körper K der reellen oder der
komplexen Zahlen. Dann ist jede Norm
k · k : V −→ R
und jedes Skalarprodukt
h·, ·i : V × V −→ K
stetig bezüglich der von der Norm bzw. vom Skalarprodukt induzierten Metrik.
4.2 Stetige Abbildungen (Definition und Beispiele)
133
Beweis. Dies folgt aus dem Verhalten des Skalarproduktes und der Norm
bei konvergenten Folgen (Satz 2.18), welches die Folgenstetigkeit der beiden
Abbildungen zeigt.
⊓
⊔
Als nächstes definieren wir zwei Stetigkeitsbegriffe, die stärker als die gewöhnliche Stetigkeit sind.
Definition 4.4.
1. Eine Abbildung f : X −→ Y heißt gleichmäßig stetig, wenn zu jedem ε > 0
ein δ > 0 existiert, so dass
f (KX (x, δ)) ⊂ KY (f (x), ε)
für alle x ∈ X.
(Im Unterschied zur Definition der Stetigkeit hängt hier die Größe von δ
nur von ε, aber nicht von x ab.)
2. Eine Abbildung f : X −→ Y heißt lipschitzstetig, wenn es eine positive
Konstante L ∈ R+ gibt, so dass für alle x1 , x2 ∈ X gilt
dY (f (x1 ), f (x2 )) ≤ L · dX (x1 , x2 ).
L heißt Lipschitz–Konstante von f .
Satz 4.14 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen.
Dann gilt:
1. f ist lipschitzstetig =⇒ f ist gleichmäßig stetig.
2. f ist gleichmäßig stetig =⇒ f ist stetig.
Beweis. Stetigkeit folgt per Definition aus gleichmäßiger Stetigkeit. Wir müssen
also nur zeigen, dass jede lipschitzstetige Abbildung gleichmäßig stetig ist.
Sei f lipschitzstetig mit Lipschitz–Konstante L und ε > 0. Wir setzen δ := Lε .
Sei x0 ∈ X fixiert und x ∈ KX (x0 , δ), d.h. dX (x, x0 ) < δ = Lε . Aus der
Lipschitzstetigkeit folgt dann
dY (f (x), f (x0 )) ≤ L · dX (x, x0 ) < L · δ = ε,
also f (x) ∈ KY (f (x0 ), ε). Somit ist f gleichmäßig stetig.
⊓
⊔
Die folgenden beiden Beispiele zeigen, dass die Umkehrung der Aussagen des
Satzes 4.14 nicht gilt.
134
4 Stetige Abbildungen zwischen metrischen Räumen
Beispiel 1:
Die Abbildung
Y 6
..
+
f : R −→ R
1
x 7−→
x
ist stetig, aber nicht gleichmäßig
stetig.
..
...
Für ein fixes ε muß
...
..
δ für x −→ 0 im..
...
mer kleiner gewählt
..
...
...
werden.
...
..
...
ε ⌢ ......
⌣ .........
.........
ε⌢
......................
.......................................
...........
⌣
() (
δ
) X
δ
Beweis. Sei δ > 0 eine fixierte Zahl und x ∈ R+ . Dann gilt
1
δ
1
δ
f (x + ) − f (x) = − =
δ
x + 2
2
x 2x(x + 2δ )
(∗)
Die rechte Seite von (∗) konvergiert bei x −→ 0 gegen +∞. Man kann also
für ein gegebenes ε > 0 kein δ > 0 finden, so dass die rechte Seite von (∗) für
jedes x > 0 kleiner als ε bleibt. Folglich ist f nicht gleichmäßig stetig.
⊓
⊔
Beispiel 2: Die Abbildung
f : R+ −→ R+
√
x 7−→ x
ist gleichmäßig stetig, aber nicht lipschitzstetig.
Beweis. Es gilt
p
√
√
| x − y| ≤ |x − y|
∀ x, y ∈ R+ .
(siehe √
Übungsaufgabe 10). Für ε > 0 setzen wir δ := ε2 . Ist |x − y| < δ, so
√
folgt | x − y| ≤ ε. Somit ist f gleichmäßig stetig.
Angenommen f wäre lipschitzstetig mit der Lipschitz-Konstanten L, das heißt
√
√
∀ x, y ∈ R+ .
| x − y| ≤ L|x − y|
Dann gilt
√
√ x − y
1
x − y = √x + √y ≤ L
Für hinreichend kleine x und y kann man aber
Dies ergibt den Widerspruch.
∀ x, y ∈ R+ .
√ 1√
x+ y
beliebig groß machen.
⊓
⊔
4.3 Eigenschaften stetiger Abbildungen
135
4.3 Eigenschaften stetiger Abbildungen
In einem metrischen Raum sind Teilmengen mit speziellen Eigenschaften ausgezeichnet, wie offene, abgeschlossene, kompakte oder zusammenhängende
Teilmengen. Wir untersuchen in diesem Abschnitt, was mit diesen Eigenschaften bei stetigen Abbildungen passiert.
Satz 4.15 Sei f : X −→ Y eine Abbildung zwischen metrischen Räumen.
Dann sind folgende Bedingungen äquivalent:
1. f ist stetig.
2. Das Urbild jeder offenen Menge ist offen.
3. Das Urbild jeder abgeschlossenen Menge ist abgeschlossen.
Beweis. (1. =⇒ 2.) Sei f : X −→ Y stetig und U ⊂ Y offen. Wir wollen
zeigen, dass das Urbild
f −1 (U ) := {x ∈ X | f (x) ∈ U } ⊂ X
dann ebenfalls offen ist. Ist f −1 (U ) = ∅, so ist die Behauptung erfüllt. Sei
also f −1 (U ) 6= ∅ und x0 ∈ f −1 (U ) ein beliebig gewählter Punkt. Dann gilt
f (x0 ) ∈ U , und da U ⊂ Y offen ist, existiert ein ε > 0 mit KY (f (x0 ), ε) ⊂ U .
Da f in x0 stetig ist, gibt es ein δ > 0, so dass
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε) ⊂ U.
Wir erhalten daraus durch Betrachten der Urbilder
KX (x0 , δ) ⊂ f −1 f (KX (x0 , δ)) ⊂ f −1 (U ).
Somit ist f −1 (U ) offen in X.
(2. =⇒ 1.) Sei f −1 (U ) ⊂ X offen für jede offene Menge U ⊂ Y . Wir
wählen einen beliebigen Punkt x0 ∈ X und ein beliebiges ε > 0. Da die
Kugel KY (f (x0 ), ε) in Y offen ist, ist nach Voraussetzung auch das Urbild
f −1 (KY (f (x0 ), ε)) in X offen. Es enthält den Punkt x0 . Folglich existiert ein
δ > 0, so dass KX (x0 , δ) ⊂ f −1 (KY (f (x0 ), ε)). Wenden wir auf diese Inklusion f an, so erhalten wir f (KX (x0 , δ) ⊂ KY (f (x0 ), ε). Das bedeutet aber,
dass f in x0 stetig ist. Da x0 ∈ X beliebig gewählt war, ist f stetig.
(2. ⇐⇒ 3.) Um dies einzusehen, erinnern wir uns daran, dass die folgende
Beziehung zwischen offenen und abgeschlossenen Mengen eines metrischen
Raumes X gilt:
B⊂X
ist abgeschlossen ⇐⇒ X \ B ⊂ X
Desweiteren gilt für das Urbild einer Komplementmenge
ist offen .
136
4 Stetige Abbildungen zwischen metrischen Räumen
f −1 (Y \ M ) = X \ f −1 (M ).
Sei nun das Urbild f −1 (U ) jeder offenen Menge U ⊂ Y offen. Wir betrachten
eine beliebige abgeschlossene Menge A ⊂ Y . Dann ist Y \ A offen in Y und
folglich f −1 (Y \ A) = X \ f −1 (A) offen in X. Dies bedeutet, dass f −1 (A)
abgeschlossen in X ist. Damit ist 2. =⇒ 3. bewiesen. Die Umkehrung zeigt
man analog.
⊓
⊔
Wir betrachten als nächstes das Verhalten von zusammenhängenden Mengen
bei stetigen Abbildungen:
Satz 4.16 Sei f : X −→ Y eine stetige Abbildung zwischen metrischen
Räumen. Dann ist das Bild jeder zusammenhängenden Menge ebenfalls zusammenhängend.
Beweis. Sei A ⊂ X eine zusammenhängende Menge. Wir wollen zeigen, dass
dann auch das Bild f (A) ⊂ Y zusammenhängend ist. Angenommen f (A) ⊂ Y
wäre nicht zusammenhängend. Dann existieren offene Mengen U, V ⊂ Y mit
•
•
•
U ∩ V = ∅,
f (A) ⊂ U ∪ V ,
f (A) ∩ U 6= ∅ und f (A) ∩ V 6= ∅.
•
•
•
f −1 (U ) ∩ f −1 (V ) = f −1 (U ∩ V ) = f −1 (∅) = ∅,
A ⊂ f −1 (f (A)) ⊂ f −1 (U ∪ V ) = f −1 (U ) ∪ f −1 (V ),
A ∩ f −1 (U ) 6= ∅ und A ∩ f −1 (V ) 6= ∅ , da ein a ∈ A mit f (a) ∈ U und ein
b ∈ A mit f (b) ∈ V existieren.
Da f stetig ist, sind nach Satz 4.15 die Urbilder f −1 (U ) und f −1 (V ) ebenfalls
offen. Desweiteren gilt für diese Urbilder
Folglich ist A nicht zusammenhängend, was ein Widerspruch zur Voraussetzung ist.
⊓
⊔
Als Anwendung erhalten wir für Abbildungen mit reellen Werten:
Satz 4.17 (Zwischenwertsatz) Sei f : X −→ R eine stetige Abbildung
von einem metrischen Raum X in die reellen Zahlen und sei A ⊂ X eine
zusammenhängende Teilmenge. Seien desweiteren a, b ∈ f (A) Bildpunkte mit
a < b. Dann gilt [a, b] ⊂ f (A).
Insbesondere hat jede reellwertige Abildung, die auf A einen negativen und
einen positiven Wert annimmt, auf A eine Nullstelle, d.h. es existiert ein
x0 ∈ A mit f (x0 ) = 0.
Beweis. Nach Satz 4.16 ist f (A) ⊂ R zusammenhängend und deshalb nach
Satz 2.43 ein (verallgemeinertes) Intervall. Das heißt mit a, b ∈ f (A) und a < b
ist auch [a, b] ⊂ f (A).
⊓
⊔
4.3 Eigenschaften stetiger Abbildungen
137
Wir definieren nun noch einen weiteren Zusammenhangsbegriff.
Definition 4.5. Sei (X, d) ein metrischer Raum. Eine Teilmenge A ⊂ X
heißt bogenzusammenhängend (oder wegezusammenhängend), falls zu je zwei
Punkten a, b ∈ A eine stetige Abbildung ω : [0, 1] ⊂ R −→ A ⊂ X existiert,
so dass ω(0) = a und ω(1) = b.
Die Abbildung ω heißt Weg in A von a nach b.
Beispiele:
1. Konvexe Mengen im Rn :
Eine Teilmenge A ⊂ Rn heißt konvex, wenn mit je zwei Punkten x, y ∈ A
auch die Verbindungsstrecke xy := {x+t(y−x) | t ∈ [0, 1]} vollständig in A
liegt. Jede konvexe Menge ist bogenzusammenhängend, da die Abbildung
ω : [0, 1] −→ A
ω(t) := x + t(y − x)
stetig ist und die Punkte x und y verbindet.
Zum Beispiel ist jede Kugel K(x0 , r) konvex.
2. Sternförmige Mengen im Rn :
Eine Teilmenge A ⊂ Rn heißt sternförmig, wenn ein Punkt x0 ∈ A
existiert, so dass für jeden Punkt x ∈ A die Verbindungsstrecke x0 x
vollständig in A liegt. Jede sternförmige Menge ist bogenzusammenhängend. Sind x, y ∈ A, so ist die Vereinigung der Strecken xx0 ∪ x0 y in A
enthalten und man kann sie als Bild eines Weges von x nach y darstellen.
3. Jede bogenzusammenhängende Menge ist auch zusammenhängend (siehe
Übungsaufgabe 67). Die Umkehrung gilt nicht. Z.B. ist die Menge Floh
und Kamm aus der Übungsaufgabe 41 zusammenhängend, aber nicht bogenzusammenhängend. Es gilt jedoch, dass jede offene zusammenhängende Menge des Rn auch bogenzusammenhängend ist.
Satz 4.18 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder
bogenzusammenhängenden Teilmenge ebenfalls bogenzusammenhängend.
Beweis. Sei A ⊂ X bogenzusammenhängend. Wir wollen zeigen, dass das Bild
f (A) ebenfalls bogenzusammenhängend ist. Seien x, y ∈ f (A) zwei Punkte in
f (A). Dann existieren a, b ∈ A mit x = f (a), y = f (b). Da A bogenzusammenhängend ist, gibt es einen (stetigen) Weg ω : [0, 1] −→ A von a nach b.
Wir betrachten die Abbildung f ◦ ω : [0, 1] −→ f (A) ⊂ Y . Da f und ω stetig
sind, ist f ◦ ω ebenfalls stetig. Weiterhin gilt (f ◦ ω)(0) = f (ω(0)) = f (a) = x
und (f ◦ ω)(1) = f (ω(1)) = f (b) = y, d.h. f ◦ ω ist ein Weg in f (A) von x
nach y.
⊓
⊔
138
4 Stetige Abbildungen zwischen metrischen Räumen
Als nächstes beschäftigen wir uns mit dem Verhalten von kompakten Mengen
bei stetigen Abbildungen:
Satz 4.19 Sei f : X −→ Y eine stetige Abbildung. Dann ist das Bild jeder
kompakten Menge ebenfalls kompakt.
Beweis. Sei K ⊂ X eine kompakte Teilmenge. Wir wollen zeigen, dass dann
auch das Bild f (K) ⊂ Y kompakt ist. Sei U = {Ui }i∈I eine beliebige offene
Überdeckung von f (K), das heißt die Mengen Ui sind offen in Y und es gilt
[
f (K) ⊂
Ui .
i∈I
Da f stetig ist, sind die Urbilder f −1 (Ui ) in X offen (siehe Satz 4.15). Außerdem gilt
[ [
f −1 (Ui ).
K ⊂ f −1 (f (K)) ⊂ f −1
Ui =
i∈I
i∈I
Folglich ist die Mengenfamilie
U ∗ := {f −1 (Ui )}i∈I
eine offene Überdeckung von K. Da K ⊂ X kompakt ist, existiert eine endliche
Teilüberdeckung von K aus U ∗ , das heißt es existieren i1 , . . . , in ∈ I, so dass
K ⊂ f −1 (Ui1 ) ∪ . . . ∪ f −1 (Uin ).
Durch Anwenden von f erhalten wir
f (K) ⊂ f f −1 (Ui1 ) ∪ . . . ∪ f −1 (Uin ) ⊂ Ui1 ∪ . . . ∪ Uin .
Somit ist {Ui1 , . . . , Uin } eine endliche Teilüberdeckung von f (K) aus U. Folglich ist f (K) kompakt.
⊓
⊔
Die folgenden beiden Sätze sind Anwendungen der gerade bewiesenen Eigenschaft stetiger Abbildungen.
Satz 4.20 (Satz von Weierstraß)
Sei f : X −→ R eine stetige Abbildung von einem metrischen Raum X in die
reellen Zahlen und sei K ⊂ X eine kompakte Teilmenge. Dann nimmt f auf
K ein Maximum und ein Minimum an, d.h. es existieren Punkte a, b ∈ K mit
f (a) = min{f (x) | x ∈ K} und f (b) = max{f (x) | x ∈ K} .
Beweis. Sei K ⊂ X kompakt. Dann ist f (K) ⊂ R ebenfalls kompakt, und
somit insbesondere beschränkt und abgeschlossen (Folgerung 2.4). Da f (K) ⊂
R beschränkt ist, existieren das Infimum S∗ := inf(f (K)) und das Supremum
S ∗ := sup(f (K)). Da f (K) abgeschlossen ist, liegen sowohl das Supremum
S ∗ als auch das Infimum S∗ in f (K). D.h. es existieren Punkte a, b ∈ K mit
S∗ = f (a) = min{f (x) | x ∈ K} und S ∗ = f (b) = max{f (x) | x ∈ K} .
⊓
⊔
4.3 Eigenschaften stetiger Abbildungen
139
Satz 4.21 (Satz von Heine)
Sei f : X −→ Y eine stetige Abbildung zwischen metrischen Räumen und
K ⊂ X eine kompakte Teilmenge. Dann ist f auf K sogar gleichmäßig stetig.
Beweis. Angenommen f|K : K −→ Y wäre nicht gleichmäßig stetig. Dann
existiert ein ε0 > 0, so dass es für alle δ > 0 einen Punkt xδ ∈ K gibt mit
f (KX (xδ , δ) ∩ K) 6⊂ KY (f (x), ε0 ) .
Wir setzen δ = n1 . Dann erhalten wir für jedes n ∈ N zwei Punkte xn , x∗n ∈ K
mit
1
dX (xn , x∗n ) <
und
dY (f (xn ), f (x∗n )) ≥ ε0 .
n
Betrachten wir nun die Folgen (xn ) und (x∗n ) in K genauer. Da K kompakt,
also nach Satz 2.40 folgenkompakt ist, existiert eine Teilfolge (xnk ) von (xn ),
die gegen einen Punkt x0 ∈ K konvergiert. Wir zeigen, dass die Teilfolge (x∗nk )
von (x∗n ) ebenfalls gegen x0 konvergiert. Es gilt
d(x0 , x∗nk ) ≤ d(x0 , xnk ) + d(xnk , x∗nk ) .
| {z } |
{z
}
→0
< n1
k
Daher gilt x∗nk −→ x0 ∈ K. Da f stetig, also auch folgenstetig ist, konvergieren
dann die Bildfolgen f (xnk ) und f (x∗nk ) für k gegen +∞ gegen f (x0 ). Somit
ist
0 < ε0 ≤ d(f (xnk ), f (x∗nk )) ≤ d(f (xnk ), f (x0 )) + d(f (x0 ), f (x∗nk )) .
{z
} |
|
{z
}
→0
Dies ist aber ein Widerspruch.
→0
⊓
⊔
Wir wenden uns jetzt der folgenden Frage zu:
Sei f : X −→ Y eine bijektive stetige Abbildung zwischen metrischen Räumen.
Dann existiert die Umkehrabbildung (inverse Abbildung) f −1 : Y −→ X. Ist
f −1 dann auch stetig? Im Allgemeinen gilt das nicht.
Beispiel: Sei X = (0, 1) ∪ {2} ⊂ R und Y = (0, 1] ⊂ R. Wir betrachten die
Abbildung f : X −→ Y gegeben durch
t falls t ∈ (0, 1)
f (t) :=
1 falls t = 2.
f ist stetig und bijektiv, da f|(0,1) = id(0,1) und 2 ∈ X ein isolierter Punkt ist.
Aber f −1 : (0, 1] −→ (0, 1) ∪ {2} ist nicht stetig, da (0, 1] zusammenhängend,
aber f −1 ((0, 1]) = (0, 1) ∪ {2} nicht zusammenhängend ist.
140
4 Stetige Abbildungen zwischen metrischen Räumen
Definition 4.6. Seien X und Y metrische Räume.
Eine Abbildung f : X −→ Y heißt Homöomorphismus, wenn f bijektiv ist
und f und f −1 stetig sind.
Die metrischen Räume X und Y heißen homöomorph, falls es einen Homöomorphismus f : X −→ Y gibt.
Bezeichnung: X ≃ Y .
Da die Verknüpfung stetiger Abbildungen stetig ist, folgt aus X ≃ Y und
Y ≃ Z, dass X ≃ Z gilt. Die Homöomorphie ist also eine Äquivalenzrelation
auf der Menge der metrischen Räume.
Beispiel : Der Rn ist homöomorph zur Kugel K(x0 , r) um einen Punkt x0 ∈
Rn vom Radius r. Die folgende Abbildung ist ein Homöomorphismus:
f : K(x0 , r) −→
x
7−→
Rn
x−x0
r−kx−x0 k2
Dabei bezeichnet k · k2 die Euklidische Norm auf Rn . (Übungsaufgabe 68).
Alle topologischen Eigenschaften von Teilmengen bleiben bei Homöomorphismen erhalten:
Satz 4.22 Sei f : X −→ Y ein Homöomorphismus zwischen metrischen
Räumen. Dann gilt:
1. A ⊂ X ist offen (abgeschlossen, kompakt, zusammenhängend bzw. bogenzusammenhängend) genau dann wenn f (A) ⊂ Y offen (abgeschlossen,
kompakt, zusammenhängend bzw. bogenzusammenhängend) ist.
2. Eine Folge (xn ) konvergiert in X gegen x0 genau dann, wenn die Bildfolge
(f (xn )) in Y gegen f (x0 ) konvergiert.
Beweis. Dies folgt aus den vorherigen Sätzen über das Verhalten von offenen, abgeschlossenen, kompakten, zusammenhängenden bzw. bogenzusammenhängenden Mengen bei stetigen Abbildungen und aus der Äquivalenz von
Stetigkeit und Folgenstetigkeit.
⊓
⊔
Will man nachweisen, dass eine bijektive stetige Abbildung ein Homöomorphismus ist, so muß man die Stetigkeit der inversen Abbildung nachweisen.
Ist der Urbildraum kompakt, so kann man sich diesen Nachweis sparen, denn
es gilt der folgende Satz:
Satz 4.23 (Satz über die Stetigkeit der inversen Abbildung)
Sei f : X −→ Y eine bijektive stetige Abbildung und X ein kompakter metrischer Raum. Dann ist die inverse Abbildung f −1 : Y −→ X stetig.
4.3 Eigenschaften stetiger Abbildungen
141
Beweis. Sei U ⊂ X offen. Wir zeigen, dass (f −1 )−1 (U ) = f (U ) ⊂ Y offen
ist. Da U ⊂ X offen ist, ist X\U ⊂ X abgeschlossen. Wir wissen aus Folgerung 2.4, dass jede abgeschlossene Teilmenge einer kompakten Menge selbst
kompakt ist. Nach Vorrausetzung ist X kompakt, folglich ist X \ U kompakt.
Wegen der Stetigkeit von f ist dann nach Satz 4.19 auch das Bild f (X \ U ) in
Y kompakt und insbesondere abgeschlossen (Folgerung 2.4). Nun ist f bijektiv und folglich f (X\U ) = Y \f (U ). Also ist die Teilmenge f (U ) ⊂ Y offen.
Nach Satz 4.15 ist die Abbildung f −1 deshalb stetig.
⊓
⊔
Definition 4.7. Sei X ein metrischer Raum. Eine Abbildung f : X −→ X
heißt kontrahierende Abbildung (oder Kontraktion), wenn sie lipschitzstetig
mit einer Lipschitzkonstanten 0 < L < 1 ist, das heißt wenn
d(f (x), f (y)) ≤ L · d(x, y)
für alle x, y ∈ X.
Für kontrahierende Abbildungen in vollständigen metrischen Räumen gilt der
folgende sehr nützliche Fixpunktsatz.
Satz 4.24 (Banach’scher Fixpunktsatz)
Sei (X, d) ein vollständiger metrischer Raum und f : X −→ X eine kontrahierende Abbildung. Dann existiert genau ein Fixpunkt von f , d.h. genau ein
Punkt x∗ ∈ X mit f (x∗ ) = x∗ .
Sei x0 ∈ X ein beliebiger Punkt und xn := f ◦ . . . ◦ f (x0 ) =: f n (x0 ). Dann
| {z }
konvergiert die Folge (xn ) gegen x∗ .
n−mal
Beweis. (1) Eindeutigkeit des Fixpunktes: Angenommen es existieren zwei
Fixpunkte x∗ und y ∗ von f , dh. es gelte f (x∗ ) = x∗ und f (y ∗ ) = y ∗ . Aus
der Kontraktivität von f erhält man
d(x∗ , y ∗ ) = d(f (x∗ ), f (y ∗ )) ≤ L · d(x∗ , y ∗ ).
Da aber 0 < L < 1 gilt, folgt d(x∗ , y ∗ ) = 0, also x∗ = y ∗ .
(2) Existenz des Fixpunktes: Sei x0 ∈ X ein beliebig gewählter Punkt. Wir
definieren eine Folge von Punkten in X durch
x1 := f (x0 ),
x2 := f (x1 ) = f 2 (x0 ),
..
.
xn := f (xn−1 ) = f 2 (xn−2 ) = . . . = f n (x0 ).
Dann gilt
142
4 Stetige Abbildungen zwischen metrischen Räumen
d(xn+1 , xn ) = d(f (xn ), f (xn−1 ))
≤ L · d(xn , xn−1 ) = L · d(f (xn−1 ), f (xn−2 ))
≤ L2 · d(xn−1 , xn−2 ) = L2 · d(f (xn−2 ), f (xn−3 ))
..
.
≤ Ln · d(x1 , x0 ).
Für n > m folgt mit der Dreiecksungleichung und der Formel für die geometrische Summe
d(xn , xm ) ≤ d(xn , xn−1 ) + d(xn−1 , xn−2 ) + . . . + d(xm+1 , xm )
≤ (Ln−1 + . . . + Lm ) · d(x0 , x1 )
= Lm (L0 + L1 + . . . + Ln−1−m ) · d(x0 , x1 )
1 − Ln−m
· d(x0 , x1 )
= Lm ·
1−L
Lm − Ln
=
· d(x0 , x1 )
1−L
m
L
· d(x0 , x1 ).
<
1−L
Da 0 < L < 1, ist (Lm ) eine Nullfolge. Somit ist (xn ) eine Cauchyfolge in
X. Da der metrische Raum X vollständig ist, konvergiert diese Cauchyfolge
gegen einen Punkt x∗ ∈ X.
Wir zeigen nun, dass dieser Grenzwert x∗ der gesuchte Fixpunkt von f ist.
Dazu betrachten wir
d(f (x∗ ), x∗ ) ≤ d(f (x∗ ), xn ) + d(xn , x∗ )
= d(f (x∗ ), f (xn−1 )) + d(xn , x∗ )
≤ L d(x∗ , xn−1 ) + d(xn , x∗ ) .
|
{z
} | {z }
→0
Daraus folgt d(f (x∗ ), x∗ ) = 0, also f (x∗ ) = x∗ .
→0
⊓
⊔
4.4 Folgen stetiger Abbildungen
In diesem Abschnitt bezeichnen X und Y wiederum metrische Räume mit den
Metriken dX bzw. dY . Wir betrachten jetzt Folgen von stetigen Abbildungen
fn : X −→ Y , n = 1, 2, 3, . . ., und untersuchen, unter welchen Bedingungen
deren Grenzfunktion ebenfalls stetig ist.
4.4 Folgen stetiger Abbildungen
143
Definition 4.8. Die Folge der Abbildungen (fn ) heißt punktweise konvergent,
falls für jedes x ∈ X die Folge (fn (x)) in Y konvergiert. Die durch
f (x) := lim fn (x)
n→∞
definierte Funktion f : X −→ Y heißt Grenzfunktion von (fn ).
Schreibweise: fn −→ f .
Im allgemeinen ist die Grenzfunktion einer punktweise konvergenten Folge stetiger Abbildungen nicht notwendiger Weise stetig. Wir betrachten dazu das
folgende Beispiel:
R 6
Seien X = [0, 1], Y = R und
fn : [0, 1] −→ R die stetigen Funktionen
fn (x) := xn . Dann ist die Grenzfunktion
.
1
....
........
.
.
.
.
f2
. ..
0 falls 0 ≤ x < 1
... ......
f (x) := lim fn (x) =
..........
f3
.
f
.
.
1
1 falls x = 1
n→∞
.. .. ..
.... ........
f4
.
.
.
.
.... .... ...
.....................
.
offensichtlich nicht stetig.
.
.
.
.... .... ...
..... ..........
.......... ......................
...................................
)
1
R
Wir benötigen für die Stetigkeit der Grenzfunktion f eine stärkere Konvergenzeigenschaft der Folge (fn ).
Definition 4.9. Die Folge der Abbildungen (fn ) konvergiert gleichmäßig gegen eine Grenzfunktion f : X −→ Y , falls zu jedem ε > 0 ein n0 ∈ N existiert,
so dass dY (fn (x), f (x)) < ε für alle n ≥ n0 und für alle x ∈ X.
Schreibweise: fn ⇉ f .
Bei gleichmäßiger Konvergenz, konvergiert die Folge (fn (x)) für jeden Punkt
x ∈ X mit der “gleichen Geschwindigkeit“ gegen f (x).
Aus gleichmäßiger Konvergenz folgt offensichtlich die Konvergenz der Folge
(fn ).
Satz 4.25 Seien fn : X −→ Y stetige Abbildungen, n = 1, 2, 3, . . . , und die
Folge (fn ) gleichmäßig gegen f : X −→ Y konvergent. Dann ist die Grenzfunktion f stetig.
Beweis. Sei x0 ∈ X beliebig fixiert. Wir zeigen, dass f in x0 stetig ist. Sei
ε > 0. Da (fn ) gleichmäßig gegen f konvergiert, existiert ein n0 ∈ N mit
dY (fn (x), f (x)) <
ε
3
∀ n ≥ n0 , ∀ x ∈ X.
144
4 Stetige Abbildungen zwischen metrischen Räumen
Die Abbildung fn0 ist in x0 stetig, folglich gibt es ein δ > 0, so dass
ε
fn0 (KX (x0 , δ)) ⊂ KY (fn0 (x0 ), ).
3
Für x ∈ KX (x0 , δ) erhalten wir damit
dY (f (x), f (x0 )) ≤ dY (f (x), fn0 (x)) + dY (fn0 (x), fn0 (x0 )) + dY (fn0 (x0 ), f (x0 ))
ε ε ε
≤ + + = ε.
3 3 3
Somit ist
f (KX (x0 , δ)) ⊂ KY (f (x0 ), ε),
also f in x0 ∈ X stetig.
⊓
⊔
Satz 4.26 (Vertauschbarkeit von Grenzwerten)
Seien fn : X −→ Y , n = 1, 2, 3, . . ., stetige Abbildungen und sei die Folge (fn )
gleichmäßig konvergent. Dann gilt in jedem Häufungspunkt x0 ∈ X
lim ( lim fn (x)) = lim ( lim fn (x)).
x→x0 n→∞
n→∞ x→x0
Beweis. Sei f die Grenzfunktion der Folge (fn ), d.h. f (x) = lim fn (x). Nach
n→∞
Satz 4.25 ist f in x0 stetig. Folglich existiert der Grenzwert
f (x0 ) = lim f (x) = lim lim fn (x).
x→x0
x→x0 n→∞
Da die Abbildungen fn in x0 stetig sind, gilt andererseits
f (x0 ) = lim fn (x0 ) = lim lim fn (x).
n→∞
n→∞ x→x0
⊓
⊔
Für spezielle Funktionenfolgen impliziert die punktweise Konvergenz bereits
die gleichmäßige Konvergenz. Wir wollen jetzt einen solchen Fall betrachten.
Definition 4.10. Eine Folge von Funktionen fn : X → R, n = 1, 2, . . ., heißt
•
•
monoton wachsend, falls fn (x) ≤ fn+1 (x) ∀ x ∈ X , ∀ n ∈ N und
monoton fallend, falls fn (x) ≥ fn+1 (x) ∀ x ∈ X , ∀ n ∈ N.
Satz 4.27 (Satz von Dini)
Sei fn : X −→ R, n = 1, 2, 3, . . ., eine monotone Folge stetiger Funktionen,
die punktweise gegen eine stetige Grenzfunktion f : X −→ Y konvergiert, und
sei X kompakt. Dann konvergiert (fn ) sogar gleichmäßig gegen f .
4.5 Funktionenreihen
145
Beweis. Wir nehmen OBdA an, dass die Funktionenfolge (fn ) monoton wachsend ist. Dann gilt f (x) ≥ fn (x) für alle x ∈ X und alle n ∈ N. Sei ε > 0.
Da (fn ) gegen f konvergiert, existiert zu jedem Punkt x ∈ X ein Index
n0 (x, ε) ∈ N so dass
0 ≤ f (x) − fn (x) < ε
für alle n ≥ n0 (x, ε).
Da fn und f stetig sind, ist die Abbildung F := f − fn0 (x,ε) : X −→ R in
x ∈ X stetig. Folglich gibt es ein δx > 0 mit
0 ≤ F (y) = f (y) − fn0 (x,ε) (y) < ε
∀ y ∈ KX (x, δx ).
Aus der Monotonie der Funktionenfolge (fn ) folgt dann
0 < f (y) − fn (y) < ε
∀ n ≥ n0 (x, ε) , ∀ y ∈ KX (x, δx ).
Wir betrachten nun die folgende offene Überdeckung von X
U := {KX (x, δx ) | x ∈ X}.
Da X kompakt ist, gibt es eine endliche Teilüberdeckung, d.h. es existieren
endlich viele Punkte x1 , x2 , . . . , xp ∈ X mit
X = KX (x1 , δ1 ) ∪ KX (x2 , δ2 ) ∪ . . . ∪ KX (xp , δp ).
Wir setzen m0 := max{n0 (xj , ε) | j = 1, 2, . . . , p}. Sei nun z ∈ X. Dann ist
z ∈ KX (xj , δxj ) für ein j ∈ {1, 2, . . . , p} und folglich
0 < f (z) − fn (z) < ε
∀ n ≥ m0 .
Dies bedeutet, dass die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert.
⊓
⊔
4.5 Funktionenreihen
In diesem Abschnitt wenden wir die im vorigen Abschnitt über Funktionenfolgen erhaltenen Resultate auf Funktionenreihen an. Insbesondere wollen wir
weitere Aussagen über Potenzreihen machen.
Im folgenden bezeichnet (X, d) einen beliebigen metrischen Raum und (E, k·k)
einen Banachraum. Da E ein Vektorraum ist, können wir zwei Abbildungen
h, f : X −→ E addieren. Die Abbildung f + h : X −→ E ist gegeben durch
(f + h)(x) := f (x) + h(x)
∀ x ∈ X.
Seien fn : X −→ E Abbildungen von X nach E, n = 0, 1, 2, . . .. Wir bilden
aus der Folge (fn ) eine neue Funktionenfolge durch
146
4 Stetige Abbildungen zwischen metrischen Räumen
s0 := f0
s1 := f0 + f1
s2 := f0 + f1 + f2
..
.
sm := f0 + f1 + f2 + · · · + fm
Definition 4.11. Die Folge
sm :=
m
P
fn
n=0
heißt Funktionenreihe mit den
Gliedern fn . Wir bezeichnen sie symbolisch mit
Die Funktionenreihe
∞
P
∞
P
fn .
n=0
fn heißt punktweise konvergent, falls die Funktionen-
n=0
folge (sm ) punktweise konvergiert.
∞
P
Die Funktionenreihe
fn heißt gleichmäßig konvergent, falls die Funktion=0
nenfolge (sm ) gleichmäßig konvergiert.
Aus den Sätzen 4.25 und 4.26 erhält man dann sofort
Satz 4.28 Sind fn : X −→ E stetige Abbildungen, n = 0, 1, 2, . . ., und kon∞
P
vergiert die Funktionenreihe
fn gleichmäßig, so ist die durch
n=0
f (x) :=
∞
X
fn (x)
n=0
∀x∈X
definierte Grenzfunktion f : X −→ E stetig. Insbesondere gilt für jeden
Häufungspunkt x0 ∈ X
lim
x→x0
∞
X
n=0
fn (x) =
∞
X
n=0
lim fn (x).
x→x0
⊓
⊔
Als nächstes beweisen wir ein Kriterium für die gleichmäßige Konvergenz von
Funktionenreihen.
4.5 Funktionenreihen
147
Satz 4.29 (Weierstraßsches Majorantenkriterium)
Seien fn : X −→ E beschränkte Abbildungen, n = 0, 1, 2, . . ., d.h. sei
kfn (x)k ≤ Mn
und sei die Reihe der Schranken
tionenreihe
∞
P
∞
P
∀ n ∈ N0 und ∀ x ∈ X ,
Mn in R konvergent. Dann ist die Funk-
n=0
fn gleichmäßig konvergent und die durch f (x) :=
n=0
∞
P
fn (x)
n=0
definierte Grenzfunktion f : X −→ E stetig.
∞
P
Beweis. Sei ε > 0. Da die Reihe
Mn konvergiert, gibt es nach dem
n=0
Cauchy–Kriterium (Satz 3.1) ein n0 ∈ N0 , so dass
Mm+1 + Mm+2 + · · · + Mn < ε
für alle n > m ≥ n0 .
Nach Voraussetzung gilt für alle x ∈ X
ksn (x) − sm (x)k = kfn (x) + . . . + fm+1 (x)k
≤ kfn (x)k + . . . kfm+1 (x)k
≤ Mn + . . . + Mm+1 .
Wir erhalten daraus für jedes x ∈ X
ksn (x) − sm (x)k < ε
∀ n > m ≥ n0 . (∗)
Also ist die Folge (sn (x)) für jedes x ∈ X eine Cauchy–Folge im Banachraum
E. Da E vollständig ist, konvergiert die Folge (sn (x)). Sei s(x) := lim sn (x) .
n→∞
∞
P
Die Funktionenreihe
fn konvergiert somit punktweise gegen die Grenzn=0
funktion s : X −→ E. Gehen wir in (∗) mit n gegen ∞, so folgt wegen der
Stetigkeit der Norm
lim ksn (x) − sm (x)k = ks(x) − sm (x)k < ε
n→∞
Somit konvergiert die Funktionenreihe
∞
P
∀x ∈ X ∀ m > n0
fn sogar gleichmäßig gegen s. Die
n=0
Stetigkeit der Grenzfunktion folgt aus dem vorigen Satz.
⊓
⊔
Wir wenden diese Sätze nun auf komplexe Potenzreihen an.
Sei (an ) eine Folge komplexer Zahlen, z0 ∈ C und
P (z) :=
∞
X
n=0
an (z − z0 )n ,
z ∈ C,
die Potenzreihe mit den Koeffizienten an und dem Zentrum z0 .
R := sup{|z − z0 | | P (z) konvergiert} bezeichne den Konvergenzradius der
Potenzreihe P . Aus Kapitel 3.2 wissen wir bereits, dass
148
1.
4 Stetige Abbildungen zwischen metrischen Räumen
R=

 lim sup

1
n→∞
√
n
1
a
lim | n+1
an |
|an |
n→∞
falls diese Werte in [0, +∞) ∪ {+∞} existieren (siehe Sätze 3.16
und 3.17).
2.
3.
P (z) konvergiert absolut für alle z ∈ K(z0 , R).
P (z) divergiert für z ∈ C \ cl(K(z0 , R)).
Wir beweisen nun, dass die durch die Potenzreihe P auf dem Konvergenzkreis
definierte Funktion stetig ist.
Satz 4.30 Sei P (z) :=
∞
P
n=0
an (z − z0 )n eine Potenzreihe mit dem Konver-
genzradius R. Dann gilt
∞
P
1. P (z) =
an (z − z0 )n konvergiert gleichmäßig auf jeder kompakten
n=0
Teilmenge K ⊂ K(z0 , R).
2. Die Abbildung P : z ∈ K(z0 , R) 7−→ P (z) ∈ C ist stetig.
Beweis. (1) Sei K ⊂ K(z0 , R) kompakt. Dann ist K abgeschlossen. Folglich
ist
η(K) := sup{|z − z0 | | z ∈ K} < R.
Wir betrachten ein z1 ∈ K(z0 , R) mit η(K) < |z1 − z0 | < R. Da die Reihe
∞
P
P (z1 ) =
an (z1 − z0 )n konvergiert, sind ihre Reihenglieder eine Nullfolge,
n=0
also insbesondere beschränkt. Somit existiert eine Zahl M > 0 , so dass
|an (z1 − z0 )n | < M für alle n ∈ N0 . Wir erhalten daraus
n
(z − z0 )n η(K)
n
n
≤M·
|an (z − z0 ) | = an (z1 − z0 ) ·
∀ z ∈ K.
(z1 − z0 )n |z1 − z0 |
|
{z
}
=:Mn
Nach Wahl von z1 ist
η(K)
|z1 −z0 |
< 1 . Folglich ist die geometrische Reihe
∞
P
Mn
n=0
konvergent. Nach Satz 4.29 konvergiert dann P (z) gleichmäßig auf K.
(2) Sei z ∈ K(z0 , R) gegeben. Wir wählen ein ε(z) > 0, so dass
cl(K(z, ε(z))) ⊂ K(z0 , R).
Da die Menge cl(K(z, ε(z))) sowohl abgeschlossen als auch beschränkt ist, ist
sie kompakt. Folglich konvergiert die Funktionenreihe P (z) auf cl(K(z, ε(z)))
gleichmäßig und die Grenzfunktion P|cl(K(z,ε(z))) : cl(K(z, ε(z)) −→ C ist
4.5 Funktionenreihen
149
stetig. Da dies für alle z ∈ K(z0 , R) gilt, ist P auf dem gesamten Konvergenzkreis K(z0 , R) stetig.
⊓
⊔
Wir betrachten nun eine spezielle Sorte von Potenzreihen P (z). Es sei
P (z) =
∞
X
n=0
an (z − x0 )n
eine Potenzreihe mit reellem Zentrum x0 und endlichem Konvergenzradius
0 < R < +∞. Dann definiert P eine stetige Funktion
P : (x0 − R, x0 + R) −→ C .
x
7−→ P (x)
In den Randpunkten des Definitionsintervalls gilt der
Satz 4.31 (Abelscher Grenzwertsatz)
∞
P
Sei P (z) =
an (z − x0 )n eine Potenzreihe mit reellem Zentrum x0 ∈ R und
n=0
Konvergenzradius 0 < R < ∞.
1. Ist P (x0 + R) konvergent, so ist P|(x0 −R,x0 +R] in x0 + R linksseitig stetig,
∞
P
d.h. es gilt
lim − P (x) = P (x0 + R) =
an R n .
x→(x0 +R)
n=0
2. Ist P (x0 − R) konvergent, so ist P|[x0 −R,x0 +R) in x0 − R rechtsseitig stetig,
∞
P
d.h. es gilt
lim + P (x) = P (x0 − R) =
(−1)n an Rn .
x→(x0 −R)
n=0
Beweis. Wir beweisen die erste Behauptung. Der Beweis der zweiten Behauptung erfolgt analog. Nach Voraussetzung konvergiert die Folge der Partialsumm
P
men sm =
an Rn gegen s = P (x0 + R). Wir müssen zeigen, dass für jedes
n=0
ε > 0 ein δ > 0 existiert, so dass |P (x) − s| < ε für alle x ∈ (x0 − R, x0 + R)
mit x0 + R − x < δ .
Wir setzen y := x − x0 . Aus den Eigenschaften der geometrischen Reihe und
dem Cauchy–Produkt von Reihen folgt für alle y mit |y| < R
150
4 Stetige Abbildungen zwischen metrischen Räumen
P (y + x0 ) =
∞
X
an y n
n=0
∞
y −1 X
y 1−
·
an y n
= 1−
R
R
n=0
∞
∞
y X y n X
·
an y n
·
= 1−
R n=0 R
n=0
| {z } | {z }
abs. konv.
abs. konv.
m
∞
o
y X n X y k
am−k y m−k
= 1−
R m=0
R
k=0
∞
y X y m
· sm .
= 1−
R m=0 R
Außerdem gilt
∞
y y −1
y X y m
s= 1−
1−
·s= 1−
.
s·
R
R
R m=0
R
Folglich ist für |y| < R
∞
y m
yX
.
P (y + x0 ) − s = 1 −
(sm − s)
R m=0
R
Sei nun ε > 0 gegeben. Da sm gegen s konvergiert, existiert ein n0 ∈ N mit
ε
∀ m ≥ n0 .
|sm − s| <
2
Wir setzen M :=
nP
0 −1
m=0
R − y < δ gilt
|sm − s| und δ := min{R, ε·R
2M } . Für |y| < R mit
0<1−
δ
y
< .
R
R
Daraus folgt
y
·
|P (y + x0 ) − s| ≤ 1 −
R
nX
0 −1
m=0
|sm − s| ·
y m
R
+
∞
X
m=n0
|sm − s| ·
n0 −1
∞
δ X
y ε X y m
·
·
|sm − s| + 1 −
R m=0
R
2 m=n R
0
|
{z
}
abs. konv.
ε
δ
·M +
≤
R
2
ε ε
≤ + = ε.
2 2
<
y m
R
!
4.5 Funktionenreihen
Somit ist die Funktion P im Punkt x0 + R linksseitig stetig.
151
⊓
⊔
Als Anwendung der Stetigkeit der Grenzfunktion von Potenzreihen beweisen
wir abschließend den folgenden Identitätssatz.
Satz 4.32 (Identitätssatz für Potenzreihen)
∞
∞
P
P
Seien P (z) =
an (z − z0 )n und Q(z) =
bn (z − z0 )n zwei Potenzreihen
n=0
n=0
mit dem Zentrum z0 ∈ C und den Konvergenzradien RP > 0 bzw. RQ > 0.
Es bezeichne R = min{RP , RQ }.
∗
Existiert eine Folge komplexer Zahlen zm
∈ K(z0 , R)\{z0}, m ∈ N , mit
∗
∗
1. P (zm
) = Q(zm
) für alle m ∈ N und
∗
2. lim zm
= z0 ,
m→∞
so gilt an = bn für alle n ∈ N0 , das heißt die Potenzreihen P und Q sind
identisch. Insbesondere sind P und Q identisch, wenn sie auf einer (beliebig
kleinen) offenen Umgebung des Zentrums z0 übereinstimmen.
∗
Beweis. Sei (zm
) eine Folge in K(z0 , R) \ {z0 } , die gegen z0 konvergiert und
∗
∗
für die P (zm ) = Q(zm
) gilt. Wir beweisen an = bn durch Induktion über den
Index n.
∗
gegen z0 konvergiert
Ind.–Anfang: Es ist zu zeigen, dass a0 = b0 gilt. Da zm
und P und Q auf K(z0 , R) stetig sind, folgt
∗
∗
a0 = P (z0 ) = lim P (zm
) = lim Q(zm
) = Q(z0 ) = b0 .
m→∞
m→∞
Ind.–Schritt : Es gelte a0 = b0 , a1 = b1 , . . . , an = bn . Es ist zu zeigen, dass
an+1 = bn+1 gilt. Dazu betrachten wir die Potenzreihen
P1 (z) =
Q1 (z) =
∞
X
k=n+1
∞
X
k=n+1
ak (z − z0 )k−(n+1) ,
bk (z − z0 )k−(n+1) .
Die Potenzreihen P1 und Q1 konvergieren auf K(z0 , R), denn für z 6= z0 gilt
P1 (z) =
Q1 (z) =
P (z) −
n
P
k=0
ak (z − z0 )k
(z − z0 )n+1
n
P
Q(z) −
bk (z − z0 )k
k=0
(z − z0 )n+1
,
.
152
4 Stetige Abbildungen zwischen metrischen Räumen
∗
∗
Nach Induktionsvoraussetzung gilt Q1 (zm
) = P1 (zm
) für alle m ∈ N . Da Q1
und P1 auf K(z0 , R) stetig sind, folgt
∗
∗
an+1 = P1 (z0 ) = lim P1 (zm
) = lim Q1 (zm
) = Q1 (z0 ) = bn+1 .
m→∞
m→∞
⊓
⊔
4.6 Die trigonometrischen und die Hyperbelfunktionen
Wir betrachten zunächst nochmal die Exponentialfunktion. Wie wir wissen,
∞
P
zn
konvergiert die Potenzreihe ez =
n! für jedes z ∈ C und erfüllt
n=0
ez+w = ez · ew .
(∗)
Die Konvergenz der Exponentialreihe ist gleichmäßig auf jedem kompakten
Bereich in C. Folglich ist die Exponentialfunktion exp : z ∈ C 7−→ ez ∈ C
∞
P
stetig und man kann lim mit
vertauschen. Wir erhalten insbesondere
z→z0
lim
z→0
n=0
∞
∞
X
X
z n−1
z n−1
ez − 1
= lim
=
lim
= 1.
z→0
z→0
z
n!
n!
n=1
n=1
(∗∗)
Wir werden nun sehen, dass die Exponentialfunktion exp : C → C die einzige
Funktion mit den Eigenschaften (∗) und (∗∗) ist. Wir beweisen dazu zunächst
folgendes Lemma
Lemma 4.12. Sei (zn ) eine Folge komplexer Zahlen mit lim zn = z. Dann
n→∞
gilt
zn n
= ez .
lim 1 +
n→∞
n
1
Beweis. Aus Beispiel 3 in Abschnitt 4.1. wissen wir, dass lim (1 + x) x = e .
Da zn → z gilt
lim
n→∞
zn
n
→ 0. Daraus folgt
x→0
z
lim z
zn n
zn znn n→∞ n
zn znn n
1+
= lim 1 +
= ez .
= lim
1+
n→∞
n→∞
n
n
n
⊓
⊔
Daraus erhalten wir die folgende funktionale Charakterisierung der Exponentialfunktion.
4.6 Die trigonometrischen und die Hyperbelfunktionen
153
Satz 4.33 Sei f : C −→ C eine Funktion, die die folgenden Eigenschaften
erfüllt:
1.
2.
f (z + w) = f (z) · f (w) für alle z, w ∈ C.
lim
z→0
f (z)−1
z
= 1.
Dann gilt: f (z) = ez für alle z ∈ C.
Beweis. Sei z ∈ C. Aus der 1. Eigenschaft von f folgt für alle n ∈ N:
z n
z
=f
f (z) = f n ·
.
n
n
Wir betrachten die Folge
z
zn := n · f ( ) − 1
n
Dann gilt
f (z) = f
z n
n
Aus der 2. Eigenschaft von f folgt
zn n
= 1+
.
n
f ( nz ) − 1
zn
= 1,
= lim
z
n→∞
n→∞ z
n
lim
also lim zn = z. Aus Lemma 4.12 folgt
n→∞
f (z) = lim
n→∞
1+
zn n
= ez .
n
⊓
⊔
Mit Hilfe der Exponentialfunktion definieren wir jetzt die trigonometrischen
Funktionen. Wir betrachten zunächst die Exponentialfunktion auf der imaginären Achse. Für eit mit t ∈ R gilt
|eit |2 = eit · eit = eit · e−it = e0 = 1.
Die komplexe Zahl eit liegt also auf der Kreislinie S 1 := {z ∈ C | |z| = 1}. Der
Realteil von eit heißt der Cosinus der reellen Zahl t, der Imaginärteil heißt
Sinus von t. Also ist
eit + e−it
eit − e−it
und
sin(t) :=
.
2
2i
Dann erhält man unmittelbar die sogenannte Eulersche Formel
cos(t) :=
eit = cos(t) + i sin(t)
und wegen |eit | = 1 ist
cos2 (t) + sin2 (t) = 1.
154
4 Stetige Abbildungen zwischen metrischen Räumen
iR
i 6
eit
sin t
t
cos t
1
R
Wir erweitern die Definition von Sinus und Cosinus auf die komplexen Zahlen
und definieren sin, cos : C −→ C durch
cos(z) :=
eiz + e−iz
2
sin(z) :=
eiz − e−iz
2i
∀ z ∈ C.
Dann gilt
∞
X
z3
z5
z7
z 2n+1
sin(z) = z −
+
−
+ ... =
(−1)n
,
3!
5!
7!
(2n + 1)!
n=0
cos(z) = 1 −
∞
X
z 2n
z2
z4
z6
(−1)n
+
−
... =
.
2!
4!
6!
(2n)!
n=0
Diese Potenzreihen haben Konvergenzradius ∞, sind also absolut und gleichmäßig
konvergent auf jeder kompakten Teilmenge von C.
Eigenschaften der trigonometrischen Funktionen sin, cos:
1. sin : C −→ C und cos : C −→ C sind stetige Funktionen.
2.
sin2 (z) + cos2 (z) = 1 ∀ z ∈ C :
1
1
sin2 (z) + cos2 (z) = − (e2iz + e−2iz − 2) + (e2iz + e−2iz + 2) = 1.
4
4
3.
eiz = cos(z) + i · sin(z) ∀ z ∈ C
cos(z) + i · sin(z) =
(Eulersche Formel ):
1 iz
1
(e + e−iz ) + (eiz − e−iz ) = eiz .
2
2
4. Additionstheoreme: Für alle z1 , z2 ∈ C gilt
sin(z1 + z2 ) = sin(z1 ) cos(z2 ) + sin(z2 ) cos(z1 )
cos(z1 + z2 ) = cos(z1 ) cos(z2 ) − sin(z1 ) sin(z2 ).
4.6 Die trigonometrischen und die Hyperbelfunktionen
155
5. Die Funktion sin ist ungerade, die Funktion cos ist gerade, d.h. es gelten
sin(−z) = − sin(z)
cos(−z) = + cos(z)
∀z∈C
6. Für reelle Zahlen x ∈ R sind auch sin(x) und cos(x) reell und es gilt
| sin(x)| ≤ 1
| cos(x)| ≤ 1.
Warnung: Für komplexe Zahlen z ∈ C gilt das im allgemeinen nicht mehr.
Z.B. ist
1
lim | sin(it)| = lim |e−t − et | = +∞.
t→∞
t→∞ 2
Zur Definition der Zahl π:
Für die stetige Funktion cos|R : R −→ R gilt cos(0) = 1 und cos(2) < − 31 ,
denn
∞
X
22n
cos(2) =
(−1)n
(2n)!
n=0
=−
1
3
=−
1
3
∞
22n
2 X
+
(−1)n
3 n=3
(2n)!
∞
X
24r−2
24r
−
−
(4r − 2)! (4r)!
r=2
∞
X 24r−2
4
−
· 1−
(4r − 2)!
4r(4r − 1)
r=2
|
{z
}
= 1−2+
>0
1
<− .
3
Andererseits gilt für sin|R : R −→ R, dass sin(x) > 0 auf x ∈ (0, 2), denn
sin(x) =
∞
X
(−1)n
n=0
∞ X
x2n+1
(2n + 1)!
x4r−3
x4r−1
−
(4r − 3)! (4r − 1)!
r=1
∞
X x4r−3
x2
=
· 1−
(4r − 3)!
(4r − 1)(4r − 2)
r=1
{z
}
|
=
>0
>0
∀ x ∈ (0, 2).
156
4 Stetige Abbildungen zwischen metrischen Räumen
Satz 4.34 Die Funktion cos|R hat auf dem Intervall (0, 2) genau eine Nullstelle.
Beweis. Da cos(0) = 1 > 0, cos(2) < − 31 < 0 und cos|R : R −→ R stetig ist,
folgt aus dem Zwischenwertsatz, dass ein ξ ∈ (0, 2) mit cos(ξ) = 0 existiert.
Es bleibt die Eindeutigkeit von ξ zu zeigen. Seien also ξ1 , ξ2 ∈ (0, 2), ξ1 < ξ2
1
∈ (0, 2) und aus den Additionsmit cos(ξ1 ) = cos(ξ2 ) = 0. Dann gilt ξ2 ±ξ
2
theoremen folgt
cos(ξ1 ) − cos(ξ2 ) = 2 sin(
ξ2 + ξ1
ξ2 − ξ1
) · sin(
) > 0.
2
2
⊓
⊔
Dies steht aber im Widerspruch zu cos(ξ1 ) = cos(ξ2 ) = 0.
Definition 4.13. Die Nullstelle von cos|R auf dem Intervall (0, 2) heißt
π
.
2
π
Es gilt also cos( π2 ) = 0 und sin( π2 ) = 1 , woraus ei 2 = i, eiπ = −1 und
e2πi = 1 folgt. Insbesondere folgt dann aus den Produkt-Eigenschaften der
Exponentialfunktion
π
π
ei(ρ+ 2 ) = eiρ · ei 2 = i eiρ
ei(ρ+π) = eiρ · eiπ = −eiρ .
Die Eulersche Forml liefert dann die folgenden Beziehungen zwischen Sinus
und Cosinus:
Folgerung 4.1 Für alle ρ ∈ R gilt
sin(ρ +
π
) = + cos(ρ)
2
R
sin(ρ + π) = − sin(ρ)
6
1
sin x
π
2
−1
π
3
2π
2π R
cos(ρ + π) = − cos(ρ)
4.6 Die trigonometrischen und die Hyperbelfunktionen
R
157
6
1
cos x
π
2
π
3
2π
2π R
−1
Satz 4.35 1. Die Exponentialfunktion ez ist periodisch mit der Periode 2πi,
das heißt es gilt
ez = ez+2πi
∀ z ∈ C.
2. Die Funktionen sin : R −→ R und cos : R −→ R sind periodisch mit der
kleinsten Periode 2π, das heißt 2π ist die kleinste positive reelle Zahl L
mit
sin(x + L) = sin(x), cos(x + L) = cos(x) ∀ x ∈ R.
3. ez = 1 ⇐⇒ z = 2πki für ein k ∈ Z.
4. Zu jedem z ∈ S 1 = {z ∈ C | |z| = 1} existiert genau eine reelle Zahl
t ∈ [0, 2π) mit
z = eit = cos(t) + i sin(t).
Beweis.
(1) Nach der Eulerschen Formel gilt e2πi = cos(2π) + i sin(2π) = 1 . Daraus
folgt e(z+2πi) = ez · e2πi = ez .
(2) Nach (1) ist die Funktion x ∈ R 7−→ eix = cos(x) + i sin(x) ∈ C 2πperiodisch, folglich gilt dies auch für ihren Realtteil cos(x) und ihren Imaginärteil sin(x). Da cos(ρ) > 0 für alle ρ ∈ (− π2 , π2 ) und cos(ρ) < 0 für alle
ρ ∈ ( π2 , 3π
2 ) (siehe Folgerung 4.1), gibt es keine kleinere Periode als 2π.
(3) (⇐=) Sei z = 2πki für ein k ∈ Z. Dann gilt
ez = e2πik = (e2πi )k = 1k = 1.
(=⇒) Sei ez = 1 und z = x + iy mit x, y ∈ R. Dann gilt
1 = ex+iy = ex · eiy = ex (cos(y) + i sin(y))
und somit
q
2
x
x
1 = e | cos(y) + i sin(y)| = e · cos2 (y) + sin (y) .
{z
}
|
=1
Da die Exponentialfunktion exp|R : R −→ R+ bijektiv ist, folgt x = 0. Somit
erhalten wir z = iy und aus 1 = cos(y) + i sin(y) folgt cos(y) = 1, sin(y) = 0.
Damit ist y = 2πk, also z = 2πki.
158
4 Stetige Abbildungen zwischen metrischen Räumen
(4) Sei z ∈ S 1 = {z ∈ C | |z| = 1}. Wir wollen zeigen, dass es genau ein
t ∈ [0, 2π) gibt, mit z = eit = cos(t) + i sin(t). Sei z = x + iy, dann gilt
x2 + y 2 = 1 sowie |x| ≤ 1. Wir beweisen nun durch Fallunterscheidung: (a) Sei
x = 1. Dann ist y = 0 und t = 0 eindeutige Lösung von x = cos t, y = sin t.
(b) Sei x = −1. Dann ist y = 0 und t = π eindeutige Lösung von x =
cos t, y = sin t.
(c) Bleibt also noch der Fall x ∈ (−1, 1) zu betrachten. Sei x ∈ (−1, 1). Dann
existieren genau zwei Werte α, β mit
α ∈ (0, 2π), β ∈ (0, 2π), x = cos α = cos β.
Dabei gilt sin α > 0 und sin β < 0 und es folgt
p
p
|y| = 1 − x2 = 1 − cos2 α = | sin α| = | sin β|.
Ist y > 0, so ist y = sin α und t = α die Lösung. Ist y < 0, so ist y = sin β
und t = β die Lösung.
⊓
⊔
Die trigonometrischen Funktionen Tangens und Cotangens
Wir definieren die Funktionen Tangens (tan) und Cotangens (cot) durch
o
nπ
+ kπ | k ∈ Z −→ C
tan : C\
2
sin(z)
z 7−→ tan(z) :=
cos(z)
n
o
cot : C\ kπ | k ∈ Z −→ C
z
7−→ cot(z) :=
cos(z)
sin(z)
Aus den Eigenschaften der Funktionen Sinus und Cosinus erhält man die
folgenden Eigenschaften der Tangens und Cotangens-Funktion:
1. tan und cot sind stetige Funktionen.
2. tan und cot sind ungerade Funktionen, die π-periodisch sind, denn
sin(z + π) = − sin(z), cos(z + π) = − cos(z).
3. Es gelten folgende Additionstheoreme:
tan(z + w) =
cot(z) · cot(w) − 1
tan(z) + tan(w)
, cot(z + w) =
.
1 − tan(z) · tan(w)
cot(z) + cot(w)
4.6 Die trigonometrischen und die Hyperbelfunktionen
159
Die Umkehrfunktionen der trigonometrischen Funktionen
Da die trigonometrischen Funktionen auf R betrachtet periodisch sind, existieren keine globalen Umkehrfunktionen. Es existieren aber Umkehrfunktionen
auf jedem Monotoniebereich der trigonometrischen Funktionen. Nach Satz 4.9
sind diese Umkehrfunktionen ebenfalls stetig.
Definition 4.14. Die Umkehrfunktion von sin|[− π , π ] heißt Arcussinus und
2 2
wird mit arcsin bezeichnet.
arcsin : [−1, 1] −→ [ − π2 , π2 ] ist bijektiv, stetig und streng monoton wachsend.
Die Umkehrfunktion von sin| 2k−1 2k+1 , k ∈ Z , ist nach den Additionstheo[
π,
π]
2
2
remen
fk (x) = (−1)k · arcsin x + k · π.
Diese fk (x) werden auch Zweige der Umkehrfunktion von Sinus genannt.
Definition 4.15. Die Umkehrfunktion von cos|[0,π] heißt Arcuscosinus und
wird mit arccos bezeichnet.
arccos : [ − 1, 1] −→ [0, π] ist bijektiv, stetig und streng monoton fallend.
Die Umkehrfunktion von cos|[kπ,(k+1)π] , k ∈ Z, ist nach den Additionstheoremen
2k + 1 − (−1)k
· π.
gk (x) = (−1)k · arccos x +
2
Definition 4.16. Die Umkehrfunktion von tan|[− π , π ] heißt Arcustangens und
2 2
wird mit arctan bezeichnet.
arctan : R −→ [ − π2 , π2 ] ist bijektiv, stetig und streng monoton wachsend.
Die Umkehrfunktion von tan| 2k−1 2k+1 , k ∈ Z, ist nach den Additionstheo[
π,
π]
2
2
remen
hk (x) = arctan x + k · π.
Definition 4.17. Die Umkehrfunktion von cot|[0,π] heißt Arcuscotangens und
wird mit arccot bezeichnet.
arccot : R −→ [0, π] ist bijektiv, stetig und streng monoton fallend.
Die Umkehrfunktion von cot|[kπ,(k+1)π] , k ∈ Z, ist nach den Additionstheoremen
160
4 Stetige Abbildungen zwischen metrischen Räumen
ik (x) = arccot x + k · π.
Die Hyperbelfunktionen
Unter den Hyperbelfunktionen Sinus hyperbolicus sinh : C −→ C und Cosinus hyperbolicus cosh : C −→ C versteht man die folgenden komplexen
Funktionen:
ez − e−z
2
ez + e−z
cosh(z) =
2
sinh(z) =
.
Aus der Reihendarstellung für ez folgt
sinh(z) =
cosh(z) =
∞
X
z 2n+1
z3
z5
=z+
+
+ ...
(2n + 1)!
3!
5!
n=0
∞
X
z 2n
z2
z4
=1+
+
+ ...
(2n)!
2!
4!
n=0
Eigenschaften der hyperbolischen Funktionen sinh, cosh
1. Die Funktionen sinh : C −→ C und cosh : C −→ C sind stetig.
2. sinh(iz) = i sin(z) und cosh(iz) = cos(z) für alle z ∈ C.
3. cosh2 (z) − sinh2 (z) = 1 ∀ z ∈ C :
cosh2 (z) − sinh2 (z) = cos2 (−iz) − (i · sin(−iz))2
= cos2 (−iz) + sin2 (−iz)
= 1.
4. Additionstheoreme:
cosh(z1 + z2 ) = cosh(z1 ) cosh(z2 ) + sinh(z1 ) sinh(z2 )
sinh(z1 + z2 ) = sinh(z1 ) cosh(z2 ) + cosh(z1 ) sinh(z2 ).
5. cosh(z) = cosh(−z), sinh(z) = − sinh(−z).
6. Die Funktion sinh|R : R −→ R ist bijektiv und hat nur die Nullstelle
x = 0. Die Funktion cosh|R : R −→ R nimmt ihre Werte in [1, +∞) an
und ist bijektiv von [0, +∞) auf [1, +∞).
4.6 Die trigonometrischen und die Hyperbelfunktionen
161
Definition 4.18. Die Umkehrfunktion von sinh|R : R −→ R heißt Areasinus
hyperbolicus und wird mit arsinh bezeichnet.
Die Umkehrfunktion von cosh|[0,+∞) : [0, +∞) −→ [1, +∞) heißt Areacosinus
hyperbolicus und wird mit arcosh bezeichnet.
Die Umkehrfunktionen können durch den natürlichen Logarithmus ausgedrückt werden:
p
arsinh(x) = ln(x + x2 + 1)
x∈R
p
x≥1
arcosh(x) = ln(x + x2 − 1)
Analog definieren wir die Hyperbelfunkionen Tangens hyperbolicus (tanh)
und Cotangens hyperbolicus (coth):
tanh : C −→ C
z
7−→ tanh(z) =
coth : C\{0} −→ C
z
7−→ coth(z) =
sinh(z)
e2z − 1
= 2z
cosh(z)
e +1
e2z + 1
cosh(z)
= 2z
sinh(z)
e −1
Für Tangens hyperbolicus gilt das folgenden Additionstheorem
tanh(z + w) =
tanh(z) + tanh(w)
.
1 + tanh(z) · tanh(w)
Die Funktion tanh|R : R −→ (−1, 1) ⊂ R ist streng monoton wachsend und
bijektiv. Die Funktion coth|R\{0} : R\{0} −→ R\[ − 1, 1] ist streng monoton
wachsend und bijektiv.
Definition 4.19. Die Umkehrfunktion von tanh|R heißt Areatangens hyperbolicus artanh : (−1, 1) −→ R .
Die Umkehrfunktion von coth|R\{0} heißt Areacotangens hyperbolicus arcoth :
R\[ − 1, 1] −→ R\{0}.
Es gilt
1 1 + x
ln
2
1−x
1 x + 1
arcot(x) = ln
2
x−1
artanh(x) =
|x| < 1
|x| > 1.
162
4 Stetige Abbildungen zwischen metrischen Räumen
4.7 Der metrische Raum der stetigen Abbildungen
In diesem Abschnitt wollen wir die Eigenschaften des Raumes aller stetigen
Abbildungen zwischen metrischen Räumen genauer untersuchen. Wir betrachten dazu einen kompakten metrischen Raum (X, dX ) und einen beliebigen metrischen Raum (Y, dY ) und bezeichnen mit C(X, Y ) die Menge aller stetigen
Abbildungen von X nach Y
C(X, Y ) := {f : X −→ Y | f stetig }.
Da die Metrik dY stetig ist und eine stetige Abbildung F : X −→ R von einem
kompakten metrischen X in die reellen Zahlen immer ein Maximum besitzt,
ist für zwei stetige Abbildungen f, h ∈ C(X, Y ) die Zahl
d∞ (f, h) := max{dY (f (x), h(x)) | x ∈ X}
korrekt definiert. Aus den Eigenschaften der Metrik dY erhält man ohne Probleme, dass d∞ eine Metrik auf C(X, Y ) ist.
Ist der Bildraum ein Vektorraum V , so trägt auch die Menge der stetigen Abbildungen C(X, V ) eine Vektoraumstruktur. Für f, h ∈ C(X, V ) und λ ∈ K
definieren wir
(f + h)(x) := f (x) + h(x)
und
(λ · f )(x) := λ · f (x)
∀ x ∈ X.
Jede Norm k · k auf V liefert dann eine Norm k · k∞ auf dem Vektorraum
C(X, V )
kf k∞ := max{kf (x)k | x ∈ X}.
Die durch k · k∞ gegebene Metrik auf C(X, V ) stimmt mit der Metrik d∞
überein, die auf C(X, V ) durch die durch k · k gegebene Metrik dk·k von V
induziert wird
d∞ (f, h) = max{dk.k (f (x), h(x)) | x ∈ X}
= max{kf (x) − h(x)k | x ∈ X}
= kf − hk∞ .
Im folgenden sind die Mengen C(X, Y ) bzw. die Vektorräume C(X, V ) immer
mit der Metrik d∞ bzw. der Norm k · k∞ versehen.
Satz 4.36 Sei X ein kompakter metrischer Raum und Y ein beliebiger metrischer Raum.
1. Sei (fn ) eine Folge stetiger Abbildungen fn ∈ C(X, Y ). Die Folge (fn )
konvergiert im metrischen Raum C(X, Y ) genau dann gegen f ∈ C(X, Y ),
wenn die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert.
2. Ist Y vollständig, so ist C(X, Y ) vollständig.
4.7 Der metrische Raum der stetigen Abbildungen
163
3. Ist E ein Banachraum, so ist C(X, E) ebenfalls ein Banachraum.
Beweis. (1) Die erste Behauptung folgt aus der Äquivalenz der folgenden
Bedingungen:
⇐⇒
⇐⇒
⇐⇒
⇐⇒
fn −→ f in C(X, Y )
∀ ε > 0 ∃ n0 ∈ N so dass d∞ (fn , f ) < ε ∀ n ≥ n0
∀ ε > 0 ∃ n0 ∈ N so dass max{dY (fn (x), f (x)) | x ∈ X} < ε ∀ n ≥ n0
∀ ε > 0 ∃ n0 ∈ N so dass dY (fn (x), f (x)) < ε ∀ n ≥ n0 ∀ x ∈ X.
(fn ) konvergiert gleichmäßig gegen f .
(2) Sei (Y, dY ) vollständig. Wir zeigen, dass dann auch (C(X, Y ), d∞ ) vollständig ist. Sei (fn ) Cauchy–Folge in C(X, Y ) und ε > 0. Dann existiert ein
n0 ∈ N, so dass für alle x ∈ X
dY (fn (x), fm (x)) ≤ d∞ (fn , fm ) < ε
∀ n, m ≥ n0 .
(∗)
Folglich ist die Folge (fn (x)) für jedes x ∈ X eine Cauchy–Folge in Y . Da Y
vollständig ist, existiert f (x) := lim fn (x) auf X. Da die Metrik dY stetig
n→∞
ist, folgt aus (∗) für jedes x ∈ X
lim dY (fn (x), fm (x)) = dY (fn (x), lim fm (x))
m→∞
m→∞
= dY (fn (x), f (x)) < ε
∀n ≥ n0 .
Dies zeigt, dass die Funktionenfolge (fn ) gleichmäßig gegen f konvergiert.
Nach Satz 4.25 ist f stetig und nach (1) konvergiert die Folge (fn ) in C(X, Y )
gegen f .
(3) ist ein Spezialfall von (2).
⊓
⊔
In verschiedenen Situationen kann man stetige Abbildungen durch “einfache“
stetige Abbildungen approximieren. Zunächst betrachten wir Fälle, wo man
Polynome für diese Approximation benutzen kann.
Dazu sei [a, b] ⊂ R ein kompaktes Intervall und E ein reeller Banachraum
mit der Norm k · k. Wir wollen im Raum der stetigen Abbildungen C([a, b], E)
eine Menge von Polynomen finden, die in diesem Raum dicht liegt, mit deren
Hilfe man also eine beliebige stetige Abbildung f ∈ C([a, b], E) approximieren
kann.
Wir bezeichnen mit E[x] den Vektorraum der Polynome mit Koeffizienten in
E
n
o
n
X
ak xk | ak ∈ E .
E[x] := p(x) =
k=0
Ist p ∈ E[x], so ist die durch p definierte Abbildung
164
4 Stetige Abbildungen zwischen metrischen Räumen
p : [a, b] −→ E
t
7−→ p(t) =
n
P
a k tk
k=0
stetig. Mit P bezeichnen wir die Menge dieser als Abbildungen aufgefassten
Polynome. Es gilt also P ⊂ C([a, b], E).
Satz 4.37 (Weierstraßscher Approximationssatz)
Sei E ein reeller Banachraum. Dann ist die Menge der Polynome dicht in
C([a, b], E), das heißt, für jede stetige Funktion f : [a, b] −→ E existiert eine
Folge von Polynomen pn : [a, b] −→ E , die auf [a, b] gleichmäßig gegen f
konvergiert.
Beweis. (1) Es genügt, die Behauptung für das Intervall [0, 1] zu zeigen:
Sei die Behauptung für das Intervall [0, 1] bewiesen und [a, b] ein beliebiges
Intervall. Wir betrachten den Homöomorphismus
φ : [0, 1] −→ [a, b]
t 7−→ a + (b − a)t
Die inverse Abbildung φ−1 ist durch
φ−1 (x) =
x−a
b−a
gegeben. Sei nun f ∈ C([a, b], E) und h := f ◦ φ ∈ C([0, 1], E). Nach unserer
Annahme existiert eine Polynomfolge (Pn ), die auf [0, 1] gleichmäßig gegen
h konvergiert. Dann ist Qn := Pn ◦ φ−1 eine Polynomfolge, die gleichmäßig
gegen f = h ◦ φ−1 konvergiert.
(2) Sei f ∈ C([0, 1], E). Unter dem n-ten Bernstein–Polynom zu f verstehen
wir das folgende Polynom n- ten Grades:
n
k n
X
(1 − x)n−k · xk .
B[f ]n (x) :=
f
n
k
k=0
|
{z
}
=:βk,n (x)
Die Polynome βk,n (x) haben folgende Eigenschaften:
(1) βk,n (x) ≥ 0 ∀ x ∈ [0, 1],
n
P
βk,n (x) = (1 − x + x)n = 1
(2)
(3)
k=0
n
P
∀ x ∈ [0, 1],
(k − nx)2 · βk,n (x) = nx(1 − x)
k=0
∀ x ∈ [0, 1].
Im folgenden zeigen wir, dass die Bernstein-Polynome B[f ]n auf [0, 1] gleichmäßig
gegen f konvergieren.
4.7 Der metrische Raum der stetigen Abbildungen
165
Da f stetig und [0, 1] kompakt ist, ist f ([0, 1]) ⊂ E ebenfalls kompakt, also
insbesondere beschränkt. Es existiert also eine Konstante C > 0 so dass
kf (x)k ≤ C
für alle x ∈ [0, 1] .
(∗)
Da [0, 1] kompakt ist, ist die Funktion f sogar gleichmäßig stetig. Folglich
existiert zu jedem ε > 0 ein δ > 0 so dass
kf (x1 ) − f (x2 )k <
Wir setzen n0 (ε) :=
ε
2
C
ε·δ 2
∀ x1 , x2 ∈ [0, 1] mit |x1 − x2 | < δ.
(∗∗)
und zeigen nun, dass
kB[f ]n (x) − f (x)k < ε
∀ n ≥ n0 , ∀ x ∈ [0, 1].
Für x ∈ [0, 1] und n ∈ N definieren wir die folgenden Mengen
k
n
o
J1,n (x) := k ∈ {1, 2, . . . , n} − x < δ
n
k
o
n
J2,n (x) := k ∈ {1, 2, . . . , n} − x ≥ δ .
n
Dann erhalten wir
n X
k
−
f
(x)
· βk,n (x)
f
n
k=0
X k
X k
f
≤
− f (x) βk,n (x) + f
− f (x) · βk,n (x) .
n
n
k∈J1,n (x)
k∈J2,n (x)
|
{z
}
|
{z
}
k B[f ]n (x) − f (x) k
(2)
=
:=S1 (x)
:=S2 (x)
Für den Summanden S1 (x) ergibt sich
(1)
S1 (x) ≤
(∗∗)
≤
X k
− f (x) · βk,n (x)
f
n
J1,n (x)
ε X
βk,n (x)
·
2
J1,n (x)
n
εX
(2) ε
≤
βk,n (x) = .
2
2
k=0
Ist k ∈ J2,n (x), so gilt ( nk − x)2 ≥ δ 2 , also
S2 (x) ergibt sich
(k−nx)2
n2 δ 2
≥ 1 . Für den Summanden
166
4 Stetige Abbildungen zwischen metrischen Räumen
S2 (x)
≤
J2,n (x)
(∗),(3)
≤
2C
·
n2 δ 2
n
X
k=0
≥1
(k − nx)2 βk,n (x)
|
C
εδ 2
. Dann ist
{z
=nx(1−x)
2C
x(1 − x).
nδ 2
=
Sei nun n ≥ n0 =
o
X n
(k − nx)2
k + kf (x)k · βk,n (x) ·
f
2 2
n
| n{zδ }
2C
nδ 2
}
< 2ε . Für x ∈ [0, 1] ist außerdem
1
1
1
x(1 − x) = x − x2 = −(x − )2 + < .
2
4
4
Folglich ist S2 (x) <
ε
2
. Insgesamt erhalten wir
kB[f ]n (x) − f (x)k < ε
für alle n ≥ n0 und x ∈ [0, 1].
Somit konvergiert die Folge der Bernstein-Polynome (B[f ]n ) gleichmäßig gegen f .
⊓
⊔
Wir wollen den Weierstraßschen Approximationssatz nun verallgemeinern.
Wir betrachten dazu einen beliebigen kompakten metrischen Raum X und
den Banachraum C(X, R) der stetigen reellwertigen Funktionen auf X mit
der Norm k · k∞ .
Unter einer Unteralgebra von C(X, R) verstehen wir einen linearen Unterraum1 R ⊂ C(X, R) mit der zusätzlichen Eigenschaft, dass mit zwei Funktionen f, h ∈ R auch das Produkt f · h, definiert durch (f · h)(x) = f (x) · h(x),
in R liegt. Ein Beispiel für eine Unteralgebra ist die im Weierstraßschen Approximationssatz betrachtete Menge der Polynome P ⊂ C([a, b], R).
Wir wollen nun Bedingungen dafür angeben, dass eine Unteralgebra R ⊂
C(X, R) dicht in C(X, R) liegt. Als Hilfsmittel beweisen wir zunächst folgende Lemmata.
Lemma 4.20. Sei X ein kompakter metrischer Raum. Ist R ⊂ C(X, R) eine
Unteralgebra im Banachraum der stetigen reellwertigen Funktionen auf X, so
ist auch der Abschluss cl(R) ⊂ C(X, R) eine Unteralgebra.
Beweis. Seien f, g ∈ cl(R) ⊂ C(X, R) stetige Funktionen, die im Abschluss
der Unteralgebra R liegen. Dann existieren Folgen stetiger Funtionen (fn )
und (gn ) mit fn , gn ∈ R, die bzgl. k · k∞ gegen f bzw. g konvergieren. Da R
1
d.h. eine Teilmenge von C(X, R), die abgeschlossen gegenüber den VektorraumOperationen ist
4.7 Der metrische Raum der stetigen Abbildungen
167
eine Unteralgebra ist, liegen die stetigen Funktionen fn + gn , λ · fn und fn · gn
ebenfalls in R, wobei λ eine reelle Zahl bezeichnet. Mit den Normeigenschaften sieht man sofort, dass die Folgen (fn + gn ) und (λ · fn ) bzgl. k · k∞ gegen
f + g bzw. λ · f konvergieren, somit liegen f + g und λ · f in cl(R). Es bleibt
zu zeigen, dass auch f · g in cl(R) liegt.
Da die Folge (fn ) konvergiert, ist sie beschränkt, d.h. es existiert eine Konstante C ∈ R+ mit
|fn (x)| ≤ kfn k∞ ≤ C
∀ n ∈ N ∀ x ∈ X.
Da g stetig und X kompakt ist, hat g auf X ein Maximum. Es existiert also
eine Konstante M ∈ R+ so dass
|g(x)| ≤ kgk∞ ≤ M
∀ x ∈ X.
Damit erhalten wir
kf · g − fn · gn k∞ = kf · g − fn · g + fn · g − fn · gn k∞
= kg(f − fn ) + fn (g − gn )k∞
≤ kg(f − fn )k∞ + kfn (g − gn )k∞
= max{|g(x)| kf (x) − fn (x)k} + max{|fn (x)| kg(x) − gn (x)k}
x∈X
x∈X
≤ M kf − fn k∞ + Ckg − gn k∞
Da (fn ) gegen f und (gn ) gegen g konvergiert, folgt aus dieser Ungleichung,
dass fn · gn gegen f · g konvergiert. Somit ist f · g ∈ cl(R).
⊓
⊔
Lemma 4.21. Sei X ein kompakter metrischer Raum und R ⊂ C(X, R)
eine Unteralgebra, die alle konstanten Funktionen enthält. Dann liegen für
zwei Funktionen f, g ∈ R die Funktionen |f | , max{f, g} und min{f, g} im
Abschluss cl(R).
Beweis. (1) Sei f ∈ R. Da X kompakt und f stetig ist, besitzt f auf X ein
Maximum, d.h. es existiert ein C ∈ R+ mit |f (x)|√≤ C für alle x ∈ X. Wir
betrachten die stetige Funktion w : x ∈ [0, C 2 ] 7−→ x ∈ R . Sei Pn eine Folge
von Polynomen, die auf [0, C 2 ] gleichmäßig gegen w konvergiert. Eine solche
Folge existiert nach Satz 4.37. Dann konvergiert die Funktionenfolge (Pn ◦f 2 )
auf X gleichmäßig gegen w ◦ f 2 = |f | . Folglich konvergiert die Folge (Pn ◦ f 2 )
im metrischen Raum (C(X, R), k · k∞ ) gegen |f |. Da P
R eine Algebra ist, ist
n
mit f ∈ R auch jede Potenz f i ∈ R. Seien Pn (x) = i=0 ani xi die obigen
Polynome. Da R alle konstanten Funktionen enthält, folgt
Pn ◦ f 2 =
n
X
i=1
ain (f 2 )i ∈ R.
168
4 Stetige Abbildungen zwischen metrischen Räumen
Somit ist |f | der Grenzwert einer Folge von Elementen aus R und folglich gilt
|f | ∈ cl(R).
(2) Seien f, g ∈ R. Dann sind f + g und f − g Elemente in R, weil R ein
Unterraum von C(X, R) ist. Aus (1) folgt |f − g| ∈ cl(R) und |f + g| ∈ cl(R).
Daraus erhalten wir
)
max{f, g} = 21 (f + g + |f − g|)
∈ cl(R).
min{f, g} = 12 (f + g − |f − g|)
⊓
⊔
Mit Hilfe dieser Lemmata beweisen wir den folgenden Approximationssatz
für reellwertige Funktionen:
Satz 4.38 (Approximationssatz von Stone–Weierstraß(1))
Sei X ein kompakter metrischer Raum und R ⊂ C(X, R) eine Unteralgebra im
Banachraum der reellwertigen Funktionen auf X mit folgenden Eigenschaften
1. R enthält alle konstanten Funktionen,
2. R trennt Punkte, d.h. für beliebige voneinander verschiedene Punkte
x, y ∈ X existiert eine Funktion f ∈ R mit f (x) 6= f (y).
Dann ist R dicht in (C(X, R), k.k∞ ), d.h. zu jedem f ∈ C(X, R) existiert
eine Folge von Funktionen f1 , f2 , . . . ∈ R, die auf X gleichmäßig gegen f
konvergiert.
Beweis. (1) Wir zeigen zunächst die folgende Eigenschaft von R:
Sind x0 und y0 zwei verschiedene Punkte in X und r1 und r2 zwei reelle
Zahlen, so existert eine Funktion h ∈ R mit h(x0 ) = r1 und h(y0 ) = r2 :
Da die Algebra R Punkte trennt, existiert eine Funktion f ∈ R mit f (x0 ) 6=
f (y0 ). Sei g die stetige Funktion
g :=
f − f (x0 )
.
f (y0 ) − f (x0 )
Da R alle konstanten Funktionen enthält, liegt g in R. Wir betrachten nun
die Funktion
h := (r1 − r2 ) · g + r1 ∈ R.
Dann gilt offensichtlich
h(x0 ) = (r1 − r2 )g(x0 ) + r1 = r1
und
h(y0 ) = (r1 − r2 )g(y0 ) + r1 = r2 .
(2) Wir zeigen nun, dass R dicht in C(X, R) liegt.
Sei f ∈ C(X, R). Wir müssen zeigen, dass für jedes ε > 0 ein fε ∈ R existiert,
so dass kf − fε k∞ < ε:
Seien a, b ∈ X zwei beliebige Punkte. Nach (1) existiert eine Funktion ha,b ∈
R mit ha,b (a) = f (a) und ha,b (b) = f (b). (Falls a = b, so setzen wir in (1)
4.7 Der metrische Raum der stetigen Abbildungen
169
x0 = a = b, r1 = f (a) und y0 , r2 beliebig). Da f und ha,b stetig sind, ist die
Teilmenge
ε
n
εo
Ua,b := x ∈ X | ha,b (x) > f (x) −
= (ha,b − f )−1 (− , +∞) ⊂ X
2
2
offen. Nach Definition ist a ∈ Ua,b . Sei b ∈ X ein fixiertes Element. Dann ist
Ub := {Ua,b }a∈X eine offene Überdeckung von X. Da X kompakt ist, existiert
eine endliche Teilüberdeckung Ub∗ ⊂ Ub , d.h. es existieren endlich viele Punkte
a1 , a2 , . . . , an ∈ X, so dass
X = Ua1 ,b ∪ Ua2 ,b ∪ . . . ∪ Uan ,b .
Wir betrachten die Funktion
fb := max{ha1 ,b , . . . , han ,b }.
Nach Lemma 4.21 ist fb ∈ cl(R). Ist x ∈ X, so gilt x ∈ Uaj ,b für einen Index
j ∈ {1, . . . , n}. Damit erhalten wir
ε
fb (x) ≥ haj ,b (x) > f (x) − .
2
Wir haben zur Funktion f ∈ C(X, R) also zunächst für jedes b ∈ X eine
Funktion fb ∈ cl(R) gefunden, so dass
fb (x) > f (x) −
ε
2
∀ x ∈ X.
(∗)
Da f und fb stetig sind, ist die Teilmenge
n
εo
ε Vb := x ∈ X | fb (x) < f (x) +
= (fb − f )−1 (−∞, ) ⊂ X
2
2
offen. Aus der Definition der Funktionen ha,b folgt, dass fb (b) = f (b). Folglich
ist V := {Vb }b∈X eine offene Überdeckung von X. Da X kompakt ist, existiert
eine endliche Teilüberdeckung V ∗ ⊂ V, d.h. es existieren endlich viele Punkte
b1 , b2 , . . . , bk ∈ X, so dass
X = Vb1 ∪ Vb2 ∪ . . . ∪ Vbk .
Wir betrachten die stetige Funktion
g := min{fb1 , . . . , fbk }.
Aus den Lemmata 4.20 und 4.21 folgt g ∈ cl(R). Ist x ∈ X, so gilt x ∈ Vbi
für einen Index i ∈ {1, . . . , k}. Damit erhalten wir
ε
g(x) ≤ fbi (x) < f (x) + .
2
Andererseits existiert für x ∈ X ein l ∈ {1, . . . , k} mit g(x) = fbl (x) und
folglich gilt wegen (∗)
170
4 Stetige Abbildungen zwischen metrischen Räumen
ε
g(x) = fbl (x) > f (x) − .
2
Wir haben also eine stetige Funktion g ∈ cl(R) gefunden, so dass
f (x) −
ε
ε
< g(x) < f (x) −
2
2
∀ x ∈ X,
also
ε
.
2
Da g im Abschluss von R liegt, gibt es eine Funktion fε ∈ R mit
kf − gk∞ <
kg − fε k∞ <
ε
.
2
Wir erhalten somit
kf − fε k∞ ≤ kf − gk∞ + kg − fε k∞ <
ε ε
+ = ε.
2 2
Damit ist bewiesen, dass die Unteralgebra R dicht in C(X, R) liegt.
⊓
⊔
Als nächstes beweisen wir einen analogen Approximationssatz für komplexwertige Funtionen.
Satz 4.39 (Approximationssatz von Stone–Weierstraß (2))
Sei X ein kompakter, metrischer Raum und R ⊂ C(X, C) eine Unteralgebra
im Banachraum der stetigen, komplexwertigen Funktionen auf X mit folgenden Eigenschaften
1. R enthält alle konstanten Funktionen,
2. R trennt Punkte,
3. Wenn f ∈ R, so f ∈ R.
Dann gilt cl(R) = C(X, C), das heißt R ist dicht in (C(X, C, k.k∞ ).
Beweis. Wir betrachten die folgende Teilmenge im Raum der reellwertigen
stetigen Funktionen
R∗ := {f ∈ R | Im(f ) = 0} ⊂ C(X, R).
Dann gilt
1. Da R eine komplexe Unteralgebra in C(X, C) ist, ist R∗ eine reelle Unteralgebra in C(X, R).
2. Da R alle komplexen Konstanten enthält, enthält R∗ alle reellen Konstanten.
4.7 Der metrische Raum der stetigen Abbildungen
171
3. R∗ trennt ebenfalls Punkte: Seien x, y ∈ X zwei verschiedene Punkte.
Wie im 1. Teil des Beweises von Satz 4.38 zeigt man, dass eine Funktion
f ∈ R existiert, so dass f (x) = 0 und f (y) = 1 gilt. Dann gilt für die
Funktion f ∗ = f + f ∈ R∗ , dass f ∗ (x) = 0 und f ∗ (y) = 2. f ∗ trennt also
die Punkte x und y.
Nach dem Approximationssatz von Stone-Weierstrass für reellwertige Funktionen (Satz 4.38), liegt dann R∗ dicht im Banachraum C(X, R). Folglich ist
die Menge der Funktionen R∗ + iR∗ dicht im Banachraum C(X, R). Da R
eine (komplexe) Unteralgebra ist und R∗ ⊂ R, gilt R∗ + iR∗ ⊂ R . Daraus
erhält man
C(X, C) = cl(R∗ + iR∗ ) ⊂ cl(R) ⊂ C(X, R),
⊓
⊔
also cl(R) = C(X, C) .
Wir wenden nun die Approximationssätze von Stone-Weierstraß auf einige
Spezialfälle an.
Beispiel 1: Approximation reellwertiger Funktionen f ∈ C([a, b], R) durch
Polynome mit reellen Koeffizienten.
Wir betrachten die Menge PR aller Polynome mit reellen Koeffinzienten
n
n
o
X
PR := P ∈ C([a, b], R) P (t) :=
a k tk , a k ∈ R , n ∈ N .
k=0
Wir hatten bereits bemerkt, dass PR eine Unteralgebra von C([a, b], R) ist.
Offensichtlich enthält PR alle konstanten Funktionen (Polynome 0. Grades).
PR trennt außerdem Punkte, denn sind x, y ∈ [a, b] verschiedene reelle Zahlen,
so gilt p(x) 6= p(y) für das Polynom p(t) = t.
Nach dem Satz von Stone-Weierstraß für reellwertige Funktionen liegt die
Menge der reellen Polynome PR dicht im Banachraum C([a, b], R), d.h. für jede
stetige Funktion f ∈ C([a, b], R) existiert eine Folge von Polynomen Pn ∈ PR ,
n ∈ N, die auf [a, b] gleichmäßig gegen die Funktion f konvergiert.
Wir haben dieses Beispiel hier nur als Musterbeispiel angeführt. Die Aussage
ist natürlich als Spezialfall des Approximationssatzes von Weierstraß (Satz
4.37) bereits bekannt. Im Beweis von Satz 4.37 haben wir sogar ein konstuktives Verfahren für die approximierende Folge von Polynomen angegeben.
Beispiel 2: Approximation komplexwertiger Funktionen f ∈ C([a, b], C)
durch Polynome mit komplexen Koeffizienten.
Wir betrachten die Menge der Polynome mit komplexen Koeffizienten
n
n
o
X
PC := P ∈ C([a, b], C) P (t) :=
a k tk , a k ∈ C , n ∈ N .
k=0
172
4 Stetige Abbildungen zwischen metrischen Räumen
Genau wie für den reellen Fall sieht man leicht, dass PC eine Unteralgebra
von C([a, b], C) ist, die alle Voraussetzungen des Satzes 4.39 erfüllt. Somit
erhalten wir
Folgerung 4.2 Die Menge der komplexen Polynome PC dicht im Banachraum C([a, b], C), d.h. für jede stetige Funktion f ∈ C([a, b], C) existiert eine
Folge von Polynomen Pn ∈ PC , n ∈ N, die auf [a, b] gleichmäßig gegen die
Funktion f konvergiert.
Beispiel 3: Approximation reellwertiger periodischer stetiger Funktionen
durch reelle trigonometrische Polynome.
In diesem Beispiel betrachten wir auf R definierte reellwertige stetige 2πperiodische Funktionen. Wir bezeichen den Vektorraum dieser Funktionen
mit
C(R, R)per := {f ∈ C(R, R) | f (x + 2π) = f (x) ∀ x ∈ R}.
Da die Werte von f ∈ C(R, R)per durch diejenigen von f|[0,2π] vollständig
bestimmt sind, ist
kf k∞ := max{|f (x)|}
x∈R
per
definiert und eine Norm auf C(R, R) .
Eine auf R definierte 2π-periodische Funktion kann man als Funktion auf S 1
auffassen, wobei
S 1 := {z ∈ C | |z| = 1} = {eit | t ∈ R} ⊂ C
die Menge der komplexen Zahlen vom Betrag 1 ist. S 1 ist beschränkt und abgeschlossen in C, also mit der durch C induzierten Metrik ein kompakter metrischer Raum. Man ordnet f ∈ C(R, R)per dabei die Funktion f ∗ ∈ C(S 1 , R)
zu
f ∗ (eit ) := f (t).
Diese Definition ist durch die Periodizitätsbedingung korrekt. Die Abbildung
φ : C(R, R)per −→ C(S 1 , R)
f
7−→
f∗
ist bijekjtiv und erfüllt kφ(f )k∞ = kf k∞ . Die normierten Vektorräume
(C(R, R)per , k·k∞ ) und (C(S 1 , R), k·k∞ ) sind also isometrisch zueinander. Wir
können deshalb den Approximationssatz von Stone-Weierstraß (Satz 4.38)
auch auf die auf R definierten periodischen Funktionen anwenden.
Definition 4.22. Ein reelles trigonometrisches Polynom ist eine 2π-periodische Funktion f ∈ C(R, R)per mit
f (t) := a0 +
n X
ak cos(kt) + bk sin(kt)
k=1
wobei a0 , a1 , . . . , an , b1 , . . . , bn ∈ R und n ∈ N.
∀ t ∈ R,
4.7 Der metrische Raum der stetigen Abbildungen
173
Wir bezeichnen mit PRper die Menge der reellen trigonometrischen Polynome.
Wegen der Additionstheoreme
1
{cos((k + l)t) + cos((l − k)t)}
2
1
cos(kt) · sin(lt) = {sin((k + l)t) + sin((l − k)t)}
2
1
sin(kt) · sin(lt) = {cos((k + l)t) + cos((l − k)t)}
2
cos(kt) · cos(lt) =
ist PRper eine Unteralgebra von C(R, R)per . Diese Unteralgebra enthält die
konstanten Funktionen (a1 = . . . = an = b1 = . . . = bn = 0.) Sie trennt
auch Punkte. Sind x, y ∈ R und x 6= y + k2π, so ist cos(x) 6= cos(y) oder
sin(x) 6= sin(y). Dann trennt das trigonometrische Polynom p(t) = cos(t)
oder das trigonometrische Polynom p(t) = sin(t) die Punkte x und y. Aus
Satz 4.38 folgt somit
Folgerung 4.3 Die Menge der reellen trigonometrischen Polynome PRper ist
dicht im Banachraum C(R, R)per der auf R definierten stetigen reellwertigen
2π-periodischen Funktionen. D.h. für jede auf R definierte 2π-periodische reellwertige stetige Funktion f existiert eine Folge von reellen trigonometrischen
Polynomen Pn ∈ PRper , n ∈ N, die auf R gleichmäßig gegen die Funktion f
konvergiert.
Beispiel 4: Approximation komplexwertiger periodischer stetiger Funktionen
durch komplexe trigonometrische Polynome.
In diesem Beispiel betrachten wir auf R definierte komplexwertige stetige 2πperiodische Funktionen. Wir bezeichnen den Vektorraum dieser Funktionen
mit
C(R, C)per := {f ∈ C(R, C) | f (x + 2π) = f (x) ∀ x ∈ R}.
Wie im letzten Beispiel erhalten wir, dass die Banachräume (C(R, C)per , k ·
k∞ ) und (C(S 1 , C), k · k∞ ) isometrisch sind. Wir können somit den Approximationssatz von Stone-Weierstraß (Satz 4.39) auf die auf R definierten komplexwertigen 2π-periodischen Funktionen anwenden.
Definition 4.23. Ein komplexes, trigonometrisches Polynom ist eine 2π–
periodische Funktion f ∈ C(R, C)per mit
f (t) =
N
X
k=−n
wobei n, N ∈ N0 und ck ∈ C.
ck eikt ,
174
4 Stetige Abbildungen zwischen metrischen Räumen
Wir bezeichnen die Menge der komplexen trigonometrischen Polynome mit
PCper . PCper ist eine Unteralgebra von C(R, C)per , die die konstanten Funktionen enthält, Punkte trennt und abgeschlossen gegenüber komplexer Konjugation ist. Aus Satz 4.39 erhalten wir deshalb
Folgerung 4.4 Die Menge der komplexen trigonometrischen Polynome PCper
ist dicht im Banachraum C(R, C)per der auf R definierten komplexwertigen stetigen 2π-periodischen Funktionen. D.h. für jede auf R definierte 2πperiodische komplexwertige stetige Funktion f existiert eine Folge von komplexen trigonometrischen Polynomen Qn ∈ PRper , n ∈ N, die auf R gleichmäßig
gegen die Funktion f konvergiert.
5
Differentialrechnung für Funktionen einer
reellen Veränderlichen
Die Grundidee der Differentialrechnung ist die Approximation einer Funktion
in der Umgebung eines Punktes durch lineare Abbildungen. Dadurch kann
man viele Aussagen über das lokale Verhalten der Funktion machen.
5.1 Differenzierbare Abbildungen
Sei E ein reeller normierter Vektorraum, U ⊂ R und x0 ∈ U Häufungspunkt
von U .
Definition 5.1. Eine Abbildung f : U ⊂ R −→ E heißt differenzierbar im
Häufungspunkt x0 ∈ U , falls der Grenzwert
f ′ (x0 ) :=
df
f (x) − f (x0 )
(x0 ) := lim
x→x0
dx
x − x0
existiert. Dieser Grenzwert heißt Ableitung von f in x0 .
Bemerkung: Ist U offen oder ein Intervall, so ist jeder Punkt von U ein
Häufungspunkt.
Definition 5.2. Sei jeder Punkt der Menge U ⊂ R ein Häufungspunkt.
f : U −→ E heißt auf U differenzierbar, falls f in jedem Punkt x0 ∈ U
differenzierbar ist. In diesem Fall heißt die Abbildung
f ′ : U ⊂ R −→ E
x 7→ f ′ (x)
1. Ableitung von f .
176
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Geometrische Interpretation: Die Motivation für die Entwicklung der Differentialrechnung durch Leibniz war das Tangentenproblem: Man approximiere eine gegebene Kurve möglichst gut durch eine Gerade, die durch einen festen
Punkt der Kurve geht.
Sei f : U −→ E, x0 ∈ U . Wir betrachten
die Sekante durch P0 = (x0 , f (x0 )) und P =
(x0 + h, f (x0 + h)). Dies ist die Gerade, die
durch die Abbildung
Sh (x) := f (x0 ) +
graph(Tx0 )
E6
f (x0 )
f (x0 + h) − f (x0 )
·(x − x0 )
h
|
{z
}
•
Anstieg
gegeben ist.
x0
•
graph(Sh )
graph(f )
X
x0 + h
Was passiert mit den Sekanten Sh bei h → 0 ? Ist f in x0 differenzierbar, so
gilt
f (x0 + h) − f (x0 )
,
f ′ (x0 ) = lim
h→0
h
das heißt, bei h → 0 konvergieren die Anstiege der Sekanten gegen f ′ (x0 ).
Somit konvergieren die Sekanten Sh bei h → 0 gegen die Geraden, die durch
die Funktion
Tx0 (x) := f (x0 ) + f ′ (x0 )(x − x0 )
gegeben sind. Die durch Tx0 definierte Gerade heißt Tangente an die Kurve graph(f ) im Punkt P0 . Tx0 approximiert f in erster Näherung in einer
”
Umgebung um x0 “, das heißt, es gilt
(1) f (x0 ) = Tx0 (x0 ),
f (x)−Tx0 (x0 )
= 0.
(2) lim
x−x0
x→x0
Bemerkung: In der Mechanik wurde die Differentialrechnung insbesondere
durch Newton benutzt, um ein mathematisches Modell für Größen wie die
Geschwindigkeit oder die Beschleunigung zu entwickeln. Sei zum Beispiel P
ein Massepunkt und s(t) ∈ R3 gebe den Ort von P zur Zeit t an. Dann ist die
Ortsänderung pro Zeiteinheit
s(t) − s(t0 )
.
t − t0
Folglich gibt s′ (t0 ) = lim
t→t0
an.
s(t)−s(t0 )
t−t0
die Geschwindigkeit von P zur Zeit t = t0
Satz 5.1 Sei f : U ⊂ R −→ E. Ist f in einem Häufungspunkt x0 ∈ U
differenzierbar, so ist f in x0 stetig.
5.1 Differenzierbare Abbildungen
177
Beweis: Sei (xn ) ⊂ U eine Folge die gegen x0 konvergiert. Es ist zu zeigen,
dass dann auch (f (xn )} gegen f (x0 ) konvergiert. Es gilt
f (xn ) − f (x0 ) n→∞
−→ 0 · kf ′ (x0 )k.
kf (xn ) − f (x0 )k = |xn − x0 | xn − x0
Somit ist f (xn )) gegen f (x0 ) konvergent.
⊓
⊔
Folgerung 5.1 Sei jeder Punkt von U ⊂ R ein Häufungspunkt. Ist f : U −→
E differenzierbar, so ist f : U −→ E stetig.
Rechenregeln für differenzierbare Funktionen
Satz 5.2 Sei K = R, C und E ein normierter K-Vektorraum. Sei weiterhin
U ⊂ R und x0 ∈ U sei Häufungspunkt von U . Die Abbildungen f, g : U −→ E
und h : U −→ K seien in x0 differenzierbar. Dann gilt:
(1) – Summenregel
f + g : U −→ E ist in x0 differenzierbar und
(f + g)′ (x0 ) = f ′ (x0 ) + g ′ (x0 ).
(2) – Produktregel
h · f : U −→ E ist in x0 differenzierbar und
(h · f )′ (x0 ) = h′ (x0 ) · f (x0 ) + h(x0 ) · f ′ (x0 ).
(3) – Quotientenregel
Sei weiterhin h(x0 ) 6= 0. Dann ist hf : {x ∈ U | h(x) 6= 0} → K in x0
differenzierbar und
′
f ′ (x0 )h(x0 ) − h′ (x0 )f (x0 )
f
(x0 ) =
.
h
h2 (x0 )
Insbesondere gilt auch
′
1
h′ (x0 )
(x0 ) = − 2
.
h
h (x0 )
Beweis: (1) Da f und g in x0 stetig sind, folgt durch Limesbildung aus
f (x) − f (x0 ) g(x) − g(x0 )
f (x) + g(x) − (f (x0 ) + g(x0 ))
=
+
.
x − x0
x − x0
x − x0
sofort die Behauptung.
178
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
(2) Wegen der Stetigkeit von f und h in x0 folgt auch hier wieder mit Limesbildung aus
(h · f )(x) − (h · f )(x0 )
f (x) − f (x0 ) h(x) − h(x0 )
= h(x) ·
+
· f (x0 ).
x − x0
x − x0
x − x0
die Behauptung.
(3) Es gilt
( h1 )(x) − ( h1 )(x0 )
x − x0
=
x→x0
1
h(x)
−
1
h(x0 )
x − x0
−→ −h′ (x0 ) ·
=
h(x0 ) − h(x)
1
·
x − x0
h(x)h(x0 )
1
.
h2 (x0 )
Durch Limesbildung folgt dann die zweite Behauptung. Mit Hilfe der Produktregel erhält man sofort die Quotientenregel.
⊓
⊔
Beispiel 5.1
Jedes Polynom P (x) = xn an + xn−1 an−1 + . . . + a0 , ai ∈ E für alle i ∈
{0, . . . , n}, ist auf R differenzierbar und es gilt
P ′ (x) = nan xn−1 + (n − 1)an−1 xn−2 + . . . + 2a2 x + a1 ,
denn f (x) = x ist differenzierbar und f ′ (x) = 1 nach Definition. Dann ist auch
fk (x) = xk = x
. . · x} differenzierbar und nach Satz 5.2 gilt fk′ (x) = k · xk−1 .
| · .{z
k−mal
Beispiel 5.2
Sei
R(x) =
P (x)
a0 + a1 x + . . . + an xn
=
Q(x)
b0 + b1 x + . . . + bm xm
eine rationale Funktion auf R \ {x ∈ R | Q(x) = 0} und ai , bj ∈ R oder
ai , bj ∈ C. Dann ist R : R \ {x ∈ R | Q(x) = 0} −→ R (C) differenzierbar.
Satz 5.3 (Kettenregel) Seien U1 , U2 ⊂ R, f : U1 −→ E, g : U2 −→ U1
und E ein normierter Vektorraum. Sei g in einem Häufungspunkt x0 ∈ U2
differenzierbar und sei f im Häufungspunkt g(x0 ) ∈ U1 differenzierbar. Dann
ist f ◦ g : U2 −→ E in x0 differenzierbar und es gilt 1
(f ◦ g)′ (x0 ) = g ′ (x0 ) · f ′ (g(x0 )).
1
Die Reihenfolge der Faktoren wurde so gewählt, weil man die Vektoren aus E
nach Vereinbarung von links mit den Skalaren multipliziert.
5.1 Differenzierbare Abbildungen
179
Beweis: Für g(x) 6= g(x0 ) gilt
g(x) − g(x0 ) f (g(x)) − f (g(x0 ))
(f ◦ g)(x) − (f ◦ g)(x0 )
=
·
.
x − x0
x − x0
g(x) − g(x0 )
Sei (xn ) eine gegen x0 konvergente Folge mit xn =
6 x0 für alle n ∈ N.
(1) Sei g(xn ) 6= g(x0 ) für alle n ≥ n0 . Da g in x0 stetig ist, folgt dann
n→∞
g(xn ) −→ g(x0 ). Folglich gilt
f (g(xn )) − f (g(x0 )) n→∞ ′
−→ f (g(x0 )) · g ′ (x0 ).
xn − x0
(2) Es gelte nun g(xn ) = g(x0 ) für unendlich viele n ∈ N. Da g in x0 und f
in g(x0 ) differenzierbar ist, gilt
g ′ (x0 ) = lim
n→∞
g(xn ) − g(x0 )
= 0,
xn − x0
und wegen
f (g(xn )) − f (g(x0 ))
= 0 = g ′ (x0 ) · f ′ (g(x0 ))
xn − x0
für alle n mit g(xn ) = g(x0 ), gilt die Behauptung auch für den zweiten Fall.
⊓
⊔
Satz 5.4 (Ableitung der inversen Abbildung) Es seien U1 , U2 ⊂ R und
f : U1 −→ U2 sei bijektiv. Sei x0 ∈ U1 ein Häufungspunkt von U1 und f (x0 ) ∈
U2 ein Häufungspunkt von U2 . Es gelte:
(1) f −1 ist in f (x0 ) stetig,
(2) f ist in x0 differenzierbar und f ′ (x0 ) 6= 0.
Dann ist f −1 : U2 −→ U1 in f (x0 ) differenzierbar und es gilt
(f −1 )′ (f (x0 )) =
1
.
f ′ (x0 )
Beweis: Für y ∈ U2 mit y = f (x) gilt
x − x0
f −1 (y) − f −1 (f (x0 ))
=
=
y − f (x0 )
f (x) − f (x0 )
1
f (x)−f (x0 )
x−x0
.
Sei nun (yn ) = (f (xn )) eine Folge in U2 , die gegen f (x0 ) konvergiert. Da f −1
in f (x0 ) stetig ist, konvergiert xn = f −1 (yn ) gegen x0 = f −1 (f (x0 )). Da f in
x0 differenzierbar ist, folgt dann
f −1 (yn ) − f −1 (f (x0 )) n→∞ 1
−→ ′
.
yn − f (x0 )
f (x0 )
⊓
⊔
180
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Bemerkung: Satz 5.4 gilt nicht ohne die Voraussetzung f ′ (x0 ) 6= 0, denn sei
zum Beispiel
f : R −→ R
x 7→ x3 .
Dann ist f bijektiv und differenzierbar. Es gilt f (0) = 0 und f ′ (0) = 0. Die
inverse Abbildung
f −1 : R −→ R
√
x 7→ 3 x
ist in 0 nicht differenzierbar, denn der Grenzwert für x gegen 0 von
√
3
f −1 (x) − f −1 (0)
1
x
=
= √
3
x
x
x2
existiert nicht in R.
Ableitungen elementarer Funktionen
(1) Die Exponentialfunktion
exp : R −→ R
x 7→ ex =
∞
X
xn
n!
n=0
ist differenzierbar und es gilt (ex )′ = ex .
Beweis: Die Potenzreihe
∞
eh − 1 X hn−1
h
h2
=
=1+ +
+ ...
h
n!
2!
3!
n=1
ist auf cl(K(0, 1)) gleichmäßig konvergent. Deswegen sind lim und
tauschbar und es gilt
eh − 1
lim
=1
h→0
h
und folglich
P
ver-
eh − 1
ex0 +h − ex0
= lim ex0 ·
= ex0 .
h→0
h→0
h
h
exp′ (x0 ) = lim
2
5.1 Differenzierbare Abbildungen
181
(2) Die Logarithmusfunktion
ln : R+ −→ R
x 7→ ln(x)
ist differenzierbar und es gilt ln′ (x) = x1 .
Beweis: ln ist die Umkehrfunktion von exp : R −→ R+ , ln ist stetig, exp
ist differenzierbar und exp′ (x) = exp(x) 6= 0 für alle x ∈ R. Somit sind die
Voraussetzungen des Satzes 5.4 erfüllt und es folgt
ln′ (ex ) =
1
1
= x.
x
′
(e )
e
1
y
∀ y ∈ R+ .
Somit ist
ln′ (y) =
2
(3) Die Potenzfunktion
Wir betrachten für a ∈ R die Funktion
pa : R+ −→ R
x 7→ xa = eln(x)·a .
pa ist differenzierbar und p′a (x) = a · xa−1 .
Beweis: Nach der Kettenregel (Satz 5.3) gilt:
p′a (x) = exp′ (ln(x) · a) · a · ln′ (x) = eln(x)·a · a ·
xa
1
=
· a = a · xa−1 .
x
x
2
(4) Die Exponentialfunktion zur Basis a
Die Funktion
expa : R −→ R+
x 7→ ax = eln(a)·x
ist für a ∈ R+ differenzierbar und es gilt
(expa )′ (x) = eln(a)·x · ln(a) = ln(a) · ax .
2
182
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
(5) Sinus-und Cosinusfunktion
Die Funktionen cos, sin : R −→ R sind differenzierbar und es gilt
cos′ (x) = − sin(x),
Beweis: Die Reihen
∞
P
sin′ (x) = cos(x).
2n+1
x
= sin(x) und
(−1)n (2n+1)!
n=0
∞
P
2n
x
= cos(x)
(−1)n (2n)!
n=0
sind gleichmäßig konvergent auf jeder kompakten Menge. Es folgt
∞
sin(h) X
1
=
(−1)n
· lim h2n = 1
h→0
h→0
h
(2n
+
1)!
n=0
lim
und
∞
h2n+1
cos(h) − 1 X
(−1)n lim
=
= 0.
h→0 (2n)!
h→0
h
n=1
lim
Daher gilt
sin(x) cos(h) + cos(x) sin(h) − sin(x)
sin(x + h) − sin(x)
=
h
h
sin(h)
cos(h) − 1
= cos(x)
+ sin(x)
h
h
h→0
−→ cos(x)
und
cos(x) cos(h) − sin(x) sin(h) − cos(x)
cos(x + h) − cos(x)
=
h
h
sin(h)
cos(h) − 1
− sin(x)
= cos(x)
h
h
h→0
−→ − sin(x).
2
(6) Die Funktionen sinh und cosh
Die Funktionen sinh, cosh : R −→ R sind differenzierbar und es gilt
(sinh)′ (x) = cosh(x), (cosh)′ (x) = sinh(x).
Beweis: Nach Definition gilt
sinh(x) =
Daraus folgt sofort
1 x
e − e−x
2
und cosh(x) =
1 x
e + e−x
2
5.1 Differenzierbare Abbildungen
183
1 x
(e + e−x ) = cosh(x),
2
1
(cosh)′ (x) = (ex − e−x ) = sinh(x).
2
(sinh)′ (x) =
2
Definition 5.3. Sei f : U ⊂ R −→ E differenzierbar und x0 ∈ U ein
Häufungspunkt von U . f heißt in x0 2-mal differenzierbar, falls die Ableitung
von f ′ : U −→ E in x0 existiert.
f ′ (x0 +h)−f ′ (x0 )
h
h→0
Bezeichnung: lim
=: f ′′ (x0 )
Bemerkung: Allgemein definiert man die n–te Ableitung f (n) (x0 ) als Ableitung (f (n−1) )′ (x0 ), falls die (n − 1)–te Ableitung f (n−1) : U −→ E existiert
(und differenzierbar ist).
Bezeichnung: f (n) (x0 ) =
dn f
dxn (x0 ).
Definition 5.4. Eine Abbildung f : U ⊂ R −→ E heißt stetig differenzierbar,
wenn f auf U differenzierbar und f ′ : U −→ E stetig ist. f : U ⊂ R −→ E
heißt n–mal stetig differenzierbar, falls alle Ableitungen f (1) , f (2) , . . . , f (n)
existieren und stetig sind.
Eine Abbildung f : U ⊂ R −→ E heißt glatt, wenn sie beliebig oft differenzierbar ist, das heißt, wenn für alle n ∈ N die Ableitungen f (n) existieren (und
stetig sind).
Bezeichnung: C (k) (U ; E) bezeichne den Vektorraum aller k-fach stetig differenzierbaren Abbildungen von U nach E. C ∞ (U ; E) bezeichne den Vektorraum aller glatten Abbildungen von U nach E.
Beispiel 5.1
Wir betrachten die Funktion f : R −→ R, defniert durch
(
x2 sin x1 , x 6= 0
f (x) :=
0,
x = 0.
Die Funktion f ist differenzierbar und f ′ ist in 0 unstetig: Wenn x 6= 0 ist,
dann ist
1
1
1
1
1
+ x2 · cos
· − 2 = 2x · sin
− cos
.
f ′ (x) = 2x · sin
x
x
x
x
x
Sei nun x = 0. Dann gilt
184
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
h2 · sin( h1 )
1 h→0
f (h) − f (0)
=
= h · sin
−→ 0
h
h
h
| {z }
beschränkt
und daher f ′ (0) = 0. Da cos( x1 ) für x gegen 0 keinen Grenzwert hat, hat auch
f ′ keinen Grenzwert in x = 0. Somit ist f ′ nicht stetig in x = 0. Insbesondere
ist f nicht 2–mal differenzierbar in x = 0.
Beispiel 5.2
Folgende Betrachtungen (Tagaki, 1903) liefern uns eine auf ganz R stetige,
aber nirgends differenzierbare Funktion. Wir betrachten die stückweise lineare
Funktion f0 : R −→ R definiert durch
(
x − [x]
falls x ∈ [[x], [x] + 12 ]
,
(5.1)
f0 (x) :=
1 − x + [x] falls x ∈ [[x] + 12 , [x] + 1]
wobei [x] wie üblich das kleinste Ganze von x bezeichnet (GaußklammerFunktion) .
R
6
f0
1
2
f1 −1
− 12
1
2
1
R
Die Funktion f0 hat also die Periode 1. Wir definieren nun
fn (x) := 4−n f0 (4n · x).
Dann hat fn die Periode 4−n . Sei weiterhin f :=
∞
P
fn . Dann gilt
n=0
(1) fn : R −→ R ist stetig.
(2) Es gilt |fn (x)| ≤ 21 4−n = Mn für alle x ∈ R. Aus den Eigenschaften der
geometrischen Reihe folgt
∞
X
n=0
Somit ist
∞
P
n=0
Mn =
∞ n
2
1X 1
= < ∞.
2 n=0 4
3
fn gleichmäßig konvergent auf R.
5.2 Der Mittelwertsatz der Differentialrechnung
185
Aus (1) und (2) folgt, dass f : R −→ R stetig ist. Trotzdem ist f nirgends
differenzierbar.
Beweis: Sei x ∈ R beliebig gegeben. Sei n ∈ N und hn := 41 · 4−n oder
hn := − 41 ·4−n , so dass fn zwischen x und x+hn linear ist. Nach Konstruktion
ist fk für alle k ≤ n zwischen x und x + hn linear. Da die linearen Abschnitte
von fn den Anstieg ±1 haben, folgt
fk (x + hn ) − fk (x)
= ±1
hn
∀ k ≤ n.
Für k > n ist hn = 4−(n+1) eine Periode von fk . Folglich ist
für alle k > n und daher gilt
fk (x+hn )−fk (x)
hn
n
n
k=0
k=0
=0
f (x + hn ) − f (x) X fk (x + hn ) − fk (x) X
=
=
±1,
hn
hn
und diese Partialsummenfolge kann nicht (für n → ∞) konvergent sein, denn
die Basisfolge ist keine Nullfolge. Somit existiert f ′ (x) = lim f (x+hhnn)−f (x)
n→∞
nicht.
⊓
⊔
5.2 Der Mittelwertsatz der Differentialrechnung
Definition 5.5. Sei f : [a, b] −→ R. Man sagt: f nimmt in x0 ∈ (a, b) ein
lokales Maximum (bzw. Minimum) an, falls ein ε > 0 existiert, so dass für
alle y ∈ [a, b] mit |y − x0 | < ε gilt
f (y) ≤ f (x0 )
R
bzw. (f (y) ≥ f (x0 )).
6
lok. Maximum
f (x01 )
f (x02 )
lok. Minimum
a
x01
x02
b
R
Satz 5.5 Ist f : [a, b] −→ R differenzierbar und hat f in x0 ∈ (a, b) ein
lokales Maximum (Minimum), so gilt f ′ (x0 ) = 0.
186
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Beweis: Sei f (x0 ) lokales Maximum von f . Dann existiert einerseits ein ε > 0,
so dass für alle x > x0 mit |x − x0 | < ε
f (x) − f (x0 )
≤0
x − x0
gilt und somit
lim
x→x+
0
f (x) − f (x0 )
≤ 0.
x − x0
(⋆)
Andererseits einerseits ein ε > 0, so dass für alle x < x0 mit |x − x0 | < ε
f (x) − f (x0 )
≥0
x − x0
gilt und daher
lim−
x→x0
Da f ′ (x0 ) = lim
x→x0
f (x)−f (x0 )
x−x0
f ′ (x0 ) = lim
x→x+
0
f (x) − f (x0 )
≥ 0.
x − x0
(⋆⋆)
existiert, muss gelten
f (x) − f (x0 )
f (x) − f (x0 )
= lim
.
−
x − x0
x − x0
x→x0
Aus (⋆) und (⋆⋆) folgt dann, dass f ′ (x0 ) = 0 ist.
⊓
⊔
Bemerkung: Aus f ′ (x0 ) = 0 folgt im Allgemeinen nicht, dass f in x0 ein
lokales Maximum oder Minimum hat. Wir betrachten zum Beispiel f (x) = x3 .
Dann ist f ′ (0) = 0, aber 0 ist kein lokaler Extremwert von f .
Satz 5.6 (Satz von Rolle) Sei f : [a, b] −→ R stetig und f : (a, b) −→ R
differenzierbar. Weiterhin gelte f (a) = f (b). Dann existiert ein Punkt x0 ∈
(a, b) mit f ′ (x0 ) = 0.
Beweis: Ist f konstant auf [a, b], so ist die Behauptung trivial. Ist f nicht
konstant, so existiert ein x1 ∈ (a, b), so dass entweder
f (x1 ) > f (a) = f (b)
oder
f (x1 ) < f (a) = f (b)
gilt. Wir betrachten zunächst den ersten Fall. Da f : [a, b] −→ R stetig und
[a, b] kompakt ist, nimmt f auf [a, b] ein globales Maximum und ein globales Minimum an. Das Maximum liegt wegen obiger Aussage nicht auf den
Randpunkten. Folglich existiert ein x0 ∈ (a, b)
f (x0 ) = max{f (x) | x ∈ [a, b]}.
Nach Satz 5.5 folgt dann f ′ (x0 ) = 0. Der Beweis für den zweiten Fall ist
analog.
⊓
⊔
5.2 Der Mittelwertsatz der Differentialrechnung
187
Satz 5.7 (Verallg. Mittelwertsatz der Diff.-rechnung von Cauchy) Seien
f, g : [a, b] −→ R stetig und auf (a, b) differenzierbar. Dann existiert ein
x0 ∈ (a, b) mit
(f (b) − f (a)) · g ′ (x0 ) = (g(b) − g(a)) · f ′ (x0 ).
Beweis: Wir betrachten die Funktion
h(x) = [f (b) − f (a)] · g(x) − [g(b) − g(a)] · f (x).
Dann ist h stetig in [a, b] und differenzierbar in (a, b) und es gilt
h(a) = f (b)g(a) − g(b)f (a) = h(b).
Nach dem Satz von Rolle existiert ein x0 ∈ (a, b) mit h′ (x0 ) = 0. Wir erhalten
somit
0 = h′ (x0 ) = (f (b) − f (a))g ′ (x0 ) − (g(b) − g(a))f ′ (x0 ).
⊓
⊔
Satz 5.8 (Mittelwertsatz von Lagrange) Sei f : [a, b] −→ R stetig und
in (a, b) differenzierbar. Dann existiert ein x0 ∈ (a, b), so dass
f (b) − f (a)
= f ′ (x0 ).
b−a
Beweis: Folgt aus Satz 5.7 mit g(x) := x.
R 6
Geometrische Bedeutung:
Es existiert ein x0 ∈ (a, b), so dass der Anstieg
der Tangente in (x0 , f (x0 )) gleich dem Anstieg
der Sekante durch (a, f (a)) und (b, f (b)) ist.
⊓
⊔
•
•
•
a
x0
b
R
Anwendung des Mittelwertsatzes auf den Kurvenverlauf der durch
f definierten Kurve
Satz 5.9 Sei f : (a, b) −→ R differenzierbar, a, b ∈ R ∪ {±∞}. Dann gilt:
(1) Ist f ′ (x) ≥ 0 für alle x ∈ (a, b), so ist f monoton wachsend. Ist f ′ (x) > 0
für alle x ∈ (a, b), so ist f streng monoton wachsend.
(2) Ist f ′ (x) ≤ 0 (< 0) für alle x ∈ (a, b), so ist f (streng) monoton fallend.
(3) Ist f ′ ≡ 0 auf (a, b), so ist f konstant.
188
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Beweis: Seien x1 , x2 ∈ (a, b), x1 < x2 . Wir wenden den Mittelwertsatz von
Lagrange auf f |[x1 ,x2 ] an. Dann existiert ein y ∈ (x1 , x2 ), so dass
f ′ (y) =
f (x2 ) − f (x1 )
.
x2 − x1
Da x2 − x1 > 0, folgen die Behauptungen aus Satz 5.8.
⊓
⊔
Anwendung:
Seien c, A ∈ R gegebene Konstanten. Dann existiert genau eine differenzierbare Funktion f : R −→ R mit f ′ = c · f und f (0) = A. Diese Funktion ist
gegeben durch f (x) = Aecx . Zum Beweis setzen wir F (x) = f (x) · e−cx . Dann
gilt
F ′ (x) = f ′ (x) · e−cx − c · f (x) · e−cx = (cf − cf )e−cx = 0.
Somit ist F konstant. Da F (0) = A ist, gilt A = f (x) · e−cx . Folglich ist
f (x) = Aecx .
2
Satz 5.10 Sei f : (a, b) −→ R differenzierbar. Weiterhin sei f in x0 ∈ (a, b)
2–mal differenzierbar und es gelte
(1) f (x0 ) = 0,
(2) f ′′ (x0 ) < 0
(bzw. f ′′ (x0 ) > 0).
Dann hat f in x0 ein isoliertes lokales Maximum (Minimum), das heißt, es
existiert ein ε > 0, so dass für alle x mit 0 < |x − x0 | < ε
f (x) < f (x0 )
(bzw. f (x) > f (x0 )).
gilt.
Beweis: Wir beweisen nur den Fall f ′′ (x0 ) < 0. (f ′′ (x0 ) > 0 analog.) Aus
f ′′ (x0 ) = lim
x→x0
f ′ (x) − f ′ (x0 )
<0
x − x0
folgt, dass ein ε > 0 existiert, so dass für alle x mit 0 < |x − x0 | < ε
f ′ (x) − f ′ (x0 )
<0
x − x0
gilt. Da f ′ (x0 ) = 0 ist, erhält man
f ′ (x) < 0,
für alle x > x0 mit x − x0 < ε
f ′ (x) > 0,
für alle x < x0 mit x0 − x < ε.
und
Nach Satz 5.9 ist daher f |(x0 −ε,x0 ) streng monoton wachsend, während f |(x0 ,x0 +ε)
streng monoton fallend ist. Somit hat f in x0 ein isoliertes lokales Maximum.
⊓
⊔
5.2 Der Mittelwertsatz der Differentialrechnung
189
Definition 5.6. Sei D ⊂ R offenes Intervall. Eine Funktion f : D −→ R
heißt
(1) konvex, falls
f (λx1 + (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 )
∀ x1 , x2 ∈ D, λ ∈ (0, 1),
(2) konkav, falls
f (λx1 + (1 − λ)x2 ) ≥ λf (x1 ) + (1 − λ)f (x2 )
∀ x1 , x2 ∈ D, λ ∈ (0, 1).
Geometrische Bedeutung:
Ist f konvex, so liegt die Kurve graph(f ) unterhalb der Geraden durch
(x1 , f (x1 )) und (x2 , f (x2 )) für beliebige x1 , x2 ∈ D. Ist f konkav, so liegt
graph(f ) oberhalb der Geraden durch (x1 , f (x1 ) und (x2 , f (x2 )) für beliebige
x1 , x2 ∈ D.
R
6
R
f (x2 )
6
f ist konvex
•
•
f (x2 )
f (x1 )
f ist konkav
•
x1
x2
R
f (x1 )
•
x1
x2
R
Satz 5.11 Sei D ⊂ R ein offenes Intervall und f : D −→ R zweimal differenzierbar. Dann gilt:
(1) f ist genau dann konvex, wenn f ′′ (x) ≥ 0 für alle x ∈ D.
(2) f ist genau dann konkav, wenn f ′′ (x) ≤ 0 für alle x ∈ D.
Beweis: Wir zeigen nur die Behauptung (1). Der Beweis der Behauptung (2)
ist analog.
(⇐)
Sei f ′′ (x) ≥ 0 für alle x ∈ D. Nach Satz 5.9 ist f ′ auf D monoton wachsend.
Seien x1 , x2 ∈ D, λ ∈ (0, 1). Wir setzen x := λx1 + (1 − λ)x2 mit x1 < x2 .
Dann ist x1 < x < x2 . Nach dem Mittelwertsatz existieren ein ξ1 ∈ (x1 , x)
und ein ξ2 ∈ (x, x2 ), so dass
f (x2 ) − f (x)
f (x) − f (x1 )
= f ′ (ξ1 ) ≤ f ′ (ξ2 ) =
.
x − x1
x2 − x
Da x − x1 = (1 − λ)(x2 − x1 ) und x2 − x = λ(x2 − x1 ) gilt, erhalten wir
190
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
f (x) − f (x1 )
f (x2 ) − f (x)
≤
.
1−λ
λ
Daraus folgt
f (x) ≤ λf (x1 ) + (1 − λ)f (x2 ).
Somit ist f konvex.
(⇒)
Sei f konvex. Wir nehmen an, dass ein x0 ∈ D existiert mit f ′′ (x0 ) < 0.
Sei c := f ′ (x0 ) und ϕ := f (x) − c(x − x0 ) für x ∈ D. Dann ist ϕ zweimal
differenzierbar und es gilt ϕ′ (x0 ) = 0, ϕ′′ (x0 ) < 0. Nach Satz 5.10 hat daher
ϕ in x0 ein isoliertes lokales Maximum, das heißt, es existiert ein h > 0 mit
[x0 − h, x0 + h] ⊂ D, so dass
ϕ(x0 − h) < ϕ(x0 ),
während ϕ(x0 + h) < ϕ(x0 )
ist. Deshalb gilt
f (x0 ) = ϕ(x0 ) >
1
1
(ϕ(x0 − h) + ϕ(x0 + h)) = (f (x0 − h) + f (x0 + h)).
2
2
Mit λ = 21 , x1 = x0 − h und x2 = x0 + h folgt, dass f nicht konvex ist.
⊓
⊔
Definition 5.7. Sei D ⊂ R ein offenes Intervall und f : D −→ R stetig. Der
Punkt x0 ∈ D heißt Wendepunkt, wenn eine Umgebung (x0 − ε, x0 + ε) ⊂ D
von x0 existiert, so dass entweder f |(x0 −ε,x0 ) konkav und f |(x0 ,x0 +ε) konvex
ist oder Umgekehrtes gilt.
Satz 5.12 Sei f : (a, b) ⊂ R −→ R zweimal stetig differenzierbar. Ist x0 ∈
(a, b) ein Wendepunkt von f , so gilt f ′′ (x0 ) = 0.
Beweis: Folgerung aus Satz 5.11
⊓
⊔
Bemerkung: Der Mittelwertsatz der Differentialrechnung gilt nicht für vektorwertige Funktionen. Wir betrachten dazu die Funktion
f : [0, 2π] −→ R2
t 7→ f (t) = (cos(t), sin(t)).
(0)
Es gilt f (2π) − f (0) = (0, 0), also f (2π)−f
= 0. Betrachten wir aber die Ab2π−0
′
′
leitung f , dann erhalten wir f (t) = (− sin(t), cos(t)). Somit ist |f ′ (t)| = 1,
d.h. f ′ (t) 6= 0 für alle t ∈ [0, 2π].
2
5.2 Der Mittelwertsatz der Differentialrechnung
191
Satz 5.13 (Mittelwertsatz für Vektorfunktionen) Sei (E, k·k) ein normierter Vektorraum, f : [a, b] −→ E stetig und auf (a, b) differenzierbar. Dann
existiert ein Punkt x0 ∈ (a, b), so dass gilt
kf (b) − f (a)k ≤ (b − a)kf ′ (x0 )k.
Zum Beweis des Satzes benötigen wir das folgende Lemma:
Lemma 5.8. Sei f : [a, b] −→ E in x0 ∈ (a, b) differenzierbar, seien
k→∞
k→∞
(αk ), (βk ) ⊂ [a, b] Folgen mit αk < x0 < βk , αk −→ x0 , und βk −→ x0
für alle k ∈ N. Dann gilt
lim
k→∞
f (βk ) − f (αk )
= f ′ (x0 ).
βk − αk
Beweis: Wir betrachten yk :=
βk −x0
βk −αk
∈ (0, 1). Es gilt
f (βk ) − f (αk )
− f ′ (x0 )
βk − αk
f (βk ) − f (x0 )
f (αk ) − f (x0 )
′
′
= yk
− f (x0 ) + (1 − yk )
− f (x0 ) .
|{z}
| {z }
βk − x0
αk − x0
{z
}
{z
}
|
|
beschr.
beschr.
k→∞
k→∞
−→0
−→0
⊓
⊔
Damit folgt die Behauptung.
Beweis:[des Satzes 5.13]
und M := kf (b) − f (a)k. Wir betrachten die Funktion g :
Sei L := b−a
3
[a, a + 2L] ⊂ R −→ E, definiert durch g(s) := f (s + L) − f (s). Dann folgt
g(a) + g(a + L) + g(a + 2L) = f (b) − f (a)
und somit
M ≤ kg(a)k + kg(a + L)k + kg(a + 2L) (⋆).
Wir zeigen zunächst, dass ein s1 ∈ (a, a + 2L) mit kg(s1 )k ≥ 31 M existiert.
Wir nehmen an, dass für alle s1 ∈ (a, a + 2L) gilt kg(s1 )k < 13 M . Da g :
[a, a + 2L] −→ E stetig ist, erhalten wir auch
kg(a)k ≤
1
M,
3
kg(a + 2L)k ≤
1
M,
3
im Widerspruch zu (⋆). Sei nun t1 := s1 + L ∈ (a, b). Dann gilt
(1) a < s1 < t1 < b und t1 − s1 = L =
(2) kg(s1 )k = kf (t1 ) − f (s1 )k ≥
1
M.
3
b−a
,
3
192
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Wir wiederholen nun diese Konstruktion, indem wir statt des Intervalls [a, b]
das Intervall [s1 , t1 ] betrachten. Dadurch erhalten wir Folgen (sn ) und (tn ),
so dass gilt
tn − s n =
1
(b − a),
3n
kf (tn ) − f (sn )k ≥
1
· M,
3n
[sn , tn ] ⊂ [sn−1 , tn−1 ].
Wir haben also eine Intervallschachtelung In := [sn , tn ], bei der die Länge der
Intervalle In gegen 0 konvergiert. Nach dem Satz über die Intervallschachte∞
T
In = {x0 }. Es gilt somit
lung existiert dann ein x0 ∈ R mit
n=1
sn −→ x0 ,
und
tn −→ x0 ,
sn < x0 < tn
kf (tn ) − f (sn )k
M
M
≥
=
.
n
tn − s n
(tn − sn ) · 3
b−a
Aus Lemma 5.8 folgt nun
f ′ (x0 ) = lim
n→∞
f (tn ) − f (sn )
tn − s n
und damit
kf (tn ) − f (sn )k
f (tn ) − f (sn )
k = lim
n→∞
tn − s n
tn − s n
M
kf (b) − f (a)k
≥
=
.
b−a
b−a
kf ′ (x0 )k = k lim
n→∞
⊓
⊔
Satz 5.14 Sei f : [a, b] −→ E stetig–differenzierbar. Dann ist f Lipschitzstetig.
Beweis: Nach Voraussetzung ist f ′ ∈ C([a, b], E). Folglich existiert
kf ′ k∞ := max{kf ′ (x)kE | x ∈ [a, b]} ∈ R.
Seien x1 , x2 ∈ [a, b] und o.B.d.A. x1 > x2 . Dann folgt aus Satz 5.13, dass ein
ξ ∈ [x2 , x1 ] existiert, so dass
kf (x1 ) − f (x2 )k ≤ kf ′ (ξ)kE · |x1 − x2 | ≤ kf ′ k∞ ·kx1 − x2 k.
| {z }
=:L
Dies aber bedeutet, dass f Lipschitz-stetig mit der Lipschitz-Konstanten L
ist.
⊓
⊔
5.2 Der Mittelwertsatz der Differentialrechnung
193
Die Regeln von L’Hospital
Satz 5.15 Sei [a, b] ⊂ R ein beschränktes Intervall und x0 ∈ [a, b]. Es seien
f, g : (a, b) \ {x0 } −→ R differenzierbare Funktionen mit
(1) lim f (x) = lim g(x) ∈ {0, ±∞},
x→x0
x→x0
(2) g ′ (x) 6= 0 für alle x ∈ (a, b) \ {x0 },
′
(x)
(3) lim fg′ (x)
= c ∈ R ∪ {±∞}.
x→x0
f (x)
x→x0 g(x)
Dann gilt lim
= c.
Beweis: 1. Fall: lim f (x) = lim g(x) = 0.
x→x0
x→x0
Wir setzen f und g in x0 durch f (x0 ) := g(x0 ) := 0 fort. Dann sind
f, g : (a, b) −→ R stetig in x0 . Wir betrachten nun eine Folge (xn ), die
gegen x0 konvergiert, wobei xn 6= x0 für alle n ∈ N gelten soll. Dann sind
f, g : [xn , x0 ] −→ R stetig und in (xn , x0 ) differenzierbar, falls xn < x0 (ansonsten betrachten wir [x0 , xn ]). Weiterhin gilt f (x0 ) = g(x0 ) = 0. Nach
dem verallgemeinerten Mittelwertsatz (5.7) existiert ein ξn ∈ (xn , x0 ) (bzw.
ξn ∈ (x0 , xn )), so dass gilt
f (xn )g ′ (ξn ) = g(xn )f ′ (ξn ).
Nach dem Satz von Rolle (5.6) ist g(xn ) 6= 0 = g(x0 ). Anderenfalls existierte ein ξˆn ∈ (xn , x0 ) (bzw. ein ξˆn ∈ (x0 , xn )), so dass g ′ (ξˆn ) = 0 wäre, im
Widerspruch zur Voraussetzung (1). Damit folgt
f (xn )
f ′ (ξn )
= ′
.
g(xn )
g (ξn )
Da (xn ) gegen x0 konvergiert, ist auch (ξn ) gegen x0 konvergent und wir
erhalten
f ′ (x)
f ′ (ξn )
f (xn )
= lim ′
= lim ′
= c.
lim
n→∞ g (ξn )
x→x0 g (x)
n→∞ g(xn )
f ′ (x)
′
x→x0 g (x)
2. Fall: lim g(x) = +∞ und lim
x→x0
= 0.
Es sei ε > 0 und (xn ) eine gegen x0 konvergente Folge mit xn < x0 . Dann
existiert ein x⋆ ∈ (a, x0 ), so dass für alle x ∈ (x∗ , x0 ) gilt
′
f (x) < ε.
g(x) > 0, und ′
g (x) Weiterhin gilt
f (x⋆ ) f (xn ) − f (x⋆ )
g(x⋆ )
f (xn )
. (⋆)
=
+
· 1−
g(xn )
g(xn )
g(xn ) − g(x⋆ )
g(xn )
194
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Ab einem Index n0 ist jedes xn ∈ (x⋆ , x0 ). Durch Anwendung des verallgemeinerten Mittelwertsatzes auf das Intervall [x⋆ , xn ] erhalten wir daher, dass
für alle n ≥ n0 ein ξn ∈ (x⋆ , xn ) existiert, so dass
f ′ (ξn )
f (xn ) − f (x⋆ )
=
.
g(xn ) − g(x⋆ )
g ′ (ξn )
Eingesetzt in Gleichung (⋆), ergibt dies
⋆ f (xn ) f (x⋆ ) f ′ (ξn ) ≤
+
1 − g(x ) g(xn ) g(xn ) g ′ (ξn ) g(xn ) | {z }
<ε
und damit
∗ f (xn ) f (x∗ ) ≤
+ ε 1 − g(x ) .
g(xn ) g(xn ) g(xn ) n→∞
Da g(xn ) gegen +∞ für xn −→ x0 konvergiert, folgt
f (x⋆ ) g(x⋆ )
−→ 0,
=0
lim
g(xn ) n→∞ g(xn )
und somit
f (xn ) < ε.
lim sup g(xn ) n→∞
ε kann beliebige Werte annehmen kann, deshalb erhalten wir
f (xn ) =0
lim
n→∞ g(xn ) für alle Folgen (xn ) mit xn −→ x0 , xn < x0 .
Analog behandelt man Folgen xn −→ x0 mit xn > x0 . Somit gilt für alle
Folgen (xn ) mit xn −→ x0
lim
f (xn )
= 0,
g(xn )
lim
f (x)
= 0.
g(x)
n→∞
also
x→x0
f ′ (x)
′
x→x0 g (x)
3. Fall: lim g(x) = +∞ und lim
x→x0
= c ∈ R beliebig, aber endlich.
Wir betrachten die Funktion f1 (x) := f (x) − c · g(x). Dann ist
lim
x→x0
f1′ (x)
f ′ (x)
= lim ′
− c = 0.
′
x→x0 g (x)
g (x)
Da lim g(x) = ∞ ist, können wir den Fall 2 anwenden und erhalten
x→x0
5.2 Der Mittelwertsatz der Differentialrechnung
lim
x→x0
195
f1 (x)
= 0.
g(x)
Daraus folgt
lim
x→x0
f (x)
f1 (x)
= c + lim
= c.
x→x0 g(x)
g(x)
f ′ (x)
′
x→x0 g (x)
4. Fall: lim f (x) = lim g(x) = +∞ und lim
x→x0
x→x0
′
g (x)
′
x→x0 f (x)
Dann gilt lim
= ∞.
g(x)
x→x0 f (x)
= 0 und aus Fall (2) folgt sofort lim
= 0. Da f (x)
und g(x) für x −→ x0 gegen +∞ konvergieren, sind f und g positiv in einer
(x)
Umgebung von x0 . Folglich gilt lim fg(x)
= +∞.
x→x0
5. Fall: lim f (x) = lim g(x) = +∞.
x→x0
f ′ (x)
′
x→x0 g (x)
Dann ist lim
x→x0
= −∞ unmöglich, denn sonst wäre f oder g in einer
⊓
⊔
Umgebung von x0 eine monoton fallende Funktion.
Satz 5.16 Seien f, g : (a, ∞) −→ R differenzierbar und g ′ (x) 6= 0 für alle
′
(x)
= c ∈
x ∈ (a, ∞). Ist lim f (x) = lim g(x) ∈ {0, ±∞} und lim fg′ (x)
x→∞
x→∞
R ∪ {±∞}, so gilt
lim
x→∞
x→∞
f (x)
= c.
g(x)
Beweis: O.B.d.A. sei a > 0. Wir betrachten die Funktionen f1 (x) = f ( x1 )
und g1 (x) = g( x1 ) auf dem Intervall (0, a1 ). Dann gilt
1 ′ 1
1 ′ 1
′
′
und g1 (x) = − 2 g
6= 0
f1 (x) = − 2 f
x
x
x
x
und daher
f ′ ( x1 ) Vor.
f1′ (x)
= c
=
lim
′ (x)
x→0 g ′ ( 1 )
x→0 g1
x
lim
Mit Satz 5.15 folgt dann
lim
x→∞
f (x)
f1 (x)
= lim
= c.
x→0 g1 (x)
g(x)
⊓
⊔
Beispiele:
1
ln(1+x)
= lim 1+x
=
x
x→0
x→0 1
ex
ex −1
= lim 1 = 1,
lim
x→0
x→0 x
(1) lim
(2)
1
1
1,
lim
1
(3) lim (cos x) x = lim e x ln(cos x) = ex→0 x
x→0
x→0
1.
ln(cos x)
lim
1
= ex→0 cos x
·(− sin x)
= e0 =
196
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
5.3 Differentiation von Funktionenfolgen und -Reihen
Sei fn : [a, b] −→ R eine Folge differenzierbarer Funktionen, die gleichmäßig
gegen eine Funktion f konvergiert. Dann muß (fn′ ) im Allgemeinen nicht
konvergieren. Sei zum Beispiel fn (x) = n1 sin(nx). Dann konvergiert (fn )
gleichmäßig auf [0, 2π] gegen 0, aber fn′ (x) = cos(nx) konvergiert in keinem
Punkt x 6= 0. Für x = π gilt z.B.
(
1,
k gerade
fk′ (π) =
−1, k ungerade.
Satz 5.17 Sei E ein Banachraum, fn : [a, b] ⊂ R −→ E differenzierbar für
alle n ∈ N und gelte
(1) ∃ x0 ∈ [a, b] : (fn (x0 )) konvergiert in E,
(2) (fn′ ) konvergiert gleichmäßig auf [a, b].
Dann konvergiert auch (fn ) gleichmäßig auf [a, b] gegen eine Funktion
f : [a, b] −→ E. f ist differenzierbar und es gilt
f ′ (x) = lim fn′ (x).
n→∞
Das heißt: lim und
d
dx
sind vertauschbar.
Beweis: (1) Sei ε > 0. Da (fn (x0 )) konvergent ist, existiert ein n0 ∈ N, so
dass für alle m ≥ n ≥ n0
ε
kfn (x0 ) − fm (x0 )k <
(A)
2
gilt. Weil (fn′ ) gleichmäßig konvergiert, gibt es ein n0 ∈ N, so dass für alle
t ∈ [a, b] und für alle m ≥ n ≥ n0
′
kfn′ (t) − fm
(t)k <
ε
.
2(b − a)
(B)
gilt. Wir wenden den Mittelwertsatz für Vektorfunktionen auf fn − fm :
[a, b] −→ E an: Für zwei Werte x, t ∈ [a, b] existiert ein ϑm,n ∈ [x, t] (bzw.
∈ [t, x]) mit
′
kfn (x) − fm (x) − fn (t) + fm (t)k ≤ |x − t| · kfn′ (ϑm,n ) − fm
(ϑm,n )k.
Mit (A) folgt dann ∀ m ≥ n ≥ n0 und ∀ x, t ∈ [a, b]
kfn (x) − fm (x) − fn (t) + fm (t)k ≤ |x − t| ·
ε
ε
≤ .
2(b − a)
2
(C)
Daher ist für t = x0 mit (C) und (A)
kfn (x) − fm (x)k ≤ kfn (x) − fm (x) − fn (x0 ) + fm (x0 )k + kfn (x0 ) − fm (x0 )k
ε ε
< + = ε.
(D)
2 2
5.3 Differentiation von Funktionenfolgen und -Reihen
197
für alle m ≥ n ≥ n0 und für alle x, t ∈ [a, b]. Somit ist (fn (x)) eine
(gleichmäßige) Cauchyfolge in E. Da E vollständig ist, existiert eine Funktion f : [a, b] −→ E, so dass
∀ x ∈ [a, b].
f (x) = lim fn (x)
n→∞
Gehen wir in (D) mit m gegen ∞, so folgt
∀ x ∈ [a, b] ∀ n ≥ n0 : kfn (x) − f (x)k < ε.
Daher konvergiert (fn ) gleichmäßig gegen f auf [a, b].
(2) Es ist zu zeigen, dass f differenzierbar ist und f ′ (x) = lim fn′ (x) gilt.
n→∞
Sei x ∈ [a, b] fest. Wir definieren ϕn : [a, b] −→ E durch
ϕn (t) :=
Da fn stetig und lim
t→x
fn (t)−fn (x)
t−x
Für x 6= t gilt mit (C)
fn (t)−fn (x)
t−x
fn′ (x)
x 6= t
x = t.
= fn′ (x) existiert, ist ϕn : [a, b] −→ E stetig.
1
kfn (t) − fm (t) − fn (x) + fm (x)k
|t − x|
ε
∀ n, m ≥ n0 .
≤
2(b − a)
kϕn (t) − ϕm (t)k =
Da ϕn − ϕm stetig ist, haben wir auch eine Abschätzung für x = t. Also ist
kϕn (t) − ϕm (t)k ≤
ε
2(b − a)
∀ n, m ≥ n0 ∀ t ∈ [a, b].
Somit konvergiert die Folge (ϕn ) gleichmäßig auf [a, b] für festes x ∈ [a, b].
Wir setzen ϕ(t) = lim ϕn (t). Da ϕn stetig ist für alle n ∈ N und die Folge
n→∞
(ϕn ) gleichmäßig gegen ϕ konvergiert, ist auch ϕ stetig. Wir erhalten
ϕ(x) = lim ϕ(t) = lim lim ϕn (t)
t→x
t→x n→∞
f (t) − f (x)
fn (t) − fn (x)
= lim
.
= lim lim
t→x
t→x n→∞
t−x
t−x
Folglich ist f in x ∈ [a, b] differenzierbar und es gilt
f ′ (x) = ϕ(x) = lim ϕn (x) = lim fn′ (x).
n→∞
Als Anwendung erhalten wir
n→∞
⊓
⊔
198
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Satz 5.18 Sei E ein Banachraum und fn : [a, b] −→ E eine Folge differenzierbarer Funktionen mit
∞
P
(1)
fn (x0 ) konvergiert für mindestens ein x0 ∈ [a, b].
(2)
n=1
∞
P
n=1
fn′ konvergiert gleichmäßig auf [a, b].
Dann konvergiert
∞
P
fn gleichmäßig auf [a, b], die Grenzfunktion
n=1
f (x) :=
∞
X
fn (x)
n=1
ist differenzierbar und
d
f (x) =
dx
′
∞
X
!
fn (x)
n=1
=
∞
X
fn′ (x).
n=1
Anwendung auf Potenzreihen
Satz 5.19 Sei E ein Banachraum und P (x) =
∞
P
n=0
an (x − x0 )n eine Potenz-
reihe mit dem Zentrum x0 ∈ R, dem Konvergenzradius R und an ∈ E. Dann
ist P : (x0 − R, x0 + R) ⊂ R −→ E differenzierbar und es gilt
′
P (x) =
∞
X
n=1
an n(x − x0 )n−1 .
Beweis: Sei fn (x) := an (x − x0 )n . Nach Satz 5.18 ist fn : R −→ E differenzierbar und es gilt
fn′ (x) = an n(x − x0 )n−1 , f0′ (x) = 0.
Offensichtlich konvergiert P (x) für x = x0 . Wir betrachten nun die Reihe
Q(x) :=
∞
X
n=1
n · an (x − x0 )n−1 =
∞
X
fn′ (x).
n=0
und berechnen den Konvergenzradius der Potenzreihe Q:
λ := lim sup
n→∞
p
p
1
n
nkan k = lim sup n kan k = ,
R
n→∞
wobei R der Konvergenzradius von P ist. Folglich ist R auch der Konvergenzradius von Q.
5.3 Differentiation von Funktionenfolgen und -Reihen
199
Nach Satz 4.30 konvergiert Q gleichmäßig auf jedem kompakten Teilintervall
des Konvergenzintervalls (x0 − R, x0 + R).
P ist also für alle ε > 0 auf dem Intervall Iε = [x0 − R + ε, x0 + R − ε]
differenzierbar und es gilt
P ′ (x) =
∞
X
n=1
nan (x − x0 )n−1
∀ x ∈ Iε .
⊓
⊔
Mit ε gegen 0 folgt die Behauptung.
Anwendung: Berechnung von π.
Dazu betrachten wir arctan : R −→ (− π2 , π2 ).
R
π 6
2
π
4
•
arctan
-
1
R
− π2
Einerseits gilt arctan′ (x) =
1
1+x2
(Übungsaufgabe). Andererseits folgt aus
∞
P
1
(−x2 )k = 1+x
der geometrischen Reihe für x ∈ (−1, 1), dass
2 . Folglich
′
gilt arctan (x) =
∞
P
k=0
k 2k
(−1) x
k=0
für alle x ∈ (−1, 1). Die Reihe
∞
P
(−1)k x2k
k=0
konvergiert auf (−1, 1) und ist die Ableitung der auf (−1, 1) konvergenten
Potenzreihe
∞
X
x2k+1
Q(x) =
(−1)k
.
2k + 1
k=0
Folglich ist arctan′ (x) = Q′ (x) auf (−1, 1) und es gilt
arctan(x) = Q(x) + C, Q(0) = 0, arctan(0) = 0
Daher ist C = 0 und damit
arctan(x) =
∞
X
k=0
(−1)k
x2k+1
,
2k + 1
für alle |x| < 1.
Nach dem Leibnizkriterium für alternierende Reihen ist Q(1) = 1 − 31 + 15 −
1
7 ± . . . konvergent und es gilt Q(−1) = −Q(1).
Nach dem abelschen Grenzwertsatz (Satz 4.31) ist damit Q in x = ±1 (einseitig) stetig und
Q(±1) = lim Q(x) = lim arctan(x) = arctan(±1).
x→±1
Wir erhalten
x→±1
200
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
arctan x =
∞
P
2k+1
(−1)k x2k+1
∀ |x| ≤ 1.
k=0
Da arctan(1) =
π
4
ist, gilt die Leibnizformel
π
1 1 1
= 1 − + − ± ....
4
3 5 7
Diese Reihe konvergiert sehr langsam gegen π4 . Man benötigt 1000 Summanden, um π auf 3 Stellen genau zu erhalten. Schneller konvergente Reihen erhält
man folgendermaßen:
Durch Umkehrung der Additionstheoreme folgt
x+y
arctan(x) + arctan(y) = arctan
1−x·y
und daher mit x = y =
1
5
2 arctan
bzw. mit x = y =
(x · y 6= 1)
5
1
= arctan
,
5
12
5
12
2 arctan
5
12
= arctan
120
119
.
1
239
in obige Formel liefert
1
120
arctan(1) + arctan
= arctan
.
239
119
Einsetzen von x = 1 und y =
Daraus folgt
π
= arctan(1)
4
1
1
− arctan
5
239
2k+1 X
2k+1
∞
∞
X
1
(−1)k
(−1)k 1
−
.
=4·
2k + 1 5
2k + 1 239
= 4 · arctan
(∗)
(⋆⋆)
k=0
k=0
(∗) heißt die Machinsche Formel. Ist
∞
P
(−1)k ak eine alternierende Reihe mit
k=0
monoton fallender Nullfolge (ak ), ak > 0 für alle k ∈ N0 , dann erhält man für
den Fehler bei der Näherungsrechnung (nach Satz 3.9)
|s −
n
X
k=0
(−1)k ak | ≤ an+1 .
5.4 Taylorreihen
201
Für den Fehler F1 bei Addition von 8 Reihengliedern der ersten Reihe in (⋆⋆)
gilt
1
4
· 17 < 4 · 10−13 .
F1 ≤
|17 {z5 }
=a8
Für den Fehler F2 bei Addition von 2 Reihengliedern der zweiten Reihe in
(⋆⋆) gilt
1
1
< 3 · 10−13 .
F2 ≤ ·
5
5
239
| {z }
a2
Somit ist der Fehler bei Addition der ersten 8 Reihenglieder kleiner als 3·10−12
und wir erhalten eine Näherung für π:
π = 3.1415926535 + R,
|R| < 10−11 .
5.4 Taylorreihen
Das Ziel dieses Abschnitts ist die Approximation von Funktionen durch Polynome und die Entwicklung von Funktionen in Reihen. Dazu werden wir
zunächst zur Abkürzung einige Bezeichnungen einführen.
Die Landau-Symbole
Sei h : I ⊂ R → E eine Funktion mit Werten in einem reellen normierten
Vektorraum E, g : I ⊂ R → R eine reellwertige Funktion und x0 ∈ I.
•
h(x) = o(g(x)) für x → x0 ,
ist die Abkürzung für die Eigenschaft
lim
x→x0
•
h(x) = O(g(x)) für x → x0 , ist die Abkürzung dafür, dass es eine
Konstante C > 0 und ein Intervall (x0 − ε, x0 + ε) gibt mit
kh(x)k ≤ C |g(x)|
•
•
h(x)
= 0.
g(x)
für alle x ∈ (x0 − ε, x0 + ε) ∩ I.
h1 (x) = h2 (x)+o(g(x)) für x → x0 , ist die Abkürzung für h1 (x)−h2 (x) =
o(g(x)) für x → x0 . Analog für O(g(x)).
Insbesondere heißt h(x) = o((x − x0 )n ) für x → x0 , dass
lim
x→x0
h(x)
= 0.
(x − x0 )n
h(x) geht für x → x0 also schneller gegen 0 als (x − x0 )n . Man sagt auch
h verschwindet in x0 von höherer als n-ter Ordnung “.
”
Für h1 (x) = h2 (x) + o((x − x0 )n ) für x → x0 , sagt man auch h2 appro”
ximiert h1 in x0 von höherer als n-ter Ordnung “.
202
•
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Zur Eigenschaft h(x) = O((x − x0 )n ) für x → x0 , d. h.
kh(x)k ≤ C |x − x0 |n ,
für alle x ∈ (x0 − ε, x0 + ε) ∩ I
sagt man auch h wächst in x0 von höchstens n-ter Ordnung “.
”
Definition 5.9. Sei U ⊂ R offen und E ein normierter Vektorraum. Eine
Abbildung
f : U ⊂ R −→ E
∞
P
ak (x − x0 )k , mit
heißt reell–analytisch in x0 ∈ U , falls eine Potenzreihe
k=0
ak ∈ E für alle k ∈ N0 , Zentrum x0 ∈ R und positivem Konvergenzradius
ρ(x0 ) > 0 existiert, so dass gilt
f (x) =
∞
X
k=0
ak (x − x0 )k ,
∀ x ∈ U ∩ (x0 − ρ, x0 + ρ).
Bemerkung:
(1) Man sagt auch: f ist in einer Umgebung von x0 in eine Potenzreihe entwickelbar.
(2) f : U ⊂ R −→ E heißt reell–analytisch, wenn f in jedem Punkt x0 ∈ U
reell–analytisch ist.
(3) C w (U ; E) bezeichne den Vektorraum der reell–analytischen Funktionen.
Beispiele
(1) Jede Potenzreihe f (x) :=
∞
P
k=0
ak (x − x0 )k mit Konvergenzradius ρ > 0 ist
in x0 reell–analytisch.
(2) exp, sin, cos, sinh, cosh sind reell–analytisch auf R.
Satz 5.20 Sei E ein Banachraum und f : U ⊂ R −→ E reell–analytisch
in x0 ∈ U . Dann ist f in einer Umgebung Ũ von x0 unendlich oft stetig
differenzierbar und es gilt:
f (x) =
Beweis: Sei f (x) =
∞
X
f (n) (x0 )
· (x − x0 )n ,
n!
n=0
∞
P
k=0
∀ x ∈ Ũ .
ak (x − x0 )k für alle x ∈ U ∩ (x0 − ρ, x0 + ρ) =: Ũ .
Nach Satz 5.19 existiert f ′ auf Ũ und
f ′ (x) =
∞
X
k=1
k · ak (x − x0 )k−1 ,
∀ x ∈ Ũ .
5.4 Taylorreihen
203
Diese Potenzreihe hat den gleichen Konvergenzradius wie f . Nach Satz 5.19
existiert wiederum f ′′ (x) mit
f ′′ (x) =
∞
X
k=2
k(k − 1)ak (x − x0 )k−2 ,
∀ x ∈ Ũ .
Durch weiteres Anwenden des Satzes 5.19 erhalten wir alle Ableitungen von
f in der Umgebung Ũ von x0 :
f (n) (x) =
∞
X
k=n
k(k − 1) · . . . · (k − n + 1)ak (x − x0 )k−n .
Da offensichtlich für jedes n ∈ N0
f (n) (x0 ) = n! · an
⊓
⊔
gilt, folgt die Behauptung.
Wir suchen nun nach einer hinreichenden Bedingung dafür, dass eine Funktion f : U ⊂ R −→ E in einem Punkt x0 reell–analytisch ist.
Definition 5.10. Sei I ⊂ R ein beliebiges Intervall, x0 ∈ I und f : I −→ E
n–mal in x0 differenzierbar. Dann heißt
Tn (f, x0 )(x) :=
n
X
f (k) (x0 )
k=0
k!
(x − x0 )k
n–tes Taylorpolynom von f in x0 .
Sei f : I ⊂ R −→ E unendlich oft differenzierbar in x0 ∈ U . Dann heißt die
Reihe
∞
X
f (k) (x0 )
T (f, x0 )(x) :=
(x − x0 )k
k!
k=0
Taylorreihe von f in x0 (formale Reihe).
Bemerkung:
(a) Tn (f, x0 )(x) ist n–te Partialsumme von T (f, x0 )(x).
(b) Tn (f, x0 ) ist n–mal differenzierbar und es gilt
dl
Tn (f, x0 )(x0 ) = f (l) (x0 ),
dxl
∀l ≤ n
204
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Definition 5.11. Sei f : I → E (I ⊂ R Intervall, E Banachraum) n-fach
differenzierbar. Dann heißt
Rn (f, x0 ) := f − Tn (f, x0 ) ∈ C (n) (I, E)
das n-te Restglied von f in x0 .
Rn beschreibt also die Abweichung des n-ten Taylorpolynoms von f .
Satz 5.21 Sei f : I ⊂ R −→ E n–mal differenzierbar, x0 ∈ I. Dann gilt
(1)
(2)
d(l)
(Rn (f, x0 ))(x0 ) = 0,
(dx)(l)
kRn (f, x0 )(x)k
= 0.
lim
x→x0
|x − x0 |n
∀ l ∈ {0, . . . , n},
Beweis: Wir beweisen den Satz durch Induktion über n:
Ind.–Anfang: Sei n = 1. Dann definiert T1 (f, x0 ) die Tangente an den Graphen
graph(f ) der Funktion f in (x0 , f (x0 )), das heißt, die Behauptung ist erfüllt.
Ind.–Voraussetzung: Die Behauptung sei für n richtig.
Ind.–Behauptung: Die Behauptung ist für n + 1 richtig.
Ind.–Beweis: Sei f : I ⊂ R −→ E (n + 1)–mal differenzierbar. Dann ist
Rn+1 := Rn+1 (f, x0 ) = f − Tn+1 (f, x0 )
(l)
(n + 1)–mal differenzierbar und Rn+1 (x0 ) = 0 für alle l ∈ {0, . . . , n + 1}. Wir
′
′
betrachten nun die Funktion Rn+1
: I −→ E. Offensichtlich ist Rn+1
n–mal
′
(l)
differenzierbar und es gilt (Rn+1 ) (x0 ) = 0 für alle l ∈ {0, . . . , n}. Folglich
′
ist Tn (Rn+1
, x0 ) ≡ 0 auf I und es gilt nach Induktionsvoraussetzung
lim
x→x0
′
kRn+1
(x)k
= 0.
|x − x0 |n
Folglich existiert für alle ε > 0 ein δ > 0, so dass
′
kRn+1
(x)k
<ε
|x − x0 |n
für alle x mit 0 < |x − x0 | < δ
(⋆).
Sei x ∈ I mit 0 < |x − x0 | < δ. Dann ist Rn+1 auf [x, x0 ] bzw. [x0 , x] differenzierbar und nach dem Mittelwertsatz für Vektorfunktionen existiert ein
ξ ∈ (x, x0 ) bzw. ξ ∈ (x0 , x), so dass gilt
(⋆)
′
(ξ)kE |x − x0 | < ε · |x − x0 |n+1 .
kRn+1 (x) − Rn+1 (x0 ) kE ≤ kRn+1
| {z }
=0
Wir erhalten
kRn+1 (x)k
|x−x0 |n+1
< ε für alle x mit 0 < |x − x0 | < δ und somit
5.4 Taylorreihen
lim
x→x0
205
kRn+1 (f, x0 )(x)k
= 0.
|x − x0 |n+1
⊓
⊔
Eigenschaft (2) von Satz 5.21 besagt, dass Tn (f, x0 ) die Funktion f in der
Umgebung von x0 in höherer als n–ter Ordnung approximiert:
f (x) = Tn (f, x0 ) + o((x − x0 )n )
für x → x0 .
Die Taylorreihe T (f, x0 )(x) konvergiert nicht in jedem Fall und wenn sie es
tut, muss sie nicht notwendigerweise gegen die Funktion f konvergieren:
Beispiel 5.1
Die Taylorreihe kann den Konvergenzradius 0 haben. Wir zitieren dazu den
Satz von Borel:
Seien c0 , c1 , c2 , . . . beliebige reelle Zahlen. Dann existiert eine C ∞ –Funktion
f : R −→ R mit
∞
X
T (f, 0) =
cn xn .
n=0
Diese Reihe ist im Allgemeinen nicht konvergent. Der Beweis dieses Satzes
kann z.B. in R. Narasimham: Analysis on real and complex manifolds, Nord
”
Holland, 1968“, nachgelesen werden.
Beispiel 5.2
Die Taylorreihe T (f, x0 ) kann den Konvergenzradius ρ = ∞ haben, aber es
gilt T (f, x0 )(x) 6= f (x). Sei zum Beispiel
−1
e x2 f ür x > 0
f (x) :=
0
f ür x ≤ 0.
Dann ist f (k) (0) = 0 für alle k ∈ N0 und f eine C ∞ –Funktion (siehe Übungsaufgabe 94). Also ist T (f, 0)(x) ≡ 0, aber f (x) 6= 0 für alle x > 0.
Wir möchten nun untersuchen, wann die Taylorreihe T (f, x0 )(x) konvergiert
und insbesondere, wann sie gegen f (x) konvergiert.
Satz 5.22 Sei f : I ⊂ R −→ E eine C ∞ –Funktion und x0 ∈ I. Wenn für
x ∈ I gilt
lim kRn (f, x0 )(x)kE = 0,
n→∞
so konvergiert T (f, x0 )(x) und es gilt f (x) = T (f, x0 )(x).
Beweis: Für alle n ≥ 0 ist f (x) = Tn (f, x0 )(x) + Rn (f, x0 )(x). Folglich gilt
n→∞
kf (x) − Tn (f, x0 )(x)k = kRn (f, x0 )(x)k −→ 0,
206
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
und daher
lim Tn (f, x0 )(x) = T (f, x0 )(x) = f (x).
n→∞
Im Fall f : I −→ R kann man das Restglied explizit angeben:
⊓
⊔
Satz 5.23 Sei I ⊂ R ein beliebiges Intervall, x0 ∈ I, f : I −→ R (n + 1)–mal
differenzierbar und Rn (f, x0 ) := f − Tn (f, x0 ) das Restglied. Dann existieren
ϑ, θ ∈ (0, 1), so dass gilt
Rn (f, x0 )(x) =
f (n+1) (x0 + ϑ(x − x0 ))
(x − x0 )n+1
(n + 1)!
Lagrange-Form
des Restgliedes
Rn (f, x0 )(x) =
f (n+1) (x0 + θ(x − x0 ))
(1 − θ)n (x − x0 )n+1 Cauchy-Form
n!
des Restgliedes.
Beweis: Sei x ∈ I fest. Wir definieren eine differenzierbare Funktion g : I −→
R durch g(y) := f (x) − Tn (f, y)(x). Dann ist g(x) = 0, g(x0 ) = Rn (f, x0 )(x)
und
!
n
(k)
X
f
(y)
d
(x − y)k
g ′ (y) = −
dy
k!
k=0
n (k+1)
X
f (k) (y)
f
(y)
k
k−1
(x − y) −
k(x − y)
=−
k!
k!
k=0
(x − y)n (n+1)
=−
f
(y).
n!
(2) Nach dem Mittelwertsatz der Differentialrechnung existiert ein θ ∈ (0, 1),
so dass
=y
z
}|
{
g(x) − g(x0 ) = g (x0 + θ(x − x0 )) · (x − x0 )
(x − x0 )n+1 (1 − θ)n (n+1)
f
(x0 + θ(x − x0 )).
=−
n!
′
Folglich ist
Rn (f, x0 )(x) =
(1 − θ)n (x − x0 )n+1 (n+1)
f
(x0 + θ(x − x0 )).
n!
(1) Wir betrachten zusätzlich die differenzierbare Funktion h : I −→ R, definiert durch h(y) := (x − y)n+1 . Dann gilt h(x) = 0, h(x0 ) = (x − x0 )n+1
und
5.4 Taylorreihen
207
h′ (y) = −(n + 1)(x − y)n .
Nach dem verallgemeinerten Mittelwertsatz existiert daher ein ϑ ∈ (0, 1), so
dass
(g(x) − g(x0 ))h′ (x0 + ϑ(x − x0 )) = (h(x) − h(x0 ))g ′ (x0 + ϑ(x − x0 )).
Für das Restglied folgt
Rn (f, x0 )(x) · (n + 1)(x − x0 )n (1 − ϑ)n
= (x − x0 )n+1
(x − x0 )n (1 − ϑ)n (n+1)
f
(x0 + ϑ(x − x0 )).
n!
und somit
(x − x0 )n+1 (n+1)
f
(x0 + ϑ(x − x0 )).
(n + 1)!
Rn (f, x0 )(x) =
⊓
⊔
Bemerkung: Satz 5.23 ermöglicht die Abschätzung des Fehlers bei der Approximation von f (x) durch Tn (f, x0 ).
Beispiel 5.1
Die Taylorentwicklung von f (x) = ln(1 + x) in x = 0 auf (−1, 1] ist
ln(1 + x) =
∞
P
(−1)n+1 ·
n=1
xn
n .
Insbesondere gilt für die alternierende, harmonische Reihe
∞
P
n=1
(−1)n+1
n
= ln(2).
Beweis: Die Abbildung f (x) := ln(x + 1) ist auf (−1, ∞) beliebig oft differenzierbar und es gilt f (0) = 0 sowie
f (n) (x) =
Folglich ist T (f, 0)(x) =
∞
P
(n − 1)!(−1)n+1
,
(1 + x)n
(−1)n+1 ·
n=1
xn
n
∀ n > 0.
die Taylorreihe von f in x0 = 0.
T (f, 0)(x) konvergiert für alle x ∈ (−1, 1). Zum Beweis betrachten wir die
Cauchy–Form des Restgliedes:
∃ θ ∈ (0, 1) :
Rn (f, 0)(x) =
Ist |x| < 1, so gilt
1−θ
1−θ|x|
(−1)n xn+1
f (n+1) (θx)
(1 − θ)n
(1 − θ)n xn+1 =
n!
(1 + θx)n+1
< 1. Folglich erhalten wir
208
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
|Rn (f, 0)(x)| = |x|n+1
(1 − θ)n
.
|1 + θx|n+1
Es gilt 1 + θx ≥ 1 − θ|x| > 1 − |x| für alle |x| < 1 und somit folgt
n
|x|n+1 n→∞
1−θ
|x|n+1
<
−→ 0, ∀ |x| < 1.
·
|Rn (f, 0)(x)| <
1 − |x|
1 − θ|x|
1 − |x|
Nach Satz 5.22 konvergiert die Taylorreihe in x0 = 0 für x ∈ (−1, 1) gegen
f (x):
∞
X
(−1)n+1 n
x , ∀ |x| < 1.
ln(1 + x) =
n
n=1
Nach dem Leibnizkriterium (Satz 3.9) existiert T (f, 0)(1) = 1 − 21 + 31 ± . . ..
Wenden wir nun den Satz von Abel (Satz 4.31) an, so gilt wegen der Stetigkeit
von ln
lim ln(1 + x) = lim T (f, 0)(x) = T (f, 0)(1).
x→1
x→1
Somit gilt ln(1 + x) = T (f, 0)(x) auch in x = 1.
Beispiel 5.2
Sei α ∈ R. Dann gilt für x ∈ (−1, 1):
(1 + x)α =
∞
P
k=0
Die Reihe
∞
P
k=0
α
k
k
x .
k
x heißt auch Binomialreihe.
α
k
Beweis: (1) f (x) = (1 + x)α ist auf (−1, ∞) beliebig oft differenzierbar und
es gilt f (0) = 1 sowie
f (k) (x) = α(α − 1) · . . . · (α − k + 1)(1 + x)α−k ,
und daher
α(α − 1) · . . . · (α − k + 1)
f (k) (0)
=
=
k!
k!
α
k
Die Taylorreihe in x0 = 0 ist damit
∞ X
α k
T (f, 0)(x) =
x
k
k=0
(2) Wo konvergiert diese Reihe und gegen welchen Wert konvergiert sie? Wir
betrachten dazu die Cauchy–Form des Restgliedes
5.4 Taylorreihen
209
f (n+1) (θx)
(1 − θx)n xn+1
n!
α(α − 1) · . . . · (α − n)
=
(1 + θx)α−n−1 (1 − θ)n xn+1
n!
α−1
= α·
(1 − θ)n xn+1 (1 + θx)α−n−1
n
n
α−1
1−θ
xn+1 (1 + θx)α−1
= α·
1 + θx
n
|
{z
}
Rn (f, 0)(x) =
<1 f ür |x|<1
Daher gilt für |x| < 1
α − 1 n
x · |αx(1 + θx)α−1 | .
|Rn (f, 0)(x)| ≤ {z
}
|
n
=M unabh. von n
Die Binomialreihe Bα−1 (x) =
∞
P
k=0
k
x ist konvergent für alle |x| < 1 (siehe
α−1
n
Übungsaufgabe 62). Folglich gilt (nach Satz 3.2)
α − 1 n n→∞
x −→ 0
n
n→∞
und somit |Rn (f, 0)(x)| −→ 0 ∀ |x| < 1. Nach Satz 5.22 konvergiert die
Taylorreihe für |x| < 1 gegen f (x) = (1 + x)α , das heißt
∞ X
α k
(1 + x)α =
x .
k
k=0
Anwendung auf Extremwertaufgaben
Satz 5.24 (Hinreichende Bedingung für lokalen Extremwert) Sei f :
(a, b) −→ R n–mal differenzierbar, n ≥ 2, x0 ∈ (a, b) und sei
f (1) (x0 ) = f (2) (x0 ) = . . . = f (n−1) (x0 ) = 0, f (n) (x0 ) 6= 0.
Dann gilt:
Ist n ungerade, so hat f in x0 keinen lokalen Extremwert.
Ist n gerade und f (n) (x0 ) > 0, so hat f in x0 ein isoliertes lokales Minimum.
Ist n gerade und f (n) (x0 ) < 0, so hat f in x0 ein isoliertes lokales Maximum.
Beweis: Sei zunächst f (n) (x0 ) > 0. Es gilt
f (n) (x0 ) = lim
x→x0
f (n−1) (x)
f (n−1) (x) − f (n−1) (x0 )
= lim
>0
x→x0 x − x0
x − x0
210
5 Differentialrechnung für Funktionen einer reellen Veränderlichen
Deshalb gibt es ein δ > 0, so dass für alle x mit 0 < |x − x0 | < δ gilt
f (n−1) (x)
> 0.
x − x0
Daraus folgt
f (n−1) (x) < 0 auf (x0 − δ, x0 ),
f (n−1) (x) > 0 auf (x0 , x0 + δ).
Nach Voraussetzung ist
f (x) = Tn−2 (f, x0 ) + Rn−2 (f, x0 )
ξ
z
}|
{
1
= f (x0 ) +
f (n−1) (x0 + θ(x − x0 ))(x − x0 )n−1 f ür ein θ ∈ (0, 1).
(n − 1)!
5.23
Ist n gerade, so ist f (n−1) (ξ)(x − x0 )n−1 > 0 für alle x mit 0 < |x − x0 | < δ.
Somit ist f (x) > f (x0 ) für alle x mit 0 < |x − x0 | < δ und f hat in x0 ein
lokales Minimum. Ist n nun ungerade, so gilt
> 0 auf (x0 , x0 + δ)
f (n−1) (ξ)(x − x0 )n−1
< 0 auf (x0 − δ, x0 ).
Folglich hat f in x0 keinen lokalen Extremwert. Analog behandelt man
f (n) (x0 ) < 0.
⊓
⊔
Bemerkung:
(1) Ist f in x0 ∈ (a, b) ∞-oft differenzierbar und f (n) (x0 ) = 0 für alle n, so
kann man keine Aussage machen.
(2) Sollen die Extrema von f auf [a, b] bestimmt werden, so sind außer den
Stellen x0 ∈ (a, b) mit f ′ (x0 ) = 0 auch noch die Intervallenden zu untersuchen.
6
Differentialrechnung für Abbildungen mehrerer
reeller Variablen
6.1 Ableitung, Richtungsableitung und Gradient einer
Abbildung
Sei E ein reeller, normierter Vektorraum, U ⊂ Rn offen und f : U ⊂ Rn −→ E
eine Abbildung.
Erinnerung:
f : U ⊂ R −→ E heißt differenzierbar in x0 ∈ U falls der Grenzwert
f (x0 + h) − f (x0 )
=: f ′ (x0 )
h→0
h
lim
existiert. Das lässt sich auch schreiben als
f (x0 + h) − f (x0 ) = L(h) + o(h)
(h → 0)
wobei die lineare Abbildung L : R → E definiert ist durch
L(h) := f ′ (x0 ) · h.
Das motiviert die folgende
Definition 6.1. f : U ⊂ Rn → E heißt in x0 differenzierbar, falls eine lineare
Abbildung L : Rn −→ E existiert, so dass
f (x0 + h) − f (x0 ) = L(h) + o(khk)
(h → 0)
Das ist äquivalent zu
lim
h→0
f (x0 + h) − f (x0 ) − L(h)
= 0.
khk
(⋆).
212
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Die lineare Abbildung L : Rn −→ E heißt Ableitung von f in x0 (auch:
Differential von f in x0 , Linearisierung von f in x0 ).
f : U ⊂ Rn → E heißt differenzierbar, falls f in jedem x0 ∈ U differenzierbar
ist.
Symbol: L =: Df (x0 )
Satz 6.1 (1) Ist f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar, so ist die
lineare Abbildung L : Rn −→ E aus (⋆) eindeutig bestimmt.
(2) Ist f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar, so ist f in x0 stetig.
Beweis: (1) Seien L, L̃ : Rn −→ E linear mit
Dann folgt
f (x0 + h) − f (x0 ) = L(h) + o(khk)
e
= L(h)
+ o(khk) (h → 0).
e
L(h) − L(h)
= 0.
h→0
khk
lim
Sei nun x ∈ Rn \{0} und t ∈ R. Betrachten wir die Folgen h := tx für t → 0+ ,
e
so erhalten wir wegen der Linearität von L und L
0 = lim
t→0+
=
e
e
L(tx) − L(tx)
|t| L(x) − L(x)
= lim
|t| · kxk
kxk
t→0+ |t|
L(x) − L̃(x)
.
kxk
e
Also ist L(x) = L(x)
für alle x ∈ Rn .
(2) Sei f : U ⊂ Rn −→ E in x0 ∈ U differenzierbar und {xn } eine gegen x0
konvergente Folge. Dann gilt
kf (xn )−f (x0 )kE ≤
kf (xn ) − f (x0 ) − L(xn − x0 )kE
· kxn − x0 k + kL(xn − x0 )kE .
{z
}
| {z } |
kxn − x0 k
|
{z
}
→0
→0
→0
n
Da jede lineare Abbildung L : R −→ E stetig ist, konvergiert {f (xn )} gegen
f (x0 ). Somit ist f in x0 folgenstetig, also auch stetig.
⊓
⊔
Definition 6.2. Sei f : U ⊂ Rn −→ E eine Abbildung, a ∈ Rn . Man sagt: f
besitzt in x0 ∈ U eine Ableitung in Richtung a ∈ Rn , falls folgender Grenzwert
existiert
f (x0 + ta) − f (x0 )
, t ∈ R.
lim
t→0
t
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung
∇a f (x0 ) := lim
t→0
f (x0 +ta)−f (x0 )
t
213
heißt die Richtungsableitung von f in Richtung
a an der Stelle x0 .
f wird also nur entlang der Geraden {x0 + ta | t ∈ R} betrachtet, das heißt,
es gilt ∇a f (x0 ) = h′ (0), wobei h die Funktion h(t) := f (x0 + ta) ist.
Satz 6.2 Ist f : U ⊂ Rn −→ E in x0 differenzierbar, so besitzt f in x0 in
jeder Richtung a die Richtungsableitung und es gilt
Df (x0 )(a) = ∇a f (x0 ).
Beweis: Sei f in x0 differenzierbar und L = Df (x0 ), L : Rn −→ E. Wir
betrachten h = ta. Dann gilt nach Definition der Differenzierbarkeit
lim
t→0
kf (x0 + ta) − f (x0 ) − L(ta)kE
= 0.
|t| · kak
Da L linear ist, folgt
lim k
t→0
f (x0 + ta) − f (x0 )
− L(a)k = 0.
t
Damit existiert
∇a f (x0 ) = lim
t→0
f (x0 + ta) − f (x0 )
= L(a) = Df (x0 )(a).
t
⊓
⊔
Eine Funktion kann aber in einem Punkt x0 eine Richtungsableitung besitzen,
ohne in diesem Punkt differenzierbar zu sein:
Beispiel 6.1
Die Abbildung f : R2 −→ R1
f (x, y) =
(
xy 2
x2 +y 4
0
(x, y) 6= (0, 0)
(x, y) = (0, 0),
ist in x0 = (0, 0) nicht stetig (also auch nicht differenzierbar, siehe Beispiel
in Abschnitt 4.1), obwohl in x0 in jeder Richtung die Richtungsableitung existiert:
Sei a = (a1 , a2 ) ∈ R2 ein beliebiger Vektor. Dann gilt
( 2
a2
f (x0 + ta) − f (x0 )
f (ta)
t3 a1 a22
a1 a22
t→0
a 6= 0
=
=
= 2
−→ a1 1
4
4
2
2
4
2
t
t
t(t a1 + t a2 )
a1 + t a2
0 a1 = 0.
Somit existiert ∇a f (x0 ) für alle a = (a1 , a2 ) ∈ R2 .
214
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Beispiel 6.2
Sei L : Rn −→ E eine lineare Abbildung. Dann ist L in jedem Punkt x0 ∈ Rn
differenzierbar und es gilt DL(x0 ) = L, denn aufgrund der Linearität von L
ist
kL(x0 + h) − L(x0 ) − L(h)kE
k0k
lim
= 0.
= lim
h→0
h→0 khk
khk
|{z}
=0
Beispiel 6.3
Sei f : Rn1 × . . . × Rnk −→ E eine multilineare Abbildung. Dann ist f in
jedem Punkt x0 differenzierbar und es gilt
Df (x1 , . . . , xk )(a1 , . . . , ak ) =
k
X
f (x1 , . . . , xj−1 , aj , xj+1 , . . . , xk ).
j=i
Beweis: (1) Jede multilineare Abbildung f : Rn1 × . . . × Rnk −→ E ist stetig.
Insbesondere existiert ein δ > 0, so dass kx1 k, . . . , kxk k ≤ δ gilt
kf (x1 , . . . , xk )kE ≤ 1.
Folglich ist für alle xj ∈ R
nj
mit xj 6= 0
kx1 k
kxk k f δ x1 , . . . , δ xk ·...·
δ
δ
kx1 k
kxk k 1
≤ k kx1 k · . . . · kxk k.
δ
Somit existiert für jede multilineare Abbildung f : Rn1 × . . . × Rnk −→ E eine
Konstante C > 0 mit
kf (x1 , . . . , xk )kE =
kf (x1 , . . . , xk )kE ≤ C · kx1 k · . . . · kxk k.
(2) Zur Differenzierbarkeit:
f (x1 + a1 , . . . , xk + ak ) − f (x1 , . . . , xk )
−
=
k
X
f (x1 , . . . , xj−1 , aj , xj+1 , . . . , xk )
j=1
|
X
j1 <j2
+
{z
L(a)
f (x1 , . . . , aj1 , . . . , aj2 , . . . , xk )
X
}
f (x1 , . . . , aj1 , . . . , aj2 , . . . , aj3 , . . . , xk )
j1 <j2 <j3
+ . . . + f (a1 , . . . , ak ).
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung
215
Folglich gilt wegen (1)
kf (x1 + a1 , . . . , xk + ak ) − f (x1 , . . . , xk ) − L(a)k
X
≤C
kx1 k · . . . · kaj1 k · . . . · kaj2 k · . . . · kxk k
j1 <j2
+
X
(. . .) + . . . + ka1 k · . . . · kak k .
j1 <j2 <j3
Da kaj1 k·kaj2 k ≤ 21 (kaj1 k2 +kaj2 k2 ) ≤ 12 kak2 gilt, kann man alle Summanden
durch kak2 abschätzen und es folgt
lim
a→0
kf (x + a) − f (x) − L(a)kE
≤ lim C(x) · kak = 0.
a→0
kak
⊓
⊔
Satz 6.3 (Rechenregeln für Ableitungen und Richtungsableitungen)
Seien f, h : U ⊂ Rn −→ E, g : U ⊂ Rn −→ R. Dann gilt
(1) Sind f und h in x0 differenzierbar, so ist f + h in x0 differenzierbar und
es gilt
D(f + h)(x0 ) = Df (x0 ) + Dh(x0 ).
Existieren ∇a f (x0 ) und ∇a h(x0 ), so existiert ∇a (f + h)(x0 ) und es gilt
∇a (f + h)(x0 ) = ∇a f (x0 ) + ∇a h(x0 ).
(2) Sind f und g in x0 differenzierbar, so gilt
D(g · f )(x0 ) = Dg(x0 ) · f (x0 ) + Df (x0 ) · g(x0 ).
Existieren ∇a f (x0 ) und ∇a g(x0 ), so gilt
∇a (g · f )(x0 ) = ∇a g(x0 ) · f (x0 ) + ∇a f (x0 ) · g(x0 ).
(3) Sind f, g : U ⊂ Rn −→ R in x0 differenzierbar und g(x0 ) 6= 0, so ist
einer Umgebung von x0 definiert, in x0 differenzierbar und es gilt
g(x0 )Df (x0 ) − f (x0 )Dg(x0 )
f
(x0 ) =
D
.
g
g(x0 )2
f
g
in
(4) Kettenregel: Ist f : U ⊂ Rn −→ V ⊂ Rm in x0 differenzierbar und g :
V ⊂ Rm −→ E in f (x0 ) differenzierbar, so ist g ◦ f : U ⊂ Rn −→ E in x0
differenzierbar und es gilt
D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 ).
216
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
(5) Sei f = (f1 , f2 ) : U ⊂ Rn −→ E1 × E2 . Die Abbildung f ist genau dann
in x0 differenzierbar, wenn f1 , f2 in x0 differenzierbar sind. Dann gilt
Df (x0 ) = (Df1 (x0 ), Df2 (x0 )).
Beweis: Die Aussagen (1)–(3) sowie Aussage (5) folgen direkt aus der Definition.
(4) Seien y0 = f (x0 ), L = Df (x0 ) und L̃ = Dg(f (x0 )). Wir betrachten die
Abbildungen
ϕ(x) := f (x) − f (x0 ) − L(x − x0 ),
ψ(y) = g(y) − g(y0 ) − L̃(y − y0 )
sowie
̺(x) := (g ◦ f )(x) − (g ◦ f )(x0 ) − (L̃ ◦ L)(x − x0 ).
Nach Voraussetzung gilt
ϕ(x) = o (kx − x0 k) , fürx → x0 und ψ(y) = o (ky − y0 k) , füry → y0 .
k̺(x)k
x→x0 kx−x0 k
Es ist zu zeigen, dass ̺(x) = o (kx − x0 k) gilt, d.h. dass lim
Da
= 0 ist.
̺(x) = g(f (x)) − g(f (x0 )) − L̃(L(x − x0 ))
= g(f (x)) − g(y0 ) − L̃(f (x) − f (x0 ) − ϕ(x))
= (g(f (x)) − g(y0 ) − L̃(f (x) − y0 )) + L̃(ϕ(x))
= ψ(f (x)) + L̃(ϕ(x)),
genügt es zu zeigen, dass lim
x→x0
kψ(f (x))k
kx−x0 k
(a) Da L̃ : Rm −→ E linear ist, gilt
= lim
x→x0
kL̃(ϕ(x))k
kx−x0 k
= 0 ist.
kL̃(ϕ(x))kE ≤ Ckϕ(x)kRm .
Folglich ist
0 ≤ lim
x→x0
kL̃(ϕ(x))k
kϕ(x)k
= 0.
≤ C · lim
x→x0 kx − x0 k
kx − x0 k
|
{z
}
=0
kψ(y)k
y→y0 ky−y0 k
(b) Sei ε > 0 gegeben. Da lim
= 0 ist, existiert ein δ > 0, so dass aus
kf (x) − y0 k < δ folgt, dass kψ(f (x))k < εkf (x) − y0 k gilt. Da f in x0 stetig
ist, existiert ein δ1 > 0, so dass aus kx − x0 k < δ1 folgt, dass kf (x) − y0 k < δ.
Für kx − x0 k < δ1 gilt also
kψ(f (x))k ≤ εkf (x) − y0 k = εkϕ(x) + L(x − x0 )k ≤ εkϕ(x)k + ε · CL kx − x0 k,
und damit
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung
kψ(f (x))k
kϕ(x)k
+ε · CL
≤ε
kx − x0 k
kx − x0 k
| {z }
217
∀|x − x0 | < δ1 .
x→x0
→ 0
Daher gilt
0 ≤ lim
x→x0
Daraus folgt
kψ(f (x))k
≤ ε · CL
kx − x0 k
lim
x→x0
∀ε > 0.
kψ(f (x))k
= 0,
kx − x0 k
womit die Kettenregel bewiesen ist.
(3) fg : U ⊂ Rn −→ R ist die Verknüpfung folgender Abbildungen
ψ : Rn −→ R2 mit ψ(x) = (f (x), g(x)),
ϕ : R2 −→ R1 mit ϕ(x, y) =
(a) Es gilt Dψ(x0 ) = (Df (x0 ), Dg(x0 )).
(b) Sei a = (a1 , a2 ). Dann gilt Dϕ(x, y)(a) =
lim
|ϕ(x + a1 , x + a2 ) − ϕ(x, y) −
ya1 −xa2
|
y2
ya1 −xa2
,
y2
= lim
x
.
y
denn
1
| x+a
y+a2 −
x
y
−
ya1 −xa2
|
y2
a→0
kak
kak
1
|xy 2 + a1 y 2 − xy 2 − xya2 − y 2 a1 − ya1 a2 + xya2 + xa22 |
= lim
a→0 kak · y 2 |y + a2 |
p
kak x2 + y 2
1
|a2 | |xa2 − ya1 | ≤ lim |a2 | 2
= 0.
= lim
a→0
a→0 kak · y 2 |y + a2 |
y |y + a2 | · kak
a→0
(c) Nach der Kettenregel gilt
f
(x0 ) = D(ϕ ◦ ψ)(x0 ) = Dϕ(ψ(x0 )) ◦ Dψ(x0 )
D
g
= Dϕ(f (x0 ), g(x0 )) ◦ (Df (x0 ), Dg(x0 ))
(b) g(x0 ) · Df (x0 ) − f (x0 ) · Dg(x0 )
=
.
g(x0 )2
⊓
⊔
Wir betrachten eine lineare Abbildung L : Rn −→ R. Aus der Algebra ist
bekannt, dass ein eindeutig bestimmter Vektor vL ∈ Rn existiert, so dass gilt
L(x) = hx, vL iRn
∀x ∈ Rn .
Definition 6.3. Sei f : U ⊂ Rn −→ R eine in x0 ∈ U differenzierbare
Funktion. Der Gradient von f in x0 ist der Vektor grad f (x0 ) ∈ Rn , definiert
durch
Df (x0 )(a) = ∇a f (x0 ) = hgrad f (x0 ), ai ∀a ∈ Rn .
218
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Satz 6.4 Sei f : U ⊂ Rn −→ R1 in x0 ∈ Rn differenzierbar. Der Gradient
grad f (x0 ) gibt diejenige Richtung an, in der die Funktion im Punkt x0 am
schnellsten wächst, das heißt die Richtung der größten Richtungsableitung.
Beweis: Sei a ∈ Rn , kak = 1. Dann gilt mit der Cauchy-Schwarz-Ungleichung
∇a f (x0 ) = hgrad f (x0 ), ai ≤ kgrad f (x0 )k · kak = kgrad f (x0 )k.
Die Gleichheit gilt genau dann, wenn a =
grad f (x0 )
kgrad f (x0 )k .
⊓
⊔
Die geometrische Bedeutung des Gradienten
Sei f : U ⊂ Rn −→ R differenzierbar, c ∈ Im(f ) und
Mc := {x ∈ U | f (x) = c} ⊂ Rn
Dann heißt Mc Niveaufläche von f zum Niveau c.
Beispiel 6.4
Wir betrachten die Abbildung
f : U ⊂ R2 −→ R
(x, y) 7→ Höhe des Ortes über dem Meeresspiegel.
z
y
Mc
grad f (x0 )
x
Beispiel 6.5
Sei f gegeben durch
f : R3 −→ R
(x, y, z) 7→ x2 + y 2 + z 2 .
Dann ist Mc = {(x, y, z) ∈ R | x2 + y 2 + z 2 = c} die Sphäre vom Radius
in R3 .
√
c
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung
grad f (p)
grad f (p)
p
219
p
p + Tp Mc
p + Tp Mc
r
Mr 2
Definition 6.4. Der Tangentialraum von Mc im Punkt p ∈ Mc ist die Menge
der Vektoren
Tp Mc := {X ∈ Rn | ∃ differenzierbare Kurve γ : (−ε, ε) −→ Mc ⊂ Rn mit
γ(0) = p, γ ′ (0) = X}.
Die Vektoren X heißen Tangentialvektoren und p + Tp Mc heißt Tangentialebene in p ∈ Mc .
Satz 6.5 Sei f : U ⊂ Rn → R differenzierbar und sei p ∈ Mc . Dann gilt für
jeden Tangentialvektor X ∈ Tp Mc
grad f (p) ⊥ X.
Beweis: Sei γ : (−ε, ε) −→ Mc eine differenzierbare Kurve mit γ(0) = p und
γ ′ (0) = X. Da Mc die Niveaufläche zum Funktionswert c ist, gilt f (γ(t)) = c
für alle t ∈ (−ε, ε). Nach der Kettenregel ist dann
0 = D(f ◦ γ)(0) = Df (γ(0))(γ ′ (0)) = Df (p)(X) = hgrad f (p), Xi.
Also ist grad f (p) ⊥ X.
⊓
⊔
Bemerkung: Ist p ∈ U ein regulärer Punkt von f , das heißt grad f (p) 6= 0,
so gilt
Tp Mc = (grad f (p))⊥ := {X ∈ Rn | hgrad f (p), Xi = 0}.
Somit ist Tp Mc ⊂ Rn ein (n − 1)–dimensionaler Unterraum, den man als
(grad f (p))⊥ berechnen kann. (Der Beweis folgt später.)
220
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Satz 6.6 (MWS für Funktionen mehrerer Veränderlicher) Sei f : U ⊂
Rn −→ R differenzierbar. Seien x, y ∈ U und die Strecke xy zwischen x, y ∈ U
liege in U . Dann existiert ein ξ ∈ xy mit ξ 6= x, ξ 6= y, so dass gilt
f (y) − f (x) = hgrad f (ξ), (y − x)iRn = Df (ξ)(y − x).
Beweis: Wir betrachten die Abbildung h : [0, 1] → R, h(t) := f (x + t(y − x)).
Nach Voraussetzung ist h auf [0, 1] differenzierbar. Daher existiert nach dem Mittelwertsatz von Lagrange ein
y
θ ∈ (0, 1) mit
x
h(1) − h(0) = h′ (θ) · (1 − 0) = h′ (θ).
U ⊂ Rn
Nach Definition von h und aufgrund der Kettenregel ist dies äquivalent zu
f (y) − f (x) = Df (x + θ(y − x))(y − x) =: Df (ξ)(y − x).
⊓
⊔
Satz 6.7 Sei U ⊂ Rn offen und bogenzusammenhängend und f : U −→ E
differenzierbar. Dann ist f genau dann konstant auf U , wenn Df (x) = 0 für
alle x ∈ U gilt. Ist f reellwertig, so ist Df (x) = 0 äquivalent zu grad f (x) = 0.
Beweis: (1) Wenn die Abbildung f konstant ist folgt sofort
0 = f (x0 + h) − f (x0 ) = Df (x0 ) + o(khk)
| {z } | {z }
=0, linear
=0
(2) Sei Df (x) = 0 für alle x ∈ U und sei x ∈ U fix. Da U offen ist, existiert
ein ε(x) > 0, so dass gilt K(x, ε(x)) ⊂ U . Für a ∈ Rn , kak = 1 ist
a
x
ϕa : (−ε(x), ε(x)) −→ R
t 7→ ϕa (t) = f (x + ta)
U
wohldefiniert und differenzierbar, wobei gilt
ϕ′a (t) = Df (x + ta)(a) ≡ 0 ∀t ∈ (−ε(x), ε(x)).
Folglich ist ϕa auf (−ε(x), ε(x)) konstant. Da aber ϕa (0) = f (x) für alle
a ∈ Rn , kak = 1 gilt, ist f auf K(x, ε(x)) konstant. Seien nun x, y ∈ U
beliebig, aber fest. Da U bogenzusammenhängend ist, existiert eine stetige
6.1 Ableitung, Richtungsableitung und Gradient einer Abbildung
221
Abbildung σ : [0, 1] −→ U ⊂ Rn mit σ(0) = x, σ(1) = y. Wir betrachten die
offene Überdeckung {K(σ(t), ε(σ(t))}t∈[0,1] von σ([0, 1]).
y
σ
x4
x2
x3
x1
x
U
Da [0, 1] kompakt und σ stetig ist, ist auch σ([0, 1]) kompakt und es existiert
eine endliche Teilüberdeckung K(σ(t1 ), ε1 ), . . . , K(σ(tr ), εr ) von σ([0, 1]). Auf
jeder dieser offenen Mengen gilt aber
f|K(σ(tj ),εj ) = konst. = f (σ(tj )).
Daraus folgt
f (x) = f (σ(t1 )) = f (x1 ) = f (σ(t2 )) = f (x2 ) = . . . = f (σ(t2 )) = f (y),
mit xi ∈ K(σ(ti ), εi ) ∩ K(σ(ti+1 ), εi+1 ). Folglich ist f auf U konstant.
⊓
⊔
Bemerkung: Sei X ein metrischer Raum und sei A ⊂ X bogenzusammenhängend. Dann ist nach Kapitel 2, die Menge A auch zusammenhängend.
Die Umkehrung gilt im Allgemeinen nicht.
Für U ⊂ Rn offen gilt hingegen ist A genau dann bogenzusammenhängend,
wenn A zusammenhängend ist. Satz (6.7) gilt somit für offene, zusammenhängende Mengen U ⊂ Rn .
222
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
6.2 Partielle Ableitungen
Wir betrachten zunächst reellwertige Funktionen f : U ⊂ Rn −→ R. Sei
e = (e1 , . . . , en ) die Standardbasis des Rn .
Definition 6.5. Die i–te partielle Ableitung von f in u ∈ U ist
f (u + tei ) − f (u)
∂f
(u) := (∇ei f )(u) = Df (u)(ei ) = lim
∈ R.
t→0
∂xi
t
Beispiel 6.6
Wir betrachten die Abbildung
f : R2 −→ R
(x, y) 7→ f (x, y) = sin(xy 2 ).
Die partiellen Ableitungen sind dann
∂f
(x, y) = y 2 cos(xy 2 ) und
∂x
∂f
(x, y) = 2xy cos(xy 2 ).
∂y
Bemerkung: Sei f : U ⊂ Rn −→ R in u ∈ U differenzierbar. Dann ist
Df (u) : Rn −→ R eine lineare Abbildung. Diese entspricht bei Fixieren der
Basis e in Rn der (1, n)–Matrix
∂f
∂f
M (Df (u)) := (Df (u)(e1 ), . . . , Df (u)(en )) =:
(u), . . . ,
(u) .
∂x1
∂x1
Ist b =
n
P
bj ej , so gilt
j=1
Df (u)(b) =
n
X
j=1
bj Df (u)(ej ) =
∂f
∂f
(u), . . . ,
(u) ◦ (b1 , . . . , bn )⊤ .
∂x1
∂xn
Insbesondere gilt für den Gradienten von f :
∂f
∂f
grad f (u) =
(u), . . . ,
(u) .
∂x1
∂xn
Satz 6.8 (Hinreichende Bedingung für Differenzierbarkeit) Sei U ⊂
Rn offen und f : U −→ R eine Abbildung. Falls alle partiellen Ableitungen
∂f
∂f
n
−→ R existieren und stetig sind, so ist f auf U
∂x1 , . . . , ∂xn : U ⊂ R
differenzierbar.
6.2 Partielle Ableitungen
223
Beweis: Sei u ∈ U und h ∈ Rn . Dann gilt
f (u + h) − f (u) = f (u1 + h1 , u2 , . . . , un ) − f (u1 , . . . , un )
+f (u1 + h1 , u2 + h2 , u3 , . . . , un ) − f (u1 + h1 , u2 , . . . , un ) + . . .
+f (u1 + h1 , . . . , un + hn ) − f (u1 + h1 , . . . , un−1 + hn−1 , un ) .
Wir betrachten die Funktion g(x) := f (x, u2 , . . . , un ). Nach Voraussetzung
∂f
(x, u2 , . . . , un ). Wenden wir den Mittelexistiert die Ableitung g ′ (x) = ∂x
1
wertsatz auf g an, so erhalten wir ein ξ ∈ [u1 , u1 + h1 ], so dass gilt
f (u1 + h1 , u2 , . . . , un ) − f (u1 , . . . , un ) = h1 ·
∂f
(ξ1 , u2 , . . . , un ) .
∂x1
Analog existiert für alle j ∈ {1, . . . , n} ein ξj ∈ [uj , uj + hj ], so dass gilt
f (u1 + h1 , . . . , uj + hj , uj+1 , . . . , un )−f (u1 + h1 , . . . , uj−1 + hj−1 , uj , . . . , uj )
∂f
∂f
(u1 + h1 , . . . , uj−1 + hj−1 , ξj , uj+1 , . . . , un ) =: hj ·
(cj ) .
= hj ·
∂xj
∂xj
mit cj ∈ Rn . Folglich gilt
n
P
∂f
(u)h
f (u + h) − f (u) −
j
∂xj
j=1
khk
P
n
∂f
∂f
(cj ) − ∂xj (u) hj j=1 ∂xj
p
=
2
h1 + . . . + h2n
v
u n 2
CSU uX
∂f
∂f
(cj ) −
(u) .
≤ t
∂xj
∂xj
j=1
Für h = (h1 , . . . , hn ) −→ 0 konvergiert aber cj gegen u für alle j ∈ {1, . . . , n}.
h→0
∂f
(cj ) −→
Da alle partiellen Ableitungen stetig sind, erhalten wir ∂x
j
und somit
n
P
∂f
(u)h
f (u + h) − f (u) −
j
∂x
j
j=1
= 0.
lim
h→0
khk
∂f
∂xj (u)
Folglich ist f differenzierbar und es gilt
Df (u)(h) =
n
X
∂f
(u)hj
∂x
j
j=1
⊓
⊔
Bemerkung: Die Stetigkeit der partiellen Ableitungen ist nicht notwendig
für die Differenzierbarkeit. Sei zum Beispiel
224
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
f : R2 −→ R
(x, y) 7→ f (x, y) =
(
1
)
x2 +y 2
(x2 + y 2 ) sin( √
x2 + y 2 > 0
0
x = y = 0.
f ist in (0, 0) differenzierbar, aber
(Übungsaufgabe).
∂f
∂x
und
∂f
∂y
sind in (0, 0) nicht stetig
∂f
Bemerkung: Sei f : U ⊂ Rn −→ R gegeben und es existiere ∂x
auf U .
i
∂f
n
Existiert die partielle Ableitung der Funktion ∂xi : U ⊂ R −→ R nach der
j-ten Koordinate, so bezeichnet man sie mit
∂
∂f
∂2f
.
:=
∂xj ∂xi
∂xj ∂xi
Auf diese Weise entstehen partielle Ableitungen höherer Ordnung. Die Funktion
∂ k−1 f
∂
∂kf
: U ⊂ Rn −→ R
:=
∂xi1 · · · ∂xik
∂xi1 ∂xi2 · · · ∂xik
heißt (falls sie existiert) k–te partielle Ableitung von f nach den Variablen
xi1 , . . . , xik .
Bezeichnung:
∂lf
∂xi ...∂xi
=:
∂lf
.
∂xli
Beispiel 6.7
Wir betrachten die Funktion f : R2 −→ R mit f (x, y) = x3 y 2 . Dann erhalten
wir die partiellen Ableitungen erster und zweiter Ordnung
∂f
= 3x2 y 2 ,
∂x
∂f
= 2x3 y
∂y
sowie
∂2f
∂f
= 6x2 y =
= 6x2 y.
∂y∂x
∂x∂y
Beispiel 6.8
Wir betrachten die Funktion f : R2 −→ R, definiert durch
(
2
2
xy · xx2 −y
+y 2 (x, y) 6= (0, 0)
f (x, y) =
0
(x, y) = (0, 0).
Dann können wir wieder die partiellen Ableitungen erster und zweiter Ordnung berechnen und erhalten
x4 + 4x2 y 2 − y 4
∂f
,
=y
∂x
(x2 + y 2 )2
∂f
x4 − 4x2 y 2 − y 4
.
=x
∂y
(x2 + y 2 )2
In diesem Fall kann man die Reihenfolge der Ableitungen nicht vertauschen,
denn
6.2 Partielle Ableitungen
225
∂2f
1
−h4
(0, 0) = lim {h · 4 } = −1
h→0 h
∂y∂x
h
aber
1
h4
∂2f
(0, 0) = lim {h · 4 } = 1.
h→0 h
∂x∂y
h
Wir wollen nun untersuchen, wann man die Reihenfolge der partiellen Ableitungen vertauschen kann. Dazu benötigen wir die folgende
Definition 6.6. Eine Funktion f : U ⊂ Rn −→ R heißt von der Klasse C k ,
k ∈ N, falls alle partiellen Ableitungen von f der Ordnung ≤ k existieren und
stetig sind. Es bezeichne C k (U, R) := {f : U −→ R | f von der Klasse C k }.
Offensichtlich gilt für k ∈ N
C 0 (U, R) ⊃ C k−1 (U, R) ⊃ C k (U, R).
Satz 6.9 (Satz von Schwarz) Sei f ∈ C k (U, R). Dann sind alle partiellen
Ableitungen der Ordnung ≤ k unabhängig von der Reihenfolge der Differentiation. Insbesondere gilt für f ∈ C 2 (U, R)
∂2f
∂2f
=
.
∂xi ∂xj
∂xj ∂xi
Beweis: Es genügt zu zeigen, dass für jede C 2 –Funktion f : U ⊂ R2 −→ R
gilt
∂2f
∂2f
=
.
∂x1 ∂x2
∂x2 ∂x1
Auf Behauptung die für partielle Ableitungen höherer Ordnung schließt man
dann induktiv.
Wir betrachten u = (u1 , u2 ) ∈ U . Seien h = (h1 , h2 ) 6= 0 so gewählt, dass gilt
[u1 − h1 , u1 + h1 ] × [u2 − h2 , u2 + h2 ] ⊂ U.
Nun betrachten wir ϕ(x) := f (x, u2 + h2 ) − f (x, u2 ). Dann ist die Funktion
ϕ auf [u1 , u1 + h1 ] differenzierbar. Nach dem Mittelwertsatz existiert ein ξ1 ∈
[u1 , u1 + h1 ], so dass gilt
ϕ(u1 + h1 ) − ϕ(u1 ) = h1 · ϕ′ (ξ1 ).
Sei nun
F (h1 , h2 ) := f (u1 + h1 , u2 + h2 ) − f (u1 + h1 , u2 ) − f (u1 , u2 + h2 ) + f (u1 , u2 ).
Dann gilt
226
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
F (h1 , h2 ) = ϕ(u1 + h1 ) − ϕ(u1 ) = h1 · ϕ′ (ξ1 )
∂f
∂f
(ξ1 , u2 + h2 ) −
(ξ1 , u2 ) .
= h1
∂x1
∂x1
|
{z
}
=:(⋆)
Nach dem Mittelwertsatz angewendet auf den Ausdruck (⋆) an, das heißt auf
∂f
∂x1 (ξ1 , ·), existiert ein ξ2 ∈ [u2 , u2 + h], so dass
F (h1 , h2 ) = h1 · h2 ·
∂2f
(ξ1 , ξ2 )
∂x2 ∂x1
(⋆⋆).
Verfährt man analog mit der Funktion ψ(x) := f (u1 + h1 , x) − f (u1 , x), so
existieren nach dem Mittelwertsatz ein ξ˜1 ∈ [u1 , u1 + h1 ] und ein ξ˜2 ∈ [u2 , u2 +
h2 ], so dass
∂2f
(ξ˜1 , ξ˜2 ) (⋆ ⋆ ⋆).
F (h1 , h2 ) = h1 · h2 ·
∂x1 ∂x2
Da h1 , h2 6= 0 gilt, folgt mit (⋆⋆) und (⋆ ⋆ ⋆)
∂2f ˜ ˜ ∂2f
(ξ1 , ξ2 ) ,
ξ1 , ξ2 =
∂x1 ∂x2
∂x2 ∂x1
wobei ξ1 , ξ˜1 ∈ [u1 , u1 + h1 ] und ξ2 , ξ˜2 ∈ [u2 , u2 + h2 ] sind. Da
∂2f
∂x2 ∂x1
∂2 f
∂x1 ∂x2
und
in (u1 , u2 ) nach Voraussetzung stetig sind, folgt für h = (h1 , h2 ) −→ 0
∂2f
∂2f
(u) =
(u).
∂x1 ∂x2
∂x2 ∂x1
Bemerkung: Oft wird die folgende Bezeichnung benutzt
∂2f
∂ ∂f
∂f
=
, fxy :=
.
fx :=
∂x
∂y ∂x
∂x∂y
⊓
⊔
Der Satz von Schwarz zeigt, dass die Reihenfolge der Indizes für f ∈ C k egal
ist.
Satz 6.10 Sei f : U ⊂ Rn −→ Rm in u ∈ U differenzierbar und f =
(f1 , . . . , fm ). Dann ist die Matrix Df (u) : Rn −→ Rm in den Standardbasen e, ẽ des Rn bzw. Rm gegeben durch

M(Df (u)) = 
∂f1
∂x1 (u)
...
∂f1
∂xn (u)
...
∂fm
∂xn (u)
:
∂fm
∂x1 (u)
:

,
6.2 Partielle Ableitungen
das heißt, für b =
n
P
1
227
bi ei ∈ Rn gilt

b1
 : 
:
:
Df (u)(b) = 
∂fm
∂fm
bn
∂x1 (u) . . . ∂xn (u)
 
b1
∂f
∂f
=:
(u), . . . ,
(u)  :  .
∂x1
∂xn
|
{z
} bn

∂f1
∂x1 (u)
...
∂f1
∂xn (u)

Spaltenvektoren
Beweis: Ist ẽ = (e˜1 , . . . , e˜n ) die Standardbasis des Rm und e = (e1 , . . . , en )
die Standardbasis des Rn und identifiziert man
 


b1
a1
n
m
X
X
 .. 
 .. 
bi ei mit  . 
aj e˜j mit  .  sowie b =
a=
i=1
j=1
bn
am
so gilt
M(Df (u)) = (he˜j , Df (u)(ei )iRm )j∈{1,...,m} (Zeilen),
i∈{1,...,n} (Spalten) .
k
Da Df (u) = Df1 (u)e˜1 + . . . + Dfm (u)e˜m und Dfk (u)(ei ) = ∂f
∂xi (u), gilt
∂fj
(u)
.
M(Df (u)) =
∂xi
j∈{1,...,m}, i∈{1,...,n}
⊓
⊔
Satz 6.11 (Kettenregel für partielle Ableitungen)
Seien g1 , . . . , gm : U ⊂ Rn −→ R und f : Rm −→ R differenzierbar. Sei
F (x) := f (g1 (x), . . . , gm (x)) : U ⊂ Rn −→ R. Dann gilt
m
X ∂f
∂F
∂gj
(x) =
(g1 (x), . . . , gm (x)) ·
(x).
∂xi
∂yj
∂xi
j=1
Beweis: Wir betrachten φ : U −→ Rm , definiert durch φ(x) = (g1 (x), . . . , gm (x)).
Dann gilt F = f ◦ φ und DF (x) = Df (φ(x)) ◦ Dφ(x). Gehen wir zu den
Matrizen über, die diesen linearen Abbildungen entsprechen, so erhalten wir
einerseits
M(DF (x)) = M(Df (φ(x))) ◦ M(Dφ(x)),
mit
∂f
∂f
(g1 (x), . . . , gm (x)) , . . . ,
(g1 (x), . . . , gm (x)) ,
∂y1
∂ym

 ∂g1
∂g1
∂x1 (x) . . . ∂xn (x)
.
:
:
M(Dφ(x)) = 
∂gm
∂gm
∂x1 (x) . . . ∂xn (x)
M(Df (φ(x))) =
228
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Andererseits gilt
M(DF (x)) =
∂F
∂F
(x), . . . ,
(x) .
∂x1
∂xn
Vergleicht man die i–ten Spalten, so erhält man
n
X ∂f
∂gj
∂F
(x) =
(g1 (x), . . . , gm (x)) ·
(x).
∂xi
∂yj
∂xi
j=1
⊓
⊔
Folgerung 6.1 Sei U ⊂ Rn offen. Sind g1 , . . . , gm ∈ C k (U, R) und f ∈
C k (Rm , R), so gilt F := f (g1 (·), . . . , gm (·)) ∈ C k (U, R).
Folgerung 6.2 Sei f : U ⊂ Rn −→ Rm aus C (1) (U, Rm ). Dann ist
Df : U ⊂ Rn −→ L(Rn , Rm )
x 7→ Df (x)
stetig.
6.3 Die Taylorentwicklung und Extrema für Funktionen
mehrerer reeller Veränderlicher
Definition 6.7. Ein Multiindex α = (α1 , . . . , αn ) ist ein n–Tupel von natürlichen Zahlen αj ∈ N0 .
|α| := α1 + . . . αn heißt die Ordnung des Multiindex und wir definieren
α! := (α1 !) · . . . · (αn !). Für y = (y1 , . . . , yn ) ∈ Rn bezeichne
y α := y1α1 · . . . · ynαn .
Für eine Funktion f : U ⊂ Rn −→ R bezeichne (sofern existent)
∂ |α| f
∂ |α| f
:=
.
∂xα
(∂x1 )α1 · · · (∂xn )αn
Satz 6.12 (Taylorformel) Sei U ⊂ Rn offen, f ∈ C k (U, R). Seien x, y ∈ U
zwei Punkte, so dass die Strecke xy in U liegt. Dann existiert ein ξ ∈ xy, so
dass gilt
f (y) =
X
|α|≤k−1
X 1 ∂kf
1 ∂ |α| f
(x)(y − x)α +
(ξ)(y − x)α .
α
α! ∂x
α! ∂xα
|α|=k
6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher
Beweis: Wir betrachten die Funktion g : [0, 1] −→ R mit g(t) := f (x +
t(y − x)). Dann ist g ∈ C k und nach der Taylorformel für Funktionen in einer
Variablen gilt
g(1) =
k−1
X
r=0
Dabei ist
1
1 (r)
g (0) + g (k) (t0 ) für ein t0 ∈ (0, 1).
r!
k!
| {z }
Restglied
g (0) (0) = g(0) = f (x)
n
X ∂αf
X
∂f
(x) · (yi − xi ) =
(x) · (y − x)α
g (1) (0) =
α
∂x
∂x
i
i=1
g (2) (0) =
n
X
i,j=1
=
|α|=1
2
∂ f
(x) · (yi − xi ) · (yj − xj )
∂xi ∂xj
X ∂2f
2!
(x)(y − x)α ·
∂xα
α!
(∗)
(∗∗).
|α|=2
2!
α!
∂2 f
∂x2i
Der Faktor
in (∗∗) ist notwendig, da in (∗)
∂2 f
∂xi ∂xj
=
∂2 f
∂xj ∂xi
zweimal auftritt,
in (∗∗) nur einmal vorhanden ist. Analog erhält man durch
während
mehrfaches Anwenden der Kettenregel und etwas Kombinatorik
g (j) (0) =
X j! ∂ |α| f
(x) · (y − x)α .
α! ∂xα
|α|=j
Damit folgt
f (y) =
X
|α|≤k−1
X 1 ∂kf
1 ∂ |α| f
α
(x)
·
(y
−
x)
+
(ξ) · (y − x)α
α! ∂xα
α! ∂xα
|α|=k
mit ξ := x + t0 (y − x).
⊓
⊔
Definition 6.8. Sei U ⊂ Rn offen, f : U ⊂ Rn −→ R differenzierbar.
(1) f nimmt in x0 ∈ U ein lokales Minimum an, falls ein ε > 0 existiert, so
dass f (x) ≥ f (x0 ) für alle x mit kx − x0 k < ε.
(2) f hat in x0 ∈ U ein lokales Maximum, falls ein ε > 0 existiert, so dass
f (x) ≤ f (x0 ) für alle x mit kx − x0 k < ε.
(3) x0 ∈ U heißt kritischer Punkt von f , falls Df (x0 ) = 0, das heißt, es gilt
∂f
∂xi (x0 ) = 0 für alle i ∈ {1, . . . , n}.
229
230
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Definition 6.9. Sei f : U ⊂ Rn −→ R von der Klasse C 2 und sei x0 ∈ U ein
kritischer Punkt von f . Die symmetrische Bilinearform Hfx0 : Rn ×Rn −→ R
Hfx0 (a, b) :=
n
X
j,i=1
∂2f
(x0 ) ai · bj
∂xi ∂xj
heißt Hessesche Form von f in x0 .
Bezeichnung: Sei A : Rn × Rn −→ R eine symmetrische Bilinearform,
n
P
Aij ai bj und sei EW (Aij ) die Menge der Eigenwerte von (Aij ).
A(a, b) =
i,j
Dann vereinbaren wir die folgenden Bezeichnungen:
(1) A > 0 :⇔ A positiv definit ⇔ für alle a 6= 0 ist A(a, a) > 0
⇔ für alle λ ∈ EW (Aij ) : λ > 0,
(2) A < 0 :⇔ A negativ definit ⇔ für alle a 6= 0 ist A(a, a) < 0
⇔ für alle λ ∈ EW (Aij ) : λ < 0,
(3) A ≥ 0 :⇔ A positiv semidefinit ⇔ für alle a ist A(a, a) ≥ 0
⇔ für alle λ ∈ EW (Aij ) : λ ≥ 0,
(4) A ≤ 0 :⇔ A negativ semidefinit ⇔ für alle a ist A(a, a) ≤ 0
⇔ für alle λ ∈ EW (Aij ) : λ ≤ 0.
Satz 6.13 Sei U ⊂ Rn offen, f ∈ C 3 (U, R).
(1) Hat f in x0 ∈ U ein lokales Maximum (lokales Minimum), so ist x0 kritischer Punkt von f und Hfx0 ist negativ semidefinit (positiv semidefinit).
(2) Ist x0 ∈ U ein kritischer Punkt von f und Hfx0 negativ definit (positiv
definit), so hat f in x0 ein isoliertes lokales Maximum (isoliertes lokales
Minimum).
Beweis: (1) f habe in x0 ∈ U ein lokales Maximum. Sei a ∈ Rn . Dann hat
g : (−ε, ε) −→ R mit g(t) := f (x0 + ta) ein lokales Maximum in t = 0. Folglich
gilt wegen g (1) (0) = 0 und g (2) (0) ≤ 0
hgrad f (x0 ), aiRn =
und
Hfx0 (a, a) =
n
X
i,j=1
n
X
∂f
(0) · ai = 0
∂x
i
i=1
∂2f
(0)ai aj ≥ 0.
∂xi ∂yj
Da a beliebig ist, folgt daraus grad f (x0 ) = 0 und Hfx0 ≤ 0. Für ein lokales
Minimum läuft der Beweis analog.
6.3 Die Taylorentwicklung und Extrema für Funktionen mehrerer reeller Veränderlicher
(2) Sei x0 ∈ U ein kritischer Punkt und Hfx0 < 0. Sei ε > 0, so dass
K(x0 , ε) ⊂ U . Da f ∈ C 3 (U, R) ist, gilt für y ∈ K(x0 , ε) die Taylorformel
f (y) = f (x0 ) +
+
n
1 X ∂2f
(x0 ) · (yi − x0i ) · (yj − x0j )
2 i,j=1 ∂xi ∂xj
X 1 ∂3f
(ξ) · (y − x0 )α
α! ∂xα
|α|=3
X 1 ∂3f
1
(ξ) · (y − x0 )α ,
= f (x0 ) + Hfx0 (y − x0 , y − x0 ) +
2
α! ∂xα
|α|=3
wobei ξ ∈ x0 y. Sei λ1 der größte Eigenwert von Hfx0 (λ1 < 0). Dann gilt
Hfx0 (y − x0 , y − x0 ) ≤ λ1 ky − x0 k2
und folglich
f (y) − f (x0 ) ≤
X 1 ∂ 3f
1
(ξ) · (y − x0 )α .
λ1 ky − x0 k2 +
2
α! ∂xα
|α|=3
Sei 0 < µ < ε und 0 < ky − x0 k < µ. Für jeden Multiindex α mit |α| = 3 gilt
|(y − x0 )α |
≤ µ.
ky − x0 k2
Damit folgt
2·
X 1 ∂ 3f
f (y) − f (x0 )
(y − x0 )α
≤ λ1 + 2
(ξ) ·
. (∗)
2
α
ky − x0 k
α! ∂x
ky − x0 k2
|α|=3
{z
}
|
|...|<
|λ1 |
µ ·µ
Sei nun 0 < µ < ε so gewählt, dass
µ<
|λ1 |
3
∂ f
2
sup α (z) | z ∈ K(x0 , ε)
∂x
|α|=3
{z
}
|
P
existiert, da
∂3f
∂xα
stetigist
gilt. Wegen (∗) gilt für 0 < ky − x0 k < µ
2·
f (y) − f (x0 )
< λ1 +|λ1 | = 0
|{z}
ky − x0 k2
<0
und somit
231
232
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
f (y) < f (x0 ),
∀ y ∈ K(x0 , µ)\{x0 }.
Folglich hat f in x0 ein lokales isoliertes Maximum. Analog beweist man den
⊓
⊔
Fall Df (x0 ) = 0, Hfx0 > 0.
Bemerkung (1) Sei A ∈ MR (2, 2) eine symmetrische 2 × 2–Matrix. Dann gilt
(a) A > 0 ⇔ det(A) > 0 und A11 > 0,
(b) A < 0 ⇔ det(A) > 0 und A11 < 0.
(2) Sei A ∈ MR (n, n) und definiere A(v) durch


A11 . . . A1v

..  .
A(v) :=  ...
. 
Av1 . . . Avv
Dann gilt
(a’)A > 0 ⇔ det(A(v)) > 0 ∀v ∈ {1, . . . , n},
(b’)A < 0 ⇔ (−1)v det(A(v)) > 0 ∀v ∈ {1, . . . , n}.
Beispiel 6.9
Wir betrachten die Funktion f : R3 −→ R mit
f (x, y, z) := 35 − 6x + 2z + x2 − 2xy + 2y 2 + 2yz + 3z 2 .
In welchen Punkten hat f lokale Extrema? Die Bedingung Df (x, y, z) = 0 ist
nur im Punkt
(x, y, z) = (8, 5, −2) =: x0
erfüllt. In diesem Punkt ist die Hesse-Matrix


2 −2 0
Hfx0 =  −2 4 2  .
0 2 6
Da det(Hfx0 ) = 16 > 0 ist, hat f in x0 ein lokales Minimum.
6.4 Der Satz über die Umkehrabbildung
Definition 6.10. Seien U, V ⊂ Rn offene Teilmengen. Eine Abbildung f : U −→ V
heißt C k –Diffeomorphismus (k ≥ 1), wenn gilt
1) f ist bijektiv,
2) f und f −1 sind C k –Abbildungen.
6.4 Der Satz über die Umkehrabbildung
233
Bemerkung: Ein Diffeomorphismus heißt auch Koordinatentransformation
und vereinfacht oft die Berechnung von Integralen oder das Lösen von Differentialgleichungen.
Beispiel 1: Polarkoordinaten in der Ebene
R
2
f : (0, ∞) × (0, 2π) −→ R \{[0, ∞) × {0}}
(r, ϕ) 7→ (r cos ϕ, r sin ϕ)
6
y
r
(r, ϕ) heißen die Polarkoordinaten von
(x, y).
(x, y) = f (r, ϕ)
•
ϕ
x
Beispiel 2: Zylinderkoordinaten im R
R
3
f : (0, ∞) × (0, 2π) ×R −→ (R2 \{[0, ∞) × {0}}) × R
{z
}
|
Polarkoordinaten
z
(r, ϕ, z) 7→ (r cos ϕ, r sin ϕ, z)
6
r
•
P
z
ϕ
•
y
+
x
Zylinderkoordinaten
Beispiel 3: Kugelkoordinaten im R3
π π
f : (0, ∞) × (− , ) × (0, 2π) −→ R3 \([0, ∞) × {0} × R)
2 2
(r, u, v) 7→ (r cos v cos u, r sin v cos u, r sin u)
234
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
z
6
r
v
P
•
-
u
•
y
+
x
Kugelkoordinaten
Satz 6.14 Ist f : U ⊂ Rn −→ V ⊂ Rn ein Diffeomorphismus, so ist für alle
x0 ∈ U die Abbildung Df (x0 ) : Rn −→ Rn ein Isomorphismus und es gilt
(Df (x0 ))−1 = (Df −1 )(f (x0 )).
Beweis: Da f ◦ f −1 = idV und f −1 ◦ f = idU gilt, folgt nach der Kettenregel
Df (f −1 (y0 ))Df −1 (y0 ) = D(id)(y0 ) = idRn
und
Df −1 (f (x0 ))Df (x0 ) = D(id)(x0 ) = idRn .
Ist nun y0 = f (x0 ), so folgt Df −1 (y0 ) = (Df (x0 ))−1 .
⊓
⊔
Bemerkung: Für Funktionen in R gilt: Ist U ⊂ R offen und zusammenhängend, f : U −→ R eine C 1 –Abbildung und f ′ (x) 6= 0 für alle x ∈ U ,
so ist V = f (U ) ⊂ R offen und zusammenhängend, f : U −→ f (U ) bijektiv
und ein Diffeomorphismus. In höheren Dimensionen gilt dies nicht!
Beispiel 6.10
Wir betrachten die Abbildung f : R2 −→ R2 mit f (x, y) := (ex cos y, ex sin y).
Dann ist f eine C 1 –Abbildung und wir können det(Df (x, y)) berechnen:
x
e cos y −ex sin y
det(Df (x, y)) = det
= e2x > 0.
ex sin y ex cos y
Folglich ist Df (x, y) : R2 −→ R2 ein Isomorphismus für alle (x, y) ∈ R2 . Aber
f ist nicht injektiv. Somit existiert f −1 nicht global sondern nur lokal.
6.4 Der Satz über die Umkehrabbildung
235
Wir wollen nun untersuchen, unter welchen Bedingungen eine C 1 –Abbildung
f : Rn −→ Rn eine lokale Umkehrfunktion besitzt.
Lemma 6.11. Sei f : U ⊂ Rn −→ Rn eine C 1 –Abbildung, W ⊂ U ein Würfel
und es gelte
∂fi
≤ M ∀u ∈ W.
(u)
∂xj
Dann folgt
3
kf (b) − f (a)k ≤ n 2 M kb − ak ≤ n2 M kb − ak
∀a, b ∈ W.
Beweis: Es gilt
fi (b) − fi (a) =
n
X
j=1
(fi (b1 , . . . , bj , aj+1 , . . . , an ) − fi (b1 , . . . , bj−1 , aj , . . . , an )).
Wenden wir den Mittelwertsatz von Lagrange auf die Funktion fi in der j–ten
Variablen an, so erhalten wir ein ξj ∈ [aj , bj ] mit
fi (b) − fi (a) =
n
X
j=1
(bj − aj )
∂fi
(b1 , . . . , bj−1 , ξj , aj+1 , . . . , an ) .
∂xj |
{z
}
∈W
Daraus folgt
|fi (b) − fi (a)| ≤
n
X
j=1
|bj − aj | · M ≤ n · M · kb − ak
und damit
kf (b) − f (a)k =
n
X
i=1
2
|fi (b) − fi (a)|
3
2
= n M kb − ak.
! 21
≤
p
n · n2 · M 2 · kb − ak2
⊓
⊔
Satz 6.15 (Satz über die Umkehrabbildung) Sei U ⊂ Rn offen, f :
U −→ Rn von der Klasse C k , k ≥ 1, x0 ∈ U und es gelte det(Df (x0 )) 6= 0,
das heißt Df (x0 ) ist Isomorphismus. Dann existieren offene Umgebungen Ũ
von x0 und offene Umgebungen Ṽ von f (x0 ), so dass gilt
(1) Ṽ = f (Ũ ),
(2) f|Ũ : Ũ −→ Ṽ ist bijektiv,
(3) (f|Ũ )−1 : Ṽ −→ Ũ ist C k –Abbildung.
236
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Beweis: (1) OBdA kann man Df (x0 ) = id annehmen: Betrachten wir die
lineare, bijektive Abbildung L := Df (x0 )−1 : Rn −→ Rn . Gilt der Satz für
L ◦ f : U −→ Rn , so gilt er auch für f (lineare Abbildungen sind C ∞ ) und es
gilt
D(L ◦ f )(x0 ) = DL(f (x0 )) ◦ Df (x0 ) = L ◦ Df (x0 ) = id.
(2) Sei f : U −→ Rn eine C 1 –Abbildung und Df (x0 ) = id, das heißt
∂fi
∂xj (x0 ) = δij . Wir wählen einen Würfel K mit x0 ∈ Int(K) ⊂ K ⊂ U ,
so dass gilt
(i) det(Df
(x)) 6= 0 ∀x
∈ K,
∂fi
∂fi
(ii) ∂xj (x) − ∂xj (x0 ) < 2n1 2 ∀x ∈ K, ∀i, j ∈ {1, . . . , n}.
Im Folgenden zeigen wir, dass f auf K injektiv ist. Wir betrachten dazu die
Abbildung g(x) = f (x) − x. Dann ist g eine C 1 –Abbildung und es folgt
∂gi
∂fi
∂fi
∂fi
1
∂xj (x) = ∂xj (x) − δij = ∂xj (x) − ∂xj (x0 ) < 2n2 ∀x ∈ K.
Aus dem Lemma 6.11 folgt dann
1
1
· kb − ak = kb − ak ∀a, b ∈ K.
2n2
2
Mit Hilfe der Dreiecksungleichung erhalten wir dann
kg(b) − g(a)k < n2 ·
kb − ak − kf (b) − f (a)k ≤ kf (b) − b − (f (a) − a)k = kg(b) − g(a)k ≤
1
kb − ak.
2
oder kurz
kb − ak ≤ 2kf (b) − f (a)k
∀a, b ∈ K. (∗)
Somit ist f auf K injektiv. Da x0 ∈ Int(K) ist, gilt insbesondere, dass
f (x0 ) 6∈ f (∂K).
(3) Definition der Umgebung Ṽ (f (x0 )): Da K kompakt ist, ist auch ∂K kompakt. Aus der Stetigkeit von f folgt dann, dass f (∂K) kompakt ist. Wegen
f (x0 ) 6∈ f (∂K) folgt
inf{kf (x0 ) − f (x)k | x ∈ ∂K} = d > 0.
Wir definieren nun die Umgebung Ṽ (f (x0 )) := {y ∈ Rn | ky − f (x0 )k < d2 }.
Damit erhalten wir
ky − f (x0 )k < ky − f (x)k
∀ y ∈ Ṽ , x ∈ ∂K. (∗∗)
f
d
x
f (x0 )
x0
U
K
f (x)
f (K)
f (∂K)
Ve
6.4 Der Satz über die Umkehrabbildung
237
(4) Definition der Umgebung Ũ(x0 ): Die Behauptung ist, dass für alle y ∈ Ṽ
genau ein x ∈ Int(K) mit f (x) = y existiert. Die Eindeutigkeit wurde bereits
in (2) gezeigt. Sei nun y ∈ Ṽ gegeben. Wir betrachten die Abbildung
gy : K −→ R.
x 7→ gy (x) = ky − f (x)k2 = hy − f (x), y − f (x)i
Da K kompakt und gy stetig ist, nimmt gy auf K das absolute Minimum an.
Da nach (∗∗) gy (x0 ) < gy (x) für alle x ∈ ∂K gilt, liegt das absolute Minimum
nicht auf ∂K. Das heißt, es existiert ein u0 ∈ Int(K), in dem gy sein absolutes
Minimum annimmt. Wir zeigen nun, dass f (u0 ) = y gilt. Es ist
0 = Dgy (u0 ) = −2Df (u0 )(y − f (u0 )) = −2hy − f (u0 ), grad f (u0 )i.
| {z }
6=0
Da u0 ∈ Int(K) und Df (u0 ) ein Isomorphismus ist, folgt y = f (u0 ). Wir
setzen nun Ũ := (Int(K)) ∩ f −1 (Ṽ ). Dann ist Ũ eine offene Umgebung von
x0 und f|Ũ : Ũ −→ Ṽ ist bijektiv.
(5) Wir zeigen nun, dass (f|Ũ )−1 : Ṽ −→ Ũ stetig ist. Aus (∗) erhalten wir
die Ungleichung
kf −1 (x) − f −1 (y)k ≤ 2kx − yk
∀ x, y ∈ Ṽ .
Folglich ist f −1 auf Ṽ Lipschitz-stetig, also stetig.
(6) Es ist zu zeigen, dass f −1 : Ṽ −→ Ũ differenzierbar ist. Sei dazu
y = f (x) ∈ Ṽ , x ∈ Ũ und Lx := Df (x). Es genügt zu zeigen, dass f −1 in y
differenzierbar ist und dass
−1
Df −1 (y) = L−1
.
x = (Df (x))
Da f in x differenzierbar ist, gilt für x + h ∈ Ũ
f (x + h) − f (x) = Lx (h) + o(h)
wobei lim
h→0
ko(h)k
khk
= 0. Daraus folgt
−1
L−1
x (f (x + h) − f (x)) = h + Lx (o(h)).
Sei y1 = f (x + h). Dann ist f −1 (y1 ) − f −1 (y) = x + h − x = h und es folgt
−1
L−1
x (y1 − y) = h + Lx (o(h)).
−1
−1
Daraus erhält man f −1 (y1 ) − f −1 (y) − L−1
x (y1 − y) = −Lx (o(h)). Da Lx
−1
linear ist, gilt kLx (z)k ≤ Ckzk für alle z. Folglich ist
238
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
lim
y1 →y
kf −1 (y1 ) − f −1 (y) − L−1
x (y1 − y)k
ky1 − yk
ko(h)k
ko(h)k
= C lim
≤ lim C
y1 →y
h→0 kf (x + h) − f (x)k
ky1 − yk
khk
ko(h)k
·
= C lim
h→0 khk
kf (x + h) − f (x)k
{z
}
|
ko(h)k
= 0.
≤ 2C lim
h→0 khk
≤2 nach (∗)
Somit ist f −1 differenzierbar und es gilt Df −1 (f (x)) = (Df (x))−1 .
(7) Es ist zu zeigen, dass wenn f ∈ C k gilt, auch f −1 ∈ C k ist. Sei dazu
f = (f1 , . . . , fn ) : Ũ −→ Ṽ ,
f −1 = (g1 , . . . , gn ) : Ṽ −→ Ũ .
Dann gilt fi (g1 (y), . . . , gn (y)) = yi . Mit der Kettenregel erhalten wir wegen
n
X
∂gk
∂fi −1
(f (y)) ·
(y) = δij
∂xk
∂yj
k=1
dass
−1
∂fi −1
∂gk
(y)
=
(f (y)
∂yj
∂xk
ik
kj
gilt. Aus der Formel für die inverse Matrix folgt dann, dass
∂fi
−1
(y))
∂xk (f
−1
1
∂gk
∂yj
für alle i, k ∈
{1, . . . , n} eine rationale Funktion Qkj von
ist. Da f −1 stetig
∞
1
und Qkj ∈ C ist, folgt aus f ∈ C , dass f
∈ C ist. Ist f ∈ C 2 , so
−1
2
folgt f ∈ C , denn in der zweiten Ableitung von f −1 sind nur Ableitungen
bis zur Ordnung 2 von f und Ableitungen der Ordnung 1 von f −1 enhalten
(usw).
⊓
⊔
Folgerung 6.3 Sei U ⊂ Rn offen, f : U −→ Rn eine C 1 –Abbildung und für
alle x ∈ U sei Df (x) ein Isomorphismus. Dann gilt
(1) f (U ) ist offen.
(2) Ist f zusätzlich injektiv, so ist f : U −→ f (U ) ein Diffeomorphismus.
Beweis: (1) Nach dem Umkehrsatz existiert für alle
S x ∈ U eine Umgebung
f (Ux ) offen.
Ux , so dass f (Ux ) offen ist. Somit ist auch f (U ) =
x∈U
(2) Ist f injektiv, so ist f : U −→ f (U ) bijektiv. Folglich ist f|Ux : Ux −→
f (Ux ) ein Diffeomorphismus für alle Ux ⊂ U und daher f : U −→ f (U ) ein
Diffeomorphismus.
⊓
⊔
6.5 Implizite Funktionen
239
6.5 Implizite Funktionen
1) Wir betrachten eine “Fläche” im R3 , die durch eine Gleichung gegeben ist:
M = {(x, y, z) ∈ R3 | F (x, y, z) = 0},
2
2
wie z.B. die Sphäre (x2 +y 2 +z 2 −1 = 0), das Paraboloid ( xa2 + yb2 −z = 0) oder
2
2
2
das Hyperboloid ( xa2 + yb2 − zc2 − 1 = 0). Sei p ∈ M . Kann man M lokal um p
als Graph einer Funktion darstellen ? Existiert z.B. eine Funktion z = z(x, y)
mit F (x, y, z(x, y)) = 0, d.h. graph(z) = M (lokal) ? Falls ja, kann man mit
Hilfe des Gradienten dieser Funktion leicht den Tangentialraum Tp M an den
Punkt p bestimmen. (−→ Übungsaufgabe)
grad F (p)
p
graph z
2) Wir betrachten das lineare Gleichungssystem
f1 (x) = a11 x1 + . . . + a1n xn = 0
..
..
..
.
.
.
fm (x) = am1 x1 + . . . + amn xn = 0.
(∗)
Das lässt sich auch schreiben als Ax⊤ = 0 wobei


a11 . . . a1n

.. 
A =  ...
. 
am1 . . . amn .
und x⊤ der transponierte Vektor zu x = (x1 , x2 , . . . , xn ) ∈ Rn ist. Sind die
Spalten (a1 , . . . , an ) von A linear unabhängig, so ist das Gleichungssystem mit
den Variablen x1 , . . . , xm auflösbar, d.h., es existieren lineare Funktionen
x1 = x1 (xm+1 , . . . , xn ),
..
..
.
.
xm = xm (xm+1 , . . . , xn ),
die (∗) lösen.
Verallgemeinerung auf beliebige Gleichungssysteme
Gegeben sei eine beliebige C k -Funktion f : Rn −→ Rm , m ≤ n. Wir betrachten das Gleichungssystem
240
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
f1 (x1 , . . . , xn ) = 0,
f2 (x1 , . . . , xn ) = 0,
..
.
fm (x1 , . . . , xn ) = 0,
d.h. (x1 , . . . , xn ) = 0. Kann man dieses Gleichungssystem nach einer oder
mehreren Variablen auflösen ? D.h.,
1) Existiert eine Abbildung ϕ : Rn−m −→ Rm , so dass
f (x1 , . . . , xn−m , ϕ1 (x1 , . . . , xn−m ), . . . , ϕm (x1 , . . . , xn−m )) = 0
|
{z
}
{z
}
|
=:y1
=:ym
gilt?
2) Ist ϕ eindeutig bestimmt?
3) Falls f differenzierbar ist und ϕ existiert, ist dann auch ϕ differenzierbar?
Beispiel 6.11
Wir betrachten die Abbildung
f (x, y) = 0
f : R2 −→ R
(x, y) 7→ f (x, y) = x2 + y 2 − 1
x
2
2
Die Gleichung
√ für ϕ(x) lautet dann x + ϕ(x) − 1 = 0, das heißt
2
ϕ(x) = ± 1 − x . Somit ist ϕ nicht eindeutig bestimmt und nur lokal auf
[ − 1, 1] definiert.
Beispiel 6.12
Wir betrachten die Abbildung
xn
f ≡0
f : Rn −→ R
(x1 , . . . , xn ) 7→ f (x1 , . . . , xn ) = x21 + . . . + x2n−1
Dann existiert kein ϕ mit f (x1 , . . . , xn−1 , ϕ(x)) = 0.
{z
}
|
x
Rn−1
6.5 Implizite Funktionen
241
Beispiel 6.13
Wir betrachten die Abbildung
f : R2 −→ R
(x, y) 7→ f (x, y) = x − y 3
Dann löst ϕ(x) =
differenzierbar.
√
3
x die Gleichung f (x, ϕ(x)) = 0, aber ϕ ist in x = 0 nicht
Satz 6.16 (Satz über implizite Funktionen) Sei U ⊂
R n × Rm
(x1 ,...,xn ) (y1 ,...,ym )
offen und f : U −→ Rm eine C 1 –Abbildung. Sei (a, b) ∈ U ein Punkt mit
1) f (a, b) = 0, d.h., es existiert eine Lösung (a, b) von f (x, y) = 0 und

2)  ∂f ∂f
∂f1
1
1
∂y1 ∂y2 . . . ∂ym
 .
..
.. 
 (a, b) =: det ∂f ⊤ (a, b) ∂f ⊤ (a, b) . . . ∂f ⊤ (a, b) 6= 0.
.
det 
.
. 
 .
∂y1
∂y2
∂ym
∂fm
∂fm ∂fm
.
.
.
∂y1 ∂y2
∂ym
Dann existieren eine offene, zusammenhängende Umgebung A(a) ⊂ Rn von a
und eine eindeutig bestimmte Abbildung ϕ : A −→ Rm mit
i) f (x, ϕ(x)) = 0 und
ii) ϕ(a) = b,
d.h., in einer Umgebung des Punktes (a, b) ist
die Lösungsmenge der Gleichung f (x, y) = 0
der Graph der Funktion ϕ.
S1
b
a
Weiterhin gilt:
iii) ϕ : A −→ Rm ist differenzierbar.
iv) Falls f ∈ C k ist, so ist auch ϕ ∈ C k und
−1 ∂ϕl
∂fk
∂fk
◦
(x) = −
(x, ϕ(x))
(x, ϕ(x)) .
∂xi
∂yl
∂xi
{z
} |
{z
}
| {z }
|
∈Rm×n
∈Rm×m
∈Rm×n
Beweis: 1) Existenz von ϕ (Auflösung der Gleichung f (x, y) = 0 nach
(y1 , . . . , ym ):
Wir definieren F : U ⊂ Rn × Rm −→ Rn × Rm durch F (x, y) = (x, f (x, y)).
Dann ist F eine C 1 -Funktion und nach Vorausetzung ist
242
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen

1n


det(DF (a, b)) = det 
(∗)
∂f1
∂y1
0
...
∂fm
∂y1
...
..
.

∂f1

∂ym 
..  (a, b) 6= 0
. 
∂fm
∂ym
Nach dem Satz über die Umkehrabbildung (Satz 6.15) existieren eine offene Umgebung Ũ(a, b) ⊂ U und eine offene Umgebung Ṽ ⊂ Rn × Rm von
F (a, b) = (a, 0), so dass F|Ũ : Ũ −→ Ṽ ein C 1 -Diffeomorphismus ist.
Da (a, 0) ∈ Ṽ ist, können wir eine zusammenhängende offene Umgebung
A(a) ⊂ Rn und einen offenen Würfel (−ε, ε)m ⊂ Rm wählen, so dass
V ′ := A × (−ε, ε)m ⊂ Ṽ ist.
Sei nun U ′ := F −1 (V ′ ) ⊂ Ũ ⊂ Rn × Rm . Dann ist F|U ′ : U ′ −→ V ′ ein
C k -Diffeomorphismus. Wir betrachten F −1 : V ′ −→ U ′ ⊂ Rn × Rm mit
F −1 =: (F1 , F2 ). Dann erhalten wir
↑
Rn
↑
Rm
Def.
(x, y) = F F −1 (x, y) = F (F1 (x, y), F2 (x, y)) = (F1 (x, y), f (F1 (x, y), F2 (x, y))).
Damit gilt
F1 (x, y) = x
f (x, F2 (x, y)) = y,
∀ (x, y) ∈ V ′ .
(∗)
Weiterhin gilt F (a, b) = (a, f (a, b)) = (a, 0) und daher
(a, b) = F −1 (a, 0) = (F1 (a, 0), F2 (a, 0)) = (a, F2 (a, 0)).
Also ist
b = F2 (a, 0).
(∗∗)
Wir definieren nun ϕ : A ⊂ Rn −→ Rm durch ϕ(x) = F2 (x, 0). Dann ist
ϕ(a) = b wegen (∗∗) und f (x, ϕ(x)) = 0 wegen (∗) für alle x ∈ A.
2) Eindeutigkeit von ϕ.
Angenommen ϕ̃ : A ⊂ Rn −→ Rm wäre eine weitere Funktion mit ϕ̃(a) = b
und f (x, ϕ̃(x)) = 0 für alle x ∈ A. Dann wäre einerseits
Def.
F (x, ϕ(x)) = (x, f (x, ϕ(x))) = (x, 0),
aber andererseits wäre auch
Def.
F (x, ϕ̃(x)) = (x, f (x, ϕ̃(x))) = (x, 0).
Da F auf Ũ injektiv ist, folgt ϕ(x) = ϕ̃(x) für alle x ∈ A.
6.5 Implizite Funktionen
243
3) Wenn f eine C k -Funktion ist, dann ist nach Definition auch F eine C k Funktion und daher nach dem Umkehrsatz auch F −1 C k . Nach Definition ist
dann auch F2 C k und wegen ϕ(x) = F2 (x, 0) ist auch ϕ eine C k -Funktion. Da
f mindestens C 1 ist, ist ϕ auf jeden Fall differenzierbar.
4) Zur Formel für die partiellen Ableitungen:
Wir wenden die Kettenregel für partielle Ableitungen an auf
f (x, ϕ(x)) = f (x1 , . . . , xn , ϕ1 (x1 , . . . , xn ), . . . , ϕm (x1 , . . . , xn )) = 0
und erhalten
∂
(fk (x, ϕ(x)))
∂xi
n
m
X
∂fk
∂xj X ∂fk
∂ϕl
=
(x, ϕ(x)) ·
(x, ϕ(x)) ·
(x)
+
∂x
∂x
∂y
∂xi
j
i
l
j=1
|{z} l=1
0=
=δij
=
∂fk
(x, ϕ(x)) +
∂xi
m
X
∂fk
l=1
∂yl
(x, ϕ(x)) ·
∂ϕl
(x),
∂xi
oder in Matrixschreibweise
∂fk
∂ϕl
∂fk
(x, ϕ(x)) =
(x, ϕ(x)) ◦
(x) .
−
∂xi
∂yl
∂xi
Daher gilt für die Ableitungen von ϕ
−1 ∂fk
∂fk
∂ϕl
(x) = −
(x, ϕ(x))
(x, ϕ(x)) .
◦
∂xi
∂yl
∂xi
⊓
⊔
Beispiel 6.14
Wir betrachten die Funktion f : R2 −→ R mit f (x, y) = x2 + y 2 − 1. Dann
erhalten wir {(x, y) ∈ R2 | f (x, y) = 0} = S 1 und ∂f
∂y = 2y. Man kann den
Satz über implizite Funktionen auf (x0 , y0 ) ∈ S 1 und y0 6= 0 anwenden.
√
(1) Ist y0 > 0, so existiert ϕ : (−1, 1) −→ R, ϕ(x) := 1 − x2 , so dass
f (x, ϕ(x)) = 0 und ϕ(x0 ) = y0 .
√
(2) Ist y0 < 0, so existiert ϕ : (−1, 1) −→ R, ϕ(x) = − 1 − x2 , so dass wie in
(1) f (x, ϕ(x)) = 0 und g(x0 ) = y0 .
244
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Anwendung
Erinnerung:
Der Tangentialraum Tp M an einen Punkt p der Fläche M ⊂ Rn ist folgendermaßen definiert:
Tp M := {v ∈ Rn | ∃ differenzierbare Kurve γ : (−ε, ε) → M mit γ(0) = p
und γ ′ (0) = v}.
Satz 6.17 Sei F : U ⊂ Rn → R eine differenzierbare Funktion und Mc =
{x ∈ U | F (x) = c} ⊂ Rn eine Niveaufläche von F . Ist grad F (p) 6= 0 für alle
p ∈ Mc , so gilt für den Tangentialraum
Tp Mc = grad F (p)⊤ = {v ∈ Rn | hv, grad F (p)i = 0}
für alle p ∈ Mc .
Beweis: Sei p ∈ Mc . Nach Voraussetzung ist grad F (p) 6= 0. Deshalb existiert
∂F
(p) 6= 0. OBdA sei dies die n-te Koordinate, es sei
eine Koordinate xj mit ∂x
j
also xj = xn (sonst kann man die Koordinaten umsortieren). Wir definieren
p̂ durch p = (p̂, pn ) und x̂ durch x = (x̂, xn ). Nach dem Satz über implizite
Funktionen kann man F (x) = c nach der Variable xn auflösen, d.h., es existieren eine Umgebung A(p̂) und eine differenzierbare Funktion ϕ : A(p̂) → R
mit
F (x1 , . . . , xn−1 , ϕ(x1 , . . . , xn−1 )) = c, ∀ x̂ ∈ A(p̂).
Daher existiert eine Umgebung M̂c (p) ⊂ Mc mit
M̂c (p) = graph(ϕ) = {(x̂, ϕ(x̂)) | x̂ ∈ A}
und aufgrund der lokalen Definition des Tangentialraums durch Kurven gilt
ÜA
Tp Mc = Tp M̂c = {(v̂, vn ) | v̂ ∈ Rn−1 , vn = hv̂, grad ϕi}
= {(v1 , . . . , vn−1 ,
n−1
X
i=1
|
∂ϕ
(p̂))}.
∂xi
{z
}
vi ·
vn
Wir werden nun zeigen, dass v = (v1 , . . . , vn ) genau dann in Tp Mc enthalten
ist, wenn hv, grad F (p)i = 0 ist. Wie im Beweis von Satz 6.16 folgt aus der
Kettenregel
∂F
∂F
∂ϕ
(p) · 1 +
(p) ·
(b
p) = 0,
∂xi
∂xn
∂xi
bzw.
6.5 Implizite Funktionen
245
∂F
∂
1
·
(b
p) = − ∂F
(p)
∂xi
∂xi
∂x (p)
n
für alle i = 1, . . . , n − 1. Eingesetzt in den obigen Ausdruck für vn ergibt sich
vn =
n−1
X
i=1
Daraus folgt
vi ·
n−1
X
∂ϕ
∂F
1
vi ·
(p̂) = − ∂F
(p).
·
∂xi
∂xi
∂x (p) i=1
n
n−1
0 = vn ·
Also gilt
X
∂F
1
vi ·
(p) = hv, grad F (p)i.
+
∂F
∂x
(p)
i
∂xn
i=1
Tp Mc = {v ∈ Rn | hv, grad F (p)i = 0}.
⊓
⊔
Beispiel 6.15
Kann man die Gleichung
f (x, y, z) = x2 + y 2 + z 2 + 3xyz + x3 z 2 + yz 4 = 1
in einer Umgebung von p = (0, 0, 1) nach z auflösen ? Wie sieht grad z(0, 0)
aus ? Genauer: Existiert eine differenzierbare Funktion z(x, y) mit
z(0, 0) = 1,
f (x, y, z(x, y)) = 1,
und falls ja, was ist grad z(0, 0) =
∂z
∂z
(0, 0), ∂y
)
( ∂x
(∗)
?
1) Wir berechnen die partielle Ableitung von f nach z
∂f
(x, y, z) = 2z + 3xy + 2zx3 + 4yz 3
∂z
Also ist ∂f
∂z (0, 0, 1) = 2 6= 0. Da auch f (0, 0, 1) = 1 gilt, existiert also eine
Funktion z : U (0, 0) ⊂ R2 → R mit (∗).
2) Mit Hilfe der in Satz 6.16,iv) angegebenen Formel folgt für den Gradienten
von z an der Stelle (x, y) = (0, 0)
∂z
∂z
grad z(0, 0) =
(0, 0),
(0, 0)
∂x
∂y
−1 ∂f
∂f
∂f
=−
(0, 0, 1)
(0, 0, 1),
(0, 0, 1)
·
∂z
∂x
∂y
1
= − 2x + 3xy + 3x2 z, 2y 2 + 3xz + z 4 (0, 0, 1)
2
1
= 0, −
2
246
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
3) Wir betrachten nun die Hyperfläche M = {f (x, y, z) = 1}.
grad f = 2x + 3yz + 3x2 z 2 , 2y + 3xz + z 4 , 2z + 3xy + 2x3 z + 4yz 3 .
Also ist
grad f (0, 0, 1) = (0, 1, 2).
Daher ist grad f (x, y, z) 6= 0 in einer Umgebung von p = (0, 0, 1) und der
Tangentialraum Tp M an M im Punkt p ist die Menge aller Vektoren v ∈ R3 ,
die orthogonal zu grad f (0, 0, 1) sind:
Tp M := {v ∈ R3 | hv, (0, 1, 2)i = 0}
   
1
0
= span 0 ,  2 
0
−1
Es gibt aber auch eine andere Möglichkeit, Tp M zu bestimmen: Wie wir gesehen haben, ist M in einer Umgebung des Punktes p = (0, 0, 1) als Graph der
Funktion z : U (0, 0) ⊂ R2 → R darstellbar. Der Tangentialraum Tp M ist nun
charakterisiert durch
v
Tp M = {(v1 , v2 , v3 ) | v1 , v2 ∈ R, v3 = h 1 , grad z(0, 0)i}
v2
1
= {(v1 , v2 , − v2 ) | v1 , v2 ∈ R}
2  
 
1
0
= span 0 ,  2  .
0
−1
6.6 Extrema unter Nebenbedingungen
Sei f : U ⊂ Rn −→ R eine Funktion. Oft benötigt man das Extremwertverhalten von f , wenn die Variablen einer Nebenbedingung unterworfen sind. Sei
zum Beispiel K ⊂ U ⊂ R3 ein Gegenstand und f : U → R eine Temperaturverteilung. Dann können wir untersuchen, welches die größte Temperatur ist,
die auf K angenommen wird und in welchem Punkt aus K dieser Maximalwert angenommen wird, dh. wir suchen max{f (x) | x ∈ K}.
Die Nebenbedingungen seien in der Form eines Gleichungssystems
g1 (x1 , . . . , xn ) = 0
..
.
gm (x1 , . . . , xn ) = 0
gegeben, d.h. die Nebenbedingungen seien charakterisiert durch die Nullstellenmenge der Funktion g = (g1 , . . . , gm ) : U ⊂ Rn −→ Rm .
6.6 Extrema unter Nebenbedingungen
247
Definition 6.12. f nimmt in einem Punkt p ∈ Ng := {x ∈ U | g(x) = 0} ein
lokales Maximum (Minimum) unter der Nebenbedingung g(x) = 0 an, falls
ein ε > 0 existiert, so dass
f (x) ≤ f (p)
(f (x) ≥ f (x0 ))
∀ x ∈ K(p, ε) ∩ Ng .
Erinnerung: Hat f : U ⊂ Rn −→ R, f ∈ C 1 , ein lokales Extremum in p ∈ U ,
so ist grad f (p) = 0.
Satz 6.18 (Notwendige Bed. für Extrema unter Nebenbedingungen)
Seien f : U ⊂ Rn −→ R und g : U ⊂ Rn −→ Rm , m ≤ n, C 1 -Funktionen und
p ∈ U mit
∂gj
(p) = m.
rang (Dg(p)) = rang
∂xi
Hat f in p ein lokales Extremum unter der Nebenbedingung g(x) = 0, dann
existieren Konstanten λ1 , . . . , λm ∈ R, so dass
grad f (p) = λ1 grad g1 (p) + . . . + λm grad gm (p)
gilt. Die (λ1 , . . . , λm ) heißen Lagrange–Multiplikatoren.
Beweis: Da rg(Dg(p)) = m ist, können wir OBdA voraussetzen, dass
 ∂g1

det 
∂x1 (p)
...
∂gm
∂x1 (p)
...
..
.

∂g1
∂xm (p)
..
.

 6= 0,
∂gm
∂xm (p)
ist. (Anderenfalls ordnen wir die (x1 , . . . , xn ) so um, dass die ersten m Spalten
von Dg(p) linear unabhängig sind.) Dann hat das lineare Gleichungssystem
m
X
v=1
λv ·
∂f
∂gv
(p) =
(p),
∂xi
∂xi
i = 1, . . . , m,
(1)
genau eine Lösung (λ1 , . . . , λm ) ∈ Rm . Dies ist ein Teil (er enthält die ersten
m der insgesamt n Komponenten von grad f ) der gesuchten Gleichung
grad f (p) =
m
X
v=1
λv · grad gv (p)
(∗).
Es ist noch zu zeigen, dass (1) auch für die Komponenten i = m + 1, . . . , n
erfüllt ist.
Wir definieren p =: (p̂, p′ ) mit p̂ = (p1 , . . . , pm ) und p′ = (pm+1 , . . . , pn ) und
analog x =: (x̂, x′ ) mit x̂ = (x1 , . . . , xm ) und x′ = (xm+1 , . . . , xn ). Nach dem
Satz über implizite Funktionen kann man
248
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
g(x1 , . . . , xm , xm+1 , . . . , xn ) = 0
| {z } |
{z
}
x′
x̂
in einer Umgebung A(p′ ) nach x1 , . . . , xm auflösen, d.h., es existieren C 1 Funktionen
ϕ1 , . . . , ϕm =: ϕ : A(p′ ) −→ Rm
mit
g(ϕ1 (xm+1 , . . . , xn ), . . . , ϕm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) = 0
und ϕ(p′ ) = p̂. Dann gilt nach der Kettenregel für
0=
m
X
∂gv
xi
i=1
bzw.
(p) ·
∂
∂xµ
∂ϕi ′
∂gv
(p ) +
(p),
∂xµ
xµ
m
X
∂gv
∂gv
∂ϕi ′
(p) = −
(p) ·
(p ).
xµ
xi
∂xµ
i=1
(2)
Wir betrachten nun die folgende Funktion F : A(p′ ) → R
F (xm+1 , . . . , xn ) := f (ϕ1 (x′ ), . . . , ϕm (x′ ), xm+1 , . . . , xn ).
{z
}
|
x′
Nach Voraussetzung hat f in p = (ϕ(p′ ), p′ ) ein lokales Extremum und daher F
in p′ ein lokales Extremum. Folglich ist grad F (p′ ) = 0 und mit der Kettenregel
folgt
m
0=
bzw.
X ∂f
∂F ′
∂ϕi ′
∂f
(p ) =
(p) ·
(p ) +
(p) = 0,
∂xµ
∂x
∂x
∂x
i
µ
µ
i=1
m
X
∂f
∂f
∂ϕi ′
(p) = −
(p) ·
(p ),
∂xµ
∂xi
∂xµ
i=1
∀ µ = m + 1, . . . , n.
∀ µ = m + 1, . . . , n.
(3)
Mit (1) und (2) nacheinander in (3) eingesetzt, ergibt sich
m
m
XX
∂gv
∂ϕi ′
∂f
(p) = −
λv ·
(p) ·
(p )
∂xµ
∂x
∂x
i
µ
i=1 v=1
=
m
X
v=1
λv ·
∂gv
(p)
∂xµ
∀ µ = m + 1, . . . , n.
Die letzte Gleichung und Gleichung (1) zusammen liefern
grad f (p) =
m
X
v=1
λv · grad gv (p).
⊓
⊔
6.6 Extrema unter Nebenbedingungen
249
Anwendung
Wir betrachten die C 1 -Funktion g : U ⊂ Rn → Rm , m ≤ n und einen Punkt
p ∈ Ng = {x ∈ U | g(x) = 0}, so dass rang(Dg(p)) = m ist. Sei ein lokaler
Extremwert von f : U ⊂ Rn −→ R unter der Nebenbedingung g(x) = 0, so
existiert ein (λ1 , . . . , λm ) ∈ Rm , so dass
(p1 , . . . , pn , λ1 , . . . , λm ) ∈ Rn × Rm
| {z }
p
eine Lösung des folgenden Gleichungssystems ist
m
X
∂gv
∂f
λv ·
(p) =
(p) ∀ j = 1, . . . , n
∂xj
∂xj
v=1
g1 (p) = 0,
..
.
gm (p) = 0.
Dieses Gleichungssystem mit n + m–Gleichungen und n + m–Unbekannten
heißt Lagrangesches Gleichungssystem. Betrachtet man die Funktion
F (x1 , . . . , xn , λ1 , . . . , λm ) := f (x) −
m
X
λi gi (x),
i=1
dann ist das Lagrangesche Gleichungssystem äquivalent zum Gleichungssystem
∂F
(p, λ) = 0 ∀i = 1, . . . , n,
∂xi
∂F
(p, λ) = 0, ∀j = 1, . . . , m. (∗).
∂λj
Man findet also die lokalen Extrema von f unter der Nebenbedingung g(x) = 0
unter den Lösungen des Lagrangeschen Gleichungssystems (∗).
Aber nicht jede Lösung (p, λ) des Lagrangeschen Gleichungssystems liefert ein
lokales Extremum p von f unter der Nebenbedingung g(x) = 0. Man muss für
jede Lösung (p, λ) des Lagrangeschen Gleichungssystems extra untersuchen,
ob p tatsächlich ein lokales Extremum ist.
Ist die Nullstellenmenge Ng = {x ∈ U | g(x) = 0} kompakt, so existieren
max f|Ng und min f|Ng . Somit müssen zwei der Lösungen des Lagrangeschen
Gleichungssystems diese Punkte liefern.
250
6 Differentialrechnung für Abbildungen mehrerer reeller Variablen
Beispiel 6.16
Wir bestimmen Maxima und Minima von f (x, y) = x · y auf S 1 = {(x, y) ∈
R2 | x2 + y 2 = 1}.
1) Die Nebenbedingung lautet also g(x, y) = x2 + y 2 − 1 = 0 und wir erhalten
∂g ∂g
,
Dg =
= (2x, 2y) 6= 0 auf S 1 .
∂x ∂y
Daraus folgt rang(Dg)(p) = 1 für alle p ∈ S 1 .
2) Nun bestimmen wir die Lösungen des Lagrangeschen Gleichungssystems
für die Funktion
F (x, y, λ) := f (x, y) − λg(x, y) = x · y − λx2 − λy 2 + λ.
Das Lagrangesche Gleichungssystem lautet daher
∂F
= y − 2λx = 0
∂x
∂F
= x − 2λy = 0,
∂y
∂F
= −x2 − y 2 + 1 = 0.
∂λ
Wir multiplizieren die erste Gleichung mit x, die zweite Gleichung mit y und
subtrahieren die zweite der entstehenden Gleichungen von der ersten. Das
ergibt λx2 = λy 2 . λ muss ungleich 0 sein, denn sonst wäre (x, y) = (0, 0) 6∈ S 1 .
Somit gilt x2 = y 2 und daher |x| = |y|. Mit der
q g(x, y) = 0
q Nebenbedingung
ergibt sich 2x2 = 2y 2 = 1. Folglich ist x = ± 12 und y = ± 12 . Damit sind
die einzig möglichen Punkte für die lokalen Extrema
1
1
1
1
1
1
1
1
√ ,√
(x0 , y0 ) ∈
, √ , −√
, −√ , √
, −√ , −√
2
2
2
2
2
2
2
2
mit den Funktionswerten

1
2
f (x, y) =
− 1
2
(x, y) =
√1 , √1
2 2 ± √12 , − √12 .
(x, y) = ±
Da S 1 kompakt ist, existieren max(f|S1 ) und min(f|S1 ). Somit ist
1
1
1
1
1
, −√ , −√
,
und wird angenommen in √ , √
max(f|S1 ) =
2
2
2
2
2
1
1
1
1
1
und wird angenommen in − √ , √
min(f|S1 ) = −
, √ , −√
.
2
2
2
2
2
Weitere lokale Extremwerte treten nicht auf.
6.6 Extrema unter Nebenbedingungen
251
Beispiel 6.17
Wir bestimmen den Punkt auf der Ebene E = {(x, y, z) ∈ R3 | z = x + y},
der den kleinsten Abstand zum Punkt P = (1, 0, 0) hat. Dazu betrachten wir
das Quadrat der Abstandsfunktion
f (x, y, z) := d((x, y, z), P )2 = k(x − 1, y, z)k2 = (x − 1)2 + y 2 + z 2
mit der Nebenbedingung g(x, y, z) = z − (x + y) = 0. Es gilt
∂g ∂g ∂g
= (−1, −1, 1) 6= 0 ∀ (x, y, z) ∈ E.
,
,
(Dg)(x, y, z) =
∂x ∂y ∂z
Wir definieren die Abbildung
F (x, y, z) := f (x, y, z) − λg(x, y) = f (x, y, z) − λ(z − (x + y))
= (x − 1)2 + y 2 + z 2 − λz + λx + λy.
Dann ergibt sich als Lagrangesches Gleichungssystem
(1)
(2)
(3)
(4)
∂F
∂x
∂F
∂y
∂F
∂z
∂F
∂λ
= 2(x − 1) + λ = 0
= 2y + λ = 0
= 2z − λ = 0
= x + y − z = 0.
Aus den Gleichungen (2) und (3) folgt y + z = 0. Daher folgt aus der Nebenbedingung (4), dass y = − x2 gelten muss und daher λ = x, woraus x = 32 folgt.
Die einzige Lösung
des Lagrangeschen Gleichungssystems ist somit (x, y, z, λ) =
1 1 2
2
,
−
,
,
.
Da
E
abgeschlossen ist, existiert ein Punkt Q ∈ E mit d(P, Q) =
3
3 3 3
d(P, E). Wir haben diesen Punkt Q = ( 32 , − 31 , 13 ) gefunden.
Bemerkung: In diesem Beispiel ist die Nebenbedingung schon in expliziter Form gegeben als z = x + y. Dadurch könnte man hier auch einfacher
vorgehen und die Nebenbedingung z = x + y gleich in die zu minimierende
Funktion f (x, y, z) = (x − 1)2 + y 2 + z 2 einsetzen und dann das Minimum der
entstehenden Funktion
h(x, y) := f (x, y, x + y) = (x − 1)2 + y 2 + (x + y)2
untersuchen.
7
Integralrechnung für Funktionen einer reellen
Variablen
Die Integralrechnung wird durch zwei verschiedene Problemstellungen motiviert:
1. Die Umkehrung der Differentialrechnung: Gegeben sei f : I ⊂ R −→ E
und gesucht wird F : I ⊂ R −→ E, so dass F ′ = f gilt. Wie kann man
zum Beispiel den Bewegungsablauf F eines Massepunktes ermitteln, wenn
man dessen Geschwindigkeit f kennt?
2. Wie kann man den Flächeninhalt von Teilmengen von Rn definieren und
berechnen?
7.1 Stammfunktionen und ihre Berechnung
Definition 7.1. Sei E ein normierter Vektorraum, I ⊂ R ein beliebiges Intervall und f : I ⊂ R −→ E eine Abbildung. Eine Abbildung F : I ⊂ R −→ E
heißt Stammfunktion von f auf I, falls F differenzierbar ist und F ′ = f gilt.
Satz 7.1 Sei F : I ⊂ R −→ E eine Stammfunktion von f : I ⊂ R −→ E.
Dann ist F̃ : I ⊂ R −→ E genau dann eine Stammfunktion von f , wenn ein
konstanter Vektor c ∈ E existiert, so dass gilt F̃ = F + c.
Beweis: (⇐) Ist F̃ = F + c, so ist F̃ differenzierbar und es gilt F̃ ′ = F ′ = f .
(⇒) Sei F̃ eine Stammfunktion von f . Dann ist F̃ − F differenzierbar und
(F̃ − F )′ = 0. Mit dem Mittelwertsatz folgt dann, dass F̃ − F eine konstante
Funktion ist.
⊓
⊔
Definition 7.2.
S(I; E) := {f : I ⊂ R −→ E | f besitzt eine Stammfunktion auf I}.
254
7 Integralrechnung für Funktionen einer reellen Variablen
Beispiel 7.1
Die Existenz einer Stammfunktion ist vom Intervall I abhängig. Betrachten
wir zum Beispiel die Funktion
f : R −→ R
x 7→ f (x) =
(
1
x
0
x 6= 0
x = 0.
Auf R existiert keine Stammfunktion: Angenommen, F sei eine Stammfunktion von f auf R. Da (ln x)′ = x1 gilt, würde für F folgen
F|(0,∞) = ln x + c,
F|(−∞,0) = ln(−x) + ĉ,
c, ĉ ∈ R.
Wäre F auf ganz R definiert, so müsste F in x = 0 stetig sein, aber ln x
konvergiert für x gegen 0 gegen −∞.
Aber für jedes Intervall I mit 0 6= I ist F (x) = ln |x| + c eine Stammfunktion
von f auf I.
Bemerkung: Später (siehe Satz 7.10) werden wir zeigen, dass jede stetige
Funktion f : [a, b] −→ E, wobei E ein Banachraum ist, eine Stammfunktion
hat, das heißt C([a, b]; E) ⊂ S([a, b]; E).
Definition 7.3. Sei f ∈ S(I; E). Unter dem unbestimmten Integral von f
auf I versteht man die Menge aller Stammfunktionen von f .
Bezeichnung:
Z
f (x) dx := {F : I ⊂ R −→ E | F Stammfunktion von f auf I}
f heißt der Integrand und x die Integrationsvariable.
Ist F eine StammfunkR
tion von f , so benutzt man die Schreibweise f (x) dx = F (x) + c auf I.
Beispiel 7.2
Ist f : I ⊂ R −→ E differenzierbar, so besitzt f ′ eine Stammfunktion, das
heißt f ′ ∈ S(I; E) und es gilt
Z
f ′ (x) dx = f (x) + c auf I.
7.1 Stammfunktionen und ihre Berechnung
255
Wichtige Grundintegrale (Beweis durch Ableiten der Stammfunktion):
(1)
Z
xα dx =
(2)
Z
1
dx = ln |x| + c auf (0, ∞) und (−∞, 0),
x
Z
1
xα+1 + c. Dies gilt für α ∈ N auf R, α ∈ −N\{−1} auf
α+1
(−∞, 0) sowie (0, ∞) und α ∈ R\{Z} auf (0, ∞),
ex dx = ex + c auf R,
Z
Z
(4)
cos x dx = sin x + c,
sin x dx = − cos x + c auf R,
Z
Z
(5)
cosh x dx = sinh x + c,
sinh x dx = cosh x + c auf R,
(3)
Z
1
dx = arctan x + c auf R,
1 + x2
(
Z
1
1 1 + x artanh(x) + c auf (−1, 1)
(7)
dx = ln +c=
,
1 − x2
2
1 − x
arcoth(x) + c auf (−∞, −1) ∪ (1, ∞)
Z
1
√
dx = arsinh(x) + c auf R,
(8)
1 + x2
Z
1
√
(9)
dx = arcsin x + c auf (−1, 1),
1 − x2
(
Z
p
1
arcosh(x) + c
auf (1, ∞)
√
(10)
dx = ln |x + x2 − 1| + c =
−arcosh(−x) + c auf (−∞, −1)
x2 − 1
Z
e(a+ib)x
+ c auf R für a + ib 6= 0,
(11)
e(a+ib)x dx =
(a + ib)
Z
dx
x−a
(12)
+ c für b 6= 0,
= ln |x − (a + ib)| + i · arctan
(x − (a + ib))
b
Z
1
1
dx
=−
+ c für n ∈ N, n > 1.
·
(13)
(x − (a + ib))n
n − 1 (x − (a + ib))n−1
(6)
Satz 7.2 (Rechenregeln für unbestimmte Integrale)
(1) Sei f, g ∈ S(I; E), µ, λ ∈ R. Dann ist auch λf + µg ∈ S(I; E) und es gilt
Z
Z
Z
(λf (x) + µg(x)) dx = λ f (x) dx + µ g(x) dx.
(2) Partielle Integration: Seien f, g : I ⊂ R −→ E differenzierbar und f · g ′ ∈
S(I; E). Dann gilt f ′ · g ∈ S(I; E) und
256
7 Integralrechnung für Funktionen einer reellen Variablen
Z
′
f (x)g (x) dx +
Z
f ′ (x)g(x) dx = f (x)g(x) + c.
(3) Substitutionsregel: g ∈ S(I; E) habe die Stammfunktion G, f : J ⊂ R −→
I ⊂ R sei differenzierbar. Dann hat (g ◦ f ) · f ′ : J ⊂ R −→ E die Stammfunktion G∗ = G ◦ f , das heißt
Z
Z
g(f (x)) · f ′ (x) dx = g(y) dy y=f (x) .
|{z} | {z }
y
dy
(Formal schreibt man: y = f (x), dy = f ′ (x) dx.)
(4) f = (f1 , f2 ) ∈ S(I; E1 × E2 ) gilt genau dann, wenn fi ∈ S(I; Ei ) für
i ∈ {1, 2} ist, und es gilt dann
Z
Z
Z
f (x) dx =
f1 (x) dx, f2 (x) dx .
Beweis: Folgt aus den Rechenregeln für die Ableitung (Produktregel, Kettenregel, komponentenweises Differenzieren).
⊓
⊔
Beispiel 7.3
Sei f : I ⊂ R −→ R eine differenzierbare Funktion ohne Nullstellen auf I.
Dann gilt
Z ′
f (x)
dx = ln |f (x)|,
f (x)
denn nehmen wir die Substitution y = f (x), dy = f ′ (x) dx vor, so erhalten
wir
Z
Z ′
dy f (x)
dx =
= ln |y|y=f (x) = ln |f (x)|.
y=f
(x)
f (x)
y
So ist zum Beispiel
Z
Z
π π
sin x
.
dx = − ln (cos x) + c auf − ,
tan x dx =
cos x
2 2
Beispiel 7.4
Gelgentlich ist das Einfügen einer 1 nützlich:
Z
Z
Z
part. Int.
ln(x) dx =
ln(x) · 1 dx = − ln′ (x) ·x dx + ln(x) · x + c
| {z }
1
=x
= −x + x · ln(x) + c auf (0, ∞).
7.1 Stammfunktionen und ihre Berechnung
257
Beispiel
R dx 7.5
x
x
Um 1+e
x zu berechnen, substituieren wir y = e , dy = e dx = y dx. Dann
ist
Z
Z Z
1 1
1
1
dx
dy y=ex
=
dy =
−
x
1+e
1+yy
y 1+y
= ln y − ln (y + 1) + cy=ex = |{z}
ln ex − ln ex + 1 + c
=x
= x − ln ex + 1 + c auf R.
Beispiel 7.6 R
Wie wird In := sinn x dx berechnet?
Z
In
=
− sinn−1 x · cos′ x dx
Z
d
part. Int.
=
− sinn−1 x · cos x +
sinn−1 x · cos x dx
dx
Z
n−1
=
− sin
x · cos x + (n − 1) sinn−2 x 1 − sin2 x dx
=
− sinn−1 x · cos x − (n − 1)In + (n − 1)In−2 .
Es folgt
n−1
1
sinn−1 x · cos x +
In−2 für n ≥ 2.
n
n
wobei I0 = x + c und I1 = − cos x + c ist.
In = −
Für Jn :=
R
cosn x dx berechnet man analog
Jn =
1
n−1
cosn−1 x · sin x +
Jn−2 für n ≥ 2
n
n
mit J0 = x + c und J1 = sin x + c.
Integrale rationaler Funktionen
Seien P, Q ∈ C[z] Polynome, Q ≡
6 0. Wir betrachten ein Intervall I ⊂ R, auf
dem Q keine Nullstelle hat und definieren
f : I ⊂ R −→ C.
x 7→ f (x) :=
P (x)
Q(x)
Dann heißt f komplexe rationale Funktion. Sind speziell P, Q ∈ R[z] ⊂ C[z]
Polynome über R, so heißt f reelle, rationale Funktion.
Unser Ziel ist nun die Berechnung von
R
P (x)
Q(x)
dx.
258
7 Integralrechnung für Funktionen einer reellen Variablen
Satz 7.3 (Fundamentalsatz der Algebra) Jedes komplexe Polynom Q ∈
C[z] vom Grad > 0 hat mindestens eine Nullstelle, das heißt, es existiert ein
ξ ∈ C mit Q(ξ) = 0.
Beweis: Sei Q ∈ C[z] mit Grad Q = n ≥ 1 gegeben. Dann gilt
Q(z) = an z n + an−1 z n−1 + . . . + a1 z + a0 ,
an 6= 0, aj ∈ C
∀ j ∈ {1, . . . , n}.
(1) Sei α > 0 gegeben. Zuerst zeigen wir, dass ein r > 0 existiert, so dass für
e
alle |z| ≥ r die Abschätzung |Q(z)| ≥ α gilt. Wir definieren dazu Q(x)
durch
a0 1
an−1 1
+ ...+
Q(z) = an z n 1 +
, z 6= 0.
a z
an z n
| n
{z
}
e
=:Q(z)
a0 +
.
.
.
+
Sei nun β := 1 + an−1
an ≥ 1. Für |z| ≥ 2β folgt dann
an
a0 1
a0 1
an−1 an−1 1
e
+ . . . + + ...+ n ≤ |Q(z)| ≤ an |z|
an |z|
an an
|z|
≤β·
1
1
≤ .
|z|
2
e
Es folgt |1 + Q(x)|
≥
1
2
und
|Q(z)| = |an z n | · |1 + Q̃(z)| ≥
Setzen wir r := max{2β,
2α
|an |
n1
1
|an | · |z|n für alle |z| ≥ 2β.
2
}, dann folgt aus |z| ≥ r, dass |Q(z)| ≥ α gilt.
(2) Wir zeigen, dass ein ξ ∈ C existiert, so dass Q(ξ) = 0. Sei A :=
{|Q(z)| | z ∈ C} ⊂ R. Da |Q(z)| ≥ 0 gilt, ist A von unten beschränkt.
Somit existiert µ := inf A ≥ 0. Nach (1) existiert ein r > 0, so dass gilt
|Q(z)| ≥ µ + 1
∀ |z| ≥ r.
Also ist µ = inf{|Q(z)| | z ∈ C} = inf{|Q(z)| | |z| ≤ r}. Da K(0, r) ⊂ C
kompakt ist und die Funktion
q : C −→ R
z 7→ |Q(z)|
stetig ist, existiert ein Minimum von q auf K(0, r), das heißt, es existiert ein
ξ ∈ K(0, r) mit |Q(ξ)| = µ. Wir zeigen, dass Q(ξ) = 0 gilt. Wir nehmen an,
dass Q(ξ) 6= 0 ist und betrachten das Polynom in z vom Grad n
H(z) :=
Q(z + ξ)
.
Q(ξ)
7.1 Stammfunktionen und ihre Berechnung
259
Da |Q(ξ)| = min{|Q(z)| | z ∈ C} ist, gilt H(0) = 1 und |H(z)| ≥ 1 für alle
z ∈ C, und es folgt
H(z) = bn z n + . . . + bm z m + 1,
bm 6= 0, m ≥ 1, bj ∈ C
∀ j ∈ {m, . . . , n}.
m|
der Norm 1 existiert ein ψ ∈ R, so dass
Für die komplexe Zahl w := − |bbm
imψ
imψ
gilt w = e
, das heißt bm e
= −|bm |. Wir betrachten nun H auf den
komplexen Zahlen der Form z = ̺ · eiψ mit ̺ > 0. Dann gilt
|H(̺ · eiψ )| ≤ |bn | · ̺n + . . . + |bm+1 | · ̺m+1 + |1 + bm ̺m · eimψ | .
|
{z
}
=|1−|bm |·̺m |
Sei nun ̺ so klein gewählt, dass ̺m <
damit
1
|bm |
ist. Dann ist 1 − |bm |̺m > 0 und
|H(̺ · eiψ )| ≤ 1 − |bm | · ̺m + |bm+1 | · ̺m+1 + . . . + |bn | · ̺n
= 1 − ̺m (|bm | − |bm+1 | · ̺ − . . . − |bn | · ̺n−m ).
{z
}
|
>0 für ̺ hinreichend klein
Somit ist |H(̺ · eiψ )| < 1 für hinreichend kleine ̺. Dies ist ein Widerspruch zu
|H(z)| ≥ 1 für alle z ∈ C. Somit ist unsere Annahme falsch und Q(ξ) = 0. ⊓
⊔
Satz 7.4 (Zerlegungssatz für komplexe Polynome) Sei Q ∈ C[z] ein
Polynom vom Grad n ≥ 1 und seien ξ1 , . . . , ξm ∈ C alle verschiedenen Nullstellen von Q. Dann gilt
Q(z) = an z n + . . . + a1 z + a0 = an (z − ξ1 )ν1 · (z − ξ2 )ν2 · . . . · (z − ξm )νm ,
wobei νj ∈ N eindeutig bestimmte natürliche Zahlen sind und n = ν1 +. . .+νm .
Bemerkung: νj heißt die Vielfachheit der Nullstelle ξj . Q hat genau n Nullstellen (gezählt mit Vielfachheit).
Beweis: Sei Q(ξ1 ) = 0. Wir betrachten das Polynom
qk (z) := z k−1 + z k−2 · ξ1 + . . . + z · ξ1k−2 + ξ1k−1 .
Dann gilt z k − ξ1k = (z − ξ1 ) · qk (z) und folglich
Q(z) = Q(z) − Q(ξ1 ) = a1 (z − ξ1 ) + a2 (z 2 − ξ12 ) + . . . + an (z n − ξ1n )
= (a1 q1 (z) + . . . + an qn (z)) · (z − ξ1 )
=: Q1 (z) · (z − ξ1 ),
mit deg(Q1 ) = n − 1.
Ist n − 1 ≥ 1, so hat Q1 eine weitere Nullstelle und wir können einen weiteren
Linearfaktor von Q abspalten. Dies funktioniert n–mal.
⊓
⊔
260
7 Integralrechnung für Funktionen einer reellen Variablen
Satz 7.5 (Partialbruchzerlegung komplexer rationaler Funktionen)
P (z)
Sei f (z) = Q(z)
eine komplexe, rationale Funktion, wobei P, Q ∈ C[z] Polynome mit deg(P ) < deg(Q) sind. Q habe die verschiedenen Nullstellen ξ1 , . . . , ξm
mit der Vielfachheit ν1 , . . . , νm . Dann existieren Konstanten cjk ∈ C für alle
j ∈ {1, . . . , m}, k ∈ {1, . . . , νj }, so dass gilt
f (z) =
νj
m X
X
j=1 k=1
m
X
cjk
=
k
(z − ξj )
j=1
cjνj
cj1
cj2
+
+ ...+
z − ξj
(z − ξj )2
(z − ξj )νj
.
Beweis: Wir führen den Beweis durch Induktion nach deg(Q).
Ind.–Anfang: Sei deg(Q) = 1. Da nach Voraussetzung deg(P ) < deg(Q) gilt,
ist deg(P ) = 0 und somit P ≡ a0 =konstant. Ist ξ1 Nullstelle von Q, so era0
, das heißt c11 := ab10 .
halten wir f (z) = b1 (z−ξ
1)
e
e ≤ n−1
Ind.–Voraussetzung: Die Behauptung sei für alle fe = P mit deg(Q)
e
Q
bewiesen.
P
Ind.–Behauptung: Die Behauptung gilt für f = Q
mit deg(Q) = n.
Ind.–Beweis: Sei ξ1 eine Nullstelle von Q mit Vielfachheit ν1 . Dann folgt
Q(z) = (z − ξ1 )ν1 · S(z), wobei S(z) ∈ C[z] mit deg(S) = n − ν1 < n und
(ξ1 )
S(ξ1 ) 6= 0 gilt. Sei a := PS(ξ
. Dann gilt
1)
P (z)
P (z) − a · S(z)
a
. (∗)
=
−
Q(z) (z − ξ1 )ν1
(z − ξ1 )ν1 · S(z)
Nach Definition von a gilt P (ξ1 ) − aS(ξ1 ) = 0. Ist P − aS ≡ 0, so gilt die
Behauptung. Sei nun P − aS 6≡ 0. Dann kann man nach dem Zerlegungssatz
den Linearfaktor (z − ξ1 ) abspalten, das heißt P (z) − aS(z) = (z − ξ1 )S̃(z).
Es folgt
e
S(z)
a
P (z) (∗)
+
.
=
ν
1
Q(z)
(z − ξ1 )
(z − ξ1 )ν1 −1 · S(z)
Da deg(S(z) · (z − ξ1 )ν1 −1 ) = deg(S) + ν1 − 1 = n − 1 ist, kann man nach
Ind.–Voraussetzung den zweiten Summanden entsprechend der Behauptung
zerlegen. Da Q(z) = (z − ξ1 )ν1 S(z) kommen alle Nullstellen von Q vor und ξ1
mit einer Vielfachheit kleiner.
⊓
⊔
Bemerkung(Methoden zur Berechnung der Koeffizienten in der
Partialbruchzerlegung):
Sei f komplexe, rationale Funktion, das heißt
m
f (z) =
νj
cjk
P (z) X X
.
=
Q(z) j=1
(z − ξj )k
(∗∗)
k=1
(1) Multiplizieren wir f (z) mit Q(z), so können wir durch Koeffizientenvergleich die Konstanten cjk für j ∈ {1, . . . , m}, k ∈ {1, . . . , νj } berechnen.
7.1 Stammfunktionen und ihre Berechnung
261
(2) Indem wir n spezielle Werte für z einsetzen und das dadurch entstehende
lineare Gleichungssystem für cjk lösen, erhalten wir ebenfalls die Koeffizienten.
(3) Multiplizieren wir (∗∗) mit (z − ξj )νj , so erhalten wir
P (z)
νj
· (z − ξj )
.
cjνj = lim
z→ξj
Q(z)
Die restlichen Koeffizienten lassen sich wie in (1) oder (2) berechnen oder wir
betrachten
e
cjνj
P (z)
(∗∗) S(z)
,
=
−
ν
j
e
Q(z) (z − ξj )
Q(z)
das heißt, Q̃ hat ξj als (νj − 1)–fache Nullstelle. Dann lassen sich die cjνj −1
analog bestimmen.
Beispiel 7.7
Wir betrachten die komplexe rationale Funktion
f (z) =
z+1
P (z)
=
.
z4 − z3 + z2 − z
Q(z)
Dann sind offensichtlich ξ1 = 0, ξ2 = 1 Nullstellen von Q und es folgt
(z 4 − z 3 + zz2 )
Q(z)
=
= z 2 + 1.
z(z − 1)
(z 2 − z)
Somit sind die weiteren Nullstellen von Q gleich ±i und es gilt
f (z) =
c1
c2
c3
c4
+
+
+
.
z
z−1 z−i z+i
Zur Berechnung der Koeffizienten wenden wir Methode (3) an, das heißt
1
z+1
=
= −1,
c1 = lim
z→0 (z − 1)(z − i)(z + i)
−1 · (−i) · i
z+1
c2 = lim
= 1.
z→1 z(z − i)(z + i)
Durch analoges Rechnen erhält man c3 =
i
2
und c4 = − 2i . Somit gilt
1
1
i
i
f (z) = − +
+
−
.
z
z − 1 2(z − i) 2(z + i)
Satz 7.6 (Partialbruchzerlegung von reellen rationalen Funktionen)
Seien P, Q ∈ R[z] Polynome mit reellen Koeffizienten, deg(Q) > deg(P ).
(1) Ist ξ ∈ C eine echt–komplexe Nullstelle von Q mit der Vielfachheit ν, so
262
7 Integralrechnung für Funktionen einer reellen Variablen
ist auch ξ eine Nullstelle von Q mit der Vielfachheit ν, das heißt:
Die reellen Nullstellen von Q sind
x1 , . . . , xs mit Vielfachheit µ1 , . . . , µs .
Die echt-komplexen Nullstellen von Q sind
ξ1 , . . . , ξr mit Vielfachheit ν1 , . . . , νr
ξ1 , . . . , ξr mit Vielfachheit ν1 , . . . , νr ,
mit n = µ1 + . . . + µs + 2(ν1 + . . . + νr ).
(2) Die Partialbruchzerlegung von f (z) =
f (z) =
µj
s X
X
j=1 k=1
ν
r
l
XX
cjk
+
k
(z − xj )
l=1 k=1
P (z)
Q(z)
hat die Form:
Alk
Alk
+
(z − ξl )k
(z − ξl )k
,
cjk ∈ R.
Beweis: (1) Sei ξ ∈ C eine echt–komplexe Nullstelle von Q und Q ∈ R[z].
Dann ist Q(ξ) = 0 und Q(ξ) = 0 = Q(ξ). Folglich ist ξ Nullstelle von Q.
Spaltet man (z − ξ)(z − ξ) von Q ab, so folgt durch die Betrachtung des
Restpolynoms die Behauptung.
(2) Aus der Partialbruchzerlegung folgt für x ∈ R, x 6= xj
s
f (x) =
µj
r
ν
l
XX
P (x) X X
cjk
+
=
Q(x) j=1
(x − xj )k
k=1
l=1 k=1
Blk
Alk
+
(x − ξl )k
(x − ξl )k
.
Da f (x) = f (x) ist, gilt für x 6= xj , ξj , ξj
X
j,k
X
cjk
+
(x − xj )k
l,k
Blk
Alk
+
(x − ξl )k
(x − ξ)k
=
X
j,k
X
cjk
+
k
(x − xj )
l,k
Alk
Blk
+
(x − ξl )k
(x − ξl )k
.
Nun erhält man aus dem Identitätssatz für Potenzreihen: Seien λ1 , . . . , λm
verschiedene komplexe Zahlen, ajk ∈ C und für alle x ∈ R mit x 6= λj (j ∈
{1, . . . , m}) gelte
νj
m X
X
ajk
= 0.
(x
−
λj )k
j=1
k=1
Daraus folgt ajk = 0. Die Anwendung dieses Identitätssatzes liefert cjk =
cjk ∈ R und Alk = Blk .
⊓
⊔
7.1 Stammfunktionen und ihre Berechnung
263
Anwendung auf die Berechnung des Integrals rationaler
Funktionen
(1) Seien P, Q ∈ C[z], N S(Q)∩I = ∅ und f eine komplexe, rationale Funktion
auf I, das heißt
f : I ⊂ R −→ C
P (x)
.
x 7→
Q(x)
R
Gesucht ist f (x) dx auf I.
(a) Dividieren wir P durch Q so erhalten wir den Rest P2 ∈ C[z] mit deg(P2 ) <
deg(Q), das heißt, es gilt
f (x) = P1 (x) +
P2 (x)
.
Q(x)
2 (x)
vor.
(b) Nun nehmen wir die Partialbruchzerlegung von PQ(x)
(c) Auf I gilt
Z
1
x−a
+ ln |x − ξ| + c für ξ = a + ib, b 6= 0,
dx = i arctan
x−ξ
b
Z
1
dz = ln |x − ξ| + c für ξ ∈ R,
z−ξ
Z
1
1
1
dx = −
+ c für n ∈ N, n > 1.
(x − ξ)n
n − 1 (x − ξ)n−1
R
Folglich kann man f (x) dx vollständig berechnen.
(2) Seien P, Q ∈ R[z], N S(Q) ∩ I = ∅ und f eine reelle rationale Funktion
auf I, das heißt
f : I ⊂ R −→ R
P (x)
x 7→
.
Q(x)
Wir nehmen die gleichen Schritte vor wie in (1) und fassen am Schluss die
komplexen Ausdrücke zu einem reellen zusammen. Dann gilt mit ξ ∈ C echt–
komplex und ξ = a + bi
Z
Z
1
x−a
x−a
1
dx = c i arctan
+ c i arctan
c
dx + c
x−ξ
b
−b
x−ξ
+c ln |x − ξ| + c ln |x − ξ|.
Wegen |x − ξ| = |x − ξ| gilt
c ln |x − ξ| + c ln |x − ξ| = 2Re(c) · ln
p
(x − a)2 + b2 .
264
7 Integralrechnung für Funktionen einer reellen Variablen
= − arctan x−a
folgt daher
b
x−a
x−a
x−a
+ ci arctan
= −2Im(c) arctan
.
ci arctan
b
−b
b
Mit arctan
x−a
−b
Daraus folgt
Z p
x−a
c
c
+
dx = 2Re(c)·ln (x − a)2 + b2 −2Im(c)·arctan
x−ξ
b
x−ξ
und
Z c
c
+
(x − ξ)k
(x − ξ)k
1
dx = −
k−1
=−
1
k−1
Beispiel 7.8
Berechnung des Integrals von f (x) =
c
c
+
(x − ξ)k−1
(x − ξ)k−1
c(x − ξ)k−1 + c(x − ξ)k−1
(x2 − 2x · a + |ξ|2 )k−1
+ const.
+ const.
2x3 +2x2 +2x−2
:
(x2 +1)2
Q(x) = (x2 + 1)2 = (x − i)2 (x + i)2 .
Folglich sind ξ1 = i und ξ2 = −i zweifache Nullstellen von Q und es folgt
c21
c11
c12
c22
+
f (z) =
+
+
2
(z − i) (z − i)
(z + i) (z + i)2
3
2
−2i − 2 + 2i − 2
2z + 2z + 2z − 2
=
=1
c12 = lim
2
z→i
(z + i)
4i2
2z 3 + 2z 2 + 2z − 2
2i − 2 − 2i − 2
c22 = lim
=
= 1.
2
z→−i
(z − i)
4i2
Setzen wir dann zum Beispiel x = 0, x = 1, erhalten wir ein Gleichungssystems für c11 , c21 . Dann ist c11 = c21 = 1. Oder wir multiplizieren mit Q(x)
und nehmen einen Koeffizientenvergleich vor:
2x3 + 2x2 + 2x − 2 = c11 (x − i)(x + i)2 + 1 · (x + i)2 + c21 (x − i)2 (x + i)
+1 · (x − i)2 .
R
Folglich ist c11 = c21 = 1. Nun können wir f (x) dx berechnen:
Z Z
Z 1
1
1
1
dx +
dx
f (x) dx =
+
+
(x − i) (x + i)
(x − i)2
(x + i)2
p
1
1
= 2 ln x2 + 1 −
−
+ const. auf R
(x − i) (x + i)
|
{z
}
=− x22x
+1
= 2 ln
p
x2 + 1 −
2x
+ const. auf R.
+1
x2
7.1 Stammfunktionen und ihre Berechnung
265
Bemerkung: Oft lassen sich Integrale durch Substitution auf Integrale rationaler Funktionen zurückführen. Seien u1 , . . . , un : I ⊂ R −→ C Funktionen.
Dann definieren wir
P
αn
1
αi1 ...in uα
1 · . . . · un
α
, αI , βI ∈ C.
R(u1 , . . . , un ) := P
βi1 ...in uβ1 1 · . . . · uβnn
β
R
Verschiedene Integrale der Form R(.) dx und oft geeignete
Substitutionen:
R
(1) R(eaxq
) dx. Geeignete Substitution: y = eax . q
R
n ax+b
(2) R(x, n ax+b
cx+d ) dx Geeignete Substitution: y =
cx+d .
R
(3) R(cos x, sin x) dx. Geeignete Substitution: y = tan x2 . Ist R(u, v) =
R(−u,
−v), so ist eine geeignete Substitution y = tan x.
R
(4) R(cosh x, sinh x) dx. Geeignete Substitution: y = tanh x2 . Alternativ
kann man die Hyperbelfunktionen durch eix darstellen und dann (1) anwenden.
√
R
. Dann
(5) R(x, ax2 + bx + c) dx. Geeignete Substitution: y = √ax+b
2
weiter substitutieren t = sinh y, t = cosh y oder t = cos y.
|b −ax|
Nicht jedes Integral ist durch eine elementare Funktion darstellbar, auch wenn
die Stammfunktion Rexistiert.
p Zum Beispiel sind elliptische Integrale, das heißt
Integrale der Form R(x, P (x)) dx, wobei P (x) Polynom vom Grad 3 oder
4 ohne mehrfache Nullstellen ist, nicht durch eine elementare Funktion darstellbar.
Definition 7.4. Sei f ∈ S(I; E) und a, b ∈ I. Sei F : I ⊂ R −→ E eine
Stammfunktion von f . Unter dem bestimmten Integral von f von a nach b
versteht man den Vektor (bzw. für E = R oder C die Zahl):
Zb
a
f (x) dx := F (b) − F (a) ∈ E.
Bezeichnung: F (b) − F (a) =: F (x)|ba
266
7 Integralrechnung für Funktionen einer reellen Variablen
Satz 7.7 (Rechenregeln für das bestimmte Integral)
(1) Sei f ∈ S(I; E) und a, b ∈ I. Dann gilt
Za
Zb
f (x) dx = 0,
a
a
f (x) dx = −
Za
Zb
f (x) dx,
f (x) dx+
a
b
Zc
f (x) dx =
b
Zc
f (x) dx.
a
(2) Seien f, g ∈ S(I; E), λ, µ ∈ R (C) und a, b ∈ I. Dann gilt
λ
Zb
f (x) dx + µ
a
Zb
g(x) dx =
a
Zb
(λf (x) + µg(x))(x) dx.
a
(3) Sei f ∈ S(I, E1 × E2 ) und f = (f1 , f2 ). Dann gilt
 b

Zb
Z
Zb
f (x) dx =  f1 (x) dx, f2 (x) dx .
a
a
a
(4) Partielle Integration:
Seien f, g : I ⊂ R −→ E differenzierbar, a, b ∈ I, f · g ′ ∈ S(I; E). Dann gilt
Zb
′
f (x)g (x) dx +
a
Zb
f ′ (x)g(x) dx = f (b)g(b) − f (a)g(a).
a
(5) Substitutionsregel:
Sei g ∈ S(I; E) und f : J ⊂ R −→ I ⊂ R differenzierbar. Dann gilt
Zb
′
g(y) dy.
g(f (x))f (x) dx =
a
f
Z(b)
f (a)
⊓
⊔
Beweis: Folgt aus Satz 7.2.
Beispiel 7.9
Es ist für n ∈ N, n > 1
π
Z2
0
n
sin x dx =
( 1·3·...·(2k−1)
2·4·...·2k
2·4·...·2k
3·5·...·(2k+1)
Beweis: Wir wissen, dass für In =
In = −
R
·
π
2
sinn x dx gilt I0 = x, I1 = − cos x, und
n−1
1
sinn−1 x · cos x +
· In−2
n
n
Somit erhalten wir
n = 2k
n = 2k + 1.
für n ∈ N, n > 1.
7.2 Das Riemannsche Integral
In (0) =
n−1
· In−2 (0),
n
und In
π =
n−1
· In−2
n
2
und
π
=
π
,
2
sowie
I1 (0) = −1,
I0 (0) = 0,
I0
Daraus folgt
2
2
267
π
I1
π
2
= 0.
2k − 1
(2k − 1)(2k − 3)
· I2k−2 (0) =
· I2k−4 (0)
2k
(2k)(2k − 2)
(2k − 1)(2k − 3) · . . . · 3 · 1
· I0 (0) = 0.
= ... =
2k(2k − 2) · . . . · 2
I2k (0) =
Analog findet man
I2k
und es folgt
π 2
=
π (2k − 1) · . . . 3 · 1 π
(2k − 1) · . . . 3 · 1
=
· I0
2k · . . . · 4 · 2
2
2k · . . . · 4 · 2 2
I2k+1 (0) =
I2k+1
π 2
(2k) · . . . · 4 · 2
· I1 (0)
(2k + 1)(2k − 1) · . . . · 3 · 1 | {z }
=−1
π
(2k) · . . . · 4 · 2
= 0.
· I1
=
(2k + 1)(2k − 1) · . . . · 3 · 1 | {z2 }
=0
7.2 Das Riemannsche Integral
Wie kann man Teilmengen A ⊂ R2 einen sinnvollen Flächeninhalt µ(A) ⊂
R+ ∪ {∞} zuordnen?
Bedingungen:
(1) µ(A) ≥ 0,
(2) µ([a1 , b1 ] × . . . × [an , bn ]) =
n
Q
(bi − ai ),
i=1
(3) Int(A1 ) ∩ Int(A2 ) = ∅ ⇒ µ(A1 ∪ A2 ) = µ(A1 ) + µ(A2 ),
(4) A ⊂ B ⇒ µ(A) ≤ µ(B).
268
7 Integralrechnung für Funktionen einer reellen Variablen
Wir betrachten Teilmengen A ⊂ Rn der Form
Diese Teilmengen kann man zerlegen in Teile der Form
f (x)
a
b
Nun versuchen wir den Flächeninhalt von Mengen der Form
A = {(x, y) ∈ R2 | x ∈ [a, b], 0 ≤ y ≤ f (x)},
wobei f : [a, b] −→ R+ ∪ {0} ist, zu definieren.
Definition 7.5. Sei I = [a, b] ⊂ R ein kompaktes Intervall. Unter einer Zerlegung von I versteht man eine Menge von Punkten P = {x0 , x1 , . . . , xn } mit
a = x0 < . . . < xn = b. Dann heißt Ik := [xk−1 , xk ] k–tes Teilintervall von P,
L(Ik ) := xk − xk−1 Länge von Ik und kPk := maxk∈{1,...,n} L(Ik ) Norm der
e heißt Verfeinerung der Zerlegung P (P
e ≥ P),
Zerlegung P. Eine Zerlegung P
e
e
falls zu jedem Teilintervall Iµ von P ein Teilintervall Iν von P mit Ieµ ⊂ Iν
existiert.
Wir definieren im Folgenden das Riemannsche Integral für Funktionen f :
[a, b] −→ E, wobei E Banachraum über R oder C ist.
Definition 7.6. Sei f : [a, b] −→ E eine Funktion, P = {x0 , . . . , xn } eine
Zerlegung von [a, b] und ξ = (ξ1 , . . . , ξn ) ∈ Rn ein Tupel von Zahlen mit
ξk ∈ Ik für alle k ∈ {1, . . . , n}. Dann heißt
S(f, P, ξ) :=
n
X
k=1
f (ξk ) · L(Ik )
Riemannsche Summe für f bzgl. der Zerlegung P und der Stützstellen ξ =
(ξ1 , . . . , ξn ).
Definition 7.7. Sei f : [a, b] −→ E. Der Vektor e ∈ E heißt Grenzwert aller
Riemannschen Summen für f , falls für alle ε > 0 eine Zerlegung Pε existiert,
so dass gilt
kS(f, P, ξ) − ek < ε
∀ P ≥ Pε und für alle Stützstellen ξ von P.
7.2 Das Riemannsche Integral
269
Bezeichnung: e := lim S(f, P, ξ)
P
Bemerkung: Der Grenzwert der Riemannschen Summen ist, falls er existiert,
eindeutig bestimmt.
Beweis: Seien e1 , e2 ∈ E zwei Vektoren mit e1 = lim S(f, P, ξ) und e2 =
P
lim S(f, P, ξ). Sei ε > 0. Dann gilt
P
ε
2
ε
∃ P2 : kS(f, P, ξ) − e2 k ≤
2
∃ P1 : kS(f, P, ξ) − e1 k ≤
∀P ≥ P1 ,
∀P ≥ P2 .
Sei P0 die Zerlegung von [a, b], die durch die Teilpunkte von P1 und P2 gebildet
wird, dass heißt, P0 := P1 ∪ P2 . Dann gilt P0 ≥ P1 und P0 ≥ P2 . Sei nun ξ0
eine beliebige Stützstelle von P0 . Dann erhalten wir
ε ε
ke1 − e2 k ≤ kS(f, P0 , ξ0 ) − e1 k + kS(f, P0 , ξ0 ) − e2 k ≤ + = ε.
2 2
⊓
⊔
Da ε beliebig ist, folgt e1 = e2 .
Definition 7.8. Eine Abbildung f : [a, b] −→ E heißt Riemann-integrierbar
über [a, b], falls die Riemannschen Summen für f einen Grenzwert besitzen.
Bezeichnung: Mit
(R) −
Zb
a
f (x) dx := lim S(f, P, ξ)
P
bezeichnen wir das Riemann-Integral von f über [a, b].
Bemerkung:
(1) Wir werden in Abschnitt 7.3 zeigen, dass jede stetige Funktion f : [a, b] −→
E eine Stammfunktion hat und Riemann-integrierbar ist, und dass
(R) −
Zb
a
f (x) dx =
Zb
f (x) dx
a
R
gilt. Wir lassen deshalb Rim Folgenden (R)− vor dem weg. In den Abschnitten 7.2 und 7.3 sei mit immer das Riemann–Integral gemeint.
(2) Ist f : [a, b] −→ R Riemann–integrierbar, f ≥ 0 und A gegeben durch
A := {(x, y) ∈ R2 | a ≤ x ≤ b, 0 ≤ y ≤ f (x)}.
Dann entspricht µ(A) =
Rb
a
f (x) dx dem Flächeninhalt von A.
270
7 Integralrechnung für Funktionen einer reellen Variablen
Beispiel 7.10
Wir betrachten die Funktion


−1
f (x) = 0


1
x ∈ [ − 1, 0)
x=0
x ∈ (0, 1].
f ist Riemann–integrierbar, hat aber keine Stammfunktion.
Bemerkung: Jede Treppenfunktion ist Riemann–integrierbar.
Vereinbarung: Ist f eine beliebige Funktion und sind a, b ∈ R mit a < b
gegeben, so gelte
(R) −
Za
f (x) dx := 0, (R) −
a
Za
f (x) dx := −(R) −
b
Zb
f (x) dx.
a
Bezeichnung: Wir bezeichnen die Menge aller Riemann–integrierbaren Funktionen von [a, b] in E mit R([a, b]; E).
Satz 7.8 Ist f : [a, b] −→ E Riemann–integrierbar, so ist f beschränkt.
Beweis: Sei e :=
Rb
a
f (x) dx. Nach Definition existiert eine Zerlegung P von
[a, b], so dass für beliebige Stützstellen ξ von P gilt
kS(f, P, ξ) − ek < 1.
Sei Iν ein Teilintervall von P und ξµ ∈ Iµ fix für µ 6= ν. Dann definieren wir
X
Mν :=
f (ξµ )L(Iµ ) ∈ E.
µ6=ν
Für jedes x ∈ Iν gilt kf (x) · L(Iν ) + Mν − ek < 1. Daraus folgt
|kf (x)k −
1
Mν − e
kMν − ek
k<
| < kf (x) +
,
L(Iν )
L(Iν )
L(Iν )
| {z }
| {z }
=a
=r
das heißt, kf (x)k liegt im Intervall [a − r, a + r). Folglich gilt für alle x ∈ Iν
kf (x)k <
Sei nun M :=
x ∈ [a, b].
kMν − ek
1
1
+
=
(1 + kMν − ek).
L(Iν )
L(Iν )
L(Iν )
1
max
(1
ν∈{1,...,n} L(Iν )
+ kMν − ek). Dann ist kf (x)k ≤ M für alle
⊓
⊔
7.2 Das Riemannsche Integral
271
Satz 7.9 (Cauchy–Integrierbarkeitskriterium) Sei f : [a, b] ⊂ R −→ E,
E Banachraum. Dann gilt f ∈ R([a, b]; E) genau dann, wenn zu jedem ε > 0
e
eine Zerlegung Pε von [a, b] existiert, so dass für beliebige Verfeinerungen P, P
e
e
von Pε und Stützstellen ξ, ξ von P bzw. P gilt
e < ε.
e ξ)k
kS(f, P, ξ) − S(f, P,
Beweis: (1) Sei f ∈ R([a, b]; E) und ε > 0 gegeben. Dann existieren e ∈ E
und Pε , so dass gilt
ε
∀P ≥ Pε .
kS(f, P, ξ) − ek <
2
e ≥ Pε . Dann gilt
Seien P, P
e ≤ kS(f, P, ξ) − ek + kS(f, P,
e − ek ≤ ε.
e ξ)k
e ξ)
kS(f, P, ξ) − S(f, P,
(2) Für jedes ε > 0 existiere eine Zerlegung Pε von [a, b], so dass für beliebige
e gilt
Verfeinerungen P, P̃ von Pε und Stützstellen ξ, ξe von P bzw. P
e < ε.
e ξ)k
kS(f, P, ξ) − S(f, P,
Es ist zu zeigen, dass f ∈ R([a, b]; E) ist. Sei εn > 0 eine Folge, die gegen 0
konvergiert. Nach Voraussetzung folgt dann
e < εn
e ξ)k
∀n ∈ N ∃ Pn : kS(f, P, ξ) − S(f, P,
e ≥ Pn . (∗)
∀ P, P
Wir bilden nun sukzessive die folgenden Zerlegungen Un von [a, b]:
U1 := P1 , U2 := P1 ∪ P2 = U1 ∪ P2 ,
U3 := P1 ∪ P2 ∪ P3 = U2 ∪ P3 , . . . , Un := P1 ∪ . . . ∪ Pn = Un−1 ∪ Pn .
Folglich ist Pn ≤ Un ≤ Un+1 ≤ . . .. Zu jeder Zerlegung Un wählen wir nun ein
Tupel von Stützstellen ξn . Sei ε > 0 gegeben. Dann existiert ein n0 ∈ N mit
εn0 < 2ε für alle n0 ≥ n, so dass gilt
kS(f, Un , ξn ) − S(f, Um , ξm )k < εn0 <
ε
2
∀ n, m ≥ n0 . (∗∗)
Folglich bilden die Vektoren {S(f, Un , ξn )}∞
n=1 eine Cauchy–Folge im Banachraum E. Da E vollständig ist, existiert e := lim S(f, Un , ξn ). Gehen wir in
n→∞
(∗∗) mit m gegen ∞, so folgt
ε
∀n ≥ n0 .
2
Sei nun P eine beliebige Zerlegung mit P ≥ Un0 . Dann ist wegen
kS(f, Un , ξn ) − ek <
kS(f, P, ξ) − ek ≤ kS(f, P, ξ) − S(f, Un0 , ξn0 )k + kS(f, Un0 , ξn0 ) − ek
(∗)
≤ εn0 +
die Funktion f ∈ R([a, b], E).
ε
< ε,
2
⊓
⊔
272
7 Integralrechnung für Funktionen einer reellen Variablen
Satz 7.10 Sei E ein Banachraum. Dann ist jede stetige Abbildung f : [a, b] ⊂
R −→ E Riemann-integrierbar.
Beweis: Da f stetig und [a, b] kompakt ist, ist f gleichmäßig stetig, das heißt,
für alle ε > 0 existiert ein δ > 0, so dass für alle x1 , x2 ∈ [a, b] gilt
|x1 − x2 | < δ ⇒ kf (x1 ) − f (x2 )k <
ε
.
2(b − a)
Sei P0 eine Zerlegung von [a, b] mit kP0 k < δ. Dann gilt für alle Pe ≥ P0 =
{x0 , x1 , . . . , xn }, wobei Pe = {y0 , y1 , . . . , yN } die xi enthält, Folgendes
e ξ)
e − S(f, P0 , ξ0 )k = k
kS(f, P,
=k
≤
=
N
X
l=1
N
X
l=1
f (ξel )(yl − yl−1 ) −
n
X
k=1
f (ξk )(xk − xk−1 )k
(f (ξel ) − f (ξkl ))(yl − yl−1 )k
für diejenigen ξk mitIel ⊂ Ik
N
X
l=1
kf (ξel ) − f (ξkl )k(yl − yl−1 )
{z
}
|
ε
< 2(b−a)
ε
ε
· (b − a) = .
2(b − a)
2
ee
e P
Seien nun P,
≥ P0 . Dann gilt
ee ee
ee ee
e ξ)k
e ≤ kS(f, P,
kS(f, P,
ξ) − S(f, P,
ξ) − S(f, P0 , ξ)k
e − S(f, P0 , ξ)k
e ξ)
+kS(f, P,
< ε.
Nach Satz 7.9 ist f Riemann–integrierbar.
⊓
⊔
Satz 7.11 Sei f ∈ R([a, b]; E) und {Pn } eine Folge von Zerlegungen von
[a, b] mit kPn k −→ 0. Die Stützstellen von Pn seien ξn . Dann gilt
Zb
a
f (x) dx = lim S(f, Pn , ξn ).
n→∞
Beweis: Nach Satz 7.8 ist f beschränkt, das heißt, kf (x)k ≤ M für alle
x ∈ [a, b]. Sei ε > 0 fix. Dann existiert ein P0 , so dass für alle P ≥ P0 gilt
Rb
kS(f, P, ξ) − ek < 2ε , wobei e = a f (x) dx ist. Die Zerlegung P0 habe r
Teilintervalle. Da kPn k gegen 0 konvergiert, existiert ein n0 ∈ N, so dass gilt
7.2 Das Riemannsche Integral
2 M r kPn k <
ε
2
273
∀ n ≥ n0 .
Seien J1 , J2 , . . . , Jl diejenigen Teilintervalle von Pn für n ≥ n0 , die nicht in
P0 ∪ Pn vorkommen, das heißt diejenigen, die durch Punkte von P0 zerlegt
werden. Dann ist l ≤ r. Wir fügen nun zu den Stützstellen ξn von Pn neue
Stützstellen hinzu, so dass Stützstellen von ξen von P0 ∪ Pn entstehen. Damit
erhalten wir für alle n ≥ n0
kS(f, Pn , ξn ) − S(f, Pn ∪ P0 , ξen )k ≤ 2M
<
ε
.
2
l
X
v=1
L(Jl ) ≤ 2M lkPnk ≤ 2M rkPn k
Da Pn ∪ P0 ≥ P0 ist, folgt für n ≥ n0
kS(f, Pn , ξn ) − ek ≤ kS(f, Pn , ξn ) − S(f, Pn ∪ P0 , ξen )k
+kS(f, Pn ∪ P0 , ξen ) − ek
ε ε
≤ + = ε.
2 2
Somit ist lim S(f, Pn , ξn ) = e.
⊓
⊔
n→∞
Bemerkung Satz 7.11 ist gut geeignet, um
(1) Rechenregeln für Riemann–Integrale zu beweisen,
(2) Abschätzungen für Summen auf Abschätzungen für Integrale zu übertragen,
(3) Grenzwerte zu berechnen.
Beispiel 7.11
Zu (3): Wir wollen den Grenzwert
n
X kα 1
1 α + 2 α + . . . + nα
= lim
· ,
α+1
n→∞
n→∞
n
nα n
lim
α>0
k=1
berechnen. Sei f (x) := xα auf [0, 1] und Pn = {0, n1 , n2 , . . . , n−1
n , 1}. Dann ist
k
kα
1
f ( n ) = nα und kPn k = n konvergiert gegen 0 für n gegen ∞. Somit erhalten
wir unter Benutzung der Stetigkeit von f und Satz 7.18 (siehe unten)
Z1
0
n
f (x) dx =
X
1
= lim
f
α + 1 n→∞
k=1
1
k
· .
n
n
Satz 7.12 (Rechenregeln für das Riemann–Integral)
274
7 Integralrechnung für Funktionen einer reellen Variablen
(1) Seien f, g ∈ R([a, b]; E) und µ, λ ∈ K. Dann ist µf + λg ∈ R([a, b]; E) und
es gilt
Zb
Zb
Zb
(µf + λg)(x) dx = µ f (x) dx + λ g(x) dx.
a
a
a
(2) Ist E = C und f ∈ R([a, b]; C), so ist auch f ∈ R([a, b]; C) und es gilt
Zb
f (x) dx =
a
Zb
f (x) dx.
a
(3) Ist f ∈ R([a, c]; E) ∪ R([c, b]; E), so ist f ∈ R([a, b]; E) und es gilt
Zb
f (x) dx =
a
Zc
f (x) dx +
a
Zb
f (x) dx.
c
(4) Ist f ∈ R([a, b]; E), [α, β] ⊂ [a, b], so ist f ∈ R([α, β]; E).
q
(5) Sei E = E1 × E2 mit der Produktnorm k(e1 , e2 )k :=
ke1 k2E1 + ke2 k2E2
versehen und sei f = (f1 , f2 ) : [a, b] −→ E1 × E2 . Dann ist f ∈ R([a, b]; E)
genau dann, wenn fi ∈ R([a, b]; Ei ) ist für i ∈ {1, 2} und es gilt
 b

Zb
Z
Zb
f (x) dx =  f1 (x) dx, f2 (x) dx .
a
a
a
(6) Seien f, g ∈ R([a, b]; E), f ≤ g. Dann gilt
Zb
f (x) dx ≤
a
Zb
g(x) dx.
a
(7) Seien f, g ∈ R([a, b]; E). Stimmen f und g auf einer dichten Teilmenge von
[a, b] überein, so gilt
Zb
Zb
f (x) dx = g(x) dx.
a
a
(8) Ist f ∈ C([a, b]; E), dann gilt
k
Zb
a
f (x) dxk ≤
Zb
a
kf (x)k dx ≤ kf k∞ · (b − a).
Dies ist die Fundamentalungleichung für Riemann–Integrale.
7.2 Das Riemannsche Integral
275
⊓
⊔
Beweis: Übungsaufgabe.
Satz 7.13 Sei {fn } mit fn : [a, b] −→ E eine Folge Riemann–integrierbarer
Funktionen und konvergiere {fn } gleichmäßig gegen f . Dann ist f Riemann–
integrierbar und es gilt
Zb
f (x) dx = lim
n→∞
a
Zb
fn (x) dx.
a
Beweis: Da {fn } gleichmäßig gegen f konvergiert, existiert für alle ε > 0 ein
n0 ∈ N, so dass für alle n ≥ n0 und für alle x ∈ [a, b]
kf (x) − fn (x)k <
1
ε
·
. (∗)
4 b−a
gilt.
(1) Wir zeigen, dass f ∈ R([a, b]; E) gilt. Da fn0 ∈ R([a, b]; E) ist, existiert
e ≥ P0
eine Zerlegung P0 , so dass für alle Zerlegungen P, P
gilt. Damit folgt
e ξ)k
e <
kS(fn0 , P, ξ) − S(fn0 , P,
ε
.
2
e
e ξ)k
kS(f, P, ξ) − S(f, P,
e
e ξ)k
≤ kS(f, P, ξ) − S(fn0 , P, ξ)k + kS(fn0 , P, ξ) − S(fn0 , P,
e − S(f, P,
e
e ξ)
e ξ)k
+kS(fn0 , P,
X
X
ε
≤ k
(f (ξk ) − fn0 (ξk ))L(Ik )k + + k
(f (ξel ) − fn0 (ξel ))L(Iel )k
2
k
(∗)
≤ 2·
l
1
ε
ε
·
· (b − a) + = ε.
4 b−a
2
Folglich ist f ∈ R([a, b]; E).
(2) Sei {Pm } eine Folge von Zerlegungen, {kPm k} konvergiere gegen 0 und
ξm seien Stützstellen von Pm . Dann folgt mit Satz 7.11
∀m ≥ m0 : k
Zb
f (x) dx − S(f, Pm , ξm )k <
ε
,
4
a
∀m ≥ m0 (n) : k
Zb
a
fn (x) dx − S(fn , Pm , ξm )k <
ε
.
4
276
7 Integralrechnung für Funktionen einer reellen Variablen
Sei nun n ≥ n0 und m ≥ max{m0 , m0 (n)}. Dann folgt
k
Zb
a
f (x) dx −
≤k
Zb
a
fn (x) dxk
a
f (x) dx − S(f, Pm , ξm )k + kS(f, Pm , ξm ) − S(fn , Pm , ξm )k
+k
Zb
a
≤
Zb
fn (x) dx − S(fn , Pm , ξm )k
ε ε ε
+ + < ε.
4 4 4
Somit gilt lim
Rb
n→∞ a
fn (x) dx =
Rb
⊓
⊔
f (x) dx.
a
Folgerung 7.1 Falls die Funktionen fn ∈ R([a, b]; E) sind und f (x) =
∞
P
fn (x) gleichmäßig konvergent ist, so ist f ∈ R([a, b]; E) und es gilt
n=1
Zb
∞ Z
X
b
f (x) dx =
a
fn (x) dx.
n=1 a
Anwendung auf die Integralberechnung
Oft sind Integrale nicht durch elementare Funktionen auszudrücken, wie zum
Beispiel elliptische Integrale. Dann kann man sie durch eine Reihendarstellung
näherungsweise berechnen.
Beispiel 7.12
Wir betrachten die Funktion f (x) = √
1
1−k2 sin2 x
für k 2 < 1 und möchten
π
I =
R2
f (x) dx zumindest näherungsweise berechnen. I existiert, da f (x) ein
0
stetige Funktion ist. Für |y| < 1 gilt
1
1·3 2 1·3·5 3
1
√
y −
y ± ...
=1− y+
2
2·4
2·4·6
1+y
und daher
1·3 4 4
1
1
p
k sin x + . . .
= 1 + k 2 sin2 x +
2
2
2·4
2
1 − k sin x
7.2 Das Riemannsche Integral
277
Diese Reihe hat für |k| < 1 eine konvergente Majorante (die Reihe mit dem
1
). Nach dem Weierstraßschen Majorantenkriterium ist die
Grenzwert √1−k
2
Reihe gleichmäßig konvergent. Mit Satz 7.13 folgt daher
π
π
I =
Z2
0
=
dx
p
=
1 − k 2 sin2 x
Z2
0
π
2
∞ Z
X
1 · 3 · . . . · (2n − 1) 2n 2n
k sin x dx
dx +
2 · 4 · . . . · (2n)
n=1
0
π
∞
π X 1 · 3 · . . . · (2n − 1) 2n
+
k
2 n=1 2 · 4 · . . . · (2n)
π
=
2
1+
Z2
sin2n x dx
0
2
∞ X
1 · 3 · . . . · (2n − 1)
n=1
2 · 4 · . . . · (2n)
k
2n
!
.
Wir leiten nun spezielle Integrierbarkeitskriterien für reellwertige Funktionen
her. Sei f : [a, b] −→ R eine beschränkte Funktion und P = {x0 , . . . , xn } eine
Zerlegung von [a, b]. Wir definieren
mk := inf{f (x) | x ∈ Ik }
und Mk := sup{f (x) | x ∈ Ik }
sowie
S(f, P) :=
S(f, P) :=
n
X
k=1
n
X
k=1
mk · L(Ik ) Untersumme von f bzgl. P,
Mk · L(Ik ) Obersumme von f bzgl. P.
Offensichtlich folgt dann:
(1) Sind ξ beliebige Stützstellen von P, so gilt S(f, P) ≤ S(f, P, ξ) ≤ S(f, P).
e ≥ P, so folgt
(2) Gilt P
e ≤ S(f, P)
e ≤ S(f, P) ≤ sup f · (b − a).
inf f · (b − a) ≤ S(f, P) ≤ S(f, P)
e
e beliebige Zerlegungen. Dann gilt S(f, P) ≤ S(f, P).
(3) Seien P, P
Folglich existieren
Zb
f (x) dx := sup S(f, P) unteres Riemann Integral,
Zb
f (x) dx := inf S(f, P) oberes Riemann-Integral
a
a
P
P
278
7 Integralrechnung für Funktionen einer reellen Variablen
und es gilt
Zb
f (x) dx ≤
a
Zb
f (x) dx.
a
Satz 7.14 (Riemannsches Integrierbarkeitskriterium) Sei f : [a, b] −→
R beschränkt. Dann gilt
(1) f ∈ R([a, b]; R) genau dann, wenn für alle ε > 0 eine Zerlegung P existiert
mit
S(f, P) − S(f, P) < ε.
(2) f ∈ R([a, b]; R) genau dann, wenn
Zb
f (x) dx =
Rb
a
f (x) dx =
Rb
f (x) dx,
a
a
und es gilt dann
Zb
f (x) dx =
a
Rb
f (x) dx.
a
Beweis: (1) (⇒) Sei f ∈ R([a, b]; R). Nach Satz 7.9 existiert dann für alle
ε > 0 eine Zerlegung P mit
e <
S(f, P, ξ) − S(f, P, ξ)
ε
,
2
(∗)
wobei ξ, ξe beliebige Stützstellen sind, so dass gilt f (ξk ) ≥ f (ξek ). Wir wählen
nun {ξkn } und {ξekn }, so dass für n gegen ∞ f (ξkn ) gegen Mk und f (ξekn )
gegen mk konvergieren. Dann folgt mit (∗)
S(f, P) − S(f, P) ≤
ε
< ε.
2
(⇐) Für alle ε > 0 existiere eine Zerlegung P0 , so dass gilt S(f, P0 ) −
S(f, P0 ) < ε. Für P ≥ P0 und beliebige Stützstellen ξ gilt
S(f, P0 ) ≥ S(f, P) ≥ S(f, P, ξ) ≥ S(f, P0 )
und daher
e ≤ S(f, P0 ) − S(f, P0 ) < ε ∀ P, P
e ξ)|
e ≥ P0 .
|S(f, P, ξ) − S(f, P,
Nach Satz 7.9 ist dann f ∈ R([a, b]; R).
(2) (⇒) Sei f ∈ R([a, b]; R). Nach Teil (1) existiert dann eine Folge {Pn } mit
S(f, Pn ) − S(f, Pn ) <
1
.
n
7.2 Das Riemannsche Integral
279
Es gilt aber auch
S(f, Pn ) ≤
Zb
f (x) dx ≤
a
und damit
Zb
f (x) dx −
a
Zb
Zb
a
f (x) dx ≤ S(f, Pn ).
f (x) dx <
1
n
∀n ∈ N
a
woraus folgt
Zb
f (x) dx =
a
Rb
(⇐) Ist andererseits a f (x) dx =
e mit
Zerlegungen P, P
ε
S(f, P) > e − ,
2
Zb
f (x) dx.
a
Rb
a
f (x) dx = e, so existieren für alle ε > 0
e < e + ε.
und S(f, P)
2
e − S(f, P) < ε. Sei nun P0 = P ∪ P̃. Dann gilt
Folglich ist S(f, P)
e − S(f, P) < ε.
S(f, P0 ) − S(f, P0 ) ≤ S(f, P)
Somit ist f ∈ R([a, b]; R).
⊓
⊔
Unser Ziel ist es nun, zu zeigen, dass f : [a, b] −→ R genau dann Riemann–
integrierbar ist, wenn f beschränkt und “fast überall” stetig ist.
Definition 7.9. Eine Teilmenge A ⊂ R hat das Lebesgue–Maß Null (Symbol
µ(A) = 0), wenn für alle ε > 0 eine Folge von Intervallen I1 , I2 , . . . existiert,
so dass gilt
(1) A ⊂
(2)
∞
X
∞
[
Int(In ),
n=1
L(In ) < ε.
n=1
Bemerkung Offensichtlich gilt dann Folgendes
(1) Ist B ⊂ A und µ(A) = 0, so ist auch µ(B) = 0.
(2) Sei A ⊂ [a, b] eine Nullmenge, d.h., A hat das Lebesque-Maß Null. Dann ist
[a, b]\A ⊂ [a, b] eine dichte Teilmenge. (Angenommen, [a, b]\A wäre nicht
dicht. Dann gäbe es ein offenes Intervall (c, d) ⊂ A mit L(c, d) = d − c = ε.
Dann aber ließe A sich nicht durch Intervalle, deren Gesamtlänge kleiner
als ε ist, überdecken.
280
7 Integralrechnung für Funktionen einer reellen Variablen
(3) Es gilt µ({x}) = 0.
Satz 7.15
(1) Seien A1 , A2 , . . . ⊂ R Mengen vom Lebesgue–Maß Null. Dann ist
∞
[
µ
n=1
An
!
= 0.
(2) Jede abzählbare Menge A ⊂ R hat Lebesgue–Maß Null.
Beweis:
(1) Sei ε > 0. Da µ(An ) = 0 für alle n ∈ N gilt, existieren Intervalle In1 , In2 , . . .
mit
∞
∞
X
[
ε
L(Ini ) < i .
Int(Ini ), und
An ⊂
2
i=1
i=1
Daraus folgt
A=
∞
[
n=1
An ⊂
∞ [
∞
[
Int(Ini )
i=1 n=1
| {z }
abzählbar
und
∞ X
∞
X
n=1 i=1
L(Ini ) < ε ·
(2) Folgt aus (1), da µ({x}) = 0.
∞
X
1
1
1
=ε· ·
i
2
2 1−
i=1
1
2
= ε.
⊓
⊔
Satz 7.16 (Lebesguesches Integrierbarkeitskriterium)
f ∈ R([a, b]; R) genau dann, wenn gilt
(1) f ist beschränkt.
(2) Die Menge der Unstetigkeitsstellen von f hat das Maß Null, das heißt, f
ist “fast überall stetig”.
Beweis:
(⇐) Sei f : [a, b] ⊂ R −→ R beschränkt und fast überall stetig, das heißt
|f (x)| < c für alle x ∈ [a, b] und
A := {x0 ∈ [a, b] | f in x0 nicht stetig}
hat Lebesgue–Maß Null. Sei ε > 0. Dann existieren Intervalle J1 , J2 , . . ., so
dass
∞
∞
[
X
A⊂
Int(Jn ), und
L(Jn ) < ε.
n=1
n=1
Wir betrachten die Oszillation von f in x0 ∈ [a, b]:
7.2 Das Riemannsche Integral
281
o(f, x0 ) := lim (sup{f (x) | |x − x0 | < δ} − inf{f (x) | |x − x0 | < δ}) .
δ→0+
Es gilt, dass f in x0 genau dann stetig ist, wenn o(f, x0 ) = 0 ist. Das heißt,
für x0 ∈ [a, b]\A existiert ein δ(x0 ), so dass gilt
sup{f (x) | |x − x0 | < δ(x0 )} − inf{f (x) | |x − x0 | < δ(x0 )} < ε.
Die Familie U = {Int(Jn ) | n ∈ N} ∪ {K(x0 , δ(x0 )) | x0 ∈ [a, b]\A} ist eine
offene Überdeckung der kompakten Menge [a, b]. Somit existiert eine endliche
Teilüberdeckung
U ∗ = {Int(Jn1 ), . . . , Int(JnN ), K(x1 , δ(x1 )), . . . , K(x̺ , δ(x̺ ))}
von [a, b]. Wir wählen eine Zerlegung P = {x0 , x1 , . . . , xn } von [a, b], deren
Teilintervalle Ik in Int(Jnj ) oder in K(xi , δ(xi )) liegen für i ∈ {1, . . . , ̺}, j ∈
{1, . . . , N }. Nun sei J ∗ die Menge der Teilintervalle, die in einem Jnj liegen
und J ∗∗ bestehe aus den restlichen Teilintervallen von P. Dann gilt wegen
|f (x)| ≤ c die folgende Ungleichung
X
X
S(f, P) − S(f, P) =
(Mk − mk ) L (Ik ) +
(Mk − mk ) L (Ik )
Ik ∈J ∗
≤ 2c
X
L (Ik ) +ε
Ik ∈J ∗
|
{z
<ε
}
Nach Satz 7.14 ist dann f ∈ R([a, b]; R).
X
Ik ∈J ∗∗
Ik ∈J ∗∗
|
L (Ik ) = (2c + (b − a)) · ε.
{z
<b−a
}
(⇒) Sei f ∈ R([a, b]; R). Dann ist f beschränkt und es bleibt zu zeigen, dass
µ(A) = 0 gilt. Sei Aε := {x ∈ [a, b] | o(f, x) ≥ ε}. Da f in x genau dann stetig
ist, wenn o(f, x) = 0, folgt A = A1 ∪ A 12 ∪ A 13 ∪ . . .. Nach Satz 7.15 genügt
es zu zeigen, dass µ(A n1 ) = 0 ist für alle n ∈ N. Sei n fix und ε > 0 gegeben.
Nach Voraussetzung existiert dann eine Zerlegung P mit
S(f, P) − S(f, P) <
ε
.
2n
Sei J ∗ die Menge der Teilintervalle Ik von P mit Int(Ik ) ∩ A n1 6= ∅. Nach
Definition der Oszillation folgt dann für x0 ∈ Ik ∩ A n1
Mk − mk = sup f|Ik − inf f|Ik ≥ o(f, x0 ) ≥
1
.
n
Daraus folgt
X
1 X
ε
.
L (Ik ) ≤
(Mk − mk ) L (Ik ) ≤ S(f, P) − S(f, P) <
n
2n
∗
∗
Ik ∈J
Ik ∈J
282
7 Integralrechnung für Funktionen einer reellen Variablen
m
P
L(Iek ) <
Außerdem wählen wir Intervalle Iek um die Teilungspunkte von P mit
ε
2.
A
k=1
Nach Wahl von J ∗ folgt dann
1
n
⊂
[
Ik ∈J ∗
Int(Ik ) ∪
m
[
k=1
Folglich ist µ(A n1 ) = 0.
Int(Iek ),
X
und
L(Ik )+
Ik ∈J ∗
m
X
k=1
L(Iek ) <
ε ε
+ = ε.
2 2
⊓
⊔
Folgerung 7.2
(1) Ist f : [a, b] −→ R eine beschränkte Funktion mit abzählbar vielen Unstetigkeitsstellen, so ist f Riemann–integrierbar.
(2) Ist f : [a, b] −→ R eine monotone Funktion, so ist f Riemann-integrierbar.
(3) Sei f : [a, b] −→ Rn . Dann ist f ∈ R([a, b]; Rn ) genau dann, wenn f
beschränkt und fast überall stetig ist, wobei für f = (f1 , . . . , fn ) gilt
f ∈ R([a, b]; Rn ) ⇔ fi ∈ R([a, b]; R), f ∈ C([a, b]; Rn ) ⇔ fi ∈ C([a, b], R).
Analoges gilt für Funktionen mit Werten in Cn .
(4) Ist f ∈ R([a, b]; Rn ), so ist auch kf k ∈ R([a, b]; R) und es gilt
k
Zb
a
f (x) dxk ≤
Zb
a
kf (x)k dx.
(5) Sind f, g ∈ R([a, b]; C), so ist auch f · g ∈ R([a, b]; C).
(6) Ist f ∈ R([a, b]; Rn ) und h ∈ C(Rn ; Rm ), so ist h ◦ f ∈ R([a, b]; Rm ).
Beispiel 7.13
Sei f : [0, 1] −→ R gegeben durch
(
f (x) =
1
0
x rational
x irrational.
f ist in keinem Punkt aus [0, 1] stetig und f 6∈ R([a, b]; R). Später führen wir
das Lebesgue–Integral ein und werden sehen, dass f Lebesgue–integrierbar
ist.
7.3 Hauptsatz der Differential- und Integralrechnung
Alle in diesem Abschnitt auftretenden Integrale sind als Riemann–Integrale
aufzufassen.
Satz 7.17 Sei f : [a, b] ⊂ R −→ E stetig. Wir definieren F : [a, b] ⊂ R −→ E
Rx
durch F (x) := f (t) dt. Dann gilt
a
7.3 Hauptsatz der Differential- und Integralrechnung
283
(1) F : [a, b] −→ E ist Lipschitz-stetig,
(2) F ist differenzierbar und es gilt F ′ = f .
Beweis:
(1) Da f ∈ C([a, b]; E) ⊂ R([a, b]; E), ist F definiert. Es gilt mit Satz 7.12
kF (x) − F (y)k = k
≤|
Zx
a
Zy
x
f (t) dt −
Zy
f (t) dtk = k
a
Zy
f (t) dtk
x
kf (t)k dt| ≤ |y − x| · kf k∞ .
(2) Sei ε > 0. Da f in x0 ∈ [a, b] stetig ist, existiert ein δ > 0, so dass für alle
t mit |t − x0 | < δ gilt, dass kf (t) − f (x0 )k < ε ist (∗). Also ist
Zt
1
F (t) − F (x0 )
− f (x0 ) = · f (u) du − f (x0 )
t − x0
t
−
x
0
x0
 t

Z
1
 (f (u) − f (x0 )) du
= t − x0
x0
≤
(∗)
≤
1
|t − x0 |
Zt
x0
kf (u) − f (x0 )k du
1
· ε|t − x0 | = ε
|t − x0 |
für alle |t − x0 | < δ. Folglich ist
lim
t→x0
F (t) − F (x0 )
= F ′ (x0 ) = f (x0 ).
t − x0
Bemerkung Ist dim E < ∞, so gilt
⊓
⊔
(1) Ist f ∈ R([a, b]; E), so ist F Lipschitz-stetig.
(2) Ist f in x0 stetig, so ist auch F in x0 stetig.
Satz 7.18 (Hauptsatz der Differential- und Integralrechnung)
f : [a, b] ⊂ R −→ E sei stetig. Dann gilt
(1) F (x) := (R) −
Rx
a
f (t) dt ist diejenige Stammfunktion von f mit F (a) = 0.
284
7 Integralrechnung für Funktionen einer reellen Variablen
(2) Ist Fe : [a, b] −→ E eine beliebige Stammfunktion von f , so gilt
(R) −
Zb
a
f (t) dt = Fe (b) − Fe(a) =
Z
b
f (t) dt .
| a {z }
best. Integral
Das heißt, jede stetige Funktion hat eine Stammfunktion und für jede stetige
Funktion stimmt das Riemann–Integral mit dem bestimmten Integral überein.
Beweis:
(1) folgt aus Satz 7.17.
(2) Sei Fe eine beliebige Stammfunktion von f . Dann ist Fe = F + e, wobei e
konstant ist. Somit ist Fe (a) = e und es folgt
Zb
a
f (t) dt = Fe(b) − Fe (a) = F (b) + e − (F (a) + e) = F (b) = (R) −
Zb
f (t) dt.
a
⊓
⊔
Anwendung: Als Anwendung beweisen wir zwei Eigenschaften der Zahl π.
(1) Die Zahl π ist irrational.
Es genügt zu zeigen, dass π 2 irrational ist. Angenommen, π 2 wäre rational.
Dann würden a, b ∈ N existieren, so dass π 2 = ab gilt. Wir wählen ein n ∈ N
n
so groß , dass 2a
n! < 1 (∗) gilt und betrachten die Funktion
2n
1 n
1 X
n
f (x) := x (1 − x) =
ck xk ,
n!
n!
k=n
ck ∈ Z.
Ist v < n oder v > 2n, so gilt f (v) (0) = 0. Ist v ∈ {n, . . . , 2n}, so ist f (v) (0) =
v!
(v)
(0) ∈ Z für alle v ∈ N0 . Da f (x) = f (1 − x) gilt, ist
n! cv ∈ Z. Folglich ist f
(v)
auch f (1) ∈ Z für alle v ∈ N0 . Wir betrachten die Funktion
F (x) := bn π 2n f (x) − π 2n−2 f (2) (x) + π 2n−4 f (4) (x) − . . . + (−1)n f (2n) (x) .
Da nach Annahme π 2(n−k) =
an−k
bn−k
gilt, sind auch F (0), F (1) ∈ Z und es gilt
d
(F ′ (x) sin πx − πF (x) cos πx) = (F (2) (x) + π 2 F (x)) sin πx
dx
= bn π 2n+2 f (x) sin πx
= an π 2 f (x) sin πx.
Daraus folgt
7.3 Hauptsatz der Differential- und Integralrechnung
I := π
Z1
285
an f (x) sin πx dx
0
1
= (F ′ (1) sin π − πF (1) cos π − F ′ (0) sin 0 + πF (0) cos 0)
π
= F (1) + F (0) ∈ Z.
Da auf (0, 1) die Abschätzung 0 < f (x) <
πan
0<I <
n!
Z1
gilt, folgt
sin πx dx =
0
|
1
n!
{z
2
=π
2an (∗)
< 1.
n!
}
Dies aber widerspricht I ∈ Z. Folglich ist π 2 irrational.
(2) Wir wollen die Wallissche Formel
definieren wir
π
An :=
Z2
n
sin x dx =
0
π
2
= lim
n→∞
( 1·3·...·(2k−1)
π
2·4·...·(2k) 2
2·4·...·(2k)
1·3·...·(2k+1)
Qn
4k2
k=1 4k2 −1
beweisen. Dazu
n = 2k ≥ 2 (∗∗)
n = 2k + 1 ≥ 3.
Für x ∈ [0, π2 ] gilt sin2n+2 x ≤ sin2n+1 x ≤ sin2n x. Da sinn stetig ist, gilt
auerdem
π
π
Z2
Z2
sinn x dx = (R) − sinn x dx.
0
0
Aus der Monotonie des Riemann–Integrals folgt A2n+2 ≤ A2n+1 ≤ A2n . Daraus folgt mit (∗∗)
1 = lim
n→∞
A2n
A2n+1
A2n+2
2n + 1
≥ lim
≥ lim
= lim
= 1.
n→∞ A2n
n→∞ A2n
n→∞ 2n + 2
A2n
Wir haben also in der Tat in der letzten Ungleichung überall ein Gleichheitszeichen. Damit folgt
2 · 4 · . . . · (2n)
2 · 4 · . . . · (2n)
2
A2n+1 (∗∗)
= lim
·
·
n→∞ 1 · 3 · . . . · (2n + 1) 1 · 3 · . . . · · · (2n − 1) π
A2n
n
Y
(2k)2
2
= lim
· .
n→∞
(2k + 1)(2k − 1) π
1 = lim
n→∞
k=1
Folglich gilt
π
2
= lim
n→∞
Qn
(2k)2
k=1 (2k+1)(2k−1) .
286
7 Integralrechnung für Funktionen einer reellen Variablen
7.4 Der Mittelwertsatz der Integralrechnung
Satz 7.19 (1. Mittelwertsatz der Integralrechnung) Sei f : [a, b] −→
R stetig, g : [a, b] −→ R Riemann–integrierbar und g ≥ 0. Dann existiert ein
ξ ∈ [a, b] mit
Zb
Zb
f (x)g(x) dx = f (ξ) · g(x) dx.
a
Beweis:
1. Fall: Sei
Rb
a
g(x) dx = 0. Es ist zu zeigen, dass dann
Rb
f (x)g(x) dx = 0 gilt.
a
a
Da f : [a, b] −→ R stetig und [a, b] kompakt ist, existieren m := min f und
M := max f . Es folgt
m · g(x) ≤ f (x) · g(x) ≤ M · g(x)
Nach Integration ergibt sich 0 =
Rb
∀ x ∈ [a, b]. (∗)
f (x)g(x) dx.
a
2. Fall: Sei
Rb
g(x) dx > 0. Dann gilt nach (∗)
a
m≤
Rb
f (x)g(x) dx
a
Rb
g(x) dx
≤ M.
a
Sei m := f (xmin ), M := f (xmax ). Da f stetig ist, folgt aus dem Zwischenwertsatz, dass ein ξ ∈ [xmin , xmax ] ⊂ [a, b] existiert, so dass gilt
f (ξ) =
Rb
f (x)g(x) dx
a
Rb
.
g(x) dx
a
⊓
⊔
Folgerung 7.3 Ist f : [a, b] −→ R stetig, dann existiert ein ξ ∈ [a, b], so dass
gilt
Zb
f (x) dx = f (ξ) · (b − a).
a
Beweis: Folgt aus Satz 7.19 mit g ≡ 1.
⊓
⊔
7.4 Der Mittelwertsatz der Integralrechnung
Folgerung 7.4 Sei f : [a, b] −→ R stetig, f ≥ 0 und
f ≡ 0.
Rb
287
f (x) dx = 0. Dann ist
a
Beweis: Sei c ∈ [a, b] fixiert. Wir betrachten Folgen (xn ), (yn ) mit a ≤ xn <
c < yn ≤ b und xn −→ c, yn −→ c. Da f : [xn , yn ] −→ R stetig ist und f ≥ 0
ist, gilt
Zb
Zyn
0 ≤ f (x) dx ≤ f (x) dx = 0.
a
xn
Daraus folgt
0=
Zyn
xn
f (x) dx = f (ξn )(yn − xn ),
ξn ∈ [xn , yn ].
Folglich ist f (ξn ) = 0. Lassen wir n gegen ∞ laufen, so konvergiert ξn gegen c.
Da f stetig ist, konvergiert daher f (ξn ) gegen f (c). Folglich ist f (c) = 0. ⊓
⊔
Satz 7.20 (2. Mittelwertsatz der Integralrechnung)
Sei f : [a, b] −→ R stetig, g : [a, b] −→ R monoton wachsend und stetig
differenzierbar. Dann existiert ein ξ ∈ [a, b], so dass gilt
Zb
f (x)g(x) dx = g(a)
a
Zξ
f (x) dx + g(b)
a
Zb
f (x) dx.
ξ
Beweis: Sei F eine Stammfunktion von f mit F (a) = 0. Da g monoton
wachsend und differenzierbar ist, gilt g ′ ≥ 0. Wenden wir den 1. MWS der
Integralrechnung auf F · g ′ an, so erhalten wir ein ξ ∈ [a, b], so dass gilt
Zb
a
′
F (x)g (x) dx = F (ξ) ·
Zb
a
g ′ (x) dx = F (ξ) · (g(b) − g(a)),
(∗)
Da F eine Stammfunktion von f ist, gilt
Zb
f (x)g(x) dx =
a
Mit (∗) folgt nun
Zb
a
F (x)g(x) dx = F (x)g(x) ba −
′
Zb
a
F (x)g ′ (x) dx.
288
7 Integralrechnung für Funktionen einer reellen Variablen
Zb
a
f (x)g(x) dx = F (b)g(b) − F (a)g(a) + F (ξ)g(a) − F (ξ)g(b)
= g(a)(F (ξ) − F (a)) + g(b)(F (b) − F (ξ))
Zξ
Zb
= g(a) f (x) dx + g(b) f (x) dx.
a
ξ
⊓
⊔
Beispiel 7.14
Sei 0 < a < b < ∞. Dann gilt
lim
n→∞
Zb
sin nx
dx = 0.
x
a
Beweis: Es genügt zu zeigen, dass
b
Z
sin(rx) 4
dx ≤
x
ra
a
für alle r > 0 gilt. Setzen wir f (x) = sin rx und g(x) = − x1 , dann folgt mit
dem 2. Mittelwertsatz
−
Zb
a
sin (rx)
1
dx = −
x
a
Zξ
a
sin (rx) dx −
1
b
Zb
sin (rx) dx
ξ
ξ
b
1
1
cos (rx) +
cos (rx) .
=
ar
br
a
ξ
Daraus folgt sofort
b
Z
sin (rx) 1
1
dx ≤
| cos (rξ) − cos (ar)| + | cos (rb) − cos (rξ)|
{z
} br |
{z
}
x
ar |
a
≤2
2
2
4
≤
+
<
.
ar br
ar
≤2
⊓
⊔
7.5 Parameterabhängige Integrale
289
7.5 Parameterabhängige Integrale
Wir werden nun untersuchen, wann Integral und Ableitung vertauschbar sind.
Satz 7.21 Sei [a, b] ⊂ R ein kompaktes Intervall, U ⊂ Rn offen, f : [a, b] ×
U ⊂ Rn+1 −→ R eine stetige Funktion. Sei F : U −→ R definiert durch
F (x) :=
Zb
f (t, x) dt.
a
Dann gilt
(1) F : U ⊂ Rn −→ R ist stetig.
∂f
∂f
und ist ∂x
: [a, b] × U −→ R stetig, so ist F : U −→ R nach
(2) Existiert ∂x
i
i
xi stetig differenzierbar und es gilt
∂F
(x) =
∂xi
Zb
a
∂f
(t, x) dt.
∂xi
Beweis: F ist definiert, da f (., x) stetig ist.
(1) Sei x ∈ U fixiert und W (x) ⊂ U eine kompakte Umgebung von x. Nach
Voraussetzung ist f|[a,b]×W stetig. Da [a, b] × W kompakt ist, ist f|[a,b]×W
gleichmäßig stetig, das heißt, für alle ε > 0 existiert ein δ > 0, so dass für alle
t ∈ [a, b] und für alle |h| < δ gilt
|f (t, x + h) − f (t, x)| <
ε
.
|b − a|
Es folgt
b
Z
Zb
|F (x + h) − F (x)| = f (t, x + h) − f (t, x) dt ≤ |f (t, x + h) − f (t, x)| dt
a
≤
Zb
a
a
ε
dt = ε.
|b − a|
Folglich ist F stetig in x und es gilt
Zb
f (t, x) dt = F (x) = lim F (x + h) = lim
h→0
a
h→0
Zb
a
=
Zb
a
lim f (t, x + h) dt.
h→0
f (t, x + h) dt
290
7 Integralrechnung für Funktionen einer reellen Variablen
(2) Sei x ∈ U fixiert, h ∈ R hinreichend klein. Wir definieren
g : [a, b] × U × (−ε, ε) −→ R
(t, x, h) 7→ g(t, x, h) :=
(
f (t,x+hei )−f (t,x)
h
∂f
∂xi (t, x)
h 6= 0
h = 0.
Für h 6= 0 ist g stetig, da f stetig ist. Die Funktion g ist auch für h = 0 stetig,
denn wenden wir den Mittelwertsatz der Differentialrechnung an, so erhalten
wir
∂f
g(t, x, h) =
(t, x + ϑh · hei ) für ein ϑh ∈ [0, 1].
∂xi
∂f
stetig. Somit konvergiert x+ϑh hei gegen x0 , wenn
Nach Voraussetzung ist ∂x
i
(x, t, h) gegen (x0 , t0 , 0) geht und es folgt
g(x, t, h) =
∂f
∂f
(t, x + ϑh hei ) −→
(t0 , x0 ) = g(t0 , x0 , 0).
∂xi
∂xi
Folglich ist g auch für h = 0 stetig. Wenden wir nun (1) auf g an, so erhalten
wir
∂F
F (x + hei ) − F (x)
(x) = lim
= lim
h→0
h→0
∂xi
h
= lim
h→0
Zb
a
=
Zb
a
g(t, x, h) dt =
| {z }
stetig
Zb
Zb
f (t, x + hei ) − f (t, x)
dt
h
a
lim g(t, x, h) dt =
h→0
a
Zb
g(t, x, 0) dt
a
∂f
(t, x) dt.
∂xi
⊓
⊔
Sei f : [a, b] × [c, d] ⊂ R2 −→ R stetig differenzierbar und seien
g0 , g1 : [c, d] ⊂ R −→ [a, b] ⊂ R differenzierbar. Wir betrachten die Abbildung
G : [c, d] ⊂ R −→ R, definiert durch
G(x) :=
gZ
1 (x)
f (t, x) dt.
g0 (x)
Wie kann man die Ableitung von G berechnen? Sind g0 , g1 konstant, so kann
man dazu Satz 7.21 verwenden.
Satz 7.22 Die Abbildung G : [c, d] ⊂ R −→ R ist differenzierbar und es gilt
7.5 Parameterabhängige Integrale
′
G (x) =
gZ
1 (x)
291
∂f
(t, x) dt + g1′ (x)f (g1 (x), x) − g0′ (x)f (g0 (x), x).
∂x
g0 (x)
Beweis: Wir betrachten die Abbildungen
F (x) :=
Zb
f (t, x) dt,
F0 (y, x) :=
a
Zy
f (t, x) dt,
F1 (y, x) :=
a
Zb
f (t, x) dt
y
Dann gilt G(x) = F (x) − F0 (g0 (x), x) − F1 (g1 (x), x). (1) Nach Satz 7.21
existiert F ′ (x) und es gilt
′
F (x) =
Zb
∂f
(t, x) dt.
∂x
a
(2) Nach dem Hauptsatz der Differential- und Integralrechnung ist F0 (y, x) für
0
festes x eine Stammfunktion von f (·, x). Das heißt, für x fest gilt ∂F
∂y (y, x) =
f (y, x). Nach Satz 7.21 gilt außerdem für festes y
∂F0
(y, x) =
∂x
Zy
∂f
(t, x) dt.
∂x
a
Aus der Kettenregel folgt
∂F0
∂F0
d
(F0 (g0 (x), x)) =
(g0 (x), x))g0′ (x) +
(g0 (x), x))
dx
∂y
∂x
=
f (g0 (x), x)g0′ (x)
+
gZ
0 (x)
∂f
(t, x) dt.
∂x
a
(3) Analog gilt
d
(F1 (g1 (x), x)) = −f (g1 (x), x)) · g1′ (x) +
dx
Zb
∂f
(t, x) dt.
∂x
g1 (x)
Insgesamt erhalten wir
′
G (x) =
gZ
1 (x)
∂f
(t, x) dt + g1′ (x) · f (g1 (x), x) − g0′ (x) · f (g0 (x), x).
∂x
g0 (x)
⊓
⊔
292
7 Integralrechnung für Funktionen einer reellen Variablen
7.6 Uneigentliche Riemannsche Integrale
Sei f : [a, ∞) −→ E eine Abbildung und sei f auf jedem kompakten Intervall
Rx
[a, x] Riemann–integrierbar. Dann kann man F (x) := f (t) dt bilden.
a
Definition 7.10. f : [a, ∞) ⊂ R −→ E heißt auf [a, ∞) uneigentlich
Riemann–integrierbar, falls
Z∞
f (t) dt := lim
x→∞
a
Zx
a
f (t) dt ∈ E
Ra
existiert. Analog definiert man −∞ f (t) dt für eine Funktion f : (−∞, a] −→ R,
die auf jedem Intervall [x, a] Riemann–integrierbar ist.
Definition 7.11. Sei f : R −→ E auf jedem kompakten Intervall Riemann–
integrierbar.
Dann
R∞
R 0 heißt f auf R uneigentlich Riemann–integrierbar, falls
f
(t)
dt
und
f (t) dt existieren. Wir verwenden die Bezeichnung
0
−∞
Z∞
f (t) dt :=
−∞
Z0
f (t) dt +
−∞
Z∞
f (t) dt.
0
Bemerkung: Für die uneigentlichen Integrale gelten die gleichen Rechenregeln wie für die Riemann–Integrale, zum Beispiel Additivität, partielle Integration, usw.
Beispiel
7.15
R∞
0 sin t dt existiert nicht, denn es gilt
Zx
0
sin t dt = − cos x + cos 0 = − cos x + 1
und lim cos x existiert nicht.
x→∞
Beispiel 7.16
Es gilt
Z∞
0
dx
1 · 3 · . . . · (2n − 3) π
=
· .
(1 + x2 )n
2 · 4 · . . . · (2n − 2) 2
Zum Beweis betrachten wir
Rx
0
1
(1+t2 )n
dt. Mit der Substitution t = cot ϕ =
und dt = −(1 + cot2 ϕ) dϕ erhalten wir
cos ϕ
sin ϕ
7.6 Uneigentliche Riemannsche Integrale
Zx
0
arccot(x)
Z
1
dt = −
(1 + t2 )n
arccot(0)
Daraus folgt
π
π
Z2
Z2
1
dϕ =
(1 + cot2 ϕ)n−1
arccot(x)
arccot(x)
293
1 + cot2 ϕ
n dϕ.
1 + cot2 ϕ
sin2 ϕ
sin2 ϕ + cos2 ϕ
n−1
dϕ
π
Z2
=
(sin ϕ)2n−2 dϕ.
arccot(x)
Wegen arccot(x) → 0 für x → ∞ folgt
Z∞
π
1
dx =
(1 + x2 )n
Z2
(sin ϕ)2n−2 dϕ =
0
0
1 · 3 · . . . · (2n − 3) π
· .
2 · 4 · . . . · (2n − 2) 2
Sei nun f : (a, b) ⊂ R −→ E eine Abbildung, die auf jedem Intervall [α, β] ⊂
(a, b) Riemann–integrierbar ist.
Definition 7.12. f heißt auf (a, b) uneigentlich Riemann–integrierbar, falls
die Grenzwerte
Zx0
Zβ
lim
f (t) dt,
lim
f (t) dt
β→b−
α→a+
α
x0
für ein beliebiges aber festes x0 ∈ (a, b) existieren. Wir verwenden die Bezeichnung
Zb
Zx0
Zβ
f (t) dt := lim+ f (t) dt + lim− f (t) dt.
α→a
a
β→b
α
x0
Beispiel 7.17 (Die Gamma–Funktion (Verallgemeinerung von n!))
Sei x ∈ R+ gegeben. Die Gamma–Funktion ist definiert durch
Γ (x) :=
Z∞
tx−1 e−t dt.
0
Dieses Integral konvergiert:
(1) Für t > 0 gilt 0 < tx−1 e−t < tx−1 und es folgt
294
7 Integralrechnung für Funktionen einer reellen Variablen
0<
Z1
t
x−1 −t
e
α
dt ≤
Z1
1 αx
1
1 1
<
tx−1 dt = [ tx ]α = −
x
x
x
x
α
(x, α > 0).
R1
Da g(α) = α tx−1 e−t dt bei α −→ 0 monoton wachsend und durch
schränkt ist, existiert der Grenzwert
lim
α→0
Z1
t
x−1 −t
e
Z1
dt =
t
(2) Es gilt tx−1 e−t =
M > 0, so dass
et
·
be-
tx−1 e−t dt.
0
α
x+1
1
x
1
t2
und lim
x+1
t
t→∞
tx−1 e−t ≤
1
t2
= 0. Das heißt, es existiert ein
et
∀ t ≥ M.
Daraus folgt
Zβ
t
x−1 −t
e
dt ≤
M
Da h(β) =
Rβ
M
Zβ
1β
1
1
dt = [ − ]M ≤
.
2
t
t
M
M
tx−1 e−t dt bei β −→ ∞ monoton wachsend und durch
1
M
be-
schränkt ist, existiert
Z∞
t
x−1 −t
e
dt = lim
β→∞
M
Zβ
tx−1 e−t dt.
M
Folglich gilt
Z∞
0
t
x−1 −t
e
dt = lim
α→0
Z1
α
t
x−1 −t
e
dt +
ZM
t
x−1 −t
e
dt + lim
1
β→∞
Zβ
tx−1 e−t dt = Γ (x).
M
Satz 7.23 (Eigenschaften der Γ –Funktion)
Γ hat folgende Eigenschaften
(1) Γ (x + 1) = x · Γ (x) ∀x > 0,
(2) Γ (1) = 1,
(3) Γ (n) = (n − 1)! ∀n ∈ N, das heißt, die Γ –Funktion verallgemeinert die
Fakultät,
(4) Γ ist logarithmisch–konvex, das heißt ln Γ ist konvex,
n!·nx
(Gaußsche Definition der Γ –Funktion),
(5) Γ (x) = lim x(x+1)·...·(x+n)
n→∞
√
1
(6) Γ ( 2 ) = π.
7.6 Uneigentliche Riemannsche Integrale
295
Beweis:
(1) Es gilt
Γ (x+1) =
Z∞
x −t
t e
dt =
Z∞
0
0
−t ′
x
−t (e ) dt =
Z∞
0
x·tx−1 ·e−t dt = x·Γ (x),
∀ x > 0.
(2) Es gilt
Γ (1) =
Z∞
0
1
+ e0 = 1.
t→∞ et
e−t dt = −e−t |∞
0 = − lim
(3) folgt aus (1) und (2) durch Induktion.
(4) Wir zeigen, dass die Γ –Funktion logarithmisch–konvex ist. Dazu ist zu
zeigen, dass für x ∈ (0, 1) gilt
ln Γ (x · a + (1 − x) · b) ≤ x · ln Γ (a) + (1 − x) ln Γ (b) ∀ a, b ∈ R+ ,
bzw., dass gilt
Γ (x · a + (1 − x) · b) ≤ Γ (a)x · Γ (b)1−x
∀ x ∈ (0, 1), a, b ∈ R+ .
Wir benutzen nun die Hölder–Ungleichung für Integrale.
Zr
ε
f (t)g(t) dt ≤ 
wobei p, q > 0 und
1
p
+
1
q

1
p
+
= 1. Sei f (t) := t
Zr
ε
t
a
b
p + q −1
e
−t
1
q
Zr
ε
 q1
 p1  r
Z
f (t)p  ·  g(t)q  ,
ε
= 1 gelten. Sei p =
a−1
p
e
− pt

dt ≤ 
und g(t) := t
Zr
ε
t
a−1 −t
e
x
dt
1
x,
b−1
q
e
q=
− qt
Z
1
1−x ,
das heißt, es gilt
. Dann folgt
r
t
b−1 −t
e
ε
dt
1−x
.
Lassen wir nun ε gegen 0 und r gegen ∞ konvergieren, so erhalten wir
Γ (xa + (1 − x)b) ≤ Γ (a)x · Γ (b)1−x .
(5) Für x = 1 ist die angegebene Formel offensichtlich erfüllt. Sei nun x ∈
(0, 1). Dann gilt für alle n ∈ N, dass (n + x) = (1 − x)n + x(n + 1) ist. Daher
ist
Γ (n + x) ≤ Γ (n)1−x · Γ (n + 1)x = Γ (n)1−x · Γ (n)x · nx = (n − 1)! · nx
(∗)
296
7 Integralrechnung für Funktionen einer reellen Variablen
Des Weiteren gilt für x ∈ (0, 1) und n ∈ N, dass
n + 1 = x(n + x) + (1 − x)(n + 1 + x)
ist und folglich
Γ (n + 1) ≤ Γ (n + x)x · Γ (n + 1 + x)1−x = Γ (n + x) · (n + x)1−x .
Es folgt
n!(n + x)x−1 ≤ Γ (n + x) (∗∗)
Nach (1) gilt Γ (n + x) = Γ (x) · x · (x + 1) · . . . · (x + n − 1). Mit (∗) und (∗∗)
folgt dann
n!(n + x)x−1
(n − 1)!nx
≤ Γ (x) ≤
x(x + 1) · . . . · (x + n − 1)
x(x + 1) · . . . · (x + n − 1)
|
|
{z
}
{z
}
=:an (x)
=:bn (x)
und damit
an (x)
n(n + x)x−1
= lim
= lim
n→∞ bn (x)
n→∞
n→∞
nx
= 1.
lim
n+x
n
x−1
x x−1
1+
n→∞
n
= lim
Daher ist
(n − 1)!nx
n→∞ x(x + 1) · . . . · (x + n − 1)
n!nx
x+n
= lim
n→∞ x(x + 1) · . . . · (x + n)
n
| {z }
Γ (x) = lim
n!nx
= lim
n→∞ x(x + 1) · . . . · (x + n)
−→1
∀x ∈ (0, 1).
Somit gilt die Formel aus (5) für x ∈ (0, 1]. Es bleibt zu zeigen, dass, falls (5)
für x gilt, (5) auch für x + 1 erfüllt ist. Die Formel aus (5) gelte nun für ein
x. Dann folgt
n! nx
·x
n→∞ x(x + 1) · . . . · (x + n)
x+1+n
n! nx+1
·
= lim
n→∞ (x + 1) · . . . · (x + 1 + n)
n }
| {z
Γ (x + 1) = x · Γ (x) = lim
x+1
= lim
n→∞
(6) Aus (5) folgt
n! n
.
(x + 1) · . . . · (x + 1 + n)
−→1
7.6 Uneigentliche Riemannsche Integrale
297
√
n! n
1
= lim 1 1
Γ
n→∞ ( + 1) · . . . · ( 1 + n)
2
2 2
2
√
n! n
= lim
.
n→∞ (1 − 1 )(2 − 1 ) · . . . · (n − 1 )(n + 1 )
2
2
2
2
Daher folgt mit der Wallisschen Formel
2
n
Y
1
k2
n · (n!)2
Q
Γ
=
2
·
lim
= lim 1
n
1
1
1
n→∞
n→∞ (n + ) ·
2
k2 −
k=1 (k − 2 )(k + 2 ))
2
2
k=1
π
= 2· .
2
√
Somit gilt Γ ( 12 ) = π.
1
4
⊓
⊔
Zusammenhang zwischen der Konvergenz von Reihen und der
Existenz uneigentlicher Integrale
Satz 7.24 Sei f : [a, ∞) −→ R stetig, positiv und monoton fallend. Dann
existiert der Grenzwert


N
Z+1
N
X
lim 
f (a + n) −
f (x) dx =: (∗)
N →∞
n=0
a
und es gilt 0 ≤ (∗) ≤ f (a). Insbesondere konvergiert
wenn das uneigentliche Integral
R∞
f (x) dx existiert.
∞
P
f (a + n) genau dann,
n=0
a
Beweis: Da f monoton fallend ist, gilt
f (a + n + 1) ≤ f (x) ≤ f (a + n)
∀ x ∈ [a + n, a + n + 1].
Folglich ist
f (a + n + 1) ≤
a+n+1
Z
a+n
f (x) dx ≤ f (a + n) (∗)
und
N
X
f (a + n + 1) =
n=0
N
+1
X
n=1
f (a + n) ≤
a+N
Z +1
a
Sei nun
bN :=
N
X
n=0
f (a + n) −
f (x) dx ≤
a+N
Z +1
N
X
n=0
f (x) dx.
a
f (a + n). (∗∗)
298
7 Integralrechnung für Funktionen einer reellen Variablen
Da f positiv ist, gilt mit (∗∗)
0 ≤ bN ≤
N
X
n=0
f (a + n) −
N
+1
X
n=1
f (a + n) = f (a) − f (a + N + 1) ≤ f (a).
Desweiteren gilt
bN = bN −1 + f (a + N ) −
a+N
Z +1
f (x) dx ≥ bN −1
a+N
{z
|
∀ N ∈ N.
}
≥0 wegen (∗)
Folglich ist {bN } eine monoton wachsende, beschränkte Folge. Somit existiert
b = lim bN und es gilt 0 ≤ b ≤ f (a).
⊓
⊔
N →∞
Beispiel 7.18
∞
P
Die Riemannsche Zeta–Funktion ζ(x) :=
n=1
1
nx .
Wir wissen bereits, dass ζ(x) für x > 1 konvergiert und für x ≤ 1 divergiert.
Mit Hilfe von Satz 7.24 können P
wir nun einen neuen Beweis dafür angeben:
∞
Sei f (t) := t1x . Dann ist ζ(x) = k=0 f (1 + k). Die Funktion f ist monoton
fallend auf [1, ∞) und es gilt
Z∞
1
1
dt = lim
r→∞
tx
Zr
t
−x
dt = lim
r→∞
1
Folglich existiert
R∞
1
1
tx
dt =
1
x−1
1
t−x+1 |r1
−x + 1
für x > 1, aber
=
R∞
1
1
( lim (1 − r1−x )).
x − 1 r→∞
1
tx
dt existiert nicht für
x ≤ 1. Aus Satz 7.24 folgt nun, dass ζ(x) genau dann konvergiert, wenn x > 1
ist und
1
0 ≤ ζ(x) −
≤ 1.
x−1
gilt.
Beispiel 7.19 (Die Euler–Konstante.)
Behauptung: Es existiert
CEuler
1
1
:= lim 1 + + . . . + − ln(n) ,
n→∞
2
n
das heißt, die Partialsummen der harmonischen Reihe wachsen wie ln(n). Zum
Beweis betrachten wir die Funktion f (t) = 1t auf [1, ∞). f ist monoton fallend
und f ≥ 0. Folglich gilt nach Satz 7.24, dass CEuler existiert und
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete

0 ≤ lim 
N →∞
gilt.
|
N
−1
X
n=0
f (1 + n) −
{z
ZN
1
299

1 
dx ≤ f (1) = 1
x
}
1
−ln(N ))
(1+ 12 +...+ N
7.7 Die Länge von Kurven und die Flächeninhalte
ebener Gebiete
Definition 7.13. Sei I ⊂ R ein beliebiges Intervall. Eine parametrisierte
Kurve im Rn ist eine stetige Abbildung γ : I −→ Rn .
γ(t)
Wir betrachten also mit γ : I −→ Rn nicht nur das Bild der Kurve, sondern
auch, wie die Kurve (z.B. mit welcher Geschwindigkeit) durchlaufen wird. Wir
werden nun untersuchen, wie man die Länge der Kurve γ bestimmen kann.
Sei P = {x0 < x1 < . . . < xm }
eine Zerlegung von I = [a, b]. Dann
gibt
L(γ, P) :=
m
X
k=1
kγ(xk ) − γ(xk−1 )k
•
γ(x1 )
•
γ(a)
γ(x2 )
•
•
γ(b)
•
γ(x3 )
die Länge des durch P definierten Polygonzuges über γ(x0 ), γ(x1 ), . . . , γ(xm )
e ≥ P, dass L(γ, P)
e ≥ L(γ, P)
an. Nach der Dreiecksungleichung folgt aus P
gilt.
Definition 7.14. Eine Kurve γ : [a, b] −→ Rn heißt rektifizierbar, falls
L(γ) := sup{L(γ, P)}
P
existiert. L(γ) heißt Länge von γ.
300
7 Integralrechnung für Funktionen einer reellen Variablen
Beispiel 7.20
Ist γ : [a, b] −→ Rn Lipschitz-stetig, so ist γ rektifizierbar, denn es gilt für alle
t, s ∈ [a, b], dass kγ(t) − γ(s)k ≤ L(t − s) ist. Folglich ist für alle Zerlegungen
P
L(γ, P) =
m
X
k=1
kγ (xk ) − γ (xk−1 ) k ≤ L
m
X
k=1
(xk − xk−1 ) = L(b − a).
Beispiel 7.21
Nicht jede stetige Kurve ist rektifizierbar. Zum Beispiel ist γ : [0, 1] → R2 ,
(
t ∈ (0, 1]
t, t · cos πt
γ(t) :=
0
t=0
stetig, schwankt aber bei t → 0 zu oft hin und her und ist deshalb nicht
rektifizierbar (Übungsaufgabe).
0, 5
f (x) = x cos
0, 2
0, 4
0, 6
0, 8
π
x
1
−0, 5
−1
Definition 7.15. Sei f : [a, b] → R eine Funktion. f heißt von beschränkter
Variation , falls eine Konstante C existiert, so dass für jede Zerlegung P =
{a = x0 , x1 , . . . , xm = b} von [a, b] gilt
V (f, P) :=
m
X
k=1
kf (xk ) − f (xk−1 ) k ≤ C.
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
301
V (f, P) misst also wie stark die Funktion f schwankt. Weiterhin definieren
wir die totale Variation von f
V f := supV (f, P).
P
Man kann folgendes zeigen:
Satz 7.25 γ : [a, b] → Rn ist genau dann rektifizierbar, wenn jede Komponente von γ eine beschränkte Variation hat.
Definition 7.16. Eine parametrisierte Kurve γ : I −→ Rn heißt genau dann
von der Klasse C k bzw. C k –Kurve, wenn γ k–mal stetig differenzierbar ist.
Sei γ : I −→ Rn eine C 1 –Kurve. γ heißt genau dann regulär, wenn γ ′ (t) 6= 0
für alle t ∈ I gilt.
Definition 7.17. Sei Γ ⊂ Rn eine Teilmenge. Eine parametrisierte Kurve
γ : I −→ Rn mit Im(γ) = Γ heißt Parametrisierung von Γ .
Beispiel 7.22
Die Kurve γ : [0, 2π] −→ R2 ≃ C, gegeben durch γ(t) = (r cos t, r sin t) = reit ,
beschreibt den Kreis vom Radius r.
Beispiel 7.23
Die Schraubenkurve γ : R −→ R3 , gegeben durch
γ(t) = (r cos t, r sin t, ct), beschreibt die Bewegung eines Punktes, der sich mit konstanter Winkelgeschwindigkeit auf einem Zylinder vom Radius r nach oben
bewegt.
c · 2π
6
?
Für C 1 –Kurven γ : [a, b] −→ Rn kann man L(γ) mit Hilfe des Riemann–
Integrals berechnen.
Satz 7.26 Sei γ : [a, b] −→ Rn eine C 1 –Kurve. Dann ist γ rektifizierbar und
es gilt
Zb
L(γ) = kγ ′ (t)k dt.
| {z }
a
stetig
Bemerkung: Infinitesimal gilt also: Weg =
b Geschwindigkeit · Zeit.
Beweis:
(1) Da γ eine C 1 -Funktion ist, ist γ auch Lipschitz-stetig und damit rektifiRb
zierbar (siehe Beispiel 7.20). Wir zeigen zuerst, dass L(γ) ≤ a kγ ′ (s)k ds gilt.
Sei P = {a = x0 < x1 < . . . < xm = b} eine beliebige Zerlegung von [a, b]. Da
γ differenzierbar ist, gilt dann
302
7 Integralrechnung für Funktionen einer reellen Variablen
L(γ, P) =
≤
m
X
k=1
kγ(xk ) − γ(xk−1 )k =
m Zxk
X
k=1x
k−1
′
kγ (s)k ds =
Zb
m
X
Zxk
k
γ ′ (s) dsk
k=1 x
k−1
kγ ′ (s)k ds.
a
Also ist
L(γ) = sup L(γ, P) ≤
P
Zb
kγ ′ (s)k ds,
(∗).
a
(2) Nun zeigen wir, dass in (∗) Gleichheit gilt. Wir betrachten dazu die Hilfsfunktion l : [a, b] → [0, L(γ)],
t 7→ l(t) := L γ|[a,t] = sup L γ|[a,t] , P .
P
Sei t ∈ [a, b), h > 0 und t + h ∈ [a, b]. Dann ist
L γ|[t,t+h] ≥
γ(t + h)
kγ(t + h) − γ(t)k
{z
}
|
kürzeste Länge zw. den EP
γ(t)
Wir wenden (∗) auf γ|[t,t+h] an und erhalten
kγ(t + h) − γ(t)k ≤ L γ|[t,t+h]
t+h
Z
≤
kγ ′ (s)k ds.
t
Es gilt L γ|[a,b] = L γ|[a,t] + L γ|[t,b] und daher
L γ|[t,t+h] = L γ|[a,t+h] − L γ|[a,t] = l(t + h) − l(t).
Deshalb ist
t+h
Z
γ(t + h) − γ(t) 1
l(t + h) − l(t)
≤
kγ ′ (s)k ds
≤
h
h
h
t
1
= (F (t + h) − F (t)) ,
h
wobei F die Stammfunktion von γ bezeichnet. Durch Limesbildung lim folgt
h→0
nun
l(t + h) − l(t)
kγ ′ (t)k ≤ lim
≤ F ′ (t) = kγ ′ (t)k.
h→0
h
Also ist
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
303
l(t + h) − l(t)
= kγ ′ (t)k.
h→0
h
l′ (t) = lim
Nun folgt sofort
L(γ) = l(b) − l(a) =
Zb
′
l (t) dt =
a
Zb
a
kγ ′ (t)k dt.
⊓
⊔
Definition 7.18. Sei I ⊂ R ein beliebiges Intervall und γ : I −→ Rn eine
C 1 –Kurve. Dann heißt
Z
L(γ) := kγ ′ (t)k dt,
I
Länge von γ.
Hierbei handelt es sich unter Umständen um ein uneigentliches Integral.
Definition 7.19. Sei γ : I ⊂ R → Rn stückweise C 1 , d.h., γ ist stetig und es
existieren endlich viele Punkte a = t0 < t1 < t2 < . . . < tm = b, tj ∈ I, so
dass γ auf (ti , ti+1 ) C 1 ist. Dann nennen wir
L(γ) :=
m Ztk
X
k=1t
k−1
kγ ′ (s)k ds
Länge von γ.
Beispiel 7.24 (Kreislinie)
Wir betrachten die Kreislinie γ : [0, 2π] −→ R2 ,
definiert durch γ(t) = (r cos t, r sin t). Dann ist
γ ′ (t) = (−r sin t, r cos t) und kγ ′ (t)k = r. Folglich erhalten wir für die Länge
L(γ) =
Z2π
r dt = 2πr.
0
Für die Kurve γ(t) = (cos t, sin t) mit t ∈ [0, φ] ergibt sich
L(γ) =
Zφ
0
1 dt = φ.
γ(t)
t
r
304
7 Integralrechnung für Funktionen einer reellen Variablen
Beispiel 7.25 (Schraubenlinie)
Wir betrachten die Schraubenlinie
γ : [0, 2π] −→ R3 , gegeben durch
γ(t)
=
(r cos t, r sin t, ct). Dann
ist γ ′ (t) =
√ (−r sin t, r cos t, c) und
kγ ′ (t)k =
r2 + c2 . Folglich erhalten
wir für die Länge der Schraubenlinie
bei
√
einer Umdrehung L(γ) = 2π r2 + c2 .
γ(2π)
c
γ(0)
r
Beispiel 7.26 (Umfang der Ellipse)
Eine Ellipse wird durch Punkte (x, y) ∈ R3
2
2
beschrieben, für die gilt xa2 + yb2 = 1, wobei
a, b ∈ R\{0} sind. Es gelte a > b und es sei
2
k 2 := 1 − ab 2 < 1. Wir parametrisieren die
Ellipse durch die Kurve γ : [0, 2π) −→ R2 mit
γ(t) = (a cos t, b sin t). Dann gilt
γ ′ (t) = (−a sin t, b cos t),
kγ ′ (t)k =
und wir erhalten
y
b
γ(t)
t
ax
p
a2 sin2 t + b2 cos2 t,
Z2πp
Z2πr
b2
2
2
sin t + 2 cos t dt = a
L(γ) = a
1 − k 2 cos2 t dt.
a
0
0
Dies ist ein elliptisches Integral, das heißt, es ist nicht√
durch elementare Funktionen ausdrückbar. Durch Reihenentwicklung von 1 − x (wie in Beispiel
7.12) erhalten wir


∞ 1
X
1
·
3
·
.
.
.
·
(2j
−
1)
2 (−1)j k 2j
L(γ) = 2a 1 +
· π .
j
2
·
4
·
.
.
.
·
(2j)
j=1
Falls a = b = r ist (es sich also um eine Kreisbahn handelt), folgt k = 0 und
damit L(γ) = 2πr.
Beispiel 7.27 (Länge eines Graphen)
Sei f : [a, b] → Rn eine C 1 –Kurve und
Γ = graph(f ) = {(x, f (x)) ⊂ Rn+1 } ihr
Graph.
Rn
Γ
a
b
Wir parametrisieren den Graphen Γ durch die Kurve γ : [a, b] → R
γ(x) := (x, f (x)). Dann ist
x
n+1
mit
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
γ ′ (x) = (1, f ′ (x)) = (1, f1′ (x), . . . , fn′ (x)),
und
305
p
kγ ′ (x)k = 1 + kf ′ (x)k2 ,
Zb p
Zb q
′
2
1 + f1′ (x)2 + . . . + fn′ (x)2 dx
L(γ) =
1 + kf (x)k dx =
a
a
Beispiel 7.28 (In Polarkoordinaten gegebene Kurven)
Sei
γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C.
Dann ist
γ ′ (t) = (r′ (t) cos ϕ(t) − r(t) sin ϕ(t) · ϕ′ (t), r′ (t) sin ϕ(t) + r(t) cos ϕ(t) · ϕ′ (t))
und
kγ ′ (t)k =
p
r′ (t)2 + r(t)2 · ϕ′ (t)2 .
Damit ergibt sich für die Länge der Kurve
L(γ) =
Zb p
r′ (t)2 + r(t)2 · ϕ′ (t)2 dt.
a
Ist hingegen ϕ der Parameter der Kurve, also γ(ϕ) = r(ϕ)eiϕ mit r = r(ϕ),
so ist
Zϕ2 p
r′ (ϕ)2 + r(ϕ)2 dϕ.
L(γ) =
ϕ1
Zum Beispiel gilt für die logarithmische Spirale mit r(ϕ) = ecϕ , c ∈ R,
Z2πp
c2 + 1 · ecϕ dϕ
L(γ) =
0
p
1 2πc
= c2 + 1 ·
e
−1 .
c
reiϕ
r
ϕ
306
7 Integralrechnung für Funktionen einer reellen Variablen
Eigenschaften der Länge von C 1 -Kurven
Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve und Γ := Im(γ) das Bild von γ. Man
kann Γ auf verschiedene Weisen (z.B. mit unterschiedlicher Geschwindigkeit)
durchlaufen:
Definition 7.20. Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve und τ : Ib → I eine
Parametertransformation, d.h., ein C 1 -Diffeomorphismus. Dann heißt
Umparametrisierung von γ.
γ
b := γ ◦ τ : Ib → Rn
Es gilt also Γ = Im(γ) = Im(b
γ ). Sinnvollerweise sollten geometrische Eigenschaften wie die Länge der Kurve nicht von der Parametrisierung abhängen,
so wie die Länge eines Weges unabhängig davon ist, wie schnell man ihn
zurücklegt.
Satz 7.27 Sei γ : [a, b] → Rn eine C 1 –Kurve.
1) Ist γ
b = γ ◦ τ : [b
a, bb] → Rn eine Umparametrisierung von γ, so gilt
L(γ) = L(b
γ ).
2) Ist R : Rn → Rn eine Euklidische Bewegung, d.h., R(x) = Ax + x0 mit
A ∈ O(n), x0 ∈ Rn , so gilt L(γ) = L(R ◦ γ).
Beweis:
1) Aus γ
b(s) = γ(τ (s)) folgt γ
b′ (s) = γ ′ (τ (s)) · τ ′ (s) und damit
Zbb Zbb ′ γ (s) ds = γ ′ (τ (s)) · |τ ′ (s)| ds.
L (b
γ ) = b
b
a
b
a
Wir substituieren t := τ (s). Dann ist dt = τ ′ (s)ds.
b = a und
a) Falls τ ′ (s) > 0 ist, ist τ monoton wachsend, d.h., es gilt τ (a)
b = b. Weiterhin ist |τ ′ (s)| = τ (s) und es folgt
τ (b)
Zb L (b
γ ) = γ ′ (t)dt = L(γ).
a
b = b und τ (b)
b = a.
b) Falls τ ′ (s) < 0 ist, ist τ monoton fallend, d.h., es gilt τ (a)
′
Weiterhin ist |τ (s)| = −τ (s) und es folgt
Za Zb ′ L (b
γ ) = − γ (t)dt = γ ′ (t)dt = L(γ).
b
a
2) Sei die Kurve δ : [a, b] → Rn definiert durch δ(t) := R · γ(t) = Aγ(t) + x0 .
Dann ist δ ′ (t) = Aγ ′ (t) und daher
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
kδ ′ (t)k = kAγ ′ (t)k = kγ ′ (t)k,
307
da A ∈ O(n).
⊓
⊔
Also ist L(δ) = L(γ).
Definition 7.21. Sei γ : I ⊂ R −→ Rn eine C 1 –Kurve. γ heißt regulär, falls
γ ′ (t) 6= 0 für alle t ∈ I gilt.
Reguläre Kurven besitzen in jedem Punkt eine Tangente.
γ ′ (t)
T ant γ = γ(t) + Rγ ′ (t)
γ(t)
Imγ = Γ
Oft wählt man Parametrisierungen, bei denen die Kurve mit konstanter Geschwindigkeit durchlaufen wird, z.B. mit der Geschwindigkeit 1, d.h.
kγ ′ (t) = 1k.
Definition 7.22. Eine C 1 -Kurve γ : I ⊂ R → Rn+1 heißt “durch ihre Bogenlänge parametrisiert”, falls
L γ|[α,β] = β − α, ∀ [α, β] ⊂ I.
Satz 7.28
1) Die Kurve γ : I → Rn ist genau dann durch ihre Bogenlänge parametrisiert,
wenn kγ ′ (t)k ≡ 1 ist für alle t ∈ I.
2) Ist γ : I → Rn eine reguläre Kurve, so existiert eine Umparametrisierung
γ
b = γ ◦ τ mit kγ ′ (t)k ≡ 1 für alle t ∈ I (d.h., γ
b ist durch ihre Bogenlänge
parametrisiert).
Beweis:
1) (=⇒) Wie im Beweis von Satz 7.26 betrachten wir die Hilfsfunktion
l : [a, b] → [0, L(γ)],
t 7→ l(t) := L γ|[a,t] =
Zt
kγ ′ (s)k ds.
a
Dann gilt nach Voraussetzung l(t) = t − a und offensichtlich ist l′ (t) = 1.
Andererseits ist nach dem Hauptsatz der Differential- und Integralrechnung
l′ (t) = kγ ′ (t)k. Daraus folgt kγ ′ (t)k = 1 für alle t ∈ I.
(⇐=) Wenn kγ ′ (t)k = 1 ist für alle t ∈ I, dann ist
308
7 Integralrechnung für Funktionen einer reellen Variablen
L γ[α,β] =
Zβ
kγ ′ (t)k dt = β − α ∀ [α, β] ∈ I,
α
n
d.h., γ : I → R ist durch ihre Bogenlänge parametrisiert.
2) Wir betrachten wieder die Hilfsfunktion l aus 1). Wenn γ regulär ist, dann
ist l′ (t) = kγ ′ (t)k > 0 und l ist stetig differenzierbar und streng monoton
wachsend. Deshalb existiert eine differenzierbare Umkehrfunktion τ von l
τ : [0, L] → [a, b]
s 7→ τ (s)
und es gilt τ ′ (s) =
1
l′ (τ (s))
mit l(τ (s) = s)
> 0. Sei γ
b := γ ◦ τ . Dann gilt
γ
b′ (s) = γ ′ (τ (s)) · τ ′ (s) =
γ ′ (τ (s))
γ ′ (τ (s))
=
.
l′ (τ (s))
kγ ′ (τ (s))k
Also ist kb
γ ′ (s)k ≡ 1.
⊓
⊔
Der Flächeninhalt ebener Gebiete
Definition 7.23. Eine stetige Kurve γ : [a, b] → Rn heißt
•
•
geschlossen, falls γ(a) = γ(b) gilt.
einfach, falls γ : (a, b) → Rn injektiv ist.
Eine einfache geschlossene Kurve γ : [a, b] → R2 heißt positiv-orientiert, falls
sie entgegen dem Uhrzeigersinn durchlaufen wird.
Sei nun γ : [a, b] → R2 eine einfache, geschlossene und positiv-orientierte
Kurve:
n=2
Γ = Im γ
Ω
γ(a) = γ(b)
Sei Ω das von Γ := Im(γ) umschlossene Gebiet. Wie berechnet man dann
seinen Flächeninhalt Area(Ω) ?
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
309
Satz 7.29 Sei γ : [a, b] → R2 eine (stückweise) C 1 -Kurve, einfach, geschlossen und positiv-orientiert. Sei Ω ⊂ R2 das von Γ := Im(γ) umschlossene
Gebiet. Weiterhin seien x, y : [a, b] → R die Koordinatenfunktionen von γ,
d.h., γ(t) =: (x(t), y(t)). Dann gilt
Area(Ω) = −
Zb
y(t)x′ (t) dt.
a
Da γ geschlossen ist, folgt mit partieller Integration
Area(Ω) =
Zb
1
y (t)x(t) dt =
2
′
Zb
(x(t)y ′ (t) − y(t)x′ (t)) dt.
a
a
Area(Ω) wird also durch die Randkurve ausgedrückt. Dies ist ein Spezialfall
des Satzes von Stokes.
Beweis: 1) Wir betrachten zunächst Kurven γ, bei denen das Bild der Kurve
aus zwei zur y-Achse parallelen Geraden und zwei Bögen, die Graphen von
Funktionen f1 , f2 sind, besteht.
f1 , f2 > 0
f1 (x)
γ (t1 )
γ(a) = γ(b)
Ω
γ (t3 )
γ (t2 )
f2 (x)
x1
x2
Nach Definition des Riemann–Integrals ist
Area(Ω) =
Zx2
x1
f1 (x) dx −
Zx2
f2 (x) dx.
(∗)
x1
Für die obige Kurve γ(t) = (x(t), y(t)) gilt

(x(t), f1 (x(t))) ,



(x , y(t)) ,
1
(x(t), y(t)) =
(x(t), f2 (x(t))) ,



(x2 , y(t)) ,
t ∈ [a, t1 ]
t ∈ [t1 , t2 ]
t ∈ [t2 , t3 ]
t ∈ [t3 , b].
310
7 Integralrechnung für Funktionen einer reellen Variablen
Die Koordinatentransformation x = x(t), dx = x′ (t)dt mit x1 = x(t1 ) und
x2 = x(a) liefert für das erste Integral in (∗)
Zx2
Za
f1 (x) dx =
f1 (x(t)) · x′ (t) dt = −
t1
x1
Zt1
y(t)x′ (t) dt.
a
Analog ergibt sich mit x = x(t), dx = x′ (t)dt sowie x1 = x(t2 ) und x2 = x(t3 )
für das zweite Integral in (∗)
Zx2
f2 (x) dx =
x1
Zt3
y(t)x′ (t) dt.
t2
Damit ergibt sich insgesamt
t

Z1
Zt3
Zb
′
′


Area(Ω) = −
y(t)x (t) dt + y(t)x (t) dt = − y(t)x′ (t) dt,
a
t2
a
da x(t) = const für t ∈ [t1 , t2 ] und t ∈ [t3 , b].
2) Wir betrachten nun den allgemeinen Fall.
E
γ (t4 )
γ (t5 )
Ω1
γ (t8 )
Ω6
Ω2
Ω3
γ (t1 )
Ω γ(a) = γ(b)
7
γ (t13 )
Ω4
Ω5
γ (t11 )
γ (t9 )
KS geeignet legen
Beh.: Man kann Ω in eine endliche Zahl von Gebieten zerlegen, die die Form
aus 1) haben. Sei E die y-Achse und Γ liege im positiven Quadranten. Wir
betrachten die stetig differenzierbare Abbildung
̺(t) = dist(E, γ(t)) = x(t).
Da das Intervall [a, b] kompakt ist, hat ̺ nur endlich viele lokale Maxima und
Minima. Wie zeichnen in diesen Punkten, wie im Bild dargestellt, die zu E
parallelen Geraden. Dann zerlegt sich Ω in Gebiete der Form 1).
Wenn x′ (t) 6= 0 ist, ist x′ > 0 oder x′ < 0. Daher ist x(t) zwischen den
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
311
kritischen Punkten von x(t) monoton wachsend oder monoton fallend. Deshalb
existiert eine Umkehrfunktion t = t(x) und die Teilstücke von γ sind Graphen
einer Funktion: γ(t) = (x(t), y(t)) mit y = y(t) = y(t(x)) =: f (x). Nun können
wir die Fläche von Ω leicht berechnen:
Area(Ω) =
m
X
Area (Ωi )
i=1
=−
Zt1
′
y(t)x (t) dt +
a
Zb
′
y(t)x (t) dt +
t13
+
Zt3
=−
y(t)x′ (t) dt
t1
y(t)x′ (t) dt + . . .
t12
Zb
Zt2
y(t)x′ (t) dt,
a
wobei wir im letzten Schritt benutzt haben, dass alle Parameterabschnitte
[ti , ti+1 ] genau einmal auftreten.
⊓
⊔
Folgerung 7.5 Ist die Randkurve γ in Polarkoordinaten gegeben, d.h.,
γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)),
so ist
1
Area(Ω) =
2
Zb
r2 (t)ϕ′ (t) dt.
a
Folgerung 7.6 (Leibnitzsche Sektorformel) Das Gebiet Ω sei begrenzt
durch die Strahlen Lα und Lβ mit den Winkeln α bzw. β zur x-Achse und
eine Kurve r = r(ϕ), wobei der Winkel ϕ streng monoton wachsend ist.
r(ϕ)eiϕ
Lβ
γ (t2 )
Ω
β
α
Lα
γ (t1 )
γ(a) = γ(b)
Dann gilt
1
Area(Ω) =
2
Zβ
α
r2 (ϕ) dϕ.
312
7 Integralrechnung für Funktionen einer reellen Variablen
Beweis: Wir parametrisieren die Randkurve durch γ(t) = r(t)eiϕ(t) , t ∈ [a, b],


t ∈ [a, t1 ]
α,
ϕ(t) = ϕ(t), t ∈ [t1 , t2 ]


β,
t ∈ [t2 , b]
Aus Folgerung 7.5 erhalten wir
1
Area(Ω) =
2
Zt2
r2 (t)ϕ′ (t) dϕ.
t1
Da α und β konstant sind und ϕ auf [t1 , t2 ] monoton wachsend ist, ist
ϕ′ (t) > 0. Deshalb existiert eine Umkehrfunktion t = t(ϕ) und wir können r
in Abhängigkeit von ϕ darstellen: r = r(ϕ). Mit dϕ = ϕ′ (t)dt folgt
1
Area(Ω) =
2
Zβ
r2 (ϕ) dϕ.
α
⊓
⊔
Beispiel 7.29 (Flächeninhalt einer Ellipse)
Sei Ω die von einer Ellipse mit den Halbachsen a und b eingeschlossene Fläche.
y
b
x2
a2
+
y2
b2
≤1
Ω
a
x
Wir parametrisieren die Ellipse durch die Kurve γ(t) = (a cos t, b sin t) =:
(x(t), y(t)) mit t ∈ [0, 2π]. Dann ist nach Satz 7.29
1
Area(Ω) =
2
Z2π
0
1
(x(t)y (t) − y(t)x (t)) dt =
2
′
′
Z2π
0
ab· cos2 t + sin2 t dt = πab.
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
313
Beispiel 7.30 (Flächeninhalt der Sternkurve (Astroide))
Ein Kreis vom Radius r = R4 rolle auf der Innenseite eines Kreises vom Radius
R entlang.
P
r
Ω
P
P
R
Der Weg, den der feste Punkt P während des Rollens zurücklegt, wird Astroide
2
2
2
genannt und ist bestimmt durch die Gleichung x 3 + y 3 = R 3 . Wir können
3
3
die Astroide parametrisieren durch γ(t) = R cos t, sin t . Dann folgt für den
Flächeninhalt des Gebietes Ω, das durch die Astroide begrenzt wird
1
Area(Ω) = R2
2
Z2π
3 2
R
2
Z2π
3
= R2
2
Z2π
3 2
R
8
Z2π
0
=
0
cos3 t · 3 sin2 t · cos t + 3 cos2 t · sin t · sin3 t dt
sin2 t cos2 t cos2 t + sin2 t dt
3
(sin t cos t) dt = R2
2
2
0
=
Z2π
0
sin2 2t dt,
2
1
sin 2t
dt
2
x := 2t, dx = 2dt
0
3 2
=
R
16
Z4π
0
π
3 2
sin2 x dx =
R ·8
16
Z2
0
|
sin2 x dx =
{z
ÜA π
= 4
}
3 2
πR .
8
314
7 Integralrechnung für Funktionen einer reellen Variablen
Beispiel 7.31 (Archimedische Spirale)
Die archimedische Spirale ist in Polarkoordinaten gegeben durch die Kurve
γ(t) = r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C, wobei r(ϕ) = c ϕ mit einer
Konstanten c ∈ R ist.
π
c
2
2πc
πc
Ω
Nach der Leibnitzschen Sektorformel ist dann
1
Area(Ω) =
2
Z2π
1
r (ϕ) dϕ = c2
2
2
Z2π
0
0
ϕ2 dϕ =
1 2 1 3
4
c · 8π = π 3 c2 .
2
3
3
Beispiel 7.32 (Kleeblatt)
Der Rand des n-blättrigen Kleeblatts ist gegeben durch die Kurve γ(t) =
r(t)eiϕ(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) ∈ C, mit r(ϕ) = R · | sin n2 ϕ |, wobei
ϕ ∈ [0, 2π] und R ∈ R ist.
n=4
n=3
r
r
r(ϕk ) = 0 genau dann, wenn n2 ϕk = kπ mit k ∈ N ist, d.h., wenn
ϕk = 0, 2π · n1 , 2π · n2 , . . . , 2π · n−1
n gilt.
r(ϕ) = r genau dann, wenn n2 ϕ = π2 + kπ gilt, wobei k ∈ N ist.
Beh.: Unabhängig von der Anzahl n der einzelnen Blätter ist die Fläche des
von der Kurve γ umschlossenen Gebietes Kn halb so groß wie die Fläche der
Kreisscheibe vom Radius R, d.h.,
7.7 Die Länge von Kurven und die Flächeninhalte ebener Gebiete
Area (Kn ) =
1 2
πR
2
für alle n.
Nach der Leibnitzschen Sektorformel ist
1
Area (Kn ) = R2
2
Z2π
sin2
0
2
1
= R2 ·
2
n
n ϕ dϕ,
2
t :=
n
n
, dt = dϕ
2
2
Zπ
Znπ
1
R2
2
sin t dt =
· n sin2 t dt = πR2 .
n
2
0
0
315
Sachverzeichnis
−A, 8
A ∩ B, IX
A · B, 8
A \ B, IX
A + B, 8
A ∪ B, IX
A ⊂ M , IX
A × B, IX
B[f ]n (x), 164
C, 26
C(R, C)per , 173
C(R, R)per , 172
C(X, R), 166
C k , 225
C k (U, R), 225
C (k) (U ; E), 183
Cn , 34
C ∞ (U ; E), 183
Df , 212
E, 93
E(z), 113
E[x], 163
F (x)|ba , 265
HP (A), 51
HP (xn ), 56
Hfx0 , 230
Int(A), 43, 50
Iso(A), 52
K(x, ε), 42
K(z0 , R), 111
L(I), 10
L(γ), 299, 301
Mc , 218
Ng , 247
O, 201
PC , 172
PCper , 174
PR , 171
PRper , 173
R, 111
R, 10
R, 166
Rn , 34
S(f, P, ξ), 268
T (f, x0 ), 203
Tn (f, x0 ), 203
Tp Mc , 219
Tx0 (x), 176
V , 87
V (f, P), 300
X, 39
az , 116
arccos, 159
arccot, 159
arcosh, 161
arcoth, 161
arcsin, 159
arctan, 159
arg(z), 30
arsinh, 161
artanh, 161
cl(A), 47
cos, 154
cosh, 160
cot, 158
coth, 161
318
Sachverzeichnis
d, A × A40
d, 39
d(p, q), 39
d∞ , 162
e, 65, 114
ez , 114
exp, 114
f ′ , 175
f ′′ , 183
f ′ (x0 ), 175
f + h, 145
f (n) , 183
fn −→ f , 143
fn ⇉ f , 143
grad f , 217
graph(f ), 176
i, 27
inf A, 13
lim xn , 54
n→∞
lim f (a), 119
a→x
lim f (a), 124
a→x+
lim f (a), 124
a→x−
lim inf, 64
lim sup, 64
ln, 115
max A, 14
min A, 14
n!, 3
o, 201
p + Tp Mc , 219
sin, 154
sinh, 160
sup A, 13
tan, 158
tanh, 161
x über k, 4
xq , 24
xn , 19
xn −→ x, 54
n→∞
xn −→ x, 54
α
y , 228
z, 28
Γ , 306
Ω, 308
α!, 228
∂A, 50
π, 156
(−∞, a), 10
(−∞, a], 10
(A | B), 11
(λ · f )(x), 162
Rb
(R) − , 269
a
(a, ∞), 10
(a, b), 10
(a, b], 10
(f + h)(x), 162
(xnj )∞
j=1 , 56
(xn ), 53
(xn )∞
n=1 , 53
[V, +, ·], 87
[K, +, ·], 8
[x], 184
h·, ·i, 91
hx, yi, 35
[a, ∞), 10
[a, b), 10
[a,
`x´b], 10
`xk´, 4
,4
0
:=, IX
:↔, IX
⇔, IX
⇒, IX
∅, IX
∃!, IX
∃, IX
∀, IX
∂f
(u), 222
∂xi
∂k f
, 224
∂xi1 ···∂xi
k
dn f
, 183
dxn
df
(x
Rdx 0 ), 175
R af (x) dx, 254
f (t) dt, 292
−∞
R∞
, 292
a
Rb
, 265
a
≤, 9
∇a f (x0 ), 213
n
Q
xi , 8
i=1
♯A, IX
≃, 140
Sachverzeichnis
√
n
x, 23
n
P
,8
i=1
∞
P
n=0
∞
P
fn , 146
xk , 93
k=1
Abel–Dirichlet–Kriterium, 101
Abelscher Grenzwertsatz, 149
abgeschlossen, 48
Ableitung, 175
der inversen Abbildung, 179
erste, 175
n-te, 183
partielle, 222
Abschluss einer Menge, 47
absolut–konvergente Reihe, 94
Abstand, 39
Euklidischer, 36
Abstandsfunktion, 39
abzählbar, 16
Additionstheoreme, 154, 158, 160, 161
äquivalente Normen, 89
äußerer Punkt, 50
alternierende harmonische Reihe, 102
angeordneter Körper, 9
Anordnungsaxiom der reellen Zahlen, 9
Approximationssatz
von Stone–Weierstraß(1), 168
von Stone–Weierstraß(2), 170
Weierstraßscher, 164
archimedische Spirale, 313
Archimedisches Axiom der reellen
Zahlen, 14
Arcuscosinus, 159
Arcuscotangens, 159
Arcussinus, 159
Arcustangens, 159
Areacosinus hyperbolicus, 161
Areacotangens hyperbolicus, 161
Areasinus hyperbolicus, 161
Areatangens hyperbolicus, 161
arithmetisches Mittel, 25
Astroide, 313
Banach’scher Fixpunktsatz, 141
Banachraum, 89
Bernoullische Ungleichung, 21
319
Bernstein–Polynom, 164
beschränkt, 12
von oben, 12
von unten, 12
beschränkte Folge, 54
beschränkte Teilmenge, 54
beschränkter Variation, Funktion von,
300
bestimmt divergent, 62
bestimmtes Integral, 265
Betrag einer komplexen Zahl, 28
Betrag einer reellen Zahl, 10
bijektive Abbildung, 16
Binomialkoeffizient, 4
Binomialreihe, 208
Binomischer Satz, 20
Bogenlänge, durch ihre ∼ parametrisierte Kurve, 307
bogenzusammenhängend, 137
Cantorsches Diagonalisierungsverfahren, 17
Cantorsches Diskontinuum, 79
Cauchy–Bedingung, 69
Cauchy–Folge, 69
Cauchy–Kriterium, 94
Cauchy–Produkt von Reihen, 105
Cauchy–Schwarzsche Ungleichung, 35,
91
Cauchy-Integrierbarkeitskriterium, 271
Cauchysches Verdichtungskriterium,
103
C k –Diffeomorphismus, 232
C k -Funktion, 225
C k –Kurve, 301
Cosinus, 153
Cosinus hyperbolicus, 160
Cotangens, 158
Cotangens hyperbolicus, 161
Dedekindscher Schnitt von R, 11
Diagonalisierungsverfahren von Cantor,
17
dichte Teilmenge, 52
Diffeomorphismus, 232
Differential, 212
differenzierbar, 175, 211
Differenzierbarkeit
hinreichende Bedingung für, 222
320
Sachverzeichnis
Differenzmenge, IX
disjunkte Mengen, IX
disjunkte Vereinigung, IX
diskrete Metrik, 40
diskreter metrischer Raum, 40
divergente Folge, 53
divergente Reihe, 94
Dreiecksungleichung, 10, 28, 35, 39
einfache Kurve, 308
Ellipse
Flächeninhalt, 312
Umfang, 304
endliche Teilüberdeckung, 79
ε–Kugel, 42
Euklidischer Abstand, 36
Euler–Konstante, 298
Eulersche Formel, 154
Eulerzahl, 65
Exponentialfunktion, komplexe, 114
Extrema unter Nebenbedingungen, 247
notwendige Bedingungen für, 247
Fakultät, 3
Fixpunktsatz, Banach’scher, 141
Floh und Kamm-Menge, 137
Folge, 53
bestimmt divergente, 62
der Partialsummen, 93
divergente, 53
konvergente, 53
monoton fallende, 64
monoton wachsende, 64
monotone, 64
uneigentlich konvergente, 62
Folge, nach ±∞ strebend, 62
folgenkompakt, 75
folgenstetig, 126
folgenstetig in einem Punkt, 126
Fundamentalsatz der Algebra, 33, 258
Fundamentalungleichung, 274
Funktionenreihe, 146
Gaußklammer-Funktion, 184
Gaußsche Zahlenebene, 29
geometrische Reihe, 22, 96
geometrische Summe, 22
geometrisches Mittel, 25
geschlossene Kurve, 308
glatte Abbildung, 183
gleichmäßig konvergente
Folge von Abbildungen, 143
Funktionenreihe, 146
gleichmäßig stetig, 133
gleichmächtige Mengen, 19
Gradient, 217
Graph
Länge eines, 304
Grenzfunktion, 143
Grenzwert
Eindeutigkeit, 54
einer Folge, 53
einer Funktion, 119
linksseitiger, 124
rechtsseitiger, 124
uneigentlicher, 62
Grenzwert aller Riemannschen Summen,
268
Grenzwerte
Vertauschbarkeit, 144
Grenzwertsatz, Abelscher, 149
Häufungspunkt einer Folge, 56
Häufungspunkt einer Menge, 51
höchstens abzählbar, 17
harmonische Reihe, 95
alternierende, 102, 207
Hauptsatz der Differential- und
Integralrechnung, 283
Hebbare Unstetigkeitsstelle, 128
Hessesche Form, 230
Hilbertraum, 92
homöomorph, 140
Homöomorphismus, 140
homogen, 25
Hyperbelfunktionen, 160
Identitätssatz für Potenzreihen, 151
imaginäre Achse, 29
imaginäre Einheit, 27
implizite Funktionen
Satz über, 241
Induktion, vollständige, 2
induzierte Metrik, 40
Infimum, 12
injektive Abbildung, 16
innerer Punkt, 43
Integral
Sachverzeichnis
bestimmtes, 265
unbestimmtes, 254
Integrand, 254
Integration
partielle, 255, 266
Integrationsvariable, 254
Integrierbarkeitskriterium
Cauchysches, 271
Lebesguesches, 280
Riemannsches, 278
Intervall
abgeschlossenes, 10
halboffenes, 10
Länge, 10
offenes, 10
Intervallschachtelung, 15
isolierter Punkt, 52
Isometrie, 41
isometrische metrische Rüme, 41
K-Vektorraum, 87
Körper, 8
angeordneter, 9
vollständiger angeordneter, 12
Körperaxiom der reellen Zahlen, 8
kartesisches Produkt metrischer Räume,
41
Kettenregel, 178, 215
für partielle Ableitungen, 227
Kleeblatt, 314
kleiner gleich, 9
kompakte Menge, 80
komplexe Potenz der Eulerzahl, 114
komplexe rationale Funktion, 257
komplexe Zahl, 26
n-te Wurzel
geometrische Bedeutung, 33
Argument, 30
Betrag, 28
geometrische Interpretation, 29
n-te Wurzel, 32
trigonometrische Darstellung, 30
komplexe Zahlen
Dreiecksungleichung, 28
geometrische Deutung der Addition,
30
geometrische Deutung der Multiplikation, 30
komplexe Zahlenebene, 29
321
konjugiert komplex, 28
konkave Funktion, 189
Kontinuumshypothese, 19
kontrahierende Abbildung, 141
Kontraktion, 141
konvergente Folge, 53
konvergente Reihe, 94
Konvergenzkreis einer Potenzreihe, 111
Konvergenzradius, 111, 112
konvexe Funktion, 189
konvexe Menge, 137
Koordinatentransformation, 233
Kreislinie, 303
kritischer Punkt, 229
k-te partielle Ableitung, 224
Kugelkoordinaten, 233
Kurve
durch ihre Bogenlänge parametrisierte, 307
einfache, 308
geschlossene, 308
in Polarkoordinaten, 305
parametrisierte, 299
positiv-orientierte, 308
reguläre, 301, 307
Kurve von der Klasse C k , 301
L’Hospitalsche Regeln, 193
Länge
einer C 1 -Kurve, 303
einer rektifizierbaren Kurve, 299
einer stückweisen C 1 -Kurve, 303
eines Intervalls, 268
Lagrange-Multiplikatoren, 247
Lagrangesches Gleichungssystem, 249
Landau-Symbole, 201
Lebesgue–Maß Null, 279
Lebesgue-Zahl einer Überdeckung, 83
Lebesguesches Integrierbarkeitskriterium, 280
Leibnitz–Kriterium für alternierende
Reihen, 102
Leibnitz-Reihe, 103
Leibnitzsche Sektorformel, 311
Leibnizformel, 200
limes inferior, 64
limes superior, 64
Linearisierung, 212
linksseitiger Grenzwert, 124
322
Sachverzeichnis
Lipschitz–Konstante, 133
lipschitzstetig, 133
logarithmische Spirale, 305
Logarithmus
natürlicher, 115
lokaler Extremwert
hinreichende Bedingung, 209
lokales Maximum, 185, 229
lokales Minimum, 185, 229
Luftlinienabstand, 40
Mächtigkeit, größere, 19
Machinsche Formel, 200
Majorantenkriterium, 97
Majorantenkriterium, Weierstraßsches ,
147
Mannheimer-Metrik, 40
Maximum, 14
lokales, 229
Maximum,lokales, 185
Metrik, 39
der franzosischen Eisenbahn, 40
diskrete, 40
durch Skalarprodukt erzeugte, 92
induzierte, 40
metrische Räume
isometrische, 41
kartesisches Produkt, 41
metrischer Raum, 39
abgeschlossene Teilmenge, 48
dichte Teilmenge, 52
diskreter, 40
innerer Punkt, 43
kompakter, 80
offene Teilmenge, 45
Rand einer Teilmenge, 50
separabler, 78
total beschränkter, 77
Vervollständigung, 72
zusammenhängender, 84
Minimum, 14
lokales, 185, 229
Mittelwertsatz
der Integralrechnung
erster, 286
zweiter, 287
für Funktionen mehrerer Veränderlicher, 220
für Vektorfunktionen, 191
von Lagrange, 187
monoton fallende Folge, 64
monoton fallende Funktionenfolge, 144
monoton wachsende Folge, 64
monoton wachsende Funktionenfolge,
144
monotone Folge, 64
Multiindex, 228
Ordnung eines, 228
Nebenbedingungen, 246
Niveaufläche, 218
Norm, 87
durch Skalarprodukt erzeugte, 92
Norm der Zerlegung eines Intervalls,
268
Norm eines Vektors, 35
Normen
äquivalente, 89
normierter Vektorraum, 87
n-te Ableitung, 183
Nullfolge, 60
oberes Riemann-Integral, 278
Obersumme, 277
offen, 45
offene Überdeckung, 79
offenen Menge, 83
Ordnung, reflexive, 9
Parametertransformation, 306
parametrisierte Kurve, 299
Parametrisierung einer Kurve, 301
Partialbruchzerlegung
komplexer rationaler Funktionen, 260
reeller rationaler Funktionen, 261
Partialsumme, 93
Partialsummen, Folge der, 93
partielle Ableitung, 222
der Ordnung k, 224
höherer Ordnung, 224
partielle Ableitungen
Kettenregel, 227
Vertauschbarkeit, 225
partielle Integration, 255, 266
pi
Berechnung, 199
π, 156
Polarkoordinaten, 233
Sachverzeichnis
in ∼ gegebene Kurve, 305
polynomiale Funktion, 131
positiv-orientierte Kurve, 308
Positivität, 39
Potenz, 19
mit rationalem Exponent, 24
Potenz, komplexe, 116
der Eulerzahl, 114
Potenzreihe, 110
Prinzip der Intervallschachtelung, 15
Produkt von Mengen, IX
Produktmetrik, 41
Produktregel, 177
punktweise konvergente
Folge von Abbildungen, 143
Funktionenreihe, 146
Quotientenkriterium, 99
Quotientenregel, 177
Rand einer Menge, 50
Randpunkt einer Menge, 50
rationale Funktion, 131, 257
rechtsseitiger Grenzwert, 124
reell–analytisch, 202
reelle Zahlen, 6
Anordnungsaxiom, 9
Körperaxiom, 8
Vollständigkeitsaxiom, 11
reelle, rationale Funktion, 257
reflexive Ordnung, 9
reguläre Kurve, 301, 307
regulärer Punkt, 219
Reihe, 93
absolut–konvergente, 94
divergente, 94
geometrische, 96
harmonische, 95
konvergente, 94
Partialsumme, 93
Wert einer Reihe, 94
rektifizierbare Kurve, 299
Restglied, 204
Richtungsableitung, 213
Riemann–integrierbar
uneigentlich, 292
uneigentlich , 293
Riemann-Integral, 269
Riemann-integrierbar, 269
323
Riemannsche Summe, 268
Riemannsche Zeta–Funktion, 298
Riemannscher Umordnungssatz, 109
Riemannsches Integrierbarkeitskriterium, 278
Satz über
die Stetigkeit der inversen Abbildung,
140
die Umkehrabbildung, 235
implizite Funktionen, 241
Satz von
Bolzano/Weierstraß, 63
Borel, 205
Cantor für folgenkompakte metrische
Räume, 78
Dini, 144
Heine, 139
Heine/Borel, 82
Rolle, 186
Schwarz, 225
Weierstraß, 138
Schnittzahl von (A | B), 11
Schranke
obere, 12
untere, 12
Schraubenlinie, 304
Sektorformel,Leibnitzsche, 311
separabler Raum, 78
Sinus, 153
Sinus hyperbolicus, 160
Skalarprodukt, 35, 91
Spirale,archimedische, 313
Spirale,logarithmische, 305
Sprungstelle, 128
Stammfunktion, 253
Standardmetrik, 39
sternförmige Menge, 137
Sternkurve, 313
stetig, 126
stetig differenzierbar, 183
n–mal, 183
stetig in einem Punkt, 126
Substitutionsregel, 256, 266
Summenregel, 177
Supremum, 12
surjektive Abbildung, 16
Symmetrie, 39
324
Sachverzeichnis
Tangens, 158
Tangens hyperbolicus, 161
Tangente, 176
Tangentialebene, 219
Tangentialraum, 219
Tangentialvektoren, 219
Taylorformel
mehrdimensionale, 228
Taylorpolynom, 203
Taylorreihe, 203
Teilüberdeckung, 79
endliche, 79
Teilfolge, 56
Teilintervall, 268
Topologie, 83
topologischer Raum, 83
total beschränkte Menge, 77
total beschränkter metrischer Raum, 77
trigonometrische Funktionen, 153
trigonometrisches Polynom
komplexes, 173
reelles, 172
überabzählbar, 17
Überdeckung
Lebesgue-Zahl einer, 83
offene, 79
Überdeckungssatz von Heine/Borel, 82
Umgebung eines Punktes, 53
Umkehrfunktion
Ableitung der, 234
Umkehrsatz, 235
Umordnung von Reihengliedern, 107
Umordnungssatz, 107, 108
Umparametrisierung einer Kurve, 306
unbestimmtes Integral, 254
uneigentlich konvergente Folge, 62
uneigentlich Riemann–integrierbar, 292,
293
uneigentlicher Grenzwert, 62, 122
Unstetigkeitsstelle
2. Art, 128
hebbare, 128
Sprungstelle, 128
Unteralgebra, 166
unteres Riemann Integral, 278
Untersumme, 277
Vektor
Norm, 35
Vektoren, 34
Vektorraum, 87
normierter, 87
Verallgemeinerter Mittelwertsatz der
Differentialrechnung von Cauchy,
187
Verdichtungskriterium
Cauchysches, 103
Verfeinerung der Zerlegung eines
Intervalls, 268
Vertauschbarkeit von Grenzwerten, 144
Vervollständigung metrischer Räume,
71
Vielfachheit einer Nullstelle, 259
vollständige Induktion, 2
vollständiger angeordneter Körper, 12
vollständiger metrischer Raum, 69
Vollständigkeitsaxiom der reellen
Zahlen, 11
Weg, 137
wegezusammenhängend, 137
Weierstraßscher Approximationssatz,
164
Weierstraßsches Majorantenkriterium,
147
Wendepunkt, 190
Wert einer Reihe, 94
Wurzel, n-te, 23
Wurzelkriterium, 98
Zentrum einer Potenzreihe, 110
Zerlegung eines Intervalls, 268
Zerlegungssatz für komplexe Polynome,
259
Zeta–Funktion
Riemannsche, 298
zusammenhängende Teilmenge, 84
zusammenhängender metrischer Raum,
84
Zusammenhangskomponente, 86
zweimal differenzierbar, 183
zweite Ableitung, 183
Zwischenwertsatz, 136
Zylinderkoordinaten, 233
Herunterladen