Analysis 2

Analysis 2
für Technische Mathematik
SS 2015
Michael Kaltenbäck
Inhaltsverzeichnis
8
9
Das Riemannsche Integral
8.1 Ober- und Untersummen . . . . . . . . . . .
8.2 Das Riemann-Integral . . . . . . . . . . . . .
8.3 Integrale von stetigen Funktionen . . . . . . .
8.4 Differential und Integralrechnung . . . . . . .
8.5 Weitere Eigenschaften des Integrals . . . . .
8.6 Uneigentliche Integrale . . . . . . . . . . . .
8.7 Vertauschung von Integralen mit Grenzwerten
8.8 Mittelwertsatz . . . . . . . . . . . . . . . . .
8.9 Übungsbeispiele . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
5
11
12
17
19
22
32
33
Normen und Banachräume
9.1 Normierte Räume . . . . . . . . . . . . . . .
9.2 Lineare Abbildungen . . . . . . . . . . . . .
9.3 Banachraumwertige Reihen, Funktionen, etc.
9.4 Übungsbeispiele . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
45
49
64
.
.
.
.
67
67
77
83
89
.
.
.
.
.
.
.
.
.
.
.
93
93
98
104
106
109
115
118
119
130
132
134
10 Ableitungen nach mehreren Variablen
10.1 Partielle Ableitungen . . . . . . .
10.2 Höhere Ableitungen . . . . . . . .
10.3 Extremwerte . . . . . . . . . . . .
10.4 Übungsbeispiele . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
11 Wegintegrale
11.1 Wege . . . . . . . . . . . . . . . . . . .
11.2 Wegintegrale . . . . . . . . . . . . . . .
11.3 Offene Mengen in Rn und Gebiete . . . .
11.4 Gradientenfelder . . . . . . . . . . . . .
11.5 Lokale Gradientenfelder . . . . . . . . .
11.6 Homotopie und einfacher Zusammenhang
11.7 Komplexe Wegintegrale . . . . . . . . . .
11.8 Holomorphe Funktionen . . . . . . . . .
11.9 Nochmals komplexe Differenzierbarkeit*
11.10Harmonische Funktionen* . . . . . . . .
11.11 Übungsbeispiele . . . . . . . . . . . . . .
i
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ii
12 Topologische Grundlagen
12.1 Topologische Grundbegriffe . . . . . . . . . . .
12.2 Abgeschlossene Mengen . . . . . . . . . . . . .
12.3 Stetige Abbildungen . . . . . . . . . . . . . . .
12.4 Basis, Subbasis . . . . . . . . . . . . . . . . . .
12.5 Initiale Topologie . . . . . . . . . . . . . . . . .
12.6 Spur- und Produkttopologie . . . . . . . . . . . .
12.7 Finale Topologie* . . . . . . . . . . . . . . . . .
12.8 Zusammenhang und Trennungseigenschaft (T 1)*
12.9 Trennungseigenschaften (T 3) und (T 4) . . . . . .
12.10Das Lemma von Urysohn* . . . . . . . . . . . .
12.11Kompaktheit . . . . . . . . . . . . . . . . . . . .
12.12Filter und Netze* . . . . . . . . . . . . . . . . .
12.13Satz von Tychonoff* . . . . . . . . . . . . . . .
12.14Kompaktheit in metrischen Räumen . . . . . . .
12.15Übungsbeispiele . . . . . . . . . . . . . . . . . .
INHALTSVERZEICHNIS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
139
139
144
148
152
156
158
162
164
167
169
172
177
182
184
189
13 Lemma von Zorn*
195
Literaturverzeichnis
199
Index
200
INHALTSVERZEICHNIS
iii
Die mit * gekennzeichneten Abschnitte, Resultate bzw. Bemerkungen sind über die
Vorlesung hinausführendes Material, welches aber den Umfang der Vorlesung sprengen würde.
iv
INHALTSVERZEICHNIS
Kapitel 8
Das Riemannsche Integral
8.1 Ober- und Untersummen
Schon die Mathematik der Antike beschäftigte man sich mit der Problemstellung, die
Fläche gewisser Figuren zu berechnen. Bei Polygonen ist dies durch Zerlegung in Dreiecke unmittelbar möglich, bei krummlinigen Figuren ist dagegen nicht einmal so klar,
wie Fläche überhaupt zu definieren ist.
8.1.1 Beispiel. Betrachte die Parabel gegeben durch f (x) = x2 .
Wir sind an der Fläche, die von der x-Achse, der Parabel und der Geraden x = 1
begrenzt wird, interessiert. Dazu könnte man, unserer intuitiven Vorstellung von Fläche
folgend, so vorgehen, dass man die Fläche in Streifen der Breite △x zerlegt, z.B.
△x = 1n , und die Fläche eines Streifens durch das Rechteck mit der Breite △x und
der Höhe min f (x) approximiert, wobei das Minimum über die im betrachteten Streifen liegenden x-Koordinaten genommen wird. Ist △x sehr klein, so wird man hoffen,
dass die Summe der Flächen aller dieser Rechtecke fast gleich der zu bestimmenden
Fläche ist.
f (x) = x2
1
f (x) = x2
1
n=8
n=4
0
1
0
1
Abbildung 8.1: Approximation der Fläche von unten
In unserem Fall erhält man auf dieser Art und Weise die folgende Näherung für die
Gesamtfläche A:
An =
n
X
k=1
min{ f (x) : (k − 1)
1
1
1 1
≤ x≤k }· =
n
n n
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
2
=
!2
n
n−1
X
k−1
1
1 X 2
1 (n − 1)n(2n − 1)
· = 3
.
k = 3
n
n
6
n
n
k=1
k=0
Lässt man in dieser Formel n immer größer werden, so erhält man A = limn→∞ An = 31 .
Genauso könnte man natürlich die Fläche des Streifens durch das Rechteck mit
der Breite △x und der Höhe max f (x) approximieren. Unserer Vorstellung von Fläche
folgend sollte bei dieser zweiten Methode zur Flächenbestimmung das selbe herauskommen.
f (x) = x2
1
f (x) = x2
1
n=8
n=4
0
1
0
1
Abbildung 8.2: Approximation der Fläche von oben
In der Tat gilt
Ân =
n
X
k=1
1 1 X k2 1
1
≤ x≤k }· =
=
n
n n k=1 n2 n
n
max{ f (x) : (k − 1)
=
n
1 n(n + 1)(2n + 1)
1 X 2
,
k = 3
6
n3 k=1
n
und für n → ∞ erhält man wieder A = limn→∞ Ân = 31 .
Wir wollen den Zugang aus dem letzten Beispiel formalisieren.
8.1.2 Definition. Sei [a, b] ein endliches Intervall in R mit a < b. Wir nennen eine
endliche Teilmenge Z von [a, b] eine Zerlegung des Intervalls [a, b], falls a, b ∈ Z.
Wir bezeichnen mit Z die Menge aller solcher Zerlegungen, versehen diese Menge
mit der Relation ⊆, und erhalten damit eine gerichtete Menge; vgl. Definition 5.3.1.
Wollen wir die Elemente einer Zerlegung Z aufzählen, so werden wir das immer
so tun, dass n(Z) + 1 die Mächtigkeit von Z bezeichnet, und dass
Z = {ξ j : j = 0, . . . , n(Z)}, wobei
a = ξ0 < ξ1 < · · · < ξn(Z) = b .
Sei nun f : [a, b] → R eine beschränkte Funktion. Zu einer gegebenen Zerlegung
Z = {ξ j : j = 0, . . . , n(Z)} ∈ Z bezeichnen wir mit U(Z) die zu Z gehörige Untersumme von f , also die Summe der Flächen der Rechtecke unter der Funktion f , die zur
gegebenen Zerlegung gehört:
U(Z) =
n(Z)
X
j=1
(ξ j − ξ j−1 )
inf
t∈[ξ j−1 ,ξ j ]
f (t) .
(8.1)
8.1. OBER- UND UNTERSUMMEN
3
Entsprechend definieren wir die Obersumme
O(Z) =
n(Z)
X
j=1
(ξ j − ξ j−1 ) sup
f (t) .
(8.2)
t∈[ξ j−1 ,ξ j ]
f (x)
Z:
a = ξ0 ξ1
ξ2
ξ3
ξ4
ξ5
ξ6
ξ7
ξ8
ξ9 = b
f (x)
Z:
a = ξ0 ξ1
ξ2
ξ3
ξ4
ξ5
ξ6
ξ7
ξ8
ξ9 = b
Abbildung 8.3: Veranschaulichung einer Unter- bzw. Obersumme
Da wir f als beschränkt voraussetzen, existieren diese Ober- und Untersummen.
P
Klarerweise gilt wegen b − a = n(Z)
j=1 (ξ j − ξ j−1 )
(b − a) inf f (t) ≤ U(Z) ≤ O(Z) ≤ (b − a) sup f (t) .
t∈[a,b]
t∈[a,b]
Wir sehen also, dass alle Ober- und Untersummen gleichmäßig nach oben und nach
unten beschränkt sind. Somit ist folgende Definition sinnvoll.
8.1.3 Definition. Wir setzen
b
Z−
f dx := inf Z∈Z O(Z),
a
Zb
−
a
f dx := supZ∈Z U(Z) ,
und bezeichnen die erste Zahl als das obere- und die zweite als das untere Integral von
f über [a, b].
Die Funktion f heißt integrierbar auf [a, b], falls das obere mit dem unteren Integral
übereinstimmt. In diesem Fall bezeichnen ihren gemeinsamen Wert als das Integral1
1 Man
spricht auch vom Darbouxschen Integral.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
4
von f über [a, b]:
b
b
Z−
f dx =
−
a
Z−
f dx =
Zb
f dx .
−
a
a
8.1.4 Bemerkung. Da die Menge Z aller Zerlegungen von [a, b] bezüglich ⊆ eine ge
richtete Menge ist, können wir von den Netzen U(Z) Z∈Z und O(Z) Z∈Z sprechen.
Sei nun Z1 ⊆ Z2 , wobei Z1 = {ξ j : j = 0, . . . , n(Z1 )} sowie
Z2 = {ηk : k = 0, . . . , n(Z2 )}. Ist j ∈ {1, . . . , n(Z1 )}, so gibt es Indizes k( j − 1) < k( j),
sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
|
{z
}
k( j)−k( j−1)−1 viele
Wegen (ξ j − ξ j−1 ) =
Pk( j)
k=k( j−1)+1 (ηk
(ξ j − ξ j−1 )
inf
t∈[ξ j−1 ,ξ j ]
− ηk−1 ) folgt
f (t) =
k( j)
X
(ηk − ηk−1 )
k=k( j−1)+1
inf
t∈[ξ j−1 , ξ j ]
| {z }
f (t) ≤
⊇[ηk−1 ,ηk ]
k( j)
X
(ηk − ηk−1 )
k=k( j−1)+1
inf
t∈[ηk−1 ,ηk ]
f (t) .
Summiert man über alle j ∈ {1, . . . , n(Z1 )} auf, so erhält man U(Z1 ) ≤ U(Z2 ). Wir
sehen also, dass U(Z) Z∈Z ein monoton wachsendes Netz ist. Nach (5.10) gilt daher
lim U(Z) = sup U(Z) =
Z∈Z
Entsprechend ist das Netz O(Z)
Z∈Z
Z∈Z
f dx .
−
a
der Obersummen monoton fallend, und
b
lim O(Z) = inf O(Z) =
Z∈Z
Zb
Z∈Z
Z−
f dx .
a
Klarerweise ist damit auch das Netz O(Z) − U(Z) Z∈Z monoton fallend, und besteht
aus nicht negativen reellen Zahlen. Also gilt auch (vgl. Nach (5.10))
inf (O(Z) − U(Z)) = lim (O(Z) − U(Z)) ,
Z∈Z
Z∈Z
(8.3)
und wegen der Rechenregeln für R-wertige Netze (siehe Anschnitt 5.3) gleicht dieser
Ausdruck
b
Z−
Zb
f dx .
(8.4)
f dx −
lim O(Z) − lim U(Z) =
Z∈Z
Z∈Z
a
−
a
Also ist die Integrierbarkeit einer Funktion f äquivalent dazu, dass der Ausdruck in
(8.3) verschwindet.
8.2. DAS RIEMANN-INTEGRAL
5
8.2 Das Riemann-Integral
Der oben vorgestellte Zugang zur Definition eines Integrals ist zwar befriedigend um
dem Begriff Fläche unter einer Kurve einen Sinn zu geben, um aber etwa komplexoder vektorwertige Funktionen integrieren zu können, benötigen wir einen alternativen
Ansatz.
n(R) 8.2.1 Definition. Wir nennen das Paar R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemann-Zerlegung
n(R)+1
eines reellen Intervalls [a, b] mit a < b, falls n(R) ∈ N und (ξ j )n(R)
, (α j )n(R)
j=0 ∈ R
j=1 ∈
n(R)
R , wobei
a = ξ0 < ξ1 < · · · < ξn(R) = b; α j ∈ [ξ j−1 , ξ j ], j = 1, . . . , n(R) ,
und nennen
|R| := max{(ξ j − ξ j−1 ) : j = 1, . . . , n(R)}
die Feinheit der Riemann-Zerlegung. Die Punkte ξ j heißen Stützstellen und die Punkte
α j Zwischenstellen. Weiters sei
R1 R2 :⇔ |R2 | ≤ |R1 | .
Ist R die Menge aller solcher Riemann-Zerlegungen, dann ist (R, ) eine gerichtete
Menge2 .
Ist f : [a, b] → R (C) eine beschränkte Funktion, so betrachtet man das Netz
S (R) R∈R , wobei die Riemannsumme zur Riemann-Zerlegung R durch
S (R) =
n(R)
X
j=1
(ξ j − ξ j−1 ) f (α j ) .
definiert ist. Konvergiert dieses Netz, so nennen wir die Funktion f Riemannintegrierbar und bezeichnen
Zb
f dx := lim S (R)
a
R∈R
als das Riemann Integral von f über [a, b].
Für limR∈R S (R) schreibt man auch lim|R|→0 S (R), um deutlich zu machen, dass R
durch die Feinheit der Riemann-Zerlegung gerichtet wird. Da es zu jedem δ > 0, δ ≤
b −a eine Riemann-Zerlegung R gibt mit |R| = δ, ist die Existenz von I = lim|R|→0 S (R)
äquivalent zu
∀ǫ > 0 ∃δ > 0 : |S (R) − I| < ǫ ∀R ∈ R, |R| ≤ δ .
8.2.2 Bemerkung. Ist f
: [a, b] → C, so folgt aus Re S ( f, R) =
S (Re f, R), Im S ( f, R) = S (Im f, R) und der Tatsache, dass ein komplexwertiges
Netz genau dann konvergiert, wenn Real- und Imaginärteil es tun, dass die RiemannIntegrierbarkeit von f zu der von Re f und Im f äquivalent ist.
2 ist sicher nicht antisymmetrisch und unterscheidet sich wesentlich von der Halbordnung ⊆ auf Z aus
Definition 8.1.2.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
6
f (x)
R:
a = ξ0
ξ1
α1
ξ2
ξ3
α2
ξ4
α3
α4
ξ5
α5
ξ6
α6
ξ7
α7
ξ8
α8
ξ9
=b
α9
Abbildung 8.4: Veranschaulichung einer Riemannsumme
8.2.3 Bemerkung. Für ein reell- oder komplexwertiges und beschränktes f definiert
auf [a, b] sei M eine feste, endliche Teilmenge von [a, b] mit m Elementen. Setzt man
für eine Riemann-Zerlegung R
n(R)
X
S M (R) =
(ξ j − ξ j−1 ) f (α j ) ,
j=1
M∩[ξ j−1 ,ξ j ]=∅
so hat diese Summe höchstens 2m Summanden weniger als S (R), da jedes Element aus
M in höchstens zwei verschiedenen Intervallen [ξ j−1 , ξ j ] liegen kann. Somit folgt
S M (R) − S (R) ≤
n(R)
X
(ξ j − ξ j−1 )| f (α j )| ≤ |R| · 2m · k f k∞ ,
wobei k f k∞ = sup{| f (t)| : t ∈ [a, b]}, und wir sehen, dass S M (R)
konvergiert, wenn S (R) R∈R es tut. In diesem Fall gilt
Z b
f dx = lim S (R) = lim S M (R) .
a
(8.5)
j=1
M∩[ξ j−1 ,ξ j ],∅
|R|→0
R∈R
genau dann
|R|→0
Als Anwendung dieser Bemerkung sieht man, dass, wenn sich zwei Funktionen f und g
nur auf einer endlichen Menge M unterscheiden, aus der Riemann-Integrierbarkeit von
f auch die von g folgt. In der Tat ist dann S M ( f, R) = S M (g, R), wobei das Argument
f bzw. g andeutet, von welcher Funktion die entsprechende Riemann-Summe gebildet
wird.
Mit Hilfe dieser Bemerkung können wir einen ersten Zusammenhang zwischen
Riemann-Summen und Ober- bzw. Untersummen herstellen.
8.2.4 Lemma. Sei f : [a, b] → R eine beschränkte reellwertige Funktion, und sei
Z0 ∈ Z, ǫ > 0. Dann gibt es ein δ > 0, sodass
∀R ∈ R, |R| ≤ δ ⇒ U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ .
Beweis. Wir zeigen zunächst für ein beschränktes f : [a, b] → R mit f (x) ≥ 0, x ∈
[a, b], dass es ein δ > 0 gibt mit
∀R ∈ R, |R| ≤ δ ⇒ S (R) ≤ O(Z0 ) + ǫ .
(8.6)
8.2. DAS RIEMANN-INTEGRAL
7
Man schreibe Z0 = {ηk : k = 0, . . . , n(Z0 )} ∈ Z, und setze M = Z0 . Mit (8.5) erhalten
wir
S M (R) − S (R) ≤ |R| · 2(n(Z0) + 1) · k f k∞ .
n(R) Für R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R, bedeutet M ∩ [ξ j−1 , ξ j ] = ∅, dass [ξ j−1 , ξ j ] sicher ganz
in einem gewissen Intervall [ηk( j)−1 , ηk( j) ] enthalten ist. Mit J := { j ∈ {1, . . . , n(R)} :
M ∩ [ξ j−1 , ξ j ] = ∅} folgt3
S M (R) =
X
j∈J
n(Z
X0 )
X
k=1 j∈J,k( j)=k
Es folgt
|
(ξ j − ξ j−1 ) f (α j ) =
(ξ j − ξ j−1 ) sup
{z
≤ηk −ηk−1
}
t∈[ηk−1 ,ηk ]
f (t) ≤
n(Z
X0 )
X
k=1 j∈J,k( j)=k
(ξ j − ξ j−1 ) f (α j ) ≤
n(Z
X0 )
k=1
(ηk − ηk−1 ) sup
f (t) = O(Z0 ) .
t∈[ηk−1 ,ηk ]
S (R) ≤ S M (R) − S (R) + O(Z0 ) ≤ O(Z0 ) + |R| · 2(n(Z0 ) + 1) · k f k∞ .
Die zu beweisende Ungleichung (8.6) gilt nun für |R| ≤ δ :=
ǫ
2(n(Z0 )+1)·k f k∞ .
Erfüllt nun ein beschränktes f : [a, b] → R nicht notwendigerweise f (x) ≥ 0,
so betrachte f + c für ein hinreichend großes c ∈ R – etwa c = k f k∞ – auf dass
f (x) + c ≥ 0, x ∈ [a, b]. Insbesondere gilt (8.6) für f + c. Wegen
O( f + c, Z0 ) = O( f, Z0 ) + c(b − a) und S ( f + c, R) = S ( f, R) + c(b − a)
gilt (8.6) auch für f für ein bestimmtes δ > 0. Indem wir das Gezeigte auf − f anwenden
und beachten, dass
O(− f, Z0 ) = −U( f, Z0 ) und S (− f, R) = −S ( f, R) ,
erhalten wir U( f, Z0 ) − ǫ ≤ S ( f, R) ≤ O( f, Z0 ) + ǫ für |R| ≤ δ mit einem hinreichend
kleinen δ > 0.
❑
Wir werden nun zeigen, dass die beiden vorgestellten Zugänge zur Integration für
reellwertige beschränkte Funktionen f äquivalent sind.
8.2.5 Satz. Für eine beschränkte Funktion f : [a, b] → R sind folgende Aussagen
äquivalent:
(i) Das obere und das untere Integral von f stimmen überein.
(ii) inf Z∈Z (O(Z) − U(Z)) = 0.
(iii) f ist Riemann-integrierbar, d.h. lim|R|→0 S (R) existiert.
n(R) 4
(iv) Setzt man für eine beliebige Riemann-Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R
O(R) :=
n(R)
X
j=1
(ξ j − ξ j−1 ) sup
t∈[ξ j−1 ,ξ j ]
f (t), U(R) :=
n(R)
X
j=1
(ξ j − ξ j−1 )
inf
t∈[ξ j−1 ,ξ j ]
so gilt lim|R|→0 (O(R) − U(R)) = 0.
3 Die
Voraussetzung f ≥ 0 geht in der letzen Ungleichung ein.
gilt O(R) = O(Z) und U(R) = U(Z), wobei Z = {ξ j : j = 0, . . . , n(R)} ∈ Z.
4 Klarerweise
f (t) ,
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
8
(v) Es gibt eine Folge (Rn )n∈N von Riemann-Zerlegungen, sodass
limn→∞ (O(Rn ) − U(Rn )) = 0.
In einem dieser Fälle gilt
b
Z−
f dx =
Z
b
f dx = lim O(R) = lim U(R) =
|R|→0
a
−
a
|R|→0
lim S (Rn ) = lim O(Rn ) = lim U(Rn ) ,
n→∞
n→∞
n→∞
für jede beliebige Folge (Rn )n∈N von Riemann-Zerlegungen mit limn→∞ |Rn | = 0.
Beweis.
(iii) ⇒ (iv) : Setzen wir R := lim|R|→0 S (R), so wollen zeigen, dass R = lim|R|→0 O(R).
Zu jedem ǫ > 0 gibt es wegen der vorausgesetzten Konvergenz ein R0 , sodass
|R − S (R)| < ǫ für alle R R0 .
n(R) Sei R = (ξ j )n(R)
j=0 ; (α j ) j=1 R0 eine feste Riemann-Zerlegung. Wähle nun für
j = 1, . . . , n(R) und k ∈ N ein αkj ∈ [ξ j−1 , ξ j ], sodass
sup
t∈[ξ j−1 ,ξ j ]
f (t) −
1
< f (αkj ) ≤ sup f (t) .
k
t∈[ξ j−1 ,ξ j ]
k n(R) Setzt man Rk = (ξ j )n(R)
j=0 ; (α j ) j=1 , so folgt
n(R)
X
1
1
O(R) − S (Rk ) ≤
|ξ j − ξ j−1 | = (b − a) .
k
k
j=1
Aus |Rk | = |R| ≤ |R0 | folgt Rk R0 , und somit
|R − O(R)| ≤ |R − S (Rk )| + |S (Rk ) − O(R)| < ǫ +
b−a
.
k
Für k → ∞ folgt |R − O(R)| ≤ ǫ und zwar für alle R R0 . Also gilt
lim|R|→0 O(R) = R. Genauso sieht man, dass lim|R|→0 U(R) = R.
Aus den Rechenregeln für Grenzwerte folgt damit
0 = R − R = lim|R|→0 (O(R) − U(R)).
(iv) ⇒ (v) : Ist (Rn )n∈N eine Folge von Riemann-Zerlegungen mit limn→∞ |Rn | = 0, so
besagt dieses Grenzverhalten für die Feinheit gerade, dass O(Rn ) − U(Rn ) n∈N
eine Teilfolge des Netzes O(R) − U(R) R∈R im Sinne von Definition 5.3.6 ist.
Gemäß Lemma 5.3.7 folgt
lim (O(Rn ) − U(Rn )) = lim (O(R) − U(R)) = 0 .
n→∞
|R|→0
Schließlich sei noch bemerkt, dass es offensichtlich eine Folge von RiemannZerlegungen mit limn→∞ |Rn | = 0 gibt. Man nehme etwa die Folge (Rn )n∈N , wo
Rn genau n +1 viele äquidistante Stützstellen hat, und wobei die Zwischenstellen
genau in der Mitte zwischen den angrenzenden Stützstellen liegt.
8.2. DAS RIEMANN-INTEGRAL
9
(v) ⇒ (ii) : Das ist klar, wenn man beachtet, dass O(R) = O(Z), U(R) = U(Z), wenn
Z = {ξ j : j = 0, . . . , n(R)} ∈ Z die Menge der Stützstellen einer gegebenen
n(R) Riemann-Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 ∈ R ist.
(i) ⇔ (ii) : Das haben wir schon in Bemerkung 8.1.4 gesehen (vgl. (8.3) und (8.4)).
b
(i) ⇒ (iii) : Nun gelte also I :=
R−
f dx =
a
Rb
−
a
f dx. Zu einem beliebigen ǫ > 0 wähle Z0
so, dass
I − ǫ < U(Z0 ) ≤ O(Z0 ) < I + ǫ .
Nach Lemma 8.2.4 folgt die Existenz eines δ > 0, sodass
I − 2ǫ < U(Z0 ) − ǫ ≤ S (R) ≤ O(Z0 ) + ǫ < I + 2ǫ
für |R| ≤ δ. Also lim|Z|→0 S (R) = I.
Dass limn→∞ O(Rn ) = lim|R|→0 O(R), limn→∞ U(Rn ) = lim|R|→0 U(R) und
limn→∞ S (Rn ) = lim|R|→0 S (R) für limn→∞ |Rn | = 0 gilt, sieht man genauso, wie im
zweiten Beweisschritt.
❑
8.2.6 Beispiel. Die Folgen An und Ân aus Beispiel 8.1.1 sind nicht anderes als U(Rn )
bzw. O(Rn ), wobei Rn = (( nj )nj=0 , ( nj )nj=1 )5 . Wegen Ân − An = O(Rn ) − U(Rn ) → 0 für
n → ∞ folgt aus Satz 8.2.5 die Riemann-Integrierbarkeit von f (x) = x2 auf [0, 1].
Wir können uns mit Satz 8.2.5 auch sicher sein, dass die Folgen An und Ân
tatsächlich gegen das Integral von f über [0, 1] konvergieren.
Wir werden später sehen, dass alle stetigen Funktionen integrierbar sind, und wie
man mit Hilfe der Differentialrechnung das Integral konkret ausrechnet. Dass bei weitem nicht alle Funktionen integrierbar sind, sieht man am übernächsten Beispiel.
8.2.7 Beispiel. Betrachte die konstante Funktion f : [0, 1] → C, d.h. f (t) = c, t ∈
[a, b]. Ist R eine Riemann-Zerlegung, so rechnet man
S (R) =
n(R)
X
j=1
(ξ j − ξ j−1 ) f (α j ) = c
n(R)
X
j=1
(ξ j − ξ j−1 ) = c(b − a) ,
Rb
und damit a c dx = lim|R|→0 S (R) = c(b − a).
Wegen Bemerkung 8.2.3 sehen wir auch, dass jede Funktion, die konstant gleich c
bis auf eine endliche Menge M ist, integrierbar ist und dass das Integral gleich c(b − a)
ist.
Diese Tatsache lässt sich aber nicht auf den Fall eines abzählbaren M ausdehnen.
8.2.8 Beispiel. Betrachte die Funktion f : [0, 1] → R definiert durch



0, x irrational
f (x) := 
.

1, x rational
5 Die
Zwischenstellen sind hier nicht von Bedeutung.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
10
Ist nun Z = {ξ j : j = 0, . . . , n(Z)} eine Zerlegung von [0, 1], so enthält jedes Intervall
[ξ j−1 , ξ j ] sowohl rationale als auch irrationale Zahlen. Somit folgt
U(Z) = 0, O(Z) = 1 .
Also ist f nicht integrierbar.
Im Folgenden wollen wir einige Eigenschaften von Integralen auflisten, die unmittelbar aus der Tatsache folgen, dass wir Integrale als Grenzwerte von Netzen auffassen.
8.2.9 Lemma.
(i) Seien f1 , f2 : [a, b] → R (C) Riemann-integrierbar über [a, b] und sei c ∈ R (C).
Dann sind auch f1 + f2 und c f1 Riemann-integrierbar, und es gilt
Zb
( f1 + f2 ) dx =
a
Zb
f1 dx +
a
Zb
f2 dx,
a
Zb
(c f1 ) dx = c
a
Zb
f1 dx .
a
(ii) Ist f Riemann-integrierbar über [a, b], so gilt
b
−
Z
Z
f dx ≤
| f (x)| dx ≤ (b − a) · k f k∞ ,
b
a
(8.7)
a
wobei sogar |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b].
(iii) Sind g1 , g2 reellwertige Riemann-integrierbare Funktionen über [a, b] mit g1 (x) ≤
g2 (x) für alle x ∈ [a, b], so gilt
Zb
a
g1 dx ≤
Zb
g2 dx .
a
Beweis. Zunächst folgt unmittelbar aus der Definition der Riemannsummen
S ( f1 + f2 , R) = S ( f1 , R) + S ( f2 , R), S (c f1 , R) = cS ( f1 , R), S (g1 , R) ≤ S (g2 , R) .
Durch den Grenzübergang |R| → 0 erhalten wir (i) und (iii).
Nun sei ǫ > 0 und Z0 eine Zerlegung von [a, b]. Weiters sei δ > 0, sodass |R| ≤
δ ⇒ S (| f |, R) ≤ O(| f |, Z0 ) + ǫ; vgl. Lemma 8.2.4.
Ist R eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so folgt leicht aus der Definition der Riemannsummen und der Obersummen und der Dreiecksungleichung
|S ( f, R)| ≤ |S (| f |, R)| ≤ O(| f |, Z0 ) + ǫ ≤ k f k∞ (b − a) + ǫ .
(8.7) folgt durch die Grenzwertbildung, zuerst |R| → 0 und dann Z0 ∈ Z, sowie der
Tatsache, dass ǫ > 0 beliebig ist.
Schließlich folgt |S ( f, R)| ≤ (b − a) · k f k∞ für jede Riemann-Zerlegung R von [a, b]
unmittelbar aus der Dreiecksungleichung.
❑
8.3. INTEGRALE VON STETIGEN FUNKTIONEN
11
8.3 Integrale von stetigen Funktionen
Ehe wir uns konkret dem Problem der Integrierbarkeit einer stetigen Funktion widmen,
sei in Erinnerung gerufen, dass gemäß Definition 5.3.10 ein Netz (xi )i∈I mit Werten
in einem metrischen Raum hX, di über eine gerichtete Menge (I, ) als Cauchy-Netz
bezeichnet wird, falls (5.13), also
∀ǫ > 0 ∃i0 ∈ I : d(xi , x j ) < ǫ ∀i, j i0
gilt. Aus Lemma 5.3.11 wissen wir, dass ein Netz in einem vollständigen metrischen
Raum genau dann konvergiert, wenn es ein Cauchy-Netz ist.
Für den folgenden Satz 8.3.4 benötigen wir den Begriff der Oszillation einer Funktion f : D → Y, wobei hY, dY i ein metrischer Raum und D ⊆ X mit einem weiteren
metrischen Raum hX, dX i ist.
8.3.1 Definition. Die Oszillation ist die Abbildung ρ : (0, +∞) → [0, +∞] definiert
durch
(8.8)
ρ(γ) := sup{dY f (s), f (t) : s, t ∈ D, dX (s, t) ≤ γ}, γ ∈ (0, +∞) .
Offenbar hängt ρ(γ) monoton wachsend von γ ab.
8.3.2 Bemerkung. Gemäß (6.2) ist f : D → Y genau dann gleichmäßig stetig, wenn
∀ǫ > 0 ∃δ > 0 : ∀s, t ∈ D, dX (s, t) ≤ δ ⇒ dY ( f (s), f (t)) ≤ ǫ .
Da ein Supremum die kleinste obere Schranke einer Teilmenge von R ist, ist wegen
(8.8) das äquivalent zu
∀ǫ > 0 ∃δ > 0 : ρ(δ) ≤ ǫ .
Wegen der Monotonie von ρ ist das wiederum dasselbe wie
∀ǫ > 0 ∃δ > 0 : 0 ≤ ρ(t) ≤ ǫ ∀t ∈ (0, δ] .
Insbesondere ist die gleichmäßige Stetigkeit von f äquivalent zu limγ→0+ ρ(γ) = 06 .
8.3.3 Lemma. Für eine beschränkte Abbildung f : [a, b] → R (C) und zwei RiemannZerlegungen R1 und R2 von [a, b] gilt
S (R1 ) − S (R2 ) ≤ 2(b − a) · ρ(max(|R1 |, |R2 |)) .
(8.9)
Beweis. Um das einzusehen, sei R eine Riemann-Zerlegung, deren Stützstellen die von
R1 und R2 umfasst. Das bedeutet, dass mit
n(R1 ) n(R2 )
n(R2 ) 1)
R1 = (ξ j )n(R
j=0 ; (α j ) j=1 , R2 = (ζ j ) j=0 ; (γ j ) j=1 ,
die Beziehung
n(R) R = (η j )n(R)
j=0 ; (β j ) j=1 ,
{ξ j : j = 0, . . . , n(R1 )} ∪ {ζ j : j = 0, . . . , n(R2 )} ⊆ {η j : j = 0, . . . , n(R)}
6 Erfüllt die Funktion f : D → Y sogar ρ(γ) ≤ Mγ für alle γ > 0 und ein festes M ≥ 0, so nennet man f
Lipschitz stetig. Man sieht leicht ein, dass das äquivalent zu dY ( f (s), f (t)) ≤ MdX (s, t) für alle s, t ∈ D ist.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
12
gilt. Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
|
{z
}
k( j)−k( j−1)−1 viele
Wir erhalten wegen (ξ j − ξ j−1 ) f (α j ) =
Pk( j)
k=k( j−1)+1 (ηk
− ηk−1 ) f (α j )

 k( j)
X1 ) 
X
 n(R
(ξ j − ξ j−1 ) f (α j ) −
S (R1 ) − S (R) = (ηk − ηk−1 ) f (βk ) =

j=1
k=k( j−1)+1
n(R
X1 )
k( j)
X
j=1 k=k( j−1)+1
n(R
X1 )
k( j)
X
(ηk − ηk−1 ) f (α j ) − f (βk ) ≤
(ηk − ηk−1 ) · | f (α j ) − f (βk )| .
j=1 k=k( j−1)+1
Bemerkt man, dass |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)}, so folgt
|S (R1 ) − S (R)| ≤
n(R
X2 )
k=1
(ηk − ηk−1 ) · ρ(|R1 |) = (b − a) · ρ(|R1 |) .
Genauso zeigt man |S (R2 ) − S (R)| ≤ (b − a) · ρ(|R2 |). Aus der Dreiecksungleichung
und der Monotonie von ρ folgt dann (8.9).
❑
8.3.4 Satz. Ist f : [a, b] → R (C) stetig auf dem reellen Intervall [a, b], so ist f
Riemann-integrierbar.
Beweis. Wir bemerken zuerst, dass wegen Proposition 6.1.13 die Funktion f beschränkt und wegen Satz 6.3.3 sogar gleichmäßig stetig ist.
Gemäß Lemma 5.3.11 folgt die Konvergenz von S (R) R∈R , wenn wir zeigen
können, dass S (R) R∈R ein Cauchy-Netz ist.
ǫ
; vgl. Bemerkung 8.3.2. Sind
Dazu sei ǫ > 0, und sei δ > 0 so, dass ρ(δ) ≤ 3(b−a)
nun R1 und R2 Riemann-Zerlegungen von [a, b] mit |R1 |, |R2 | < δ, so folgt aus (8.9)
sofort
|S (R1 ) − S (R2 )| ≤ 2(b − a) · ρ(max(|R1 |, |R2 |)) < ǫ
und damit die Tatsache, dass S (R) R∈R ein Cauchy-Netz ist.
❑
8.4 Differential und Integralrechnung
Um das Integral einer Funktion tatsächlich ausrechnen zu können, wollen wir einen
wichtigen Zusammenhang zur Differentialrechnung herstellen. Bevor wir das tun, brauchen wir folgendes Lemma.
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG
13
8.4.1 Lemma. Sei f : [a, b] → R (C) ein Funktion auf dem reellen Intervall [a, b],
und sei c < d, [c, d] ⊆ [a, b]. Weiters bezeichne 1[c,d] die Indikatorfunktion (auch
charakteristische Funktion genannt), d.h.
(
1 , falls t ∈ [c, d]
1[c,d] (t) =
.
0 , falls t < [c, d]
Dann ist f |[c,d] auf [c, d] genau dann Riemann-integrierbar, wenn es 1[c,d] · f auf [a, b]
ist, wobei
Z
Z
d
b
a
1[c,d] · f dx =
c
f |[c,d] dx .
Das ist sicher der Fall, wenn f auf ganz [a, b] Riemann-integrierbar ist.
Beweis. Wir bezeichnen mit R ∈ R die Riemann-Zerlegungen von [a, b] und mit R′ ∈
R′ die Riemann-Zerlegungen von [c, d].
Sei zunächst f über [a, b] Riemann-integrierbar. Wir zeigen, dass dann
S ( f |[c,d] , R′ ) R′ ∈R′ ein Cauchy-Netz ist. Dazu sei ǫ > 0. Da S ( f, R) R∈R konvergent
und daher ein Cauchy-Netz ist, gibt es ein δ > 0, sodass |S ( f, R1 ) − S ( f, R2 )| < ǫ, wenn
nur |R1 |, |R2 | ≤ δ.
Sind nun R′1 , R′2 ∈ R′ mit |R′1 |, |R′2 | ≤ δ, so wähle eine beliebige Fortsetzung R1
und R2 von R′1 bzw. R′2 zu Riemann-Zerlegungen von [a, b] mit einer Feinheit kleiner
oder gleich δ und so, dass die Stütz- und Zwischenstellen von R1 und R2 außerhalb von
[c, d] übereinstimmen.
Die Summanden (ξ j −ξ j−1 ) f (α j ) zu Intervallen [ξ j−1 , ξ j ] mit [ξ j−1 , ξ j ] * [c, d] treten
dann bei S ( f, R1 ) und bei S ( f, R2 ) auf. Also folgt
S ( f, R ) − S ( f, R ) = S ( f | , R′ ) − S ( f | , R′ ) < ǫ .
1
2
′
Somit ist S ( f |[c,d] , R )
Riemann-integrierbar.
R′ ∈R′
[c,d]
1
[c,d]
2
auch ein Cauchy-Netz und f |[c,d] daher auf [c, d]
Wegen (1[c,d] · f )|[c,d] = f |[c,d] folgt aus dem eben bewiesenen auch aus der
Riemann-Integrierbarkeit von 1[c,d] · f die von f |[c,d] .
Wir setzen M = {c, d}, und wissen aus Bemerkung 8.2.3, dass der Beweis vollendet
ist, wenn wir
I = lim
S M ( f |[c,d] , R′ ) ⇒ I = lim S M (1[c,d] · f, R) ,
′
|R |→0
|R|→0
beweisen können. Dazu sei ǫ > 0 gegeben, und δ > 0, sodass aus |R′ | ≤ δ die Ungleichung |I − S M ( f |[c,d] , R′ )| < ǫ folgt.
n(R) Ist nun R = (ξ j )n(R)
j=0 ; (α j ) j=1 eine Riemann-Zerlegung von [a, b] mit |R| ≤ δ, so
′
′ )
′ n(R )
sei R′ = (ξ′j )n(R
die Riemann-Zerlegung von [c, d], für die
j=0 ; (α j ) j=1
′
{ξ1′ , . . . , ξn(R
′ )−1 } = {ξ1 , . . . , ξn(R)−1 } ∩ (c, d) ,
sowie
′
{α′2 , . . . , α′n(R′ )−1 } = {α1 , . . . , αn(R) } ∩ [ξ1′ , ξn(R
′ )−1 ] .
Es folgt
S M (1[c,d] · f, R) =
n(R)
X
(ξ j − ξ j−1 )1[c,d] (α j ) f (α j ) =
j=1
c,d<[ξ j−1 ,ξ j ]
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
14
n(R)
X
j=1
c<ξ j−1 ,ξ j <d
′
n(R
)−1
X
(ξ j − ξ j−1 ) f (α j ) =
j=2
(ξ′j − ξ′j−1 ) f (α′j ) = S M ( f |[c,d] , R′ ) .
Wegen |R′ | ≤ |R| ≤ δ folgt |I − S M (1[c,d] · f, R)|
I = lim|R|→0 S M (1[c,d] · f, R).
<
ǫ. Daher gilt
❑
8.4.2 Bemerkung. Mit Hilfe von Bemerkung 8.2.3 sieht man leicht, dass die RiemannIntegrierbarkeit von 1[c,d] · f über [a, b] zu der von 1(c,d) · f bzw. 1(c,d] · f oder auch der
von 1[c,d) · f äquivalent ist. Die entsprechenden Integrale stimmen alle überein.
8.4.3 Definition. Eine Abbildung f : [a, b] → R (C) heißt stückweise stetige Funktion,
falls es eine Zerlegung a = t0 < t1 < · · · < tn = b von [a, b] gibt, sodass sich die
Funktionen f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lassen.
8.4.4 Bemerkung. Aus Lemma 8.4.1 folgt, dass jede stückweise stetige Funktion
Riemann-integrierbar ist.
Ist nämlich f : [a, b] → R (C) und sind a = t0 < t1 < · · · < tn = b, sodass sich
für alle j = 1, . . . , n, die Funktion f |(t j−1 ,t j ) stetig auf [t j−1 , t j ] fortsetzen lässt, so sind
alle Funktionen 1(t j−1 ,t j ) · f und daher auch ihre Summe Riemann-integrierbar. Diese
Summe unterscheidet sich aber von f nur an endlich vielen Punkten und ist daher
selbst Riemann-integrierbar.
Sei f auf [a, b] reell- bzw. komplexwertig und Riemann-integrierbar. Für das Folgende macht es Sinn, für ein c ∈ [a, b] das Integral von f über [c, c] als
Z c
f (x) dx := 0
c
zu definieren. Sind nun a ≤ u ≤ v ≤ w ≤ b, so folgt mit dieser Konvention aus Lemma
8.4.1, Lemma 8.2.9 und Bemerkung 8.4.2
Z
w
f (t) dt =
u
Z
a
bzw.
Z
b
a
1[u,w] (t) · f (t) dt =
b
1[u,v) (t) · f (t) dt +
Z
Z
a
a
b
1[u,v) (t) + 1[v,w] (t) · f (t) dt =
Z
b
1[v,w] (t) · f (t) dt =
w
u
Z
f (t) dt −
Z
v
f (t) dt =
u
Z
v
f (t) dt +
Z
w
f (t) dt ,
v
u
w
f (t) dt .
(8.10)
v
8.4.5 Satz (Hauptsatz der Diff.-Int.Rechnung). Sei f eine reell- oder komplexwertige
Funktion auf [a, b], die über [a, b] Riemann-integrierbar ist. Für x ∈ [a, b] definiere7
F(x) :=
Zx
f (t) dt .
a
7 Die
Existenz dieses Integrals für alle x ∈ [a, b] folgt aus Lemma 8.4.1.
8.4. DIFFERENTIAL UND INTEGRALRECHNUNG
15
Dann ist die Funktion F : [a, b] → R (C) stetig auf [a, b].
Ist f in einem Punkt x0 stetig, so ist F bei x0 differenzierbar, und es gilt8
F ′ (x0 ) = f (x0 ) .
Beweis. Als erstes sei bemerkt, dass gemäß unser Definition 8.2.1 die Funktion f als
Riemann-integrierbare Funktion auch beschränkt ist. Für a ≤ x < y ≤ b folgt wegen
(8.10)
y
Z
|F(y) − F(x)| = f (t) dt ≤ k f k∞ · (y − x) .
x
Insbesondere ist F stetig9 .
Sei nun f stetig bei einem x0 ∈ [a, b). Ist ǫ > 0 gegeben, so existiert δ > 0, sodass
| f (t) − f (x0 )| ≤ ǫ für alle t ∈ [a, b], |t − x0 | < δ .
Insbesondere gilt für x0 < x < min(x0 + δ, b) wegen (8.10) und (8.7) 10
Zx
f
(t)
−
f
(x
)
F(x)
−
F(x
)
0
0
≤ sup | f (t) − f (x )| ≤ ǫ .
= −
f
(x
)
dt
0
0
x − x0
x
−
x
0
x0
t∈[x0 ,x]
Also folgt F ′ (x0 )+ = limx→x0 +
F ′ (x0 )− = f (x0 ), wenn x0 ∈ (a, b].
F(x)−F(x0 )
x−x0
=
f (x0 ). Entsprechend zeigt man
❑
8.4.6 Bemerkung. Mit den Voraussetzungen von Satz 8.4.5 gilt für
Z b
Z b
Z x
G(x) :=
f (t) dt = G(x) =
f (t) dt −
f (t) dt
x
a
a
′
G (x) = − f (x). Setzen wir allgemein für a ≤ u ≤ v ≤ b
Z v
Z u
f (t) dt ,
f (t) dt := −
u
v
so folgt für jedes feste c ∈ [a, b]
Z
x
c
′
f (t) dt = f (x)
egal, ob x ≥ c oder x ≤ c.
Folgendes Korollar ist die Grundlage, Integrale mit Hilfe der Stammfunktion berechnen zu können.
8.4.7 Korollar. Ist f : [a, b] → R (C) stetig, und ist H : [a, b] → R (C) eine Stammfunktion von f , d.h. H ist auf [a, b] differenzierbar mit H ′ (x) = f (x) für alle x ∈ [a, b],
so gilt
Z b
f (t) dt = H(b) − H(a) .
a
8 Ist
x0 gleich a oder b, so meinen wir die links- bzw. rechtsseitige Differenzierbarkeit bzw. Ableitung.
9 Wir sehen, dass diese Funktion sogar Lipschitz stetig ist, d.h. dass |F(y) − F(x)| ≤ M · |y − x| für alle
x, y ∈ [a, b] mit einer festen Konstante M ≥ 0 gilt.
10 Man beachte, dass die Länge das Integrationsintervalles gerade x − x ist.
0
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
16
Rx
Beweis. Nach Satz 8.4.5 ist die Funktion F(x) = a f (t) dt ebenfalls eine Stammfunktion von f auf [a, b]. Somit unterscheiden sich H und F nur um eine Konstante,
F ≡ H + c auf [a, b]; vgl. Bemerkung 7.5.2. Wegen 0 = F(a) = H(a) + c ist H(a) = −c,
und somit
Z
b
a
f (t) dt = F(b) = H(b) + c = H(b) − H(a) .
❑
8.4.8 Beispiel. Wir wollen das Integral der Funktion ln x über das Intervall [1, 3] berechnen. Eine Stammfunktion von ln x auf (0, +∞) ist x(ln(x) − 1). Also folgt mit der
Konvention, dass g(x)|ba = g(b) − g(a),
Z 3
ln t dt = x(ln(x) − 1)|31 = 3(ln 3 − 1) − (−1) = 3 ln 3 − 2 .
1
Rπ
8.4.9 Beispiel. Um das bestimmte Integral 0 te2it dt zu berechnen, nehmen wir die
1 2ix
von xe2ix und erhalten
Stammfunktion 2ix e2ix − (2i)
2e
!π
Z π
x 2ix
1 2ix π
2it
te dt =
e −
e = .
2
2i
2i
(2i)
0
0
8.4.10 Bemerkung. Aus dem Hauptsatz sieht man insbesondere, dass für eine überall
Rx
auf [a, b] stetige Funktion f die Funktion F(x) = f (t) dt eine stetig differenzierbare
a
Funktion ist, die F ′ (x) = f (x) und F(a) = 0 erfüllt.
Ist umgekehrt F(x) = eine stetig differenzierbare Funktion auf [a, b] mit F(a) = 0,
so ist ihre Ableitung f stetig und wegen Satz 8.3.4 integrierbar. Die Funktion x 7→
Rx
f (t) dt hat nach dem Hauptsatz die selbe Ableitung wie F. Außerdem verschwinden
a
sie beide bei a, und daher F(x) =
Rx
a
f (t) dt, x ∈ [a, b]; vgl. Korollar 8.4.7.
Also wird C[a, b] durch den Integraloperator bijektiv auf {F ∈ C 1 [a, b] : F(a) = 0}
abgebildet. Die Umkehrabbildung ist dabei das Differenzieren. Man sieht auch leicht,
dass diese beiden Mengen Vektorräume sind, und dass dieser Integraloperator linear
ist.
8.4.11 Korollar. Ist f : [a, b] → R stetig mit f (x) ≥ 0 für alle x ∈ [a, b], und gilt
Rb
f (x) dx = 0, so verschwindet f identisch auf [a, b].
a
Beweis.
Die Funktion F(x) =
Rx
a
f (t) dt, x ∈ [a, b] ist in C 1 [a, b], erfüllt
F(a) = F(b) = 0 und hat für x ∈ (a, b) die Ableitung F ′ (x) = f (x) ≥ 0. Also
ist F(x) monoton wachsend, und somit 0 = F(a) ≤ F(x) ≤ F(b) = 0. Mit F
verschwindet auch F ′ = f identisch.
❑
Die in Lemma 7.5.4 kennengelernten Regeln zur Auffindung von Stammfunktionen
führen auf entsprechende Regeln zur Berechnung von Integralen.
8.5. WEITERE EIGENSCHAFTEN DES INTEGRALS
17
8.4.12 Lemma (Substitutionsregel). Sei f reell- oder komplexwertig und stetig auf
[a, b], und g ∈ C 1 [α, β] reellwertig mit g([α, β]) ⊆ [a, b]. Dann gilt
Z g(β)
Z β
f (x) dx =
f (g(t))g′ (t) dt .
α
g(α)
R
Beweis. Nach Lemma 7.5.4 ist ( f ) ◦ g eine Stammfunktion von f (g(t))g′ (t). Aus
Korollar 8.4.7 folgt daher die behauptete Gleichheit.
❑
Ähnlich beweist man folgendes Lemma.
8.4.13 Lemma (Partielle Integration). Seien f, g ∈ C 1 [a, b]. Dann gilt
Zb
′
f g dx = f (b)g(b) − f (a)g(a) −
a
Zb
f g′ dx .
a
Für f (b)g(b) − f (a)g(a) schreibt man auch f g|ba .
Folgender Satz wird ebenfalls Hauptsatz der Differential-Integralrechnung genannt.
Dieser ist dem Satz 8.4.5 zwar sehr ähnlich, aber auf den zweiten Blick unterscheiden
sie sich doch durch die Voraussetzungen wesentlich.
8.4.14 Satz (*). Sei f : [a, b] → R Riemann-integrierbar über [a, b], sodass es eine
stetige Funktion F : [a, b] → R gibt, die auf (a, b) differenzierbar ist und die dort
F ′ (x) = f (x) erfüllt. Dann gilt
Zb
f (x) dx = F(b) − F(a) .
a
Beweis. Sei {ξ j : j = 0, . . . , n} eine Zerlegung von [a, b]. Dann existieren nach dem
Mittelwertsatz der Differentialrechnung Satz 7.2.6 Zwischenstellen αi , ξi−1 ≤ αi ≤ ξi ,
sodass
F(ξi ) − F(ξi−1 ) = (ξi − ξi−1 ) f (αi ) .
n(R)
Somit ist R = (ξ j ) j=0 ; (α j )n(R)
j=1 eine Riemann-Zerlegung von [a, b]. Es folgt
F(b) − F(a) =
n
X
i=1
X
F(ξi ) − F(ξi−1 ) =
(ξi − ξi−1 ) f (αi ) = S (R) .
Für |R| → 0 strebt die rechte Seite gegen
n
i=1
Rb
f (x)dx.
a
❑
Man beachte, dass Satz 8.4.14 nur auf reellwertige Funktionen anwendbar ist, da
im Beweis der Mittelwertsatz der Differentialrechnung verwendet wird, der ja nur für
reellwertige Funktionen gilt.
8.5 Weitere Eigenschaften des Integrals
Sind f und g im folgenden Satz stetig, so ist die Aussage des Satzes eine einfache
Konsequenz aus der Tatsache, dass stetige Funktionen integrierbar sind.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
18
8.5.1 Satz (*). Sind f, g reellwertig und über [a, b] Riemann-integrierbar, so sind es
auch | f |, f 2 , f g und
b
b
Z
Z
f dx ≤
| f |dx .
a
a
Beweis. Sei ǫ > 0 gegeben. Nach Satz 8.2.5 existiert eine Zerlegung
Z = {ξi : i = 0, . . . , n(Z)} von [a, b], sodass
O( f, Z) − U( f, Z) < ǫ .
Setze für i = 0, . . . , n(Z)
sup
Mi =
f (x), mi =
x∈[ξi−1 ,ξi ]
Mi∗ =
sup | f (x)|, m∗i =
x∈[ξi−1 ,ξi ]
inf
f (x),
inf
| f (x)| .
x∈[ξi−1 ,ξi ]
x∈[ξi−1 ,ξi ]
Für x, y ∈ [ξi−1 , ξi ] folgt | f (x)| − | f (y)| ≤ | f (x) − f (y)| ≤ Mi − mi , und mit Hilfe von
Lemma 2.9.11
Mi∗ − m∗i =
sup | f (x)| + sup (−| f (x)|) =
x∈[ξi−1 ,ξi ]
x∈[ξi−1 ,ξi ]
sup
x,y∈[ξi−1 ,ξi ]
(| f (x)| − | f (y)|) ≤ Mi − mi .
Es folgt
O(| f |, Z) − U(| f |, Z) =
≤
n(Z)
X
i=1
n(Z)
X
i=1
(Mi∗ − m∗i )(ξi − ξi−1 ) ≤
(Mi − mi )(ξi − ξi−1 ) = O( f, Z) − U( f, Z) < ǫ .
und nach (8.3) ist | f | integrierbar. Die behauptete Ungleichung folgt aus Lemma 8.2.9,
(ii).
Ist Z wie oben, so folgt aus der Tatsache, dass x 7→ x2 monoton wachsend auf
+
R ∪ {0} ist,
sup f (x)2 − inf f (x)2 = (Mi∗ )2 − (m∗i )2
x∈[ξi−1 ,ξi ]
x∈[ξi−1 ,ξi ]
=
(Mi∗
+
m∗i )(Mi∗
− m∗i ) ≤ 2k f k∞ · (Mi∗ − m∗i ) .
Nun sehen wir wegen
2
2
O( f , Z) − U( f , Z) =
≤ 2k f k∞
n(Z)
X
i=1
n(Z)
X
i=1

 sup
x∈[ξi−1 ,ξi ]
2
f (x) −
inf
x∈[ξi−1 ,ξi ]


f (x)  (ξi − ξi−1 ) ≤
2

(Mi∗ − m∗i )(ξi − ξi−1 ) = 2k f k∞ O(| f |, Z) − U(| f |, Z) < 2k f k∞ · ǫ
wie oben, dass auch f 2 integrierbar ist. Die Behauptung für f g folgt aus der Beziehung
fg =
1
( f + g)2 − f 2 − g2 .
2
❑
8.6. UNEIGENTLICHE INTEGRALE
19
8.5.2 Bemerkung (*). Sind die Funktionen in Satz 8.5.1 komplexwertig, so sind mit f, g
auch Re f, Im f, Re g, Im g Riemannintegrierbar. Da man | f |2 , Re f g, Im f g als Summe
von Produkten von Re f, Im f, Re g, Im g darstellen kann, sind auch | f |2 , f g Riemannintegrierbar.
p
Man zeigt auch ähnlich wie im Beweis von Satz 8.5.1, dass mit | f |2 auch | f |2 = | f |
Riemann-integrierbar ist.
8.6 Uneigentliche Integrale
Angenommen, eine Funktion f : [a, b) → R (C) lässt sich zu einer Riemannintegrierbaren Funktion f˜ : [a, b] → R (C) fortsetzen, dann folgt aus dem Hauptsatz
lim
x→b
Z
x
f (t) dt =
Z
b
f˜(t) dt .
(8.11)
a
a
Hat die Funktion f : [a, b) → R (C) nicht die Eigenschaft, dass sie sich auf [a, b]
zu einer Riemann-integrierbaren Funktion
R x fortsetzen lässt, so kann man immer noch
versuchen, für x ∈ [a, b) das Integral a f (t) dt zu berechnen, und dann x gegen b
streben zu lassen.
8.6.1 Definition. Sei f : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] für alle
x ∈ [a, b) Riemann-integrierbar. Dann heißt f uneigentlich integrierbar, falls
Z
b
f (t) dt := lim
β→b−
a
Z
β
f (t)dt
a
Rb
existiert. Dazu sagen wir auch, dass a f (t) dt konvergiert. Entsprechend definiert man
uneigentliche Integrale für Funktionen f : (a, b] → R (C), wenn −∞ ≤ a < b.
Ist f : (a, b) → R (C), so definiert man mit einem beliebigen c ∈ (a, b)
Z
b
f (t) dt := lim
β→b−
a
Z
c
β
f (t)dt + lim
α→a+
Z
c
f (t)dt ,
(8.12)
α
falls die Grenzwerte existieren.
Eine reell- bzw. komplexwertige Funktion f heißt absolut uneigentlich integrierRb
bar, falls | f | uneigentlich integrierbar ist. Dazu sagt man auch, dass a f (t) dt absolut
konvergiert.
Man sieht leicht, dass (8.12) nicht von der Wahl von c ∈ (a, b) abhängt.
8.6.2 Beispiel.
(i) Für a ∈ R rechnet man
Z
Z +∞
−t
e dt = lim
β→+∞
a
a
β
e−t dt = lim −(e−β − e−a ) = e−a .
β→+∞
(ii) Mit der Regel von de l’Hospital erhält man für ein b > 0
Z
0
b
ln t dt = lim
α→0+
Z
α
b
ln t dt = b(ln(b) − 1) − lim α(ln(α) − 1) = b(ln(b) − 1) .
α→0+
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
20
(iii) Bei der Berechnung von
Z
+∞
sin πt
dt
(8.13)
t
1
sieht man, dass bei uneigentlichen Integralen ähnliche Phänomene auftreten, wie
bei Reihen. In der Tat gilt
Z [β]
Z β
Z β
sin πt
sin πt
sin πt
dt =
dt +
dt =
t
t
t
1
[β]
1
[β]−1
X
(−1)n
n=1
Z
n+1
n
| sin πt|
dt +
t
Z
β
[β]
sin πt
dt .
t
R n+1
Man erkennt unschwer, dass n | sint πt| dt monoton gegen Null für n → ∞ konvergiert. Mit Hilfe des Leibnizschen Kriteriums und wegen
Z β
Z [β]+1
sin πt 2 β→+∞
1
dt
| sin πt| dt =
−→ 0
≤
t
[β] [β]
π[β]
[β]
sieht man, dass (8.13) konvergiert.
Das Integral ist aber nicht absolut konvergent in dem Sinne, dass auch
existiert, da
Z
1
β
R β sin πt t dt
1
Z 1
[β]−1
[β]−1
X Z n+1 | sin πt|
X 1
sin t dt ≥
dt
=
|
sin
πt|
dt
·
t n+1
n+1
0
n=1 n
n=1
für β → +∞ divergiert.
Das wohl am meisten verwendete und ähnlich wie bei den Folgen zu beweisende
Kriterium für die absolute Konvergenz ist das folgende Resultat.
8.6.3 Lemma. Seien f, g : [a, b) → R (C), wobei a < b ≤ +∞, und sei f |[a,x] und g|[a,x]
sowie der Betrag dieser Funktionen für alle x ∈ [a, b) Riemann-integrierbar.
Rb
Ist a g(x) dx absolut konvergent, so ist es auch konvergent. Gilt obendrein die
Rb
Ungleichung |g(x)| ≥ | f (x)| für alle x ∈ [c, b) mit einem c ∈ [a, b), so ist auch a f (x) dx
absolut konvergent und somit auch konvergent.
Entsprechende Aussagen gelten für Funktionen, die auf Intervallen der Bauart
(a, b] bzw. (a, b) definiert sind.
Beweis. Wegen den Ungleichungen
Z x
Z x
Z x2
Z x2
2
2
|g(t)| dt ,
|
f
(t)|
dt
≤
g(t)
dt
|g(t)|
dt,
≤
x1
x1
x1
x1
R x
vererbt sich die Eigenschaft, dass a |g(t)| dt
ein Cauchy-Netz ist auch auf
x≥a
R x
R x
g(t) dt x≥a bzw. a | f (t)| dt x≥a . Die behauptete Konvergenz folgt dann aus Lemma
a
5.3.11.
❑
8.6.4 Bemerkung. Man kann Lemma 8.6.3 anwenden, um aus der Divergenz eines
Rb
Rb
uneigentlichen Integrales a | f (x)| dx auf die Divergenz von a |g(x)| dx zu schließen,
wenn |g(x)| ≥ | f (x)| für alle x ∈ (a, b).
8.6. UNEIGENTLICHE INTEGRALE
21
8.6.5 Beispiel. Man betrachte das uneigentliche Integral
Z β
Z +∞
Z 1
x ln x
x ln x
x ln x
dx
:=
lim
dx
+
lim
dx .
2
3
2
3
β→+∞ 1 (x2 + 1)3
α→0+ α (x + 1)
(x + 1)
0
Da die Funktion h(x) := x ln x nur für x ∈ (0, +∞) definiert ist, ist dieses Integral
uneigentlich an beiden Integrationsgrenzen. Die Funktion h(x) lässt sich aber stetig auf
[0, +∞) durch h(x) = 0 stetig fortsetzen. Somit bleibt nur die Uneigentlichkeit bei der
Stelle +∞; vgl. (8.11).
Für x ≥ 1 ist der Integrand nicht negativ. Somit ergeben dort die Abschätzungen
x2
x2
1
x ln x = x ln x ≤
≤
(x2 + 1)3 (x2 + 1)3 (x2 + 1)3 (x2 )3 = x4 .
Wegen
Z
1
1 ∞ 1
dx
=
−
=
3
x4
3x3 0
1
folgt aus Lemma 8.6.3 die absolute Konvergenz unseres Integrals.
∞
8.6.6 Beispiel. Man betrachte das uneigentliche Integral
Z 1
ln x
dx .
2x
x
0 e −e
Dieses ist nur uneigentlich bei 0. Für x ∈ (0, 1] gilt
ln x = − ln x .
e2x − e x e2x − e x
Wegen e−x ≥ 1/e für alle x ∈ [0, 1] folgt
− ln x
1 − ln x
− ln x
≥
.
= e−x x
e − 1 e ex − 1
e2x − e x
Weiters gilt − ln x ≥ 1 für alle x ∈ (0, 1/e], d. h.
1 1
− ln x
≥ 1(0,1/e] (x) ·
≥ 0, x ∈ (0, 1] .
e ex − 1
e2x − e x
Dabei ist 1(0,1/e] die Charakteristische Funktion des Intervalls (0, 1/e]. Für alle ǫ ∈
(0, 1/e) erhalten wir mit der Monotonie des Integrals
Z 1 Z 1/e
Z
1 1/e e−x
1
ln x dx ≥ 1
dx .
Iǫ :=
dx
=
e2x − e x e ǫ ex − 1
e ǫ 1 − e−x
ǫ
Nun steht im Zähler die Ableitung des Nenners, d. h. eine Stammfunktion des Integranden ist ln(1 − e−x ). (Wegen x > 0 ist das Argument des Logarithmus positiv.) Daraus
ergibt sich
1/e 1 1 − e−1/e
1
.
Iǫ ≥ ln(1 − e−x ) = ln
ǫ
e
e
1 − e−ǫ
Für ǫ → 0+ konvergiert die rechte Seite und damit auch die linke Seite gegen +∞.
Insbesondere divergiert das uneigentliche Integral
Z 1 ln x dx ,
2x
x
0 e −e
und damit auch das im Beispiel angegebene.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
22
8.7 Vertauschung von Integralen mit Grenzwerten
Das folgende Lemma ist eine unmittelbare Verallgemeinerung von Lemma 6.6.11.
Auch den Beweis kann man fast wörtlich übernehmen.
8.7.1 Lemma. Seien (I, I ) und (J, J ) zwei gerichtete Mengen, und sei hY, di ein
vollständig metrischer Raum.
Weiters seien H : I × J → Y und h : I → Y Funktionen, sodass für alle j ∈ J die
Funktion H j : I → Y, i 7→ H(i, j) beschränkt ist, und sodass
h(i) = lim H(i, j)
j∈J
gleichmäßig auf I, d.h.
∀ǫ > 0 ∃ j0 ∈ J : ∀ j j0 , ∀i ∈ I : d(H(i, j), h(i)) ≤ ǫ ,
bzw. äquivalent dazu h = lim j∈J H j in hB(I, Y), d∞i11 .
Schließlich existiere für alle j ∈ J der Limes A j := limi∈I H(i, j). Unter diesen
Voraussetzungen ist sowohl (A j ) j∈J als auch (h(i))i∈I in Y konvergent, wobei
lim A j = lim h(i) ;
j∈J
i∈I
(8.14)
also gilt
lim lim H(i, j) = lim lim H(i, j) .
j∈J i∈I
i∈I j∈J
Beweis. Sei ǫ > 0 gegeben. Wegen der vorausgesetzten gleichmäßigen Konvergenz ist
H j j∈J in B(I, Y) ein Cauchy-Netz. Es existiert also ein j0 ∈ J, sodass für j, k j0 und
alle i ∈ I gilt
dY (H(i, j), H(i, k)) ≤ d∞ (H j , Hk ) ≤ ǫ .
Hält man j und k fest, so folgt dY (A j , Ak ) = limi∈I dY (H(i, j), H(i, k)) ≤ ǫ. Damit ist
(A j ) j∈J ein Cauchy-Netz, und wegen Lemma 5.3.11 konvergent. Setzen wir lim j∈J A j =:
A, so gilt
dY (h(i), A) ≤ dY (h(i), H(i, j)) + dY (H(i, j), A j) + dY (A j , A) .
Wähle j nach der vorausgesetzten gleichmäßigen Konvergenz so, dass für alle i ∈ I gilt
dY (h(i), H(i, j)) ≤ d∞ (h, H j) < ǫ und so, dass dY (A j , A) < ǫ. Für dieses j existiert ein
i0 ∈ I, sodass aus i i0 , die Ungleichung dY (H(i, j), A j) < ǫ folgt. Insgesamt erhalten
wir
dY (h(i), A) < 3ǫ für i ∈ I und i i0 .
❑
Aus diesem Lemma folgen nun eine Reihe wichtiger Ergebnisse.
8.7.2 Satz. Sei ( fn )n∈N eine Folge von Riemann-integrierbaren Funktionen auf [a, b]
mit Werten in R oder C. Gilt limn→∞ fn = f gleichmäßig auf [a, b], so ist auch f
Riemann-integrierbar, wobei
lim
n→∞
Zb
a
fn dx =
Zb
f dx .
a
Entsprechendes gilt für gleichmäßig konvergente Netze von Funktionen.
11 Wegen Satz 6.6.15 und Lemma 5.3.11 ist diese Tatsache, dass lim
j∈J H j in hB(I, Y), d∞ i existiert äquivalent dazu, dass (H j ) j∈J in hB(I, Y), d∞ i ein Cauchy-Netz ist.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN
23
Beweis. Um das letzte Lemma anwenden zu können, sei I = R die Menge aller
Riemann-Zerlegungen von [a, b] versehen mit der durch die Feinheit induzierte Ordnung und (J, J ) = (N, ≤). Weiters sei Y = R (C), versehen mit der Euklidischen
Metrik, je nachdem, wo die Funktionen hinein abbilden.
Wir setzen H(R, n) := S ( fn , R), h(R) = S ( f, R). Wegen Lemma 8.2.9, (ii), gilt
|H(R, n) − h(R)| = |S ( fn − f, R)| ≤ k fn − f k∞ · (b − a) = d∞ ( fn , f ) · (b − a) . (8.15)
Also konvergiert H(., n) gleichmäßig gegen h. Nach Lemma 8.7.1 folgt
lim
n→∞
Zb
fn dx = lim lim S ( fn , R)
n→∞ |R|→0
a
= lim lim S ( fn , R) = lim S ( f, R) =
|R|→0 n→∞
|R|→0
Zb
f dx ,
a
wobei limn→∞ S ( fn , R) = S ( f, R) für ein festes R ∈ R aus (8.15) folgt.
Der Beweis für Netze verläuft fast identisch.
❑
P∞
8.7.3 Beispiel. Sei n=0 an xn eine Potenzreihe mit positivem Konvergenzradius R.
Dann gilt für [a, b] ⊆ {x ∈ R : |x| < R}

Zb X
Z
∞
∞
X


n

an
 an x  dx =
a
n=0
n=0
b
xn dx =
a
∞
X
an n+1 b
x | x=a .
n
+1
n=0
Somit haben wir eine weitere Möglichkeit, Stammfunktionen auszurechnen. So ist et2
wa die Stammfunktion von e−x nicht als Summe von Produkten von Funktionen wie
Polynome, e hoch Polynomen, oder dergleichen darstellbar. Aber zumindest lässt sich
eine Stammfunktion F(x) als
F(x) =
Z
0
x
e
−t2
dt =
Z
0
∞
xX
j=0
X
(−1) j
(−1) j 2 j
t dt =
x2 j+1 ,
j!
(
j!)(2
j
+
1)
j=0
∞
anschreiben.
Mit Hilfe des Hauptsatzes können wir auch Differentiation und Limes vertauschen.
8.7.4 Korollar. Sei ( fn )n∈N eine Folge von reell- bzw. komplexwertigen und stetig differenzierbaren Funktionen definiert auf [a, b].
Existiert ein Punkt x0 ∈ [a, b], sodass ( fn (x0 ))n∈N konvergiert, und ist die Folge
( fn′ )n∈N gleichmäßig konvergent auf [a, b], so ist auch die Folge ( fn )n∈N gleichmäßig
konvergent auf [a, b], und es gilt
d
d
lim fn (x) = lim
fn (x), x ∈ [a, b] .
n→∞ dx
dx n→∞
Entsprechendes gilt für Netze von Funktionen.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
24
Rx
Beweis. Nach Satz 8.4.5 bzw. Bemerkung 8.4.6 gilt fn (x) = x fn′ (t) dt + fn (x0 ) für alle
0
x ∈ [a, b]. Setzen wir g := limn→∞ fn′ und A := limn→∞ fn (x0 ), so ist g wegen Korollar
6.6.13 stetig. Außerdem folgt für x ∈ [a, b] aus Satz 8.7.2
!
Z x
Z x
′
g(t) dt + A = lim
f (x) :=
fn (t) dt + fn (x0 ) = lim fn (x) ,
n→∞
x0
n→∞
x0
womit ( fn )n∈N zumindest punktweise gegen f (x) konvergiert. Nach Satz 8.4.5 ist die
linke Seite ableitbar, und daher gilt f ′ (x) = g(x) = limn→∞ fn′ (x), x ∈ [a, b].
Die Gleichmäßigkeit der Konvergenz folgt aus
Z x
′
k fn − f k∞ = sup | fn (x) − f (x)| = sup ( fn (t) − g(t)) dt + fn (x0 ) − A ≤
x∈[a,b]
x∈[a,b]
x0
n→∞
(b − a) · k fn′ − gk∞ + | fn (x0 ) − A| −→ 0 .
(8.16)
Der Beweis für Netze verläuft fast identisch.
❑
Dass aus der gleichmäßigen Konvergenz einer Funktionenfolge im Allgemeinen
nicht die gleichmäßige Konvergenz der Folge der Ableitungen folgt, zeigt
8.7.5 Beispiel. Sei fn (x) =
sin√ nx
n
für x ∈ R. Offensichtlich gilt
lim fn (x) = 0 ,
n→∞
und zwar gleichmäßig auf ganz R. Wegen
fn′ (x) =
√
n cos nx
gilt aber etwa limn→∞ fn′ (0) = +∞.
Wenden wir Korollar 8.7.4 auf Potenzreihen an, so erhalten wir folgendes Resultat.
Dieses zeigt insbesondere auch, dass die Taylorreihe zur Grenzfunktion einer Potenzreihe mit der gegebenen Potenzreihe übereinstimmt; vgl. Fakta 7.4.4, 7.
P
8.7.6 Proposition. Sei ∞
a zn eine Potenzreihe mit Konvergenzradius R > 0. Dann
P∞ n=0 n
hat die Potenzreihe n=0 (n + 1)an+1 zn denselben Konvergenzradius R.
Die Funktion
∞
X
f : (−R, R) → C, f (t) =
an t n
n=0
ist auf (−R, R) differenzierbar mit der Ableitung
f ′ (x) =
∞
X
(n + 1) an+1 xn .
n=0
Sie ist sogar beliebig oft differenzierbar mit (l ∈ N)
f (l) (x) =
∞
X
n=0
(n + l) · · · (n + 1) an+l xn ,
wobei auch diese Potenzreihe Konvergenzradius R hat. Insbesondere gilt
f (l) (0) = l! al .
(8.17)
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN
25
P
n
Beweis. Dass der Konvergenzradius von ∞
prüft man entn=0 (n + 1)an+1 z auch R ist,
P
n
weder mit Hilfe des Majorantenkriteriums durch einen Vergleich mit ∞
n=0 |an z | nach,
12
oder man zeigt, dass
lim supn→∞
1
√n
|(n + 1)an+1 |
=
1
= R,
√
lim supn→∞ n+1 |an+1 |
vgl. Satz 6.7.7.
Für jedes feste r ∈ (0, R) konvergiert wegen Satz 6.7.7 die Funktionenfolge
PN
( n=0
an tn )N∈N auf [−r, r] gleichmäßig gegen f . Analog konvergiert die FunktionenPN−1
folge ( n=0
(n + 1)an+1 tn )N∈N auf [−r, r] gleichmäßig und zwar wegen Korollar 8.7.4
′
gegen f . Da r < R beliebig war, folgt die Behauptung.
Die Verallgemeinerung in (8.17) folgt nun leicht durch vollständige Induktion.
❑
8.7.7 Beispiel. Für x ∈ (−1, 1) ist die Funktion x 7→ ln(1 − x) beliebig oft differenzierP
1
n
bar. Da ln(1 − x)′ = − 1−x
=− ∞
n=0 x nach Proposition 8.7.6 mit der Ableitung von
P∞ xn
P
xn
x 7→ − n=1 n , x ∈ (−1, 1) übereinstimmt, und da ln(1 − x) und − ∞
n=1 n für x = 0
beide den Wert Null annehmen, folgt aus Korollar 7.2.9, dass
ln(1 − x) = −
∞
X
xn
für alle x ∈ (−1, 1) .
n
n=1
Da diese Reihe
auch für x = −1 (bedingt) konvergiert, folgt aus Satz 6.11.1, dass
P (−1)n
− ∞
=
ln(2).
n=1 n
Als Vorspiel zum nächsten Ergebnis wollen wir uns kurz mit dem Produkt zweier
metrischer Räume beschäftigen.
8.7.8 Fakta.
1. Seien hX, dX i und hY, dY i zwei metrische Räume. Ist X × Y die Menge aller geordneten Paare, und definiert man
d (a, b), (x, y) := max(dX (a, x), dY (b, y)) ,
(8.18)
so sieht man unmittelbar, dass (X × Y, d) ein metrischer Raum ist, und dass
(xn , yn ) → (x, y) genau dann, wenn xn → x und yn → y.
2. Sind K1 ⊆ X und K2 ⊆ Y jeweils kompakt, so ist es auch K1 × K2 , denn ist
(xn , yn ) n∈N eine Folge in K1 × K2 , so gibt es eine Teilfolge (xn(k) )k∈N , sodass
xn(k) → x ∈ K1 und weiter eine Teilfolge (yn(k( j)) ) j∈N mit yn(k( j)) → y ∈ K2 , also
(xn(k( j)) , yn(k( j)) ) → (x, y).
3. Die offene Kugel Uǫ (a, b) um ein (a, b) ∈ X × Y ist nichts anderes als Uǫ (a) ×
Uǫ (b), da
d (a, b), (x, y) = max(dX (a, x), dY (b, y)) < ǫ ⇔ dX (a, x) < ǫ ∧ dY (b, y) < ǫ .
4. Sind O1 ⊆ X, O2 ⊆ Y offen, so auch O1 × O2 ⊆ X × Y, da es zu (a, b) ∈ X × Y
sicherlich ein ǫ > 0 mit Uǫ (a) ⊆ O1 und Uǫ (b) ⊆ O2 gibt, und dann Uǫ (a, b) ⊆
O1 × O2 .
12 Um diese Gleichheit einzusehen, verwendet man am besten die Charakterisierung des Limes Superior
als größter Häufungspunkt; vgl. Proposition 5.2.3.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
26
5. Die Definition von d∞ auf R p passt genau in dieses Bild, denn haben wir p1 +
p2 = p, und sind sowohl R p1 als auch R p2 versehen mit d∞ , und versieht man
R p = R p1 × R p2 mit der Metrik aus (8.18), so erhält man genau wieder d∞ .
8.7.9 Korollar. Ist f : [a, b] × K → R (C) stetig, wobei K eine kompakte Teilmenge
eines metrischen Raumes (Y, dY ) ist, so ist auch die Funktion R : K → R (C) definiert
durch
Z
b
f (s, t) ds
R(t) =
a
stetig. R(t) nennt man Parameterintegral.
Beweis. Es gilt limt→t0 R(t) = limt∈K\{t0 } R(t) = R(t0 ) für ein beliebiges t0 ∈ K zu zeigen.
Dabei ist K \ {t0 } geordnet durch
t1 t2 ⇔ dY (t0 , t1 ) ≥ dY (t0 , t2 ) .
Wegen der Kompaktheit von [a, b] × K ist die Funktion f sogar gleichmäßig stetig; vgl.
Satz 6.3.3. Zu gegebenem ǫ > 0 gibt es somit ein δ > 0, sodass
d (s, t), (s′ , t′ ) < δ ⇒ | f (s, t) − f (s′ , t′ )| < ǫ .
Insbesondere folgt aus dY (t, t0 ) < δ wegen d (s, t), (s, t0 ) = dY (t, t0 ) die Ungleichung
| f (s, t) − f (s, t0 )| < ǫ für alle s ∈ [a, b] und somit
k f (., t) − f (., t0 )k∞ = sup | f (s, t) − f (s, t0 )| ≤ ǫ .
s∈[a,b]
Also konvergiert das Netz ( f (., t))t∈K\{t0 } gleichmäßig gegen die Funktion f (., t0 ) :
[a, b] → R (C). Wegen Satz 8.7.2 gilt dann
Z b
Z b
Z b
lim R(t) = lim
f (s, t0 ) ds = R(t0 ) .
lim f (s, t) ds =
f (s, t) ds =
t→t0
t→t0
a t→t0
a
a
❑
Mit unserem Grenzwertvertauschungssatz lässt sich auch die Vertauschbarkeit der
Integrationsreihenfolge zeigen.
8.7.10 Satz (Satz von Fubini). Ist f : [a, b] × [c, d] → R (C) stetig, so gilt
!
!
Z d Z b
Z b Z d
f (s, t) ds dt .
f (s, t) dt ds =
a
c
c
Beweis. Die Existenz der inneren Integrale wird durch
Integrale durch Korollar 8.7.9 gewährleistet.
Sei I = R die Menge aller Riemann-Zerlegungen
die Menge aller Riemann-Zerlegungen von [c, d] beide
Feinheit induzierten Ordnung. Wir definieren für R =
n(P) (η j )n(P)
j=0 ; (β j ) j=1
H(R, P) :=
Satz 8.3.4 und der äußeren
von [a, b] und sei J = P
gerichtet mit der durch die
n(R) (ξ j )n(R)
j=0 ; (α j ) j=1 und P =
n(R) X
n(P)
X
(ξ j − ξ j−1 )(ηk − ηk−1 ) f (α j , βk ) ,
j=1 k=1
(8.19)
a
(8.20)
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN
27
und bemerken, dass
n(R)

X


(ηk − ηk−1 )  (ξ j − ξ j−1 ) f (α j , βk ) = S (S ( f1 , R), P) ,
H(R, P) =
k=1
j=1
|
{z
}
n(P)
X
=S ( f1 ,R)(βk )
wobei f1 die Funktion f mit festgehaltener zweiter Variablen ist, und S ( f1 , R) als
Funktion eben dieser Variable aus [c, d] betrachtet wird. Entsprechend gilt H(R, P) =
S (S ( f2 , P), R).
Wegen (8.9) gilt
|H(R, P1 ) − H(R, P2 )| = |S (S ( f1 , R), P1 ) − S (S ( f1 , R), P2 )| ≤
(8.21)
2(d − c) · sup{ |S ( f1 , R)(t) − S ( f1 , R)(t′ )| : t, t′ ∈ [c, d], |t − t′ | ≤ max(|P1 |, |P2 |) } .
Außerdem ist wegen Lemma 8.2.9, (ii),
|S ( f1 , R)(t) − S ( f1 , R)(t′ )| = S f (, t) − f (., t′ ) , R ≤ (b − a) · k f (., t) − f (., t′ )k∞ .
Da unsere Funktion f gleichmäßig stetig ist, gibt es zu gegebenen ǫ > 0 ein δ > 0,
sodass k f (., t) − f (., t′ )k∞ ≤ ǫ für alle t, t′ ∈ [c, d] mit |t − t′ | < δ. Aus (8.21) folgt dann
sup |H(R, P1 ) − H(R, P2 )| ≤ 2(d − c)(b − a)ǫ ,
R∈R
wenn nur |P1 |, |P2 | < δ. Somit ist H(., P) P∈J ein Cauchy-Netz in B(I, C)13 und konvergiert daher wegen Lemma 5.3.11 in B(I, C) bzgl. d∞ – also gleichmäßig – gegen
eine Funktion h : I → C, wobei
h(R) = lim H(R, P) = lim S (S ( f2 , P), R) =
|P|→0
|P|→0
S ( lim S ( f2 , P), R) = S (
|P|→0
Z
d
f (., t) dt, R) .
c
Daraus folgt
lim lim H(R, P) = lim S (
|R|→0 |P|→0
|R|→0
Z
d
f (., t) dt, R) =
c
Aus Symmetriegründen konvergiert auch H(R, .)
g : J → C, wobei
g(P) = lim H(R, P) = S (
|R|→0
Z
a
R∈I
Z
b
a
Z
d
!
f (s, t)dt ds .
c
in B(J, C) gegen eine Funktion
b
f (s, .) ds, P) ,
womit
lim lim H(R, P) = lim S (
|P|→0 |R|→0
|P|→0
Z
a
b
f (s, .) ds, P) =
Z
c
d
Z
b
a
!
f (s, t)ds dt .
13 Das ist der vollständig metrische Raum aller auf I beschränkten C-wertigen Funktionen versehen mit
d∞ , vgl. Definition 6.6.3.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
28
Weil alle Voraussetzungen von Lemma 8.7.1 erfüllt sind, erhalten wir
lim lim H(R, P) = lim lim H(R, P) ,
|R|→0 |P|→0
|P|→0 |R|→0
und damit (8.19).
❑
8.7.11 Bemerkung. Ist eine stetige reell- oder komplexwertige Funktion auf einem
Qp
Quader j=1 [a j , b j ] = [a1 , b1 ] × · · · × [a p , b p ] ⊆ R p definiert, so ist wegen Korollar
R bp
Q p−1
p−1
8.7.9 (t j ) j=1 7→ a f (t1 , . . . , t p−1 , s) ds stetig auf j=1 [a j , b j ] ⊆ R p−1 .
p
Nun kann man nach der vorletzten Variablen integrieren, dann nach der vorvorletzten, usw. . Schließlich erhält man
Z b1
Z bp
...
f (t1 , . . . , t p ) dt p . . . dt1 .
(8.22)
a1
ap
Wendet man Satz 8.7.10 mehrere Male an, so sieht man, dass es hier nicht auf die
Integrationsreihenfolge ankommt.
Man kann das als Ausgangspunkt für die Integrationstheorie für Funktionen, die auf
Q
einem Rechteck oder allgemeiner über einem Quader Q = pj=1 [a j , b j ] ⊆ R p definiert
sind, nehmen, indem man
Z
f (t) dt
Q
als (8.22) definiert. Dieser Ausdruck hängt zumindest für stetige f nicht von der Integrationsreihenfolge ab, ist also in einem gewissen Sinne sinnvoll definiert.
Größere Probleme tauchen auf, wenn man etwa das Integral einer stetigen Funktion über einen Kreis definieren will. Solche Integrale werden wir in der Analysis 3
Vorlesung behandeln.
Als Folgerung erhält man unmittelbar eine Aussage über die Differenzierbarkeit
von Parameterintegralen.
8.7.12 Korollar. Sei f : [a, b] × [c, d] → R(C) stetig und so, dass die Ableitung nach
der ersten Variablen für alle (s, t) ∈ [a, b] × [c, d] existiert, und dass
f1 (s, t) =
d
f (s, t)14 ,
ds
ebenfalls auf [a, b] × [c, d] stetig ist. Dann ist die Funktion s 7→
s ∈ [a, b] stetig differenzierbar mit der Ableitung
Z d
Z d
d
f1 (s, t) dt .
f (s, t) dt =
ds c
c
Rd
c
f (s, t) dt für
(8.23)
Beweis. Wegen Satz 8.7.10 und dem zweiten Hauptsatz gilt
Z xZ d
Z dZ x
Z d
f1 (s, t) dt ds =
( f (x, t) − f (a, t)) dt .
f1 (s, t) ds dt =
a
c
c
a
c
Differenziert man diese Gleichung nach der Variablen x, so erhält man (8.23). Dass
(8.23) stetig von s ∈ [a, b] abhängt, folgt aus Korollar 8.7.9.
❑
14 Dafür
werden wir später
∂
∂s
f (s, t) schreiben.
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN
29
8.7.13 Beispiel. Als Anwendung der Grenzwertvertauschungen wollen wir folgende
besonders in der Statistik und Wahrscheinlichkeitstheorie wichtige Tatsache zeigen:
Z +∞
√
2
(8.24)
e−t dt = π .
−∞
Dazu betrachte man (x ∈ [0, C] mit C > 0 beliebig)
π
F(x) = −
4
Z
1
0
2 2
e−x (t +1)
dt .
t2 + 1
(8.25)
2 2
Die Ableitung des Integranden nach x ist −2xe−x (t +1) . Somit ist diese und offensichtlich der Integrand selber auf [0, C] × [0, 1] stetig. Aus Korollar 8.7.12 schließen wir
′
F (x) = 2xe
−x2
Z
1
2 2
e−x t dt .
0
Außerdem gilt
Z
1
1
π
dt = − arctan |10 = 0 .
2+1
4
t
0
R x 2 2
Rx 2
2
Ist andererseits G(x) = 0 e−t dt , so gilt G′ (x) = 2e−x 0 e−t dt, und aus der Substitutionsregel folgt F ′ (x) = G′ (x). Wegen G(0) = 0 = F(0) folgt F(x) = G(x) und
zwar für alle x ≥ 0, da ja C > 0 beliebig war.
F(0) =
−x2 (t 2 +1)
π
−
4
2
Wegen e t2 +1 ≤ e−x konvergiert der Integrand in (8.25) für x → +∞ gleichmäßig
gegen die Nullfunktion, und mit Satz 8.7.2 erhält man
lim G(x) = lim F(x) =
x→+∞
x→+∞
π
.
4
Aus der Stetigkeit der Wurzelfunktion folgt
lim
x→+∞
Z
x
√
π
,
2
2
e−t dt =
0
und damit (8.24).
8.7.14 Beispiel. Wir betrachten die Funktion
F(t) =
Z
0
+∞
sin x −xt
· e dx := lim
γ→0+
x
Z
γ
1
sin x −xt
· e dx + lim
β→+∞
x
Z
1
β
sin x −xt
· e dx .
x
Diese ist wohldefiniert für t ∈ [0, +∞), da obiges uneigentliches Integral für alle t ≥ 0
konvergiert, wobei es aber nur für t > 0 absolut konvergiert.
Man beachte dabei auch, dass 0 nicht wirklich eine Uneigentlichkeitsstelle obigen
Integrales ist, da sich die Funktion g(x) := sinx x , x ∈ (0, +∞) stetig auf [0, +∞) durch
g(0) := 1 = lim x→0+ sinx x fortsetzen lässt. Also gilt nach dem Hauptsatz der Differentialund Integralrechnung
lim
δ→0+
Z
1
δ
sin x −xt
· e dx =
x
Z
0
1
g(x) · e−xt dx .
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
30
Man betrachte, das Netz (α > 1)
Fα (t) =
Z
α
1
α
sin x −xt
· e dx
x
von Funktionen auf [0, +∞). Offenbar konvergiert
es punktweise gegen F(t).
Weiters wollen wir bemerken, dass sinx x ≤ 1, x > 0, da die Funktion sin x − x
bei Null verschwindet, und auf [0, +∞) eine Ableitung kleiner gleich Null hat und
somit monoton fallend ist. Also gilt sin x − x ≤ 0, x ∈ [0, +∞) und daher sinx x ≤ 1
sicher für x ∈ (0, 1]. Für x > 1 ist diese
klarerweise auch richtig, da
Ungleichung
.
| sin x| ≤ 1, x ∈ R, und für x < 0 gilt sinx x = sin(−x)
−x
Wir wollen nun limt→+∞ F(t) berechnen. Dazu betrachten wir F(t) für t ∈ [δ, +∞)
für ein festes δ > 0, und bemerken, dass für t ≥ δ
Z 1
Z β
α sin x
sin x −xt −xt
|F(t) − Fα (t)| = lim
· e dx + lim
· e dx ≤
β→+∞ α
x
x
γ→0+ γ
lim
γ→0+
Z
1
α
Z
1
α
e−δx dx + lim
β→+∞
γ
e−δx dx +
Z
β
e−δx dx =
α
1
+∞
e−δx dx =
α
0
Z
1 − e− α + e−α
.
δ
Der Ausdruck rechts konvergiert für α → +∞ gegen 0 und zwar unabhängig von t ∈
[δ, +∞). Also konvergiert Fα gegen F gleichmäßig auf [δ, +∞).
Andererseits gilt nach Satz 8.7.2 für ein festes α > 1
Z α
sin x −xt
lim Fα (t) = lim
· e dx =
t→+∞
t→+∞ 1
x
α
Z
α
sin x −xt
· e dx =
t→+∞ x
lim
1
α
Z
α
0 dx = 0 ,
1
α
1
da wegen sinx x · e−xt ≤ e−t α das Netz von Funktionen x 7→ sinx x · e−xt , x ∈ [ α1 , α] für
t → +∞ gleichmäßig gegen 0 konvergiert.
Setzen wir also H(t, α) := Fα (t) für (t, α) ∈ [δ, +∞)×(1, +∞), wobei diese Intervalle
jeweils gegen +∞ gereichtet sind, so folgt aus Lemma 8.7.1
lim F(t) = lim lim Fα (t) = lim lim Fα (t) = lim 0 = 0 .
t→+∞
t→+∞ α→+∞
α→+∞ t→+∞
α→+∞
Nun wollen wir F ′ (t) für t > 0 berechnen. Dazu halten wir wieder δ > 0 fest und
betrachten t ∈ [δ, +∞). Wir wissen schon, dass Fα → F und zwar gleichmäßig auf
dieser Menge. Betrachten wir nun für ein festes α > 1 die das Integral
Z α
sin x −xt
Fα (t) =
· e dx ,
1
x
α
so ist der Integrand stetig in (x, t) ∈ [ α1 , α] × [δ, +∞), und auch die Ableitung
∂ sin x −xt
· e = − sin x · e−xt
∂t x
8.7. VERTAUSCHUNG VON INTEGRALEN MIT GRENZWERTEN
31
des Integranden nach t (∈ [δ, +∞)) ist stetig in (x, t) ∈ [ α1 , α] × [δ, +∞). Also gilt nach
Korollar 8.7.12
Z α
Fα′ (t) =
Wegen (t ∈ [δ, +∞))
Z
− sin x · e−xt dx .
+∞
− sin x · e−xt dx −
0
Z
1
α
1
α
Z
Z
α
1
α
− sin x · e−xt dx ≤
1
+∞
1 − e− α + e−α
δ
α
0
konvergiert Fα′ (t) für α → +∞ unabhängig von t ≥ δ, daher gleichmäßig in t ∈ [δ, +∞),
gegen
Z
e−δx dx +
e−δx dx =
+∞
0
− sin x · e−xt dx .
Gemäß Korollar 8.7.4 ist das somit genau F ′ (t) und zwar für t ∈ (0, +∞), da ja das feste
δ > 0 beliebig war. Wegen
Z +∞
+∞
1
1
−xt − sin x · e−xt dx =
(t
sin
x
+
cos
x)e
, t > 0,
0 = −
2
1+t
1 + t2
0
folgt F(t) = C − arctan t, t ∈ (0, +∞) für ein festes reelles C. Lässt man t gegen +∞
streben, so sieht man, dass C = π2 .
Schließlich gilt für t ≥ 015
Z 1
Z +∞
sin x −xt
1 −xt
F(t) =
· e dx +
· e sin x dx .
x
x
0
1
Das erste Integral ist gemäß Korollar 8.7.9 stetig in t ∈ [0, +∞). Für das zweite stimmt
nach einer partiellen Integration überein mit
#β
"
Z β
1 t sin x + cos x −xt
1 t sin x + cos x −xt
−
lim
e
e dx .
(8.26)
lim −
β→+∞ 1 x2
β→+∞
x
1 + t2
1 + t2
1
Man beachte, dass der erste Grenzwert genau
t sin 1 + cos 1 −t
e
1 + t2
x+cos x −xt ist, und somit auch stetig in t ∈ [0, +∞) ist. Wegen t sin1+t
e
≤ 1 gilt für t ≥ 0
2
Z +∞
Z +∞
Z β
1 t sin x + cos x −xt 1
1 t sin x + cos x −xt
e dx −
e dx ≤
dx .
2
2
2
2
2
x
1
+
t
x
1
+
t
x
1
β
1
Also konvergiert das Netz
Z
1
β
1 t sin x + cos x −xt
e dx
x2
1 + t2
von stetigen (siehe Korollar 8.7.9) Funktion in t ∈ [0, +∞) gleichmäßig gegen den
zweiten Grenzwert aus (8.26). Also ist auch dieser stetig; vgl. Korollar 6.6.13. Damit
haben wir die Stetigkeit von F(t) auf ganz [0, +∞) nachgewiesen.
Da aber F(t) = π2 − arctan t für t > 0 folgt für t → 0+ die Gleichung
Z +∞
π
sin x
dx = F(0) = .
x
2
0
15 Man
denke sich wieder
sin x
x
bei x = 0 stetig fortgesetzt mit dem Wert 1.
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
32
8.8 Mittelwertsatz
Folgende Tatsache liegt unmittelbar auf der Hand.
8.8.1 Satz (Mittelwertsatz der Integralrechnung). Seien f und g reelle und Riemannintegrierbare Funktion auf [a, b], wobei g(t) ≥ 0, t ∈ [a, b]. Dann existiert ein µ ∈
[inf t∈[a,b] f (t), supt∈[a,b] f (t)] mit
Zb
f (t)g(t) dt = µ
a
Zb
g(t) dt .
(8.27)
a
Ist f stetig, so gibt es ein x ∈ [a, b], sodass µ = f (x).
Beweis. Man betrachte die Ungleichung
g(s) inf f (t) ≤ g(s) f (s) ≤ g(s) sup f (t) ,
t∈[a,b]
t∈[a,b]
und integriere alle Funktionen nach s. Nach Lemma 8.2.9 erfüllen die Integrale die
selbe Ungleichungskette. Daraus folgt unmittelbar (8.27). Für ein stetiges f ist nach
dem Zwischenwertsatz f (x) = µ für ein x ∈ [a, b].
❑
Für g(t) = t erhalten wir aus Satz 8.8.1 unmittelbar, dass für ein Riemannintegrierbares f : [a, b] → R
Zb
f (t) dt = µ(b − a) ,
(8.28)
a
wobei im Falle der Stetigkeit von f gilt, dass µ = f (x) für ein gewisses x ∈ [a, b].
Als Anwendung können wir mit Satz 8.8.1 die Darstellung des Restgliedes im Satz
von Taylor, Satz 7.4.2, unter etwas stärkeren Voraussetzungen nochmals ableiten. Dazu
benötigen wir zunächst eine Darstellung dieses Restgliedes in Integralform, die aber
auch für komplexwertige Funktion gültig ist.
8.8.2 Proposition. Sei I ⊆ R ein Intervall und n ∈ N ∪ {0}. Weiters sei f : I → R oder
f : I → C mit f ∈ C n+1 (I). Für x, y ∈ I, x , y gilt
f (x) = f (y) +
f ′ (y)
f ′′ (y)
f (n) (y)
(x − y) +
(x − y)2 + · · · +
(x − y)n +
1!
2!
n!
+
Zx
f (n+1) (t)
(x − t)n
dt .
n!
y
Beweis. Um diese Formel einzusehen, starten wir mit
f (x) − f (y) =
Zx
y
f ′ (t) dt ,
8.9. ÜBUNGSBEISPIELE
33
und integrieren partiell:
f (x) − f (y) = −
Zx
′
′
f (t)(−1) dt = f (y)(x − y) +
y
Zx
f ′′ (t)(x − t) dt =
y
(x − y)2
+
= f (y)(x − y) + f (y)
2
′
′′
Zx
f ′′′ (t)
(x − t)2
dt =
2
y
= ··· =
n
X
f (k) (y)
k=1
(x − y)k
+
k!
Zx
f (n+1) (t)
(x − t)n
dt .
n!
y
❑
8.8.3 Bemerkung. Ist f reellwertig, so folgt aus Satz 8.8.1, dass sich das Restglied in
n+1
der Form f (n+1) (ξ) (x−y)
(n+1)! für ein geeignetes ξ ∈ [min(x, y), max(x, y)] schreiben lässt;
vgl. Satz 7.4.2.
8.9 Übungsbeispiele
8.1 Man betrachte die Funktion f (x) = x3 + 1 : [0, 1] → [0, 1]. Wählen Sie n + 1 äquidistante
Stützstellen, und berechnen Sie zur entsprechenden Zerlegung Zn von [0, 1] die Ober- und
die Untersummen, sowie limn→∞ O(Zn ), limn→∞ U(Zn ).
P
Hinweis: 4 nk=1 k3 = n2 (n + 1)2 .
8.2 Berechnen Sie das Integral aus dem vorherigen Beispiel mit Hilfe von Riemannschen Zwischensummen mit n + 1 äquidistanten Stützstellen, und Zwischenstellen an den Intervallmittelpunkten.
8.3 Seien a, b ∈ R, a < b und bezeichne R die Menge aller Riemannzerlegungen von [a, b]
gerichtet durch die Feinheit. Zeigen Sie, dass dass für ein Netz ( f (R))R∈R mit Werten in
einem metrischen Raum folgende Aussagen äquivalent sind:
lim f (R) = y, dh. ∀ǫ > 0 ∃R0 ∈ R : ∀R R0 ⇒ d( f (R), y) < ǫ .
R∈R
∀ǫ > 0 ∃δ > 0 : ∀|R| < δ ⇒ d( f (R), y) < ǫ .
∀(Rn )n∈N mit lim |Rn | = 0 gilt lim f (Rn ) = y
n→∞
n→∞
8.4 Seien a, b ∈ R, a < b und f : [a, b] → C stetig. Weiters bezeichne R die Menge aller Rien(R)
mannzerlegungen von [a, b] gerichtet durch die Feinheit. Zu jedem R = ((ξ j )n(R)
j=0 , (α j ) j=1 ) ∈
R sei F(R) die Funktion auf [a, b] definiert durch
F(R)(x) = f (α j ) ,
wenn x ∈ [ξ j−1 , ξ j ), und F(R)(b) = f (αn(R) ).
Man zeige, dass dann limR∈R F(R) = f und zwar in B([a, b], C) bezüglich der Metrik d∞ ,
also gleichmäßig.
8.5 Man berechne folgende Integrale:
Ze
1
ln x
dx
,
x
Z
2
1
dx
.
x3 + x
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
34
8.6 Man berechne folgende Integrale:
Z
0
Z
x
dx,
x2 − 3x + 2
−1
3
4
1
4
x+1
dx .
x4 − x
8.7 Man berechne durch geeignte Substitutionen folgende Integrale:
√
Z 1 x
Z 5
e −1
x− x
5 x
dx,
√ dx .
x
−4 e + 1
1 x+
8.8 Man berechne folgende Integrale:
Z
9
Z
x3
dx,
4x − 1
5
−2
−3
1
dx .
x2 − 1
8.9 Man berechne die Integrale:
Z
π
2
π
8
1
dx,
sin x
8.10 Man berechne
Z
π
4
0
Z
π
4
π
8
1
dx .
sin2 x cos4 x
2 sin x + tan x
dx .
1 + cos x
8.11 Zeigen Sie mit Hilfe der Integralrechnung (Ober-, Unter-, Riemannsummen), dass
lim
n→∞
1k + 2k + . . . + nk
1
=
nk+1
k+1
k+1
(k, n ∈ N) .
Hinweis: xk+1 ist eine Stammfunktion von xk und es gilt
eine Stammfunktion von f ist.
8.12 Für m, n ∈ Z berechnen Sie
Z
Rb
a
f (x) dx = F(b) − F(a), wenn F
2π
exp(int) · exp(imt) dt ,
0
sowie
Z
2π
0
sin(nt) · sin(mt) dt,
Z
2π
0
cos(nt) · cos(mt) dt,
Z
2π
0
sin(nt) · cos(mt) dt .
Rb
Hinweis: Es gilt a f (x) dx = F(b) − F(a), wenn F eine Stammfunktion von f ist. Unterscheiden Sie dabei den Fall m = n und m , n. Um Rechenarbeit zu sparen, kann man die
letzten drei Integrale auf das erste zurück führen.
8.13 Man zeige:
Dn (t) :=
sowie
Rπ
−π
n
n
1
1 X ikt sin(n + 2 )t 1
t
1 X
= (cos nt + cot · sin nt) ,
+
cos mt =
e =
t
2 m=1
2 k=−n
2
2
2 sin 2
Dn (t) dt = π.
8.14 Sei f (x) eine auf ganz R definierte Funktion. Wir nehmen an, dass f (x) stetig und 1periodisch ist, dh. f (x) = f (x + 1) für alle x ∈ R. Man zeige, dass f (x) auf R beschränkt ist.
Weiters beweise man, dass für beliebiges α ∈ R folgende Gleichheit gilt:
Z
1
f (x)dx =
0
Z
α+1
f (x)dx .
α
8.9. ÜBUNGSBEISPIELE
35
8.15 Sind folgende uneigentliche Integrale absolut konvergent oder nicht?
Z +∞
Z π
Z 1
2
x ln x
ln x
dx,
dx .
ln(sin x) dx,
2x
x
2 + 1)3
e
−
e
(x
0
0
0
Rb
Hinweis zur Divergenz: Wenn ein uneigentliches Integral a | f (x)| dx divergiert, und wenn
Rb
|g(x)| ≥ | f (x)|, dann divergiert auch a |g(x)| dx (Divergente Minorante).
1
,
4x2 −12x+13
8.16 Man bestimme die Fläche unter der Kurve
wenn x in [−1, 2] läuft.
8.17 Man berechne mit Hilfe eines Riemannintegrals den Flächeninhalt eines Kreises mit dem
Radius r > 0.
Weiters berechne den Flächeninhalt folgender Teilmenge der Ebene:
{(x, y) ∈ R2 : x2 + y2 ≤ 1, y ≥ x2 }.
8.18 Welche folgender Integrale sind eigentliche bzw. uneigentliche Riemann-Integrale? Weiters
berechne man diese (r > 0):
√
Z 1
Z r √
Z 3
x2 + 4x + 5
1
2
2
dx .
dx,
r − x dx,
√
√
0
−r
1 2+ x+
9x − 4x2
x2 + 4x + 5
Hinweis: Zum letzten Integral: Substituieren Sie zuerst so, dass x2 + 4x + 5 = (x + 2)2 + 1 =
t2 + 1.
8.19 Für welche α ∈ R \ {0} existieren die (unbestimmten) Integrale:
Z 1
Z +∞
Z +∞
xα dx,
xα dx,
xα dx .
0
1
0
Im Falle der Existenz berechne man diese! Weiters berechne man (falls existent)
Z +∞
ln t
dt .
t2
1
8.20 Man berechne
Z
+∞
(t2 − 2t + 2) exp(−|t| · (2 + iπ)) dt .
−∞
Weiters betrachte man den Betrag f (x) des Integranden als Funktion von R nach R. Man bestimme lokal und globale Extrema, limx→+∞ f (x), limx→−∞ f (x). Wo ist f monton wachsend,
fallend, wo konvex und wo konkav?
8.21 Überprüfe, ob folgende Integrale absolut konvergieren:
Z ∞
Z π
2
1
ln x
dx .
dx,
√3
2
1+x
0
0
x sin x
8.22 Man berechne (a > 0, b ∈ R, w = −a + ib):
Z ∞
ewt dt ,
0
sowie
Z
∞
ewt cos bt dt,
0
8.23 Man berechne das uneigentliche Integral
8.24 Man berechne
Z
1
−1
x
dx,
x6 + i
Z
0
R +∞
0
Z
∞
ewt sin bt dt .
0
(t2 + 2t) exp(wt) sin t dt mit w ∈ C, Re w < 0.
1
xm (log x)n dx, n, m ∈ N .
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
36
8.25 Sei α ≥ 0, und Iα sei definiert als
Iα =
Z
π
2
sinα x dx .
0
Man finde durch partielle Integration eine Relation zwischen Iα und Iα+2 . Man zeige mit
Hilfe dieser Rekursionsformel, dass für k ∈ N folgende zwei Formeln gelten:
I2k =
2k − 1 2k − 3
3 1 π
·
· ··· · · · ,
2k
2k − 2
4 2 2
I2k+1 =
8.26 Für x ∈ [0, π2 ] und k ∈ N zeige man
2k − 2
4 2
2k
·
· ··· · · .
2k + 1 2k − 1
5 3
sin2k+1 x ≤ sin2k x ≤ sin2k−1 x .
Daraus und aus dem vorherigen Beispiel leite man folgende Ungleichungen her:
1 · 3 · · · · · (2k − 1) · π 2 · 4 · · · · · (2k − 2)
2 · 4 · · · · · (2k)
≤
≤
.
3 · 5 · · · · · (2k + 1)
2 · 4 · · · · · (2k) · 2
3 · 5 · · · · · (2k − 1)
Nun forme man diese Ungleichung so um, sodass in der Mitte nur noch
leite daraus die Wallische Produktformel her:
π
2
steht, und man
π
1
22 · 42 · · · · · (2k)2
= lim 2 2
·
.
2 k→∞ 3 · 5 · · · · · (2k − 1)2 2k
Rn P R j
8.27 Sei f (x) auf [0, n] stetig differenzierbar. Man zeige durch eine Zerlegung von 0 in nj=1 j−1
P
unter Verwendung der partiellen Integration, dass sich die Differenz von nk=1 f (k) und
Rund
n
f (x)dx berechnen lässt durch
0
n
X
k=1
f (k) −
Z
n
f (x)dx =
0
Z
n
0
(x − [x]) f ′ (x)dx .
Außerdem zeige man:
n
X
f (k) =
k=0
Z
n
f (x)dx +
0
8.28 Man zeige, dass der Limes
f (0) + f (n)
+
2
Z
n
0
1
(x − [x] − ) f ′ (x)dx .
2

 n

X 1

− ln n
γ := lim 
n→∞
k
k=1
existiert. Die Zahl γ wird Euler-Mascharonische Konstante genannt; ihr ungefährer Wert ist
0, 577215....
8.29 Sei f (x) auf [0,
R nn] zweimal stetig differenzierbar. Man zeige, dass sich die Differenz von
Pn
k=1 f (k) und 0 f (x)dx berechnen lässt durch
n
X
k=1
wobei φ(x) =
f (k) −
(x−[x])2 −(x−[x])
.
2
Z
n
f (x)dx =
0
f (n) − f (0)
−
2
Z
n
φ(x) f ′′ (x)dx ,
0
8.9. ÜBUNGSBEISPIELE
37
8.30 Man wende voriges Beispiel auf f (x) = ln(x + 1) an, und zeige, dass das uneigentliche
Integral
Z
∞
a := −
φ(x) f ′′ (x)dx + 1
0
existiert. Man zeige weiters, dass
1
3
a = lim ln((n + 1)!) − (n + ) ln(n + 1) + n + 1 = lim ln(n!) − (n + ) ln n + n .
n→∞
n→∞
2
2
8.31 Man zeige, dass für den Grenzwert a aus dem vorherigen Beispiel
n!en
√
n→∞ nn n
√
gilt. Man setze b := ea , und zeige weiters, dass b = 2π.
Hinweis: Man zeige mit Hilfe des Wallischen Produkts
ea = lim
1
b2n
= √ ,
b2n
2π
lim
n→∞
wobei bn =
n
n!e√
.
nn n
Man verwende dabei auch die Tatsache, dass
2k
k
22k
1 · 3 . . . (2k − 1)
.
2 · 4 . . . (2k)
=
Anmerkung: Mit diesem Beispiel erhält man die Stirlingsche Formel
n!en
= 1.
√
2πn
√
Es gilt somit die asymptotische Gleichung n! nn e−n 2πn.
lim
n→∞
nn
8.32 Sei Q[a, b] die Menge alle stückweise stetigen, reellwertigen Funktionen auf [a, b]. Weiters
sei N die Menge aller f : [a, b] → R, sodass f (t) , 0 für nur endlich viele t.
Zeigen Sie, dass Q[a, b] (versehen mit punktweiser Addition und Multiplikation) ein Vektorraum über R
R xund N ein Unterraum davon ist. Weiters zeige man, dass (c, f +N) 7→ F, wobei
F(x) = c+ a f (t) dt eine wohldefinierte, lineare und bijektive Abbildung von R× Q[a, b]/N
auf
{F ∈ C[a, b] : F ist einmal differenzierbar auf [a, b] mit F ′ ∈ Q[a, b]} .
Bestimmen Sie auch die Umkehrfunktion dieser linearen Bijektion!
8.33 Geben Sie eine Riemann-integrierbare aber nicht stückweise stetige Funktion f an und
führen Sie aus, warum f diese Eigenschaft hat!
Hinweis: Betrachten Sie etwa f : [0, 1] → R mit f (t) = 1 auf [ 12 , 1], f (t) = 12 auf [ 14 , 21 ),
f (t) = 14 auf [ 81 , 14 ), usw. . Bauen Sie zu jedem ǫ > 0 eine Zerlegung von [0, 1], sodass die
Differenz von Ober- und Untersumme kleiner als ǫ wird.
8.34 Man berechne
lim
a→0
Z
1
0
8.35 Man berechne
1
dx .
1 + a sin2 (x)
Z
+∞
e−xt
dt .
1 + t2
0
RR
RR
Hinweis: Zeigen Sie zunächst, dass limx→0+ 0 .. = 0 limx→0+ .. für jedes feste reelle R ≥ 0.
R R e−xt
Dann definiere man H : [0, +∞)×(0, 1] → R mit H(R, x) := 0 1+t
2 dt, wobei [0, +∞) durch
≤ und (0, 1] durch ≥ gerichtet sind. Nun weise man nach, dass sich Lemma 8.7.1 anwenden
lässt.
lim
x→0+
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
38
8.36 Man betrachte die Funktionenfolge
N
X
S N (x) =
k=−N
1
.
x−k
für x ∈ R \ Z. Man zeige, dass S N (x) auf jedem kompakten Teilintervall [a, b] ⊆ R \ Z
gleichmäßig gegen eine Funktion h(x) konvergiert.
Man berechne h(k + 12 ) für k ∈ Z.
Schließlich zeige man h(x) = π cot(πx), x ∈ R \ Z, indem man ihre Ableitungen vergleicht.
Man verwende dazu Beispiel 6.28 und 6.29.
PN
1
. Begründung für Vertauschen von Limes und
Hinweis: Es gilt S N (x) = 1x + 2x k=1
x2 −k2
Differenzieren!
8.37 Durch Betrachtung der Ableitung leite man die Taylorreihe zur Funktion arctan mit Anschlussstelle x0 = 0 her.
Anmerkung: Zusammen mit dem Ableschen Grenzwertsatz, Satz 6.11.1, folgt
∞
X
(−1)k
π
= .
2k
+
1
4
k=0
8.38 Durch Betrachtung der Ableitung leite man die Taylorreihe zur Funktion areatanh mit Anschlussstelle x0 = 0 her.
8.39 Man berechne
Z
1
0
Z
2
1
Z
2
z
1
x+y
! !
dx dy dz ,
und begründe alle vorgenommenen Vertauschungen.
8.40 Für x ∈ (0, +∞) zeige man, dass folgendes uneigentliche Integral absolut konvergiert:
Z ∞
Γ(x) :=
e−t t x−1 dt.
0
Weiters zeige man, dass Γ(x) stetig von x abhängt.
Rn
Hinweis: Sei [a, b] ⊆ (0, +∞) fest. Man zeige, dass fn (x) := 1 e−t t x−1 dt eine Folge stetiger
n
Funktionen auf [a, b] ist, die auf [a, b] gleichmäßig gegen Γ(x) konvergiert. Dazu zeige
man, dass |e−t t x−1 | ≤ K1 ta−1 , t ∈ (0, 1] und |e−t t x−1 | ≤ K2 t12 , t ∈ [1, +∞) mit irgendwelche
Konstanten K1 , K2 .
Allgemeiner Tipp, wie man f (t) ≤ Cg(t) mit irgendeinem C > 0 für nicht negative stetige
Funktionen f, g auf einem Intervall [a, b) mit g(t) , 0 herleitet:
f (t)
f (t)
Gilt limt→b− g(t)
= 0, so gibt es insbesondere zu ǫ = 1 ein t0 ∈ [a, b), sodass t ≥ t0 ⇒ g(t)
≤ 1.
Da die Funktion
f (t)
g(t)
f (t)
g(t)
auf dem kompakten Intervall [a, t0 ] stetig ist, ist sie dort beschränkt, d.h.
≤ C für ein C > 0, das oBdA. auch C ≥ 1 erfüllt. Also gilt
8.41 Man zeige, dass für x > 0, n ∈ N:
f (t)
g(t)
≤ C auf ganz [a, b).
Γ(x + 1) = xΓ(x), Γ(n) = (n − 1)!.
8.42 Für x ∈ (0, +∞) zeige man, dass folgendes uneigentliche Integral absolut konvergiert:
Z ∞
gk (x) :=
e−t (ln t)k t x−1 dt.
0
Ry
Weiters zeige man, dass die gk stetig sind, dass 1 gk (t)dt = gk−1 (y) − gk−1 (1), und dass daher
gk die k-te Ableitung der Gammafunktion ist.
Hinweis:
Sei [a, b] ⊆ (0, +∞) beliebig. Man zeige, dass (α ∈ (1, +∞), x ∈ [a, b]) F(α, x) :=
Rα
−t
k x−1
dt gleichmäßig auf [a, b] konvergiert, wenn α → +∞. Dazu zeige man, dass
1 e (ln t) t
α
3
|e−t (ln t)k t x−1 | ≤ K1 t 4 a−1 , t ∈ (0, 1] und |e−t (ln t)k t x−1 | ≤ K2 t12 , t ∈ (1, +∞) mit irgendwelchen
Konstanten K1 , K2 .
8.9. ÜBUNGSBEISPIELE
39
8.43 Sei x nun nicht nur in (0, +∞), sondern allgemeiner in {z ∈ C : Re z > 0}. Man zeige, dass
dann Γ(x) ebenfalls konvergiert, und zwar in {z ∈ C : Re z > 0}, dass diese Funktion stetig
auf ganz {z ∈ C : Re z > 0} ist, und dass Γ(z + 1) = zΓ(z) gilt.
Schließlich stelle man Re Γ(z) und Im Γ(z) getrennt dar.
8.44 Man berechne Γ( 21 )!
40
KAPITEL 8. DAS RIEMANNSCHE INTEGRAL
Kapitel 9
Normen und Banachräume
9.1 Normierte Räume
In diesem Kapitel wollen wir eine spezielle Klasse von metrischen Räumen betrachten.
Diese Räume stellen eine Schnittstelle zwischen Linearer Algebra und Analysis dar.
9.1.1 Definition. Sei X ein Vektorraum über R (C). Eine Abbildung k.k : X → [0, ∞)
heißt Norm, falls
(i) kx + yk ≤ kxk + kyk, für alle x, y ∈ X Dreiecksungleichung.
(ii) kλxk = |λ| · kxk, für alle x ∈ X, λ ∈ R (∈ C).
(iii) kxk > 0 für alle x , 0.
Das Paar (X, k · k) heißt dann normierten Raum.
Ist X ein normierter Raum, so folgt unmittelbar aus den Eigenschaften einer Norm,
dass
d(x, y) := kx − yk, x, y ∈ X ,
(9.1)
eine Metrik auf X ist. Diese Metrik hat ganz spezielle Eigenschaften.
9.1.2 Lemma. Sei (X, k · k) ein normierter Raum, und seien (xn )n∈N , (yn )n∈N Folgen in
X, x, y ∈ X, und (λn )n∈N eine Folge bzw. λ ein Element im Skalarkörper von X, also in
R bzw. C. Ist xn → x, yn → y, λn → λ für n → ∞, so folgt
lim kxn k = kxk, lim xn + yn = x + y, lim λn xn = λx .
n→∞
n→∞
n→∞
Entsprechende Aussagen gelten auch für Netze.
Beweis. Den Beweis führt man genauso, wie für Folgen von Zahlen. Die erste Gleichung folgt aus Lemma 3.2.10 wegen kxn k = d(xn , 0) → d(x, 0) = kxk.
Wir zeigen nur noch die dritte Grenzwertbeziehung. Die zweite ist noch einfacher
zu verifizieren.
Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es ein N ∈ N, sodass |λ − λn |, kxn − xk < ǫ für alle
n ≥ N. Es folgt kxn k ≤ kxn − xk + kxk < 1 + kxk und damit
kλn xn − λxk ≤ kλn xn − λxn k + kλxn − λxk =
|λn − λ|kxn k + |λ|kxn − xk ≤ (1 + kxk + |λ|)ǫ .
41
KAPITEL 9. NORMEN UND BANACHRÄUME
42
Wir sehen also, dass λn xn → λx.
❑
9.1.3 Korollar. Sei (X, k · k) ein normierter und hY, di ein metrischer Raum, und seien
f, g : D → X und λ : D → R (C) stetig, wobei D ⊆ Y. Dann sind auch λ f und f + g
stetige Funktionen von D nach X.
Beweis. Aus yn → y in hY, di folgt wegen der Stetigkeit f (yn ) → f (y) und g(yn ) → g(y)
in (X, k·k). Aus Lemma 9.1.2 folgt ( f +g)(yn ) = f (yn ) +g(yn) → f (y) +g(y) = ( f +g)(y)
und mit Proposition 6.1.4 die Stetigkeit von f + g. Entsprechend zeigt man die Stetigkeit von λ f .
❑
Für die folgende Definition sei daran erinnert, dass ein metrischer Raum vollständig
heißt, wenn jede Cauchy-Folge konvergiert; vgl. Definition 3.5.5.
9.1.4 Definition. Ist die von (X, k·k) erzeugte Metrik vollständig, so heißt der normierte
Raum Banachraum.
9.1.5 Beispiel.
(i) Klarerweise ist (R, |.|) ein Banachraum über R. (C, |.|) ist auch ein Banachraum,
wobei man ihn als Vektorraum über C und als Vektorraum über R betrachten
kann.
p
(ii) Das
qP Paradebeispiel eines normierten Raums über R ist (R , k.k2 ), wobei kxk2 :=
p
1
T
2
j=1 |x j | . Dabei ist x = (x1 , . . . , x p ) . Die erzeugte Metrik ist die wohlbekannte Euklidische Metrik:
v
u p
t
X
|x j − y j |2 .
d2 (x, y) = kx − yk2 =
j=1
Wegen Korollar 3.6.3 ist (R p , k.k2 ) sogar ein Banachraum.
(iii) Man kann auch den normierten Raum (C p , k.k2 ) über C mit kzk2 :=
betrachten, wobei z = (z1 , . . . , z p )T .
qP
p
j=1 |z j |
2
Identifiziert man dabei die j-te Komponente z j mit dem Paar (Re z j , Im z j ), so
sieht man leicht, dass sich C p mit R2p identifizieren lässt. Wegen
v
v
u
u
tX
tX
p
p
p
X
|z j |2 =
| Re z j |2 +
| Im z j |2 ,
j=1
j=1
j=1
bleiben dabei auch die Normen erhalten, und mit (R2p , k.k2 ) ist auch (C p , k.k2 ) ein
Banachraum.
(iv) Man kann R p auch mit den Normen
kxk1 :=
1 Ab
p
X
j=1
|x j |, kxk∞ := max |x j |
j=1,...,p
hier wollen wir die Elemente von R p als stehende Vektoren betrachten.
9.1. NORMIERTE RÄUME
43
versehen. Die dazugehörigen Metriken sind gerade die wohlbekannten Metriken
d1 und d∞ . Wegen Korollar 3.6.3 sind (R p , k.k1 ) und (R p , k.k∞ ) ebenfalls Banachräume.
Ehe wir uns mehr Beispiele normierter bzw. Banachräume anschauen, brauchen
wir ein kleines Lemma.
9.1.6 Lemma. Ist hX, di ein vollständiger metrischer Raum und ist Y eine abgeschlossene Teilmenge von X, so ist hY, d|Y×Y i auch ein vollständiger metrischer Raum.
Ist umgekehrt hY, d|Y×Y i vollständig, wobei Y Teilmenge eines metrischen Raumes
hX, di ist, so ist Y abgeschlossen in X.
Beweis. Klarerweise ist Y versehen mit der eingeschränkten Metrik selber ein metrischer Raum.
Ist (xn )n∈N eine Cauchy-Folge in Y, so konvergiert diese nach Voraussetzung gegen
ein x ∈ X. Ist nun Y abgeschlossen und enthält daher alle seine Häufungspunkte, so
folgt x ∈ Y.
Ist (xn )n∈N eine Folge in Y, die gegen ein x ∈ X konvergiert, so ist diese sicherlich
eine Cauchy-Folge bzgl. d und somit auch bzgl. d|Y×Y . Ist Y vollständig, so konvergiert
(xn )n∈N bzgl. d|Y×Y und somit auch bzgl. d gegen ein y ∈ Y. Da aber Grenzwerte
eindeutig sind, folgt x = y ∈ Y. Also ist Y abgeschlossen.
❑
Folgende Situation tritt bei der Betrachtung konkreter Räume auf. Ist (X, k · k) ein
normierter Raum und Y ein linearer Unterraum (Untervektorraum), so kann man k.k auf
Y einschränken und erhält offenbar wieder einen Normierten Raum. Ist dabei (X, k · k)
ein Banachraum und ist Y als Teilmenge von X abgeschlossen, so muss nach Lemma
9.1.6 auch (Y, k · k) ein Banachraum sein.
9.1.7 Lemma. Ist (X, k · k) ein normierter Raum und Y ein linearer Unterraum, so ist
der Abschluss c(Y) von Y in X ebenfalls ein linearer Unterraum und somit der kleinste
abgeschlossene Teilraum von X, der Y enthält.
Beweis. Sind x, y ∈ c(Y) und λ, µ ∈ R (C), so gibt es Folgen xn , yn ∈ Y mit
limn→∞ xn = x und limn→∞ yn = y. Wir wissen, dass dann die Folge λxn + µyn ∈ Y
gegen λx + µy konvergiert und somit diese Linearkombination auch in c(Y) liegt.
❑
9.1.8 Beispiel. Wir wollen uns nun weitere Beispiele von normierten Räumen ansehen.
(i) Ist E eine nichtleere Menge und (Y, k.kY ) ein normierter Raum. Wir betrachten den
Raum B(E, Y) aller beschränkten Abbildungen von E nach Y. Diesen Raum haben wir schon im ersten Semester betrachtet, wobei aber Y allgemeiner ein metrischer Raum war; vgl. Definition 6.6.3. In unserem Fall ist mit Y auch B(E, Y) ein
Vektorraum über dem selben Skalarkörper, wie Y, wobei die Operationen punktweise definiert sind.
Setzen wir für f ∈ B(E, Y)
k f k∞ := sup{k f (x)kY : x ∈ E} ,
so prüft man leicht nach, dass k f k∞ eine Norm auf B(E, Y) ist. Die von dieser
Norm erzeugte Metrik ist genau die in Definition 6.6.3 eingeführte Metrik
k f − gk∞ = d∞ ( f, g) = sup k f (x) − g(x)kY .
x∈E
44
KAPITEL 9. NORMEN UND BANACHRÄUME
Im Falle, dass (Y, k.kY ) ein Banachraum ist, folgt aus Satz 6.6.15, dass
(B(E, Y), d∞) vollständig und damit (B(E, Y), k.k∞) auch ein Banachraum ist.
Für Y = R oder Y = C versehen mit |.| haben wir k.k∞ schon in Definition 6.7.1
kennen gelernt.
(ii) Ist E = N und Y = R oder Y = C, so ist B(E, Y) die Menge aller beschränkten
reellen bzw. komplexen Folgen, die man auch als l∞ bzw. l∞ (N) bezeichnet. Diese
sind Banachräume, da R und C vollständig sind.
(iii) Bezeichne c0 bzw. c0 (N) den Raum aller reellwertigen bzw. komplexwertigen
Nullfolgen. Offenbar ist c0 ein linearer Teilraum von l∞ . Mit Hilfe von Lemma
8.7.1 kann man sogar zeigen, dass c0 als Teilraum von l∞ abgeschlossen ist. Also
ist auch (c0 , k.k∞ ) ein Banachraum.
(iv) Mit der Notation aus (i) setzen wir noch zusätzlich voraus, dass E ⊆ X, wobei
hX, di ein metrischer Raum ist, und dass (Y, k.kY ) ein Banachraum ist.
Dann kann man die Menge Cb (E, Y) aller f ∈ B(E, Y) betrachten, die stetig
sind. Diese Menge stellt einen linearen Unterraum von B(E, Y) dar; siehe Korollar 9.1.3. Somit ist auch (Cb (E, Y), k.k∞ ) ein normierter Raum. Man beachte,
dass für kompaktes E alle stetigen Funktionen auf E automatisch beschränkt sind,
womit in diesem Fall Cb (E, Y) = C(E, Y).
Ist nun ( fn )n∈N eine Folge von Funktionen aus Cb (E, Y), die bzgl. d∞ gegen ein
f ∈ B(E, Y) konvergiert, so wissen wir aus Korollar 6.6.13, dass auch f stetig ist,
also f ∈ Cb (E, Y). Somit ist Cb (E, Y) sogar eine abgeschlossene Teilmenge von
B(E, Y).
Daher ist neben B(E, Y) auch Cb (E, Y) ein Banachraum, wenn nur (Y, k.kY ) ein
solcher ist.
(v) Ist Y = R oder Y = C, so schreiben wir für den Banachraum Cb (E, Y) auch Cb (E).
Ist E etwa [a, b] ⊆ R, so schreiben wir Cb [a, b] oder auch C[a, b] dafür, da [a, b]
ja kompakt ist.
Auf dem Raum C[a, b] können wir auch andere Normen betrachten wie beispielsweise
Z b
| f (t)| dt .
(9.2)
k f k1 :=
a
Diese Norm unterscheidet sich von k.k∞ wesentlich, denn es gibt bzgl. k.k1
Cauchy-Folgen, die bzgl. k.k∞ keine sind. Daraus kann man herleiten, dass
bezüglich k.k1 der Raum C[a, b] kein Banachraum ist.
(vi) Sind (X, k.kX ) und (Y, k.kY ) zwei normierte Räume über dem selben Körper R oder
C, so auch (X × Y, k.kmax ), wobei
k(x, y)kmax = max{kxkX , kykY } .
In der Tat ist X × Y ein Vektorraum, und die Axiome, die für eine Norm erfüllt
sein müssen, lassen sich auch leicht nachweisen. Die von k.kmax erzeugte Metrik
ist genau jene aus (8.18), wenn man dort dX (a, x) = kx−akX und dX (b, y) = ky−bkY
setzt.
9.2. LINEARE ABBILDUNGEN
45
Wie schon in Fakta 8.7.8 festgestellt ist eine Folge (xn , yn ) n∈N in X × Y konvergent gegen (x, y) genau dann, wenn (xn )n∈N gegen x und (yn )n∈N gegen y konver
giert. Man sieht auch sofort, dass (xn , yn ) n∈N genau dann eine eine Cauchy-Folge
ist, wenn (xn )n∈N und (yn )n∈N beide Cauchy-Folgen sind.
Somit erhält man auch, dass (X × Y, k.kmax ) ein Banachraum ist, wenn X und Y
beide Banachräume sind.
(vii) Ist im vorherigen Beispiel X = Y, so folgt aus Lemma 9.1.2, dass die Abbildung
+ : X × X → X stetig ist.
9.2 Lineare Abbildungen
9.2.1 Definition. Zwei Normen k.k1 und k.k2 auf einem linearen Raum X heißen äquivalent, falls es Konstanten α > 0, β > 0 gibt sodass
αkxk1 ≤ kxk2 ≤ βkxk1 für alle x ∈ X .
9.2.2 Bemerkung. Man überzeugt sich auch sofort davon, dass die Relation, äquivalent zu sein, auf der Menge aller Normen auf einem gegebenen Vektorraum X eine
Äquivalenzrelation ist.
Betrachtet man die jeweiligen Definitionen, so sieht man auch, dass äquivalente
Normen die gleichen konvergenten Folgen, die gleichen Cauchy-Folgen, die gleichen
abgeschlossenen bzw. offenen Mengen, etc. haben.
9.2.3 Beispiel.
(i) Sei X = R p . Die Normen k.k∞ , k.k2 und k.k1 sind äquivalent, denn für
(x1 , . . . , x p )T ∈ X = R p gilt
max |xi | ≤ (
i=1,...,p
p
X
i=1
2
1
2
|xi | ) ≤
p
X
i=1
|xi | ≤ p · max |xi | .
i=1,...,p
Man kann zeigen, dass auf R p alle Normen äquivalent sind. Insbesondere ist R p
mit jeder Norm vollständig.
(ii) Betrachte auf X = C[0, 1] neben der Supremumsnorm k.k∞ noch die Norm aus
(9.2). Diese beiden Normen sind nicht äquivalent. Es gilt zwar k f k1 ≤ k f k∞ , aber
es gibt kein β > 0, sodass k f k∞ ≤ βk f k1 gleichzeitig für alle f ∈ C[0, 1]. Um das
einzusehen, betrachte
(
1 − n t , t ∈ [0, n1 ],
.
fn (t) =
0
, t ∈ [ n1 , 1]
Dabei ist k fn k∞ = 1, aber k fn k1 ≤
1
2n .
Thematisch verwandt mit der Äquivalenz von Normen ist der Begriff der Beschränktheit einer linearen Abbildung. Man beachte dabei, dass die Definition der Beschränktheit einer linearen Abbildung nicht mit der Definition der Beschränktheit einer
Funktion aus Definition 3.2.11 übereinstimmt.
KAPITEL 9. NORMEN UND BANACHRÄUME
46
9.2.4 Definition. Seien (X, k.kX ) und (Y, k.kY ) zwei normierte Räume über demselben
Skalarkörper R oder C. Für eine lineare Abbildung A : X → Y sei
(
)
kAxkY
kAk := sup
: x ∈ X \ {0}
(9.3)
kxkX
in dem Sinne, dass kAk = +∞, falls obige Menge nach oben unbeschränkt ist; vgl.
Definition 2.2.4. Wir nennen A beschränkt , falls kAk < +∞, dh. falls es ein C ≥ 0 gibt,
sodass
kAxkY
C≥
, für alle x ∈ X \ {0} .
(9.4)
kxkX
Ist A beschränkt, so bezeichnet man das dabei endliche kAk als die Abbildungsnorm
von A.
9.2.5 Bemerkung. (9.4) ist äquivalent zu
kAxkY ≤ CkxkX , für alle x ∈ X ,
(9.5)
da für x = 0 diese Ungleichung immer gilt. Also ist die Menge aller C ≥ 0, für die
(9.5) zutrifft, genau die Menge aller oberen Schranken von
(
)
kAxkY
: x ∈ X \ {0} .
kxkX
Somit ist A genau dann beschränkt, wenn es es ein C ≥ 0 gibt, sodass (9.5) zutrifft, und
kAk ist dann eben das kleinste derartige C ≥ 0. Wegen
) (
!
)
(
1
kAxkY
: x ∈ X \ {0} = kA
x kY : x ∈ X \ {0} =
kxkX
kxkX
{kAxkY : x ∈ X, kxkX = 1} ⊆ {kAxkY : x ∈ X, kxkX ≤ 1}
und wegen kAxkY ≤ kA kxk1 X x kY für jedes x ∈ X mit 0 < kxk < 1 gilt auch
kAk = sup{kAxkY : x ∈ X, kxkX = 1} = sup{kAxkY : x ∈ X, kxkX ≤ 1} .
Aus obiger Definition erkennt man unmittelbar, dass zwei Normen k.k1 und k.k2 auf
einem Vektorraum genau dann äquivalent sind, wenn idX sowohl als Abbildung von
(X, k.k1 ) nach (X, k.k2 ) als auch als Abbildung von (X, k.k2 ) nach (X, k.k1 ) beschränkt ist.
9.2.6 Satz. Eine lineare Abbildung A : X → Y ist genau dann stetig, wenn sie beschränkt ist. Ist das der Fall, so ist sie sogar gleichmäßig stetig.
Beweis. Im Fall A = 0 ist A offenbar beschränkt und trivialerweise gleichmäßig stetig.
Gelte also A , 0.
ǫ
, so folgt
Sei A beschränkt. Ist ǫ > 0 und gilt kx − yk ≤ kAk
kAx − Ayk = kA(x − y)k ≤ kAk · kx − yk ≤ ǫ .
Also ist A gleichmäßig stetig und daher insbesondere stetig.
Ist umgekehrt A stetig, so gibt es wegen der Stetigkeit insbesondere bei x = 0
ein δ > 0 zu ǫ = 1, sodass
kxk ≤ δ die Ungleichung
kAxk ≤ 1 impliziert. Für jedes
δ δ x ∈ X \ {0} folgt kxk x ≤ δ und somit A( kxk x) ≤ 1 bzw. kAxk ≤ 1δ · kxk. Für x = 0
gilt diese Ungleichung trivialerweise auch.
❑
9.2. LINEARE ABBILDUNGEN
47
9.2.7 Satz. Sind (X, k.kX ) und (Y, k.kY ) zwei normierte Räume beide zugleich über R
oder C, so ist die Menge L(X, Y) aller beschränkten linearen Abbildungen von X nach
Y versehen mit der Abbildungsnorm k.k selber ein normierter Raum.
Ist (Y, k.kY ) ein Banachraum, so auch (L(X, Y), k.k).
Beweis. Für A, B ∈ L(X, Y) und für ein beliebiges x ∈ X gilt
k(A+ B)xkY = kAx + BxkY ≤ kAxkY + kBxkY ≤ kAk kxkX +kBk kxkX = (kAk+kBk)kxkX .
Gemäß Bemerkung 9.2.5 ist dann die lineare Abbildung A + B beschränkt. Da kA + Bk
das kleinste C ≥ 0 ist, sodass k(A + B)xkY ≤ C kxkX für alle x ∈ X, folgt aus dieser
Rechnung auch kA + Bk ≤ kAk + kBk. Für A ∈ L(X, Y) und λ ∈ R (C) ist
{ kλAxkY : x ∈ X, kxkX ≤ 1 } = |λ| · { kAxkY : x ∈ X, kxkX ≤ 1 }
nach oben beschränkt, und ihr Supremum ist genau |λ| · k Ak. Somit ist das lineare λA
beschränkt mit kλAk = |λ| · k Ak.
Dass A , 0 die Ungleichung kAk > 0 nach sich zieht, folgt sofort aus (9.3). Wir
haben somit nachgewiesen, dass (L(X, Y), k.k) ein normierter Raum ist.
Um die Vollständigkeit zu zeigen, könnten wir direkt vorgehen. Wir werden uns
aber der schon bekannten Tatsache bedienen, dass Cb (E, Y) versehen mit k f k∞ =
supt∈E k f (t)kY ein Banachraum ist, wenn E Teilmenge eines metrischen Raumes ist;
vgl. Beispiel 9.1.8.
Dazu setze E = {x ∈ X : kxk ≤ 1}. Für A ∈ L(X, Y) ist A|E sicherlich eine stetige
und beschränkte Funktion, wobei
kA|E k∞ = sup{ kAxkY : kxkX ≤ 1 } = kAk .
Also ist A 7→ A|E eine isometrische und daher injektive Abbildung von L(X, Y) in
Cb (E, Y). Diese Abbildung ist offenbar auch linear. Das Bild dieser Einbettung ist genau die Menge L aller f ∈ Cb (E, Y), sodass
x ∈ E, λ ∈ R (C), λx ∈ E ⇒ f (λx) = λ f (x) ,
und
x, y, x + y ∈ E ⇒ f (x + y) = f (x) + f (y) .
In der Tat sieht man mit einem solchen f leicht, dass die Abbildung A : X → Y
definiert durch A(0) = 0 und A(x) := kxkX f ( kxk1 X x) für x , 0 die eindeutige beschränkte
und lineare Abbildung ist, sodass A|E = f gilt.
Die Menge L ⊆ Cb (E, Y) ist abgeschlossen, denn aus fn → f mit fn ∈ L und
f ∈ Cb (E, Y) folgt f (x + y) = lim fn (x + y) = lim fn (x) + lim fn (y) = f (x) + f (y), falls
x, y, x + y ∈ E und genauso f (λx) = λ f (x), falls x, λx ∈ E und somit f ∈ L. Wegen
Lemma 9.1.6 ist (L, k.k∞ ), und daher auch (L(X, Y), k.k), ein Banachraum.
❑
Ähnlich wie im vorhergehenden Beweis erkennt man auch, dass für A ∈ L(X, Y)
und B ∈ L(Y, Z)
kBAk = sup{ kBAxkZ : x ∈ X, kxkX ≤ 1 } ≤
sup{ kBk · kAxkY : x ∈ X, kxkX ≤ 1 } = kBk · kAk .
Für die Räume L(X, Y) gilt in Analogie zu Lemma 9.1.2 folgendes Resultat.
(9.6)
KAPITEL 9. NORMEN UND BANACHRÄUME
48
9.2.8 Lemma. Seien X, Y, Z normierte Räume, und seien (An )n∈N , (Bn )n∈N , (xn )n∈N Folgen in L(X, Y), L(Y, Z) bzw. X. Weiters seien A ∈ L(X, Y), B ∈ L(Y, Z) und x ∈ X. Gilt
An → A, Bn → B und xn → x für n → ∞, so folgt
lim Bn An = BA und lim An xn = Ax ,
n→∞
n→∞
wobei die erste Folge in L(X, Z) bzgl. der Abbildungsnorm und die zweite in Y bzgl.
der Norm auf Y konvergiert. Entsprechende Aussagen gelten auch für Netze.
Beweis. Wir zeigen die erste Grenzwerteigenschaft. Zu ǫ > 0 mit oBdA. ǫ < 1 gibt es
ein N ∈ N, sodass kAn −Ak, kBn −Bk < ǫ für alle n ≥ N. Es folgt kAn k ≤ kAn −Ak+kAk <
1 + kAk und damit
kBn An − BAk ≤ kBn An − BAn k + kBAn − BAk =
kBn − Bk kAn k + kBk kAn − Ak ≤ (1 + kAk + kBk)ǫ .
Wir sehen also, dass Bn An → BA.
❑
Genauso wie in Korollar 9.1.3 folgt daraus
9.2.9 Korollar. Seien X, Y, Z normierte Räume und hM, di ein metrischer Raum und
D ⊆ M. Sind f : D → L(X, Y), g : D → L(Y, Z) und h : D → X stetig, so auch
g f : D → L(X, Z) und f h : D → Y. Dabei sind diese Funktionen definiert durch 2
(g f )(t) := g(t) f (t) sowie 3 ( f h)(t) := f (t)h(t).
9.2.10 Beispiel.
(i) Sei Y ein normierter Raum über R und y0 ∈ Y. Dann ist die Abbildung λ → λy0
von R nach Y linear und beschränkt durch ky0 k. Entsprechendes gilt für C.
(ii) Sei T : R p → Y linear, wobei Y ein normierter Raum ist. Ist R p mit k.k∞ oder
mit einer zu ihr äquivalenten Norm versehen, so ist T beschränkt und somit steP
tig. Denn ist x = (x1 , . . . , x p )T = pj=1 x j e j ∈ R p , wobei e j der j-te kanonische
p
Basisvektor in R ist, so folgt
kT (x)k = k
p
X
j=1
x j T (e j )k ≤
p
X
j=1
|x j | · kT (e j )k ≤ kxk∞
p
X
j=1
kT (e j )k .
(iii) Sei X = R p und Y = Rq , beide versehen mit k.k∞ . Wegen des vorherigen Beispiels
ist jede lineare Abbildung A : R p → Rq beschränkt. Also lässt sich L(R p , Rq ) als
Vektorraum mit Rq×p identifizieren.
(iv) Versieht man X = R p mit k.k∞ und auch Y = Rq mit k.k∞ , so hat man mit der
Abbildungsnorm k.k auf Rq×p R pq eine weitere Norm. Auch diese ist zu k.k∞
äquivalent. In der Tat ist für A = (ai j ) ∈ Rq×p und x ∈ R p
kAxk∞ = max |
i=1,...,q
p
X
j=1
ai j x j | ≤
2 Hintereinanderausführung von zuerst f (t) und dann g(t). Im Falle X = R p , Y = Rq , Z = Rr entspricht
das der Multiplikation der Matrizen g(t) und f (t).
3 Anwenden von f (t) auf h(t). Im Falle X = R p , Y = Rq entspricht das der Multiplikation der Matrix f (t)
mit dem Vektor h(t).
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
max p max |ai j | · kxk∞ = p
i=1,...,q
j=1,...,p
max
i=1,...,q; j=1,...,p
49
|ai j | · kxk∞ .
Also kAk ≤ pkAk∞ . Bezeichnet {e j } j=1,...,p die kanonische Basis von R p , so ist
sicherlich auch ( j = 1, . . . , p)
kAk ≥ kAe j k∞ = max |ai j | ,
i=1,...,q
und daher kAk ≥ kAk∞ .
Allgemeiner kann man X = R p und Y = Rq jeweils mit einer der Normen
k.k1 , k.k2 , k.k∞ versehen, wobei die Norm auf R p nicht dieselbe wie auf Rq sein
muss. Die daraus resultierenden Abbildungsnormen sind verschieden. Ähnlich
wie oben zeigt man aber, dass sie alle zu k.k∞ auf Rq×p R pq und somit auch
untereinander äquivalent sind.
(v) Sei X = Y = R2 mit k.k2 versehen und A ∈ R2×2 von der speziellen Form
A = ab −b
mit festen a, b ∈ R. Um die Abbildungsnorm von A zu berechnen,
a
bemerken wir, dass der erste und zweite Eintrag von
! !
!
a −b x
xa − yb
=
b a y
xb + ya
genau Real- bzw. Imaginärteil von (a + ib) · (x + iy) ist. Wegen k dc k2 = |c + id|
x
gilt kA y k2 = |(a + ib) · (x + iy)| = |a + ib| · |x + iy| = |a + ib| · k yx k2 . Daraus
folgt unmittelbar, dass kAk = |a + ib| = k ab k2 .
(vi) Sei X = Y = C[0, 1], und A : X → Y definiert durch
Z x
A( f )(x) :=
f (t) dt .
0
Man sieht sofort, dass A linear ist. Außerdem ist mit f ∈ C[0, 1]
kA( f )k∞ = sup |A( f )(x)| ≤ sup (x sup | f (t)|) ≤ k f k∞ .
x∈[0,1]
x∈[0,1]
t∈[0,x]
Also kAk ≤ 1.
9.3 Banachraumwertige Reihen, Funktionen, etc.
Zunächst verallgemeinern wir den Begriff von Zahlenreihen auf Reihen mit Summanden, die in einem normierten Raum liegen. Die Definition ist genau die gleiche.
9.3.1 Definition. Ist (an )n∈N eine Folge in einem normierten Raum (X, k.k), so heißt die
P
Reihe ∞
n=1 an konvergent, falls die Folge (S N )N∈N der Partialsummen
S N :=
N
X
an
n=1
in X, d.h. bzgl. der von k.k erzeugten Metrik, konvergiert.
P
P∞
Die Reihe ∞
n=1 an heißt absolut konvergent, falls
n=1 kan k in R konvergiert, dh.
P∞
falls n=1 kan k < +∞, vgl. Definition 3.9.12.
KAPITEL 9. NORMEN UND BANACHRÄUME
50
9.3.2 Fakta. Nicht nur die Definition lässt sich unmittelbar auf Reihen mit Werten
in normierten Räumen übertragen, sondern auch viele der im ersten Semester hergeleiteten Ergebnisse. Im Folgenden seien (X, k.k) und (Y, k.k) normierte Räume. Für die
Beweise der Verallgemeinerungen muss man in allen Fällen nur an geeigneten Stellen
|.| durch k.k ersetzen:
1. Rechenregeln (siehe Korollar 3.9.3):
∞
X
λan = λ
n=1
∞
X
an , und
n=1
∞
X
(an + bn ) =
n=1
∞
X
an +
n=1
∞
X
bn ,
n=1
wobei λ ∈ R bzw. λ ∈ C je nachdem, was der Skalarkörper von X ist, und
P
P∞
wobei ∞
n=1 an und
n=1 bn beide als konvergent vorausgesetzt sind. Die zweite
Rechenregel etwa folgt mit Lemma 9.1.2 aus

 
 
 N
N
N
N
N
X
X
X
X

 
 
X
bn  .
an  +  lim
bn  =  lim
(an + bn ) = lim  an +
lim
N→∞
N→∞
n=1
n=1
N→∞
n=1
N→∞
n=1
2. Ist T : X → Y linear und stetig, so folgt für eine konvergente Reihe
T(
∞
X
n=1
an ) = T ( lim
N→∞
N
X
an ) = lim T (
N→∞
n=1
N
X
n=1
an ) =
∞
X
n=1
P∞
T (an ) ,
n=1
an
(9.7)
n=1
wobei die Reihe rechts automatisch konvergiert.
Da für ein festes a ∈ X die Abbildung λ 7→ λa von R bzw. C nach X linear und
beschränkt ist, gilt insbesondere für jede konvergente R- bzw. C-wertige Reihe
P∞
P
auch ∞
n=1 αn , dass
n=1 (αn a) in X konvergiert, wobei der Grenzwert letzterer
P∞
Reihe mit ( n=1 αn )a übereinstimmt.
3. Manipulationsregeln wie in Fakta 3.9.4, (1) und (2), d.h. man darf endlich viele
Summanden umändern, ohne das Konvergenzverhalten zu ändern. Der Grenzwert ändert sich im Allgemeinen. Außerdem kann man in einer Reihe Klammern
setzen.
P
4. Ist ∞
n=1 an konvergent, so folgt
 n
  n−1   ∞   ∞ 
X  X
 X  X 
lim an = lim  a j  −  a j  =  an  −  an  = 0
n→∞
n→∞
j=1
j=1
n=1
n=1
in X; vgl. Proposition 3.9.7.
Die Resultate für reell- bzw. komplexwertige Reihen, die die Vollständigkeit von
R (C) verwenden, lassen sich auf vollständige normierte Räume, d.h. Banachräume
verallgemeinern. Ist also (X, k.k) ein Banachraum, dann gelten folgende Verallgemeinerungen.
5. Setzt man in die Definition von Cauchy-Folge die Folge der Partialsummen ein,
so erhält man analog zu Lemma 3.9.11 das Cauchysche Konvergenzkriterium:
P∞
n=1 an konvergiert genau dann, wenn
m
X
∀ǫ > 0 ∃N ∈ N : a j < ǫ, ∀m > n ≥ N .
j=n+1 9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
51
P
6. Ist eine Reihe ∞
Konn=1 an absolut konvergent, so folgt aus dem Cauchyschen
P
vergenzkriterium und der Dreiecksungleichung sofort, dass ∞
a
auch
konn=1 n
vergiert, wobei wegen der Stetigkeit von k.k : X → R
∞
N
∞
X
X
X
an = lim an ≤
kan k .
n=1 N→∞ n=1 n=1
7. Majorantenkriterium (siehe Lemma 3.9.8): Ist kan k ≤ αn ∈ R+ ∪ {0} und konverP
P∞
giert ∞
n=1 αn , so konvergiert n=1 an absolut, wobei
∞
∞
∞
X
X
X
an ≤
kan k ≤
αn .
(9.8)
n=1 n=1
n=1
8. Quotienten- und Wurzelkriterium wie in Satz 3.10.3.
√
In der Tat folgt√aus n kan k ≤ q, n ≥ N, für ein q ∈ [0, 1) und ein N ∈ N – das ist
P
n
zu lim supn→∞ kan k < 1 äquivalent, dass kan k ≤ qn , n ≥ N. Also hat ∞
n=N kan k
P∞
eine konvergente Majorante, und in Folge konvergiert auch n=1 kan k.
p
Ist dagegen n(k) kan(k) k ≥ 1, k ∈ N für eine Teilfolge, so kann (an )n∈N keine
P
Nullfolge sein, und somit ∞
n=1 an nicht konvergieren.
k
≤ q, n ≥ N, für ein q ∈ [0, 1) und ein N ∈ N – das ist zu
Aus an , 0, kakan+1
nk
kan+1 k
lim supn→∞ kan k < 1 äquivalent – folgt kan k ≤ qn−N kaN k für n ≥ N und somit
√
lim supn→∞ n kan k < 1.
k
Ist dagegen an , 0, kakan+1
≥ 1, n ≥ N, für ein N ∈ N, so kann (an )n∈N wegen 0 <
nk
P
kaN k ≤ kaN+1 k ≤ . . . keine Nullfolge sein, und somit ∞
n=1 an nicht konvergieren.
Genauso wie im R-wertige bzw. C-wertigen Fall definieren wir auch hier Summen über beliebige Indexmengen; vgl. Definition 5.4.2. Für eine Menge M bezeichne
wieder E = E(M) die Menge aller endlichen Teilmengen. Versehen mit ⊆ wird diese
Menge zu einer gerichteten Menge.
9.3.3 Definition. Sei (X, k.k) ein normierter Raum, M , ∅ eine Menge und a j ∈ X für
P
jedes j ∈ M. Falls das Netz ( j∈A a j )A∈E in X bzgl. k.k konvergiert, so sagen wir, dass
P
4
j∈M a j unbedingt konvergiert und setzen
X
X
aj .
a j = lim
j∈M
A∈E
j∈A
Da Grenzwerte mit dem Addieren und dem skalaren Multiplizieren verträglich
sind, gilt wie im skalaren Fall, dass (λ, µ ∈ R (C))




X
X 
X 



(λa j + µb j ) = λ  a j  + µ  b j 
j∈M
j∈M
j∈M
in dem Sinn, dass die linke Seite unbedingt konvergiert, wenn es die rechte tut.
9.3.4 Fakta. Für einen Banachraum (X, k.k) gelten folgende Aussagen, die wie Fakta
5.4.3, Korollar 5.4.5, Proposition 5.4.8 und Lemma 5.4.9 zu verifizieren sind.
4 Die
Summe über die leere Indexmenge sei dabei per definitionem Null.
KAPITEL 9. NORMEN UND BANACHRÄUME
52
1. Die Summe
P
j∈M
ka j k konvergiert unbedingt genau dann, wenn
X
j∈A
ka j k ≤ C für alle A ∈ E ,
P
für ein C > 0. In dem Fall konvergiert auch j∈M a j unbedingt.
P
P
2. Konvergiert j∈M a j unbedingt, so auch j∈P a j für jede nichtleere Teilmenge
P ⊆ M.
3. Ist M̃ eine weitere Menge – es kann auch M̃ = M sein – und σ : M̃ → M eine
P
P
Bijektion, so konvergiert j∈M a j genau dann unbedingt, wenn j∈ M̃ aσ( j) es tut.
P
4. Im Falle M = N folgt aus der unbedingten Konvergenz von j∈N a j die KonverP∞
genz von n=1 an im Sinne von Definition 9.3.1 gegen den gleichen Grenzwert.
P
P
5. Wenn ∞
konvergiert, dh. ∞
n=1 an absolut
n=1 kan k < +∞, so konvergieren
P
P
ka
k
sowie
a
unbedingt.
j
j∈N
j∈N j
6. Im Allgemeinen gilt das Banachraumwertige Analogon von Satz 5.4.4 nicht; insP
besondere zieht die unbedingte Konvergenz von j∈N a j nicht notwendigerweise
P
die unbedingte Konvergenz von j∈N ka j k nach sich.
P
7. Falls die Reihe ∞
k=1 bk mit Summanden in X absolut konvergiert, so tut das auch
P∞
b
für
jede
Bijektion σ : N → N mit dem selben Grenzwert in X.
σ(k)
k=1
Ṡ
8. Zerlegt man M als M = i∈I Mi mit nichtleerer Indexmenge I und nichtleeren
P
Mengen Mi , i ∈ I, so folgt aus der unbedingten Konvergenz von j∈M a j auch
P P
die von i∈I j∈Mi a j , wobei
XX
aj =
i∈I j∈Mi
X
aj .
(9.9)
j∈M
Siehe Proposition 5.4.8.
P P
P
9. Konvergiert
unbedingt, dh. alle
sowie
i∈I
j∈Mi ka j k
j∈Mi ka j k
P P
P
konvergieren unbedingt, so konvergiert auch
i∈I Pj∈Mi ka j k
j∈M ka j k
sowie j∈M a j unbedingt, wobei wieder (9.9) gilt; vgl. Lemma 5.4.9.
9.3.5 Beispiel. Sei B ∈ R p×p (versehen z.B. mit der Abbildungsnorm) mit kBk < 1, und
definiere5 (B0 = I)
∞
X
S :=
Bn .
n=0
P
n
Wegen (9.6) hat man kBn k ≤ kBkn , und daher ist ∞
n=0 kBk eine konvergente Majorante,
P∞ n
und somit konvergiert S = n=0 B absolut, wobei mit (9.8)
kS k ≤
5 Man
∞
X
n=0
kBn k ≤
spricht von der von Neumannschen Reihe.
∞
X
n=0
kBkn =
1
.
1 − kBk
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
53
Die Tatsache, dass C 7→ BC eine beschränkte lineare Abbildung von R p×p nach R p×p
ist, erlaubt die Anwendung von (9.7), dh.
BS = B lim
N→∞
N
X
n=0
Bn = lim
N→∞
N
X
n=0
Bn+1 = lim (−I +
N→∞
N+1
X
n=0
Bn ) = −I + S .
Also I = (I − B)S . Genauso sieht man I = S (I − B). Also ist I − B invertierbar mit
S = (I − B)−1 .
9.3.6 Korollar. Ist T ∈ R p×p invertierbar, und ist S ∈ R p×p mit kT − S k < kT1−1 k , so ist
auch S invertierbar.
Insbesondere ist die Menge GL(p, R) aller invertierbaren p×p-Matrizen eine offene
Menge, und die Funktion S 7→ S −1 ist stetig auf GL(p, R) ⊆ R p×p .
Beweis. Nach Voraussetzung ist k(T − S )T −1 k < 1. Gemäß Beispiel 9.3.5 existiert
(I − (T − S )T −1 )−1 und
S T −1 (I − (T − S )T −1 )−1 = (T − (T − S ))T −1 (I − (T − S )T −1 )−1 =
(I − (T − S )T −1 )(I − (T − S )T −1 )−1 = I .
Also hat S eine Rechtsinverse. Entsprechend ist (I − T −1 (T − S ))−1 T −1 eine Linksinverse. Aus der Linearen Algebra ist bekannt, dass diese dann übereinstimmen müssen.
Um die Stetigkeit von S 7→ S −1 einzusehen, sei S n → S , wobei alle Matrizen
invertierbar sind. Es folgt
kS n−1 − S −1 k = kS n−1 (S − S n )S −1 k ≤ kS n−1 k · kS − S n k · kS −1 k
(9.10)
und daher kS n−1 k ≤ kS −1 k + kS n−1 − S −1 k ≤ kS −1 k + kS −1 k · kS n−1 k · kS − S n k. Für
hinreichend großes n hat man somit
kS n−1 k ≤
kS −1 k
.
1 + kS −1 k · kS − S n k
Also ist kS n−1 k beschränkt, und aus (9.10) folgt S n−1 → S −1 .
❑
9.3.7 Bemerkung. Im vorangegangenen Beispiel 9.3.5 und Korollar 9.3.6 haben wir
zwar von quadratischen Matrizen gesprochen. Es gilt aber der selbe Sachverhalt, wenn
die auftretenden Objekte allgemeiner beschränkte lineare Abbildungen eines Banachraumes X in sich – also Elemente von L(X, X) sind. Die Beweise sind so gewählt, dass
sie auch in diesem allgemeineren Fall funktionieren.
Man kann auch Funktionen mit Werten in normierten Räumen betrachten. Dabei
heißt eine Folge ( fn )n∈N von beschränkten Funktionen fn : E → X gleichmäßig konvergent gegen f , falls limn→∞ fn = f in dem normierten Raum B(E, X)6.
9.3.8 Fakta. Ist (X, k.k) sogar ein Banachraum, so gelten folgend Aussagen, die für
X = R (C) schon bekannt sind.
6 Dieses
ist.
Konzept ist schon aus Definition 6.6.5 bekannt, wenn sogar X allgemeiner ein metrischer Raum
KAPITEL 9. NORMEN UND BANACHRÄUME
54
1. Mit (X, k.k) ist auch B(E, X) ein Banachraum. Somit ist ( fn )n∈N in B(E, X) genau
dann konvergent, wenn diese Folge bzgl. k.k∞ eine Cauchy-Folge ist.
2. Ist E Teilmenge eines metrischen Raumes, so wissen wir schon, dass Cb (E, X)
abgeschlossen in B(E, X) ist, was zur Folge hat, dass die Grenzfunktion f stetig
ist, wenn alle fn es sind; vgl. Korollar 6.6.13.
P
3. Weierstraßsches Konvergenzkriterium (siehe Korollar 6.7.4): Ist ∞
n=1 fn eine
Reihe von X-wertigen beschränkten Funktionen, so folgt aus der absoluten KonP
P∞
vergenz ∞
n=1 k fn k∞ < +∞ die gleichmäßige Konvergenz der Reihe
n=1 fn .
Die absolute Konvergenz gilt insbesondere, wenn es eine konvergente Reihe
P∞
n=1 αn von nichtnegativen reellen Zahlen mit k fn k∞ ≤ αn gibt.
Das Weierstraßsche Konvergenzkriterium ist nichts anderes, als das Majorantenkriterium angewandt auf den Banachraum B(E, X); siehe (9.8).
4. Für Potenzreihen zeigt man fast genauso wie in Satz 6.7.7 folgenden Sachverhalt.
P
n
Für an ∈ X, n ∈ N ∪ {0}, sei R das Supremum aller |z|, sodass die Reihe ∞
n=0 z an
konvergiert. Dabei ist je nach Skalarkörper z ∈ R bzw. z ∈ C. Dann konvergiert
P
n
die Reihe ∞
n=0 z an in X absolut, wenn z ∈ R (C), |z| < R. Im Falle |z| > R
divergiert sie.
Für |z| ≤ r < R konvergiert sie gleichmäßig. Somit ist auf {z ∈ R (C) : |z| ≤ r} die
P
n
C
Funktion z 7→ ∞
n=0 z an (∈ X) stetig und beschränkt, d.h. sie liegt in C(Kr (0), X).
Auf {z : |z| < R} ist sie stetig.
Für R gilt auch (lim supn→∞
√
R = (lim supn→∞ n kan k)−1 .
kan+1 k −1
kan k )
≤ R ≤ (lim inf n→∞
kan+1 k −1
kan k )
und
Auch die Differentialrechnung lässt sich auf Funktionen mit Werten in normierten
Räumen ausdehnen.
9.3.9 Definition. Ist I ein reelles Intervall und f : I → X, so heißt f im Punkt x ∈ I
differenzierbar, wenn der Grenzwert
d
1
f (x) = f ′ (x) := lim
( f (t) − f (x))
t→x t − x
dx
in X existiert, wobei dieser Grenzwert einseitig zu verstehen ist, wenn x ein Randpunkt
von I ist. Ist f bei allen x ∈ I differenzierbar, so heißt f differenzierbar. Die Funktion
x 7→ f ′ (x) (Ableitung von f ) ist dann eine Abbildung von I nach X. Ist diese stetig, so
heißt f stetig differenzierbar. Mit C 1 I, X wird die Menge aller stetig differenzierbaren
X-wertigen Funktionen auf I bezeichnet.
Analog zum skalaren Fall definiert man auch die höheren Ableitungen.
9.3.10 Bemerkung. Im Falle X = R p kann man sich f (I) als Kurve vorstellen. Die
Ableitung f ′ (x) ist dann der Anschauung nach nichts anderes, als der Tangentialvektor
an diese Kurve im Punkt f (x).
Wir wollen uns auch ein Beispiel einer Funktion von einem Intervall in einen unendlich dimensionalen Banachraum anschauen.
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
55
9.3.11 Beispiel. Sei X = Cb (0, 1) der Banachraum aller reellwertigen, beschränkten
und stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm
k.k∞ .
Für t ∈ R sei f (t) die Funktion s 7→ et s(1 − s) . Man überzeugt sich leicht, dass
f (t) ∈ X = Cb (0, 1). Also
(
R → X
.
f :
t 7→ s 7→ et s(1 − s)
Für x, t ∈ R gilt
1 ( f (t) − f (x)) − f (x) = sup 1 et s(1 − s) − e x s(1 − s) − e x s(1 − s) =
t − x
∞
s∈(0,1) t − x
1 et − e x − e x · sup |s(1 − s)| = 1 et − e x − e x · 1 .
t − x
2
t − x
s∈(0,1)
1
1
( f (t) − f (x)) in X für t → x
Wegen limt→x t−x
et − e x = e x konvergiert somit t−x
′
gegen f (x). Also gilt f (x) = f (x).
9.3.12 Fakta. Ähnlich wie im skalarwertigen Fall zeigt man folgende Regeln.
1. Die Ableitung von konstanten Funktionen ist 0 ∈ X.
1
( f (t) − f (x)) → 0 · f ′ (x) = 0 für t → x, folgt aus
2. Wegen f (t) − f (x) = (t − x) · t−x
der Ableitbarkeit von f bei x die Stetigkeit von f bei x.
3. ( f + g)′ (x) = f ′ (x) + g′ (x), (λ f )′ (x) = λ f ′ (x), (α f )′ (x) = α′ (x) f (x) + α(x) f ′ (x),
wobei λ ∈ R (C), f, g : I → X und α : I → R (C). Siehe Satz 7.1.7. Die
Gleichheitszeichen sind dabei so zu interpretieren, dass die linke Seite existiert,
wenn die rechte Seite existiert und dann die Gleichheit gilt.
4. Ähnlich wie bei den Reihen sieht man, dass für jedes lineare und beschränkte
T : X → Y mit f auch T ◦ f bei einem x ∈ I differenzierbar ist, wobei dann
T ( f ′ (x)) = (T f )′ (x).
Insbesondere gilt für eine auf einem Intervall I definierte, R- bzw. C-wertige
und bei x differenzierbare Funktion α und einem a ∈ X, dass auch die Funktion
t 7→ α(t)a von I nach X bei x differenzierbar ist, wobei (α(.)a)′(x) = α′ (x)a.
5. Kettenregel (Satz 7.1.9): Sei f : (c, d) → X und α : (a, b) → R mit α (a, b) ⊆
(c, d). Dann gilt
( f ◦ α)′ (x) = α′ (x) f ′ (α(x)) ,
(9.11)
falls die Ableitungen rechts existieren.
Kann man Produkte von Funktionen bilden, so gelten jeweils auch Produktregeln.
6. Sei I ein reelles Intervall und f : I → L(X, Y), g : I → L(Y, Z). Für x ∈ I und
t ∈ I \ {x} gilt
k
1
g(t) f (t) − g(x) f (x) − g′ (x) f (x) − g(x) f ′ (x)k =
t−x
KAPITEL 9. NORMEN UND BANACHRÄUME
56
kg(t)
1
f (t) − f (x) − g(t) f ′ (x) + g(t) f ′ (x) − g(x) f ′ (x)+
t−x
1
g(t) − g(x) f (x) − g′ (x) f (x)k ≤
t−x
kg(t)k · k
1
f (t) − f (x) − f ′ (x)k + kg(t) − g(x)k · k f ′ (x)k+
t−x
1
k
g(t) − g(x) − g′ (x)k · k f (x)k .
t−x
Sind f und g bei x differenzierbar, so sind sie dort auch stetig und daher konvergieren für t → x alle Summanden gegen Null. Damit ist auch g f bei x differenzierbar, wobei
(g f )′ (x) = g′ (x) f (x) + g(x) f ′ (x) .
(9.12)
7. Entsprechend zeigt man ( f h)′ (x) = f ′ (x)h(x) + f (x)h′ (x), wenn f : I → L(X, Y)
und h : I → X, oder auch wenn f : I → R (C) und h : I → X.
8. Sind f, g : I → R p in einem Punkt x ∈ I differenzierbar, so zeigt man ähnlich
wie oben aber unter Zuhilfenahme der Cauchy-Schwarzschen Ungleichung, dass
die Funktion7 t 7→ ( f (t), g(t)) von I nach R auch in x differenzierbar ist, wobei
( f, g)′ (x) = ( f (x), g′ (x)) + ( f ′ (x), g(x)).
9.3.13 Beispiel. Sei X = Cb (0, 1) wieder der Banachraum aller reellwertigen, beschränkten und stetigen Funktionen auf dem Intervall (0, 1) versehen mit der Supremumsnorm k.k∞ .
√ Für t ∈ [0, 1] sei f (t) die Funktion s 7→ s+tt . Man überzeugt sich leicht, dass
f (t) ∈ X = Cb (0, 1). Also
(
[0, 1] → X
√ .
f :
t
7→ s 7→ s+tt
Klarerweise ist f (0) die Nullfunktion und somit (t > 0)
√
√
1
t
t
k f (t) − f (0)k∞ = sup
= lim
= √ .
s→0+ s + t
t
s∈(0,1) s + t
Der Grenzwert dieses Ausdruckes für t → 0 ist aber sicherlich nicht 0. Also ist f bei
t = 0 nicht stetig und daher insbesondere nicht differenzierbar. √
Man beachte, dass für feste s ∈ (0, 1) die Funktion t 7→ s+tt bei t = 0 sehr wohl
stetig ist.
Viele Resultate, die sich aus dem Mittelwertsatz, Satz 7.2.6, herleiten haben lassen,
können nicht unmittelbar auf Funktionen mit Werten in normierten Räumen verallgemeinert werden. Manches lässt sich jedoch mit Hilfe des folgenden Lemmas retten.
9.3.14 Lemma. Ist f : [a, b] → X stetig, f |(a,b) differenzierbar und gilt f ′ (x) = 0 für
alle x ∈ (a, b), so ist f konstant.
7 (., .)
bezeichnet das Skalarprodukt in R p .
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
57
Beweis. Subtrahieren wir von f (x) immer den Wert f (a), so können wir annehmen,
dass o.B.d.A. f (a) = 0.
Seien x, t ∈ (a, b), so folgt aus der Dreiecksungleichung k f (x)k ≤ k f (t) − f (x)k +
k f (t)k sowie k f (t)k ≤ k f (t) − f (x)k + k f (x)k. Also gilt
−k f (t) − f (x)k ≤ k f (t)k − k f (x)k ≤ k f (t) − f (x)k
und daher
− k f (t)k − k f (x)k 1
1
f (t) − f (x) ≤
f (t) − f (x) .
≤ t−x
t−x
t−x
Da k.k : X → R stetig ist, konvergieren für t → x die linke und die rechte Seite laut
Voraussetzung gegen 0 und nach dem Einschlusskriterium für Netze somit auch der
mittlere Ausdruck.
Also ist x 7→ k f (x)k auf (a, b) differenzierbar mit k f (x)k′ = 0 und klarerweise auf
[a, b] stetig. Wegen k f (a)k = 0 folgt aus dem Mittelwertsatz angewandt auf k f (x)k,
dass k f (x)k = 0, und somit f (x) = 0 für alle x ∈ [a, b].
❑
Als Folgerung erhält man z.B. dass zwei ableitbare X-wertige Funktionen übereinstimmen, wenn sie es an einer Stelle tun, und wenn ihre Ableitungen gleich sind.
9.3.15 Definition. Sei f : [a, b] → X eine beschränkte Funktion. Konvergiert das Netz
(S ( f, R))R∈R in X, wobei8
S ( f, R) =
n(R)
X
j=1
(ξ j − ξ j−1 ) f (α j ) ,
so heißt f Riemann-integrierbar. In diesem Fall schreiben wir
Z b
f (t) dt := lim S ( f, R) .
a
|R|→0
Der Zugang zu Integralen mit Ober- und Untersummen funktioniert offensichtlich
hier nicht.
9.3.16 Fakta. Man kann genauso wie im skalaren Fall folgende Tatsachen für den
normierten Raum wertigen Fall beweisen, indem man in den jeweiligen Beweisen an
den richtigen Stellen |.| durch k.k ersetzt.
1. Rechenregeln (Lemma 8.2.9):
Zb
a
(λ f + µg) dx = λ
Zb
a
f dx + µ
Zb
g dx ,
a
b
Z−
Zb
f dx ≤
k f (x)k dx ≤ k f k∞ (b − a) .
a
a
(9.13)
wobei f, g : [a, b] → X Riemann-integrierbar sind, und λ, µ ∈ R (C) je nachdem,
was der Skalarkörper von X ist. Zur Erinnerung: k f k∞ = supx∈[a,b] k f (x)k.
8 Vgl.
Definition 8.2.1.
KAPITEL 9. NORMEN UND BANACHRÄUME
58
2. Ist T : X → Y beschränkt und linear, so folgt aus der Stetigkeit von T
Z
Z
T ( f (t) dt) = T ( lim S ( f, R)) = lim S (T f, R) =
T f (t) dt .
|R|→0
|R|→0
(9.14)
Insbesondere gilt für ein Riemann-integrierbares g : [a, b] → R (C) und x ∈ X,
Rb
Rb
dass a (g(t)x) dt = ( a g(t) dt)x.
Setzt man noch voraus, dass (X, k.k) ein Banachraum ist, so gelten auch folgende
Aussagen, die ganz ähnlich wie im skalaren Fall zu beweisen sind. Um zu zeigen,
wie wenig sich die Beweise vom skalaren Fall unterscheiden, ist der Beweis von 3
ausgeführt.
3. Ist f : [a, b] → X stetig, so ist f Riemann-integrierbar, vgl. Satz 8.3.4.
Beweis. Genauso wie in Lemma 8.3.3 zeigt man zunächst für eine beschränkte
Abbildung f : [a, b] → X und zwei Riemann-Zerlegungen R1 und R2 von [a, b]
S (R1 ) − S (R2 ) ≤ 2(b − a) · ρ(max(|R1 |, |R2 |)) ,
(9.15)
wobei
ρ(γ) = sup{ k f (s) − f (t)k : s, t ∈ [a, b], |s − t| ≤ γ }, γ > 0 ,
die Oszillation von f bezeichnet. Um das einzusehen, sei R eine RiemannZerlegung, deren Stützstellen die von R1 und R2 umfasst. Das bedeutet, dass
mit
n(R2 ) n(R1 ) n(R2 )
1)
R1 = (ξ j )n(R
j=0 ; (α j ) j=1 , R2 = (ζ j ) j=0 ; (γ j ) j=1 ,
n(R) R = (η j )n(R)
j=0 ; (β j ) j=1 ,
die Beziehung
{ξ j : j = 0, . . . , n(R1 )} ∪ {ζ j : j = 0, . . . , n(R2 )} ⊆ {η j : j = 0, . . . , n(R)}
gilt. Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
|
{z
}
k( j)−k( j−1)−1 viele
Wir erhalten wegen (ξ j − ξ j−1 ) f (α j ) =
Pk( j)
k=k( j−1)+1 (ηk
− ηk−1 ) f (α j )
 
k( j)
X
X1 ) 
 n(R
 =
(ξ j − ξ j−1 ) f (α j ) −
S (R1 ) − S (R) = (η
−
η
)
f
(β
)
k
k−1
k


k=k( j−1)+1
j=1
n(R
X1 )
k( j)
X
(ηk − ηk−1 ) f (α j ) − f (βk ) ≤
j=1 k=k( j−1)+1
n(R
X1 )
k( j)
X
j=1 k=k( j−1)+1
(ηk − ηk−1 ) · k f (α j ) − f (βk )k .
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
59
Bemerkt man, dass |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)}, so
folgt
kS (R1 ) − S (R)k ≤
n(R
X2 )
k=1
(ηk − ηk−1 ) · ρ(|R1 |) = (b − a) · ρ(|R1 |) .
Genauso zeigt man kS (R2 ) − S (R)k ≤ (b − a) · ρ(|R2 |). Aus der Dreiecksungleichung und der Monotonie von ρ folgt dann (9.15).
Ist nun f : [a, b] → X stetig, so ist f wegen Proposition 6.1.13 beschränkt und
wegen Satz 6.3.3 sogar gleichmäßig stetig.
Gemäß Lemma 5.3.11 folgt die Konvergenz von S (R) R∈R in X, wenn wir zei
gen können, dass S (R) R∈R in X ein Cauchy-Netz ist.
ǫ
Dazu sei ǫ > 0, und sei δ > 0 so, dass ρ(δ) ≤ 3(b−a)
; vgl. Bemerkung 8.3.2. Sind
nun R1 und R2 Riemann-Zerlegungen von [a, b] mit |R1 |, |R2 | < δ, so folgt aus
(9.15) sofort
kS (R1 ) − S (R2 )k ≤ 2(b − a) · ρ(max(|R1 |, |R2 |)) < ǫ
und damit die Tatsache, dass S (R) R∈R ein Cauchy-Netz ist.
❑
4. Sei f : [a, b] → X und c < d, [c, d] ⊆ [a, b]. Dann ist f |[c,d] über [c, d] Riemannintegrierbar genau dann, wenn 1[c,d] f es über [a, b] ist. Das ist insbesondere der
Fall, wenn f über [a, b] Riemann-integrierbar ist. vgl. Lemma 8.4.1.
5. Der Hauptsatz der Differential- und Integralrechnung (Satz 8.4.5) gilt auch für
Banachraum-wertige Funktionen:
Ist f : [a, b] → X Riemann-integrierbar, und setzt man für a ≤ x ≤ b
F(x) :=
Zx
f (t) dt ,
a
so ist F stetig auf [a, b]. Ist f in einem Punkt x0 stetig, so ist F bei x0 differenzierbar, und es gilt F ′ (x0 ) = f (x0 ).
6. Ist f : [a, b] → X stetig, und ist G : [a, b] → X stetig und stetig differenzierRx
bar auf (a, b), sodass G′ (x) = f (x), x ∈ (a, b), so erfüllt G(x) − f (t) dt die
a
Voraussetzung von Lemma 9.3.14. Also ist diese Funktion konstant, woraus
Zb
f (t) dt = G(b) − G(a)
(9.16)
a
folgt.
Man erhält
R x also wie im skalarwertigen Fall, dass der Integrationsoperator f 7→
(x 7→ a f (t) dt) den Vektorraum C([a, b], X) bijektiv auf die Hyperebene aller
bei a verschwindenden Funktionen in C 1 ([a, b], X) abbildet.
KAPITEL 9. NORMEN UND BANACHRÄUME
60
7. Sei I ⊆ R ein Intervall mit endlicher linker Intervallgrenze a, die in I liege. Ist f : I → X eine Funktion, dann gilt f ∈ C 1 (I, X) genau dann, wenn
f ∈ C(I, X), f |I\{a} ∈ C 1 (I \ {a}, X) und der X-wertige Grenzwert limtցa f ′ (t)
existiert, vgl. Korollar 7.2.17. Eine entsprechende Aussage gilt für die rechte
Intervallgrenze von I.
Um das einzusehen, sei f ∈ C(I, X), f |I\{a} ∈ C 1 (I \ {a}, X) und existiere
limtցa f ′ (t). Setzen wir g(t) = f ′ (t), t ∈ I \ {a}, und g(a) = limtցa f ′ (t), so
gilt klarerweise
R xg ∈ C(I, X), vgl. Bemerkung 6.4.4. Die X-wertige Funktion
F(x) = f (x) − a g(t) dt, x ∈ I, ist auf I stetig, hat auf I \ {a} eine verschwindende Ableitung, und ist somit wegen Lemma 9.3.14
R x auf jedem Intervall der Form
[a, s] mit s ∈ I konstant. Also ist mit x 7→ a g(t) dt, x ∈ [a, s] auch f (x) auf
[a, s] stetig differenzierbar; vgl. (5). Die Umkehrung gilt offensichtlich auch.
8. Da die Kettenregel (9.11) und auch die Produktregel für Funktion f : I → R (C)
und h : I → X (vgl. Fakta 9.3.12, 7) gilt, leitet man wie in Lemma 8.4.12 bzw.
Lemma 8.4.13 aus (9.16) die Substitutionsregel
Z β
Z g(β)
f (g(t))g′ (t) dt .
f (x) dx =
α
g(α)
mit R-wertige und stetig differenzierbarer Funktion g und stetiger, X-wertiger
Funktion f und die Regel der partiellen Integration
Zb
′
f g dx = f (b)g(b) − f (a)g(a) −
a
Zb
f g′ dx .
a
für stetig differenzierbare Funktionen f und g her, wobei f skalarwertig sein
muss, damit das Produkt von zwei Funktion erklärt ist.
9. Uneigentliche Riemann-Integrale lassen sich genauso wie im skalaren Fall definieren, siehe Definition 8.6.1.
Insbesondere zeigt man wie in Lemma 8.6.3, dass aus absoluten Konvergenz
Rb
Rb
von a g(x) dx einer Funktion g : [a, b) → X, dh. a kg(x)k dx < +∞, die
Rβ
Rb
Konvergenz von a g(x) dx, dh. von limβրa a g(x) dx in X folgt. Ist obendrein
Rb
kg(x)k ≥ k f (x)k für alle x ab einem c ∈ [a, b), so ist auch a f (x) dx absolut
konvergent, wobei f : [a, b) → X.
Bei diesem Schluss von absoluter Konvergenz auf die Konvergenz muss man
voraussetzen, dass für alle β ∈ [a, b) die Funktionen g, f, kg(.)k, k f (.)k auf [a, β]
Riemann-integrierbar sind.
10. Wie im skalaren Fall kann man auch Integral und Grenzübergang vertauschen
(siehe Satz 8.7.2)
Zb
Zb
lim
fn dx =
f dx .
(9.17)
n→∞
a
a
11. Genauso wie im skalaren Fall gilt für stetige Funktionen f : [a, b] × K → X –
dabei ist K kompakte Teilmenge eines metrischen Raumes –, dass R : K → X
definiert durch
Z
b
f (s, t) ds
R(t) =
a
(9.18)
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
61
stetig ist; vgl. Korollar 8.7.9.
Ebenfalls kann man für Banachraum-wertige Funktionen f : [a, b] × [c, d] → X
die Integrationsreihenfolge vertauschen (siehe Satz 8.7.10)
!
!
Z d Z b
Z b Z d
f (s, t) ds dt .
f (s, t) dt ds =
a
c
c
a
Schließlich kann man Integral und Ableitung vertauschen (siehe Korollar
8.7.12):
Z d
Z d
d
d
f (s, t) dt ,
(9.19)
f (s, t) dt =
ds c
ds
c
wenn f (s, t) und
d
ds
f (s, t) beide auf [a, b]×[c, d] stetig sind und Werte in X haben.
12. Man kann nun auch die Rechnung aus Proposition 8.8.2 nochmals für f : I → X
durchführen, um für eine (n + 1)-mal stetig differenzierbare Funktion die Taylorsche Entwicklung
n
X
1 (k)
f (y) +
f (x) =
(x − y)
k!
k=0
k
Zx
(x − t)n (n+1)
f
(t) dt .
n!
(9.20)
y
zu erhalten. Nur eine Abschätzung des Restgliedes mit Hilfe von f (n+1) ausgewertet an einer gewissen Stelle zwischen x und y wie im R-wertigen Fall hat man
nicht, da diese ja den Mittelwertsatz der Differentialrechnung bzw. Integralrechnung verwendet.
9.3.17 Bemerkung. Alle oben erwähnten Konzepte (Reihen, gleichmäßig konvergente
Funktionen, Ableitung, Integral) hängen nicht von der Norm auf X ab, solange diese
zur ursprünglich auf X gegenen Norm äquivalent sind, denn Grenzwerte und deren
Existenz in X bleiben unverändert, wenn man zu einer äquivalenten Norm wechselt.
9.3.18 Bemerkung. Ist X = Rd , so wissen wir, dass die Konvergenz eines Netz zur komponentenweisen Konvergenz äquivalent ist, wobei die Komponenten des Grenzwertes
genau die Grenzwerte der Komponentennetze sind.
Somit erhalten wir
 
  P∞

d

 f1 
 dt f1 (t)
an,1   n=1 an,1 
∞ 
X


d  . 
 ..  

..
 ..  (t) =  ...  ,
 .  = 
 ,
.




 P∞
d
 dt  
n=1 
fd
an,d
f
(t)
d
n=1 an,d
dt
Z
a
b
R b
 

 f1 
 a
 . 
 ..  (t) dt = 
R
 
 b
fd
a

f1 (t) dt

..
 ,
.


fd (t) dt
in dem Sinne, dass die linken Seiten genau dann existieren, wenn die rechten es tun.
Als Anwendung für obige eher abstrakt wirkende Konzepte wollen wir die Exponentialfunktion, die einer p × p-Matrix wieder eine p × p-Matrix zuweist, betrachten.
KAPITEL 9. NORMEN UND BANACHRÄUME
62
9.3.19 Beispiel. Sei A ∈ R p×p . Man betrachte die R p×p -wertige Potenzreihe (t ∈ R)
etA :=
∞
X
n=0
tn
1 n
A .
n!
(9.21)
Dabei sei R p×p mit einer Abbildungsnorm versehen. Wegen
ktn
1 n
(|t| kAk)n
A k≤
n!
n!
folgt nach dem Majorantenkriterium die absolute Konvergenz von etA für alle t ∈ R, da
ja
∞
X
(|t| kAk)n
(= e|t| kAk )
n!
n=0
konvergiert. Somit ist der Konvergenzradius R von (9.21) gleich +∞. Als Grenzfunktion einer Potenzreihe ist t 7→ etA eine stetige Funktion von R nach R p×p .
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen
von R p×p nach R p×p gilt wegen (9.7)

∞
∞
X n 1 n  X
1
tA

A  =
(9.22)
Ae = A  t
tn An+1 = etA A .
n!
n!
n=0
n=0
Sei x ∈ R. Da die Potenzreihe für auf [−|x|, |x|] gleichmäßig konvergiert, kann man
im Folgenden wegen (9.17) Integration und Grenzwert vertauschen.
Z
x
tA
e dt =
0
∞ Z
X
n=0
x
0
X xn+1
1 n n
t A dt =
An .
n!
(n
+
1)!
n=0
∞
Wegen (9.14) und (9.7) gilt somit
Z
0
x
tA
Ae dt = A
Z
0
x
etA dt =
∞
X
n=0
X 1
xn+1
An+1 =
xn An = e xA − I .
(n + 1)!
n!
n=1
∞
Aus dem Hauptsatz der Differential und Integralrechnung folgt daher dtd etA = AetA =
etA A.
Übrigens konvergiert etA auch für alle t ∈ R, wenn man R p×p mit einer anderen
Norm versieht, da diese alle äquivalent sind. Wir haben oben aber die Tatsache kAn k ≤
kAkn verwendet, welche i.A. nur von der Abbildungsnorm erfüllt wird.
9.3.20 Beispiel. Sei nun R eine weitere beliebige p × p-Matrix. Dann sieht man mit
Hilfe der Produktregel wie in (9.12), dass die Funktion f (t) = etA R eine Lösung des
Randwertproblems
f ′ (t) = A f (t), f (0) = R
(9.23)
ist. Ist umgekehrt f : R → R p×p eine weitere auf ganz R differenzierbare Lösung dieses Problems, so folgt aus der Produktregel für R p×p L(R p , R p )-wertige Funktionen
(9.12)
d −tA
(e f (t)) = −e−tA A f (t) + e−tA f ′ (t) = −e−tA A f (t) + e−tA A f (t) = 0 ,
dt
9.3. BANACHRAUMWERTIGE REIHEN, FUNKTIONEN, ETC.
63
und daher e−tA f (t) = e−0A f (0) = R. Da insbesondere etA eine Lösung von (9.23) mit
R = I ist, erhalten wir e−tA etA = I und somit e−tA = (etA )−1 .
Für unsere zunächst beliebige Lösung folgt daher auch f (t) = etA R. Also ist etA R
die einzige Lösung von (9.23).
Mit dieser Tatsache lässt sich nun auch die Frage behandeln, ob für die Exponentialfunktion wie im skalaren Fall gilt, dass eA+B = eA eB . Im Allgemeinen ist das nämlich
nicht richtig. Sollten aber A und B kommutieren (AB = BA), so gilt wegen (9.7)

∞
∞ n
∞ n
X
X
X tn n 
t
t
tA

A  B =
(An B) =
(BAn) = BetA ,
e B = 
n!
n!
n!
n=0
n=0
n=0
und daher
d tA tB
(e e ) = AetA etB + etA BetB = (A + B)etAetB .
dt
Somit ist etA etB eine Lösung von (9.23) mit A ersetzt durch A + B und R ersetzt durch
I, und wegen der Eindeutigkeit der Lösung folgt et(A+B) = etA etB .
Betrachtet man die Abbildung A 7→ eA , so gilt folgende Aussage.
9.3.21 Proposition. Für jede p × p-Matrix A ∈ R p×p konvergiert die Reihe (A0 := I)
eA :=
∞
X
1 n
A .
n!
n=0
absolut im Banchraum R p×p versehen mit der Abbildungsnorm, wobei keA k ≤ ekAk und
zwar gleichmäßig auf jeder Menge der Form
Er = {A ∈ R p×p : kAk ≤ r}
für jedes beliebige 0 < r < +∞.
Die Abbildung A 7→ eA als Abbildung von R p×p nach R p×p ist stetig.
P kAkn
Beweis. Wegen (9.6) gilt kAn k ≤ kAkn für alle n ∈ N. Somit ist ∞
n=0 n! eine konverP∞ 1 n
gente Majorante und n=0 n! A konvergiert absolut, wobei keA k ≤ ekAk (siehe (9.8)).
Wegen der Beschränktheit der Abbildungen B 7→ AB, B 7→ BA als Abbildungen
von R p×p nach R p×p gilt wegen (9.7)

∞
∞
X 1 n  X
1 n+1
A

A  =
A = eA A .
Ae = A 
n!
n!
n=0
n=0
Nun betrachte für ein r > 0 die Teilmenge
Er = {A ∈ R p×p : kAk ≤ r}
n
von R p×p . Für A ∈ Er gilt n!1 An ≤ rn! , und daher können wir das Weierstraßsche
P
N
1 n
Konvergenzkriterium anwenden. Insbesondere konvergiert dann
n=0 n! A N∈N für
N → ∞ gleichmäßig auf Er gegen die Funktion A 7→ eA .
Nach Korollar 9.2.9 ist A 7→ An stetig auf Er für alle n ∈ N, und nach Korollar 9.1.3
PN 1 n
ist auch A 7→ n=0
n! A stetig auf E r .
Da die Grenzfunktion von einer Folge stetiger Funktionen bei gleichmäßiger
Konvergenz wieder stetig ist, folgt die Stetigkeit von A 7→ eA auf Er . Weil die
Stetigkeit eine lokale Eigenschaft ist, folgt diese damit auf ganz R p×p .
❑
KAPITEL 9. NORMEN UND BANACHRÄUME
64
9.3.22 Bemerkung. Ganz ähnlich wie in Bemerkung 9.3.7 gelten auch Beispiel 9.3.19
und die Aussagen von Proposition 9.3.21 und Beispiel 9.3.20 für den Fall, dass A ∈
L(X, X) mit einem beliebigen Banachraum X. Die Beweise sind im wesentlichen die
selben.
9.4 Übungsbeispiele
9.1 Man beweise die Höldersche Ungleichung mit Hilfe von Beispiel 7.21:
p
Sei p ∈ R, p > 1 und sei q = p−1
. Weiters seien a j , b j ∈ [0, +∞), j = 1, . . . , n. Dann gilt
n
X
j=1
 n
1
X  p
p

a j b j ≤  a j 
j=1
 n
1
X  q
q

b j  .

j=1
Hinweis: Man beweise Die Ungleichung zuerst unter der zusätzlichen Voraussetzung, dass
b j > 0, j = 1, . . . , n. Dazu wende man das erwähntes Beispiel auf die Funktion x p und
a
I = [0, +∞) an, und setze µ j = bqj sowie x j = q−1j .
bj
n
9.2 Für p ≥ 1 sei k.k p : R → R definiert durch
k(x j )nj=1 k p
:=
v
t n
X
p
j=1
|x j | p .
Man zeige, dass k.k p eine Norm ist.
P
P
P
Hinweis: Es gilt j |x j + y j | p ≤ j |x j ||x j + y j | p−1 + j |y j ||x j + y j | p−1 . Nun wende man die
Höldersche Ungleichung an, .....
9.3 Man zeige, dass alle Normen k.k p , p ∈ [1, ∞] auf Rn äquivalent sind. Man zeige insbesondere, dass (1 ≤ p < q < ∞)
kxk∞ ≤ kxkq ≤ kxk p ≤ nkxk∞
Hinweis: Man verwende, dass aus 0 < p < q und λ ∈ [0, 1] folgt, dass λq ≤ λ p .
9.4 Man betrachte den Banachraum ℓ∞ (N, C) aller beschränkten, komplexwertigen Folgen versehen mit der Norm k.k∞ ; also k(zn )n∈N k∞ = supn∈N |zn |.
Zeigen Sie, dass die Menge c0 (N, C) aller komplexwertigen Nullfolgen ein abgeschlossener
Unterraum von ℓ∞ (N, C) ist.
Weiters bestimme man den Abschluss c(F) von F in dem Banachraum ℓ∞ (N, C), wobei
F = {(zn )n∈N ∈ ℓ∞ (N, C) : ∃N ∈ N, zn = 0 für alle n ≥ N} .
Anmerkung: Wegen F , c(F) ist das ein Teilraum eines Banachraumes, der nicht abgeschlossen ist.
9.5 Seien A1 : R2 → R2 , A2 : R3 → R und A3 : R → R3 in Matrixdarstellung gegeben durch
 
!
5
2 −1
 
, A2 = −2 0 2 , A3 = 0 ,
A1 =
 
0 1
1
wobei die Ausgangsräume der Abbildungen mit k.k∞ und die Zielräume mit k.k1 versehen
sind. Berechnen Sie die Abbildungsnormen von A1 , A2 , A3
9.6 Sei D = diag(λ1 , . . . , λn ) eine Diagonalmatrix im Rn×n . Man bereche kDk2 , kDk∞ , wenn man
2
D als Element vom Rn Rn×n betrachtet.
Weiters berechne man die Abbildungsnorm von D als Element von L(Rn , Rn ), wenn man Rn
vorne und hinten mit der k.k2 -Norm versieht.
9.4. ÜBUNGSBEISPIELE
65
9.7 Mit der Notation aus dem vorherigen Beispiel berechne man die Abbildungsnorm von D als
Element von L(Rn , Rn ), wenn man Rn vorne und hinten mit der k.k∞ -Norm versieht.
9.8 Sei Rn versehen mit k.k1 . Man betrachte L(Rn , R) den Raum aller linearen Abbildungen von
Rn nach R, d.h. den Dualraum von Rn , versehen mit der Abbildungsnorm k.k. Bekanntlich
ist L(Rn , R) isomorph zu Rn , indem man ein A ∈ L(Rn , R) in Matrixform (a1 , . . . , an ) angibt.
Man zeige, dass dann k.k mit der k.k∞ -Norm übereinstimmt.
9.9 Sei Rn versehen mit k.k∞ . Man betrachte L(Rn , R) den Raum aller linearen Abbildungen von
Rn nach R, d.h. den Dualraum von Rn , versehen mit der Abbildungsnorm k.k. Bekanntlich
ist L(Rn , R) isomorph zu Rn , indem man ein A ∈ L(Rn , R) in Matrixform (a1 , . . . , an ) angibt.
Man zeige, dass dann k.k mit der k.k1 -Norm übereinstimmt.
9.10 Mit welcher Norm stimmt die Abbildungsnorm auf L(Rn , R) überein, wenn man Rn mit k.k2
versieht. Warum?
9.11 Man betrachte den Banachraum ℓ∞ (N, C) aller beschränkten, komplexwertigen Folgen versehen mit der Norm k.k∞ ; also k(zn )n∈N k∞ = supn∈N |zn |.
c0 (N, C) sei der Banachraum aller komplexwertigen Nullfolgen.
Weiters sei A : ℓ∞ (N, C) → c0 (N, C) definiert durch
1
A((zn )n∈N ) = ( zn )n∈N .
n
Man zeige, dass A tatsächlich nach c0 (N, C) hinein abbildet, und dass A linear, beschränkt,
injektiv, aber nicht surjektiv ist.
9.12 Seien (X, k.kX ) und (Y, k.kY ) ein normierte Räume und (L(X, Y), k.k) der Raum aller beschränkten linearen Abbildungen von X nach Y. Weiters sei x ∈ X fest. Zeigen, Sie, dass die
Abbildung A 7→ Ax als Abbildung von L(X, Y) nach Y beschränkt und linear ist.
Ist weiters E eine nichtleere Menge und t ∈ E, so zeige man auch, dass die Abbildung
B(E, Y) → Y, f 7→ f (t)
beschränkt und linear ist. Bestimmen Sie die Abbildungsnorm dieser Abbildung!
9.13 Sei M eine Menge und B(M, R) der Banachraum aller beschränkten, reellwertigen Funktionen auf M versehen mit der Norm k.k∞ .
Seien t1 , . . . , tn ∈ I. Man zeige, dass die Abbildung T : B(M, R) → Rn definiert durch
linear und beschränkt ist.


 f (t1 )
 . 
T ( f ) =  .. 


f (tn )
9.14 Man betrachte die Menge Cb [a, b] aller stetigen reellwertigen Funktionen auf [a, b] und
versehe diese mit
Z b
k f k1 :=
| f (t)| dt .
a
Zeigen Sie, dass k.k1 eine Norm ist, und dass (Cb [a, b], k.k1 ) kein Banchraum ist, indem Sie
eine Cauchy-Folge angeben, die nicht konvergiert.
Hinweis: OBdA. sei a = −1, b = 1. Approximieren Sie sgn(x) (diese liegt nicht in Cb [a, b])
geeignet durch eine Folge stetiger Funktionen.
9.15 Sei Cb [0, 1] die Menge aller stetigen und komplexwertigen Funktionen auf [0, 1] versehen
mit der Supremumsnorm. Weiters sei h : [−1, 1] → Cb [0, 1] definiert durch
h(t) = (s 7→
s
).
s+2+t
KAPITEL 9. NORMEN UND BANACHRÄUME
66
Zeigen Sie, dass h stetig ist, indem Sie kh(t1 ) − h(t2 )k∞ abschätzen. Berechnen Sie auch
Z 1
h(t) dt .
−1
Hinweis: Verwenden Sie (9.14) mit T s : Cb [0, 1] → C, T ( f ) = f (s) für jedes feste s ∈ [0, 1].
9.16 Seien T, A ∈ Rn×n , und sei T invertierbar. Man zeige, dass T −1 eA T = eT
rechne man eA , wenn A eine Diagonalmatrix ist und wenn
!
0 1
.
A=
0 0
9.17 Sei F : [1, 2] → R3 definiert durch
Berechnen Sie
R2
1
F(t) dt und F ′ .
−1 AT
. Weiters be-
 3

 t + 5 

t2 
F(t) = sin t + t+1  .


t exp(3t)
P
p
9.18 Für p ≥ 1 sei ℓ (N, C) die Menge aller komplexwertigen Folgen (zn )n∈N , die ∞
n=1 |zn | < +∞
p
erfüllen. Man zeige, dass ℓ (N, C) mit der gliedweisen
Addition und skalaren Multiplikation
pP
p
p
ein Vektorraum ist, und dass k(zn )n∈N k p := p ∞
n=1 |zn | eine Norm auf ℓ (N, C) ist.
p
Anmerkung: (ℓ (N, C), k.k p ) ist sogar ein Banachraum.
Ist nämlich ((zkn )n∈N )k∈N eine Cauchy-Folge in ℓ p (N, C), so ist für ein festes j ∈ N wegen
|zkj − zkj | ≤ k(zkn )n∈N − (zln )n∈N k p auch jede Komponentenfolgen (zkj )k∈N Cauchy-Folge und
somit konvergent gegen ein z j ∈ C konvergiert.
Es bleibt (zn )n∈N ∈ ℓ p (N, C) und k(zkn )n∈N − (zn )n∈N k p → 0 zu zeigen. Dazu sei ǫ > 0 und
N ∈ N beliebig und k0 so, dass k, l ≥ k0 ⇒ k(zkn )n∈N − (zln )n∈N k p ≤ ǫ. Wegen
v
t N
X
p
|zkn − zln | p ≤ k(zkn )n∈N − (zln )n∈N k p ≤ ǫ
p
n=1
folgt für l → ∞, dass mit beliebigen N ∈ N,
q
p PN
k
p
ungleichung
n=1 |zn | ≤ ǫ + k(zn )n∈N k p .
q
p
PN
n=1
|zkn − zn | p ≤ ǫ und wegen der Dreiecks-
Mit N → ∞ folgt aus letzerer Tatsache, dass (zn )n∈N ∈ l p , und aus der vorletzten Ungleichung
k(zkn )n∈N − (zn )n∈N k p ≤ ǫ und zwar für alle k ≥ k0 .
9.19 Man betrachte den normierten Raum (R p×p, k.k∞ ), und zeige, dass die Funktionen A 7→
Pp
spur(A) (= i=1
aii ), A 7→ det(A) stetig auf R p×p sind, und die Funktion A 7→ A−1 stetig auf
p×p
GL(p, R) (⊆ R ) ist.
Weiters sei y ∈ R p fest und man betrachte die Funktion von GL(p, R) (alle invertierbaren
p × p-Matrizen) nach R p , die jedem A ∈ GL(p, R) die Lösung x der Gleichung Ax = y
zuweist. Man zeige, dass diese Funktion auch stetig ist.
9.20 Sei (wn )n∈N eine komplexe Folge in einem normierten Raum (X, k.k), die für n → ∞ gegen
einen Grenzwert w ∈ X konvergiert. Man zeige, dass dann auch die Folge
w1 + · · · + wn
n
gegen w konvergiert.
Hinweis: Zeigen Sie das Ergebnis zuerst unter der Annahme, dass wn ∈ R, wn ≥ 0 und w =
0, und führen Sie das allgemeine Ergbenis auf diesen Fall zurück, indem Sie die Trivialität
w = w+···+w
verwenden.
n
Kapitel 10
Ableitungen nach mehreren
Variablen
10.1 Partielle Ableitungen
Wir wollen in diesem Kapitel die Differentialrechnung für auf D ⊆ Rn definierte Funktionen entwickeln. Dazu wollen wir im folgenden mit ei den i-ten kanonischen Basisvektor ei = (0, . . . , 0, 1, 0, . . . , 0)T mit der 1 an der i-ten Stelle bezeichnen.
10.1.1 Definition. Sei (X, k.k) ein Banachraum1. Sei f : D → X definiert auf einer
offenen Menge D ⊆ Rn . Existiert für ein x ∈ D der Limes
1
∂f
(x) := lim f (x + tei ) − f (x) ,
t→0 t
∂xi
(10.1)
so heißt dieser die partielle Ableitung von f nach der Variablen xi an der Stelle x.
∂f
(x) schreibt man auch Di f (x) oder f xi (x).
Anstatt ∂x
i
Ist allgemeiner v = (µ1 , . . . , µn )T ∈ Rn ein sogenannter Richtungsvektor, und existiert für x ∈ D der Limes
1
∂f
(x) := lim f (x + tv) − f (x)
t→0 t
∂v
so heißt dieser die Richtungsableitung von f an der Stelle x in Richtung v.
Offensichtlich gilt für den Richtungsvektor ei
∂f
∂f
(x) =
(x) .
∂xi
∂ei
10.1.2 Bemerkung. Für x ∈ D und v ∈ Rn ist die Abbildung t 7→ x + tv von R nach
Rn stetig, wobei 0 auf x abgebildet wird. Da D ⊆ Rn offen ist, gibt es daher ein reelles
Intervall (−δ, δ) mit δ > 0 um die Null, sodass x + tv ∈ D für alle t ∈ (−δ, δ). Setzt man
g(t) := f (x + tv), t ∈ (−δ, δ) ,
1 Man
sollte anfangs einfach an R oder Rm denken.
67
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
68
so bildet g das Intervall (−δ, δ) nach X hinein ab. Wegen
1
1
f (x + tv) − f (x) = g(t) − g(0)
t
t
ist g genau dann bei Null differenzierbar, wenn
∂f
∂v (x)
existiert. In dem Fall gilt dann
∂f
(x) .
∂v
Richtungsableitungen sind ihrer Natur nach also “eindimensional“. Denn man betrachtet ja f eingeschränkt auf die Strecke x + tv, t ∈ (−δ, δ). Insbesondere variiert bei
der Bildung der partiellen Ableitung nach xi wie in (10.1) beim Differenzenquotienten
f (x+tei )− f (x)
im Vektor x + tei , t ∈ (−δ, δ) nur die i-te Koordinate.
t
g′ (0) =
e2
e2
v
x
x
x + te1
x + tv
e1
e1
Abbildung 10.1: Ableitung in Richtung der Koordinate x1 bzw. des Vektors v
10.1.3 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D. Existieren
∂f
∂f
(x), . . . , ∂x
(x), x ∈ D, so heißt f partiell differenzierbar
alle partiellen Ableitungen ∂x
1
n
auf D.
∂f
Sind alle X-wertigen Funktionen x 7→ ∂x
(x), j = 1, . . . , n, darüber hinaus stetig
j
auf D, so heißt f stetig partiell differenzierbar. Wir schreiben dafür f ∈ C 1 bzw. f ∈
C 1 (D).
10.1.4 Bemerkung. Teilmengen A von Vektorräumen Y (über R oder C) heißen konvex,
falls für alle x, y ∈ A folgt, dass auch alle Punkte auf ihrer Verbindungsgeraden in D
liegen, also tx + (1 − t)y ∈ D, t ∈ [0, 1].
Ist Y sogar mit einer Norm k.k versehen und ist A = Uǫ (z) oder A = Kǫ (z) die
offene bzw. abgeschlossene Kugel vom Radius ǫ, so ist A konvex, denn aus den aus
den Ungleichungen kz − xk, kz − yk < (≤)ǫ folgt
kz − (tx + (1 − t)y)k = kt(z − x) + (1 − t)(z − y)k ≤
tkz − xk + (1 − t)kz − yk < (≤) tǫ + (1 − t)ǫ = ǫ .
10.1.5 Lemma. Sei f : D ⊆ Rn → X, v = (µ1 , . . . , µn )T ∈ Rn ein Richtungsvektor und
sei x ∈ D. Wähle δ > 0 so, dass x + tv ∈ D für t ∈ (−δ, δ). Falls f ∈ C 1 (D), so ist die
Funktion g : (−δ, δ) → X definiert durch
g(t) := f (x + tv), t ∈ (−δ, δ) ,
stetig differenzierbar auf (−δ, δ), dh. g ∈ C 1 (−δ, δ), wobei
g′ (t) =
n
X
i=1
µi
∂f
(x + tv) , t ∈ (−δ, δ) .
∂xi
10.1. PARTIELLE ABLEITUNGEN
69
Beweis. Sei t ∈ (−δ, δ), setze y = x + tv, und wähle ρ > 0 so klein, dass2 Uρ·kvk∞ (y) ⊆ D.
Betrachte die Vektoren
v0 := 0, vi := µ1 e1 + . . . + µi ei , i = 1, . . . , n .
Offensichtlich gilt vn = v sowie vi = vi−1 + µi ei für i = 1, . . . , n. Da die ganze Kugel mit
Radius ρ · kvk∞ und Mittelpunkt y in D liegt, sind alle Punkte y + svi in D für |s| < ρ,
und damit auch alle Verbindungsstrecken zwischen ihnen (Kugeln sind konvex, vgl.
Bemerkung 10.1.4).
Nun lässt sich g(t + s) − g(t) für |s| < ρ als Teleskopsumme
g(t + s) − g(t) = f (y + sv) − f (y) =
n
X
i=1
f (y + svi ) − f (y + svi−1 )
∂f
(y + svi−1 + τei ) genau die Ableitung von τ 7→ f (y + svi−1 + τei )
darstellen. Da τ 7→ ∂x
i
ist, stimmt diese Teleskopsumme nach dem Hauptsatz der Differential- und Integralrechnung (vgl. (9.16)) überein mit
n Z
X
i=1
Wir erhalten
sµi
0
∂f
(y + svi−1 + τei ) dτ .
∂xi
g(t + s) − g(t) X ∂ f
(y) =
−
µi
s
∂xi
i=1
n
Z
n
X
1
i=1
s
sµi
0
(10.2)
!
∂f
∂f
(y + svi−1 + τei ) −
(y) dτ .
∂xi
∂xi
Wegen (9.13) ist die Norm dieses Ausdruckes kleiner oder gleich
n
X
i=1
|µi |
∂ f (y + sv + τe ) − ∂ f (y) .
i−1
i
∂xi τ∈[−|sµi |,|sµi |] ∂xi
sup
Wegen der Stetigkeit der partiellen Ableitungen in y konvergiert dieser Ausdruck
gegen 0, wenn s → 0.
❑
Zusammen mit Bemerkung 10.1.2 erhalten wir unmittelbar aus Lemma 10.1.5
10.1.6 Korollar. Für eine Funktion f : D ⊆ Rn → X mit f ∈ C 1 (D) existieren alle
Richtungsableitungen ∂∂vf (x) für x ∈ D und v ∈ Rn . Für v = (µ1 , . . . , µn )T gilt dabei
X ∂f
∂f
(x) .
(x) =
µi
∂v
∂xi
i=1
n
Insbesondere ist auch x 7→
2 Wir
∂f
∂v (x)
eine stetige Funktion von D nach X.
versehen hier praktischerweise Rn mit k.k∞ .
(10.3)
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
70
10.1.7 Bemerkung. Wir haben im Beweis von Lemma 10.1.5 die Stetigkeit der partiellen Ableitungen (in allen Variablen gleichzeitig) benützt, um zu zeigen, dass (10.2)
gegen Null strebt, wenn s → 0.
Beachte, dass z.B. die Funktion
! 
ξη
T
T


ξ
 ξ2 +η2 , (ξ, η) , (0, 0)
f
=

T
T
0
η
, (ξ, η) = (0, 0)
aus Beispiel 6.1.11 stets Richtungsableitungen in Richtung der Koordinatenachsen besitzt, die Richtungsableitung in Richtung v = e1 + e2 jedoch bei 0 nicht existiert. Man
∂f
nicht weglassen.
kann also in Lemma 10.1.5 die Voraussetzung der Stetigkeit der ∂x
i
Die Tatsache, dass für festes x die Richtungsableitung
abhängt, legt folgende Begriffsbildung nahe.
∂f
∂v (x)
in (10.3) linear von v
10.1.8 Definition. Sei f : D ⊆ Rn → X stetig partiell differenzierbar, und x ∈ D. Dann
bezeichne d f (x) ∈ L(Rn , X) die lineare Abbildung
 
µ1 
n
X
 . 
∂f
 ..  7→
(x) .
µi
∂xi
 
i=1
µn
Sie heißt die Ableitung von f im Punkt x.
Nach Korollar 10.1.6 ist d f (x)v gerade ∂∂vf (x), also die Richtungsableitung von f in
∂f
(x).
x in Richtung v. Insbesondere gilt d f (x)ei = ∂x
i
10.1.9 Fakta.
1. Ist D ⊆ R, dh. n = 1, so ist d f (x) gerade jene lineare Abbildung R → X, die 1
auf f ′ (x) abbildet.
2. Wir wissen, dass Netze in Rm genau dann konvergieren, wenn sie komponentenweise konvergieren. Für X = Rm (versehen mit zB. k.k∞ ) ist somit die Tatsache,
dass eine Funktion f : D ⊆ Rn → Rm , f = ( f1 , . . . , fm )T , (stetig) partiell differenzierbar ist, äquivalent dazu, dass jede ihrer Komponenten fk (stetig) partiell
differenzierbar ist.
3. Ist f : D ⊆ Rn → Rm stetig partiell differenzierbar, und x ∈ D, und zerlegen wir f (x) in seine Komponenten, f (x) = ( f1 (x), . . . , fm (x))T , so hat d f (x) ∈
L(Rn , Rm ) Rm×n als Matrix die Darstellung
!
∂ fi
d f (x) =
(x)
.
i=1,...,m
∂x j
j=1,...,n
Ist dabei m = 1, d.h. f ist R-wertig, so nennt man den Vektor d f (x)T auch den
Gradienten und schreibt auch grad f (x) dafür.
4. Ist f : D ⊆ Rn → X eine affine Abbildung, also von der Form x 7→ x0 + Ax mit
x0 ∈ X und einer linearen Abbildung A : Rn → X, so hat man
x0 + A(x + tei ) − x0 + A(x)
A(tei )
= lim
= A(ei ) ,
d f (x)ei = lim
t→0
t→0
t
t
10.1. PARTIELLE ABLEITUNGEN
71
und damit d f (x) = A für alle x ∈ D. Das ist eine Verallgemeinerung der Tatsache,
dass im eindimensionalen die Ableitung einer linearen Funktion kx + d konstant
gleich der Steigung k ist.
10.1.10 Beispiel. Sei D = R+ × R ⊆ R2 und T : D → R2 definiert durch
!
!
r
r cos t
T
=
.
t
r sin t
Diese Polarkoordinatenfunktion kennen wir schon aus dem ersten Semester; siehe Definition 6.8.12 und Bemerkung 6.8.13. Nun gilt offensichtlich
!
!
!
!
∂T r
∂T r
cos t
−r sin t
=
=
und
.
sin t
r cos t
∂r t
∂t t
∂T
Also sind ∂T
∂r und ∂t stetig, und damit T stetig partiell differenzierbar. Die Ableitung
T
2
dT (r, t) ∈ L(R , R2 ) ist damit
!
!
r
cos t −r sin t
dT
=
,
(10.4)
t
sin t r cos t
und die Richtungsableitung von T im Punkt (r, t)T in Richtung v = (µ1 , µ2 )T ist nach
Korollar 10.1.6
!
!
!
!
∂T r
r µ1
µ cos t − µ2 r sin t
= dT
= 1
.
t µ2
µ1 sin t + µ2 r cos t
∂v t
Berechnen wir diese Richtungsableitung gemäß Bemerkung 10.1.2 direkt dadurch,
dass wir g′ (0) mit g(s) = T (r, t)T + s(µ1 , µ2 )T bestimmen, so erhalten wir auch
!
d
(r + sµ1 ) cos(t + sµ2 ) | s=0
′
ds
g (0) = d
=
ds (r + sµ1 ) sin(t + sµ2 ) | s=0
!
!
µ1 cos(t + sµ2 ) − (r + sµ1 )µ2 sin(t + sµ2 ) | s=0
µ cos t − µ2 r sin t
= 1
.
µ1 sin(t + sµ2 ) + (r + sµ1 )µ2 cos(t + sµ2 ) | s=0
µ1 sin t + µ2 r cos t
10.1.11 Proposition. Sei f : D ⊆ Rn → X mit f ∈ C 1 (D).
Versieht man L(Rn , X) mit der Abbildungsnorm (Rn versehen mit k.k∞ und X mit
der darauf gegebenen Norm k.k)3 , so ist die Abbildung
d f : D ⊆ Rn → L(Rn , X), x 7→ d f (x)
stetig.
Für festes x ∈ D gilt
f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z) ,
(10.5)
4
wenn x + z ∈ D \ {x}, mit einer Funktion ǫ : (D \ {x} − x) → X, sodass
limz→0 ǫ(z) = 0.
3 Versieht man Rn dagegen mit k.k , k.k oder einer anderen äquivalenten Norm, so ist die resultierende
1
2
Abbildungsnorm auf L(Rn , X) zwar eine andere aber zur eingangs definierten Abbildungsnorm auf L(Rn , X)
äquivalent.
4 Man beachte, dass D \ {x} − x eine Menge der Bauart U (0) \ {0} enthält.
δ
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
72
Beweis.
Für x, y ∈ D gilt
k d f (x) − d f (y) k = sup k d f (x)v − d f (y)v k =
kvk∞ ≤1
sup
|µ1 |,...,|µn |≤1
n
n X
X
∂ f
∂f
(x) −
(y) .
µ j d f (x)e j − d f (y)e j ≤
∂x j
∂x j
j=1
j=1
Wegen der vorausgesetzten Stetigkeit der partiellen Ableitungen folgt
d f (y) → d f (x) für y → x.
Wir setzen (x ∈ D und z , 0, sodass x + z ∈ D)
ǫ(z) :=
1
( f (x + z) − f (x) − d f (x)z ) .
kzk∞
Ist ρ > 0, sodass Uρ (x) = x + Uρ (0) ⊆ D und 0 < kzk < ρ, so ist ǫ(z) definiert,
und wir haben wegen (10.2) mit t = 0, s = kzk∞ , v = (µ1 , . . . , µn )T := kzkz ∞ , wobei
offensichtlich max j=1,...,n |µ j | = kvk∞ = 1,
!
Z
n
X
∂f
1 sµi ∂ f
k ǫ(z) k = (x + svi−1 + τei ) −
(x) dτ ≤
∂xi
∂xi
i=1 s 0
n
X
i=1
|µi |
∂ f (x + sv + τe ) − ∂ f (x) ≤
i−1
i
∂xi
τ∈[−|sµi |,|sµi |] ∂xi
n
X
∂f
∂f
(x + y) −
(x) .
sup ∂xi
∂xi
i=1 kyk∞ ≤kzk∞
sup
Dieser Ausdruck konvergiert wegen der Stetigkeit der partiellen Ableitungen für
z → 0 gegen 0.
❑
10.1.12 Bemerkung. Wir sehen also, dass sich f lokal bei x durch die affine Abbildung
x + z 7→ f (x) + d f (x)z approximieren lässt, wobei der Fehler mit kzk∞ ǫ(z) verhältnismäßig klein ist.
Ist X = Rm und stellt man sich f (D) als n-dimensionale Fläche im Rm vor, so ist
deshalb der affine Teilraum
{ f (x) + d f (x)z : z ∈ Rn }
der Anschauung nach gerade die Tangentialebene an f (D) im Punkt f (x).
Man kann auch umgekehrt starten.
10.1.13 Definition. Sei f : D ⊆ Rn → X und x ∈ D. Gibt es ein d f (x) ∈ L(Rn , X),
sodass (10.5) mit einer X-wertigen Funktion ǫ definiert auf Uρ (0) \ {0} für ein gewisses ρ > 0, mit x + Uρ (0) ⊆ D, sodass limz→0 ǫ(z) = 0 erfüllt ist, so heißt f bei x
differenzierbar.
f heißt stetig differenzierbar, wenn f bei allen x ∈ D differenzierbar und die Abbildung x 7→ d f (x) stetig auf D ist.
10.1. PARTIELLE ABLEITUNGEN
73
Aus (10.5) folgt unmittelbar
10.1.14 Korollar. Ist f : D → X bei x ∈ D differenzierbar, so ist f dort auch stetig.
10.1.15 Fakta.
1. Wir haben oben gesehen, dass jede stetig partiell differenzierbare Funktion stetig
differenzierbar ist.
2. Ist f bei x differenzierbar, so existieren wegen (0 , v ∈ Rn , s ∈ R, sv ∈ Uρ (0))
f (x + sv) − f (x)
s→0
= d f (x)v + sgn(s) kvk∞ ǫ(sv) −→ d f (x)v ,
s
auch alle Richtungsableitungen, insbesondere alle partiellen Ableitungen, wobei
∂f
∂v (x) = d f (x)v.
Man sieht damit auch, dass d f (x) eindeutig durch f bestimmt ist, es also kein
weiteres d̃ f (x) ∈ L(Rn , X) mit d̃ f (x) , d f (x) geben kann, das auch (10.5) erfüllt.
3. Ist f stetig differenzierbar, so sind auch die partiellen Ableitungen stetig, da ja
∂ f (x) − ∂ f (y) = k d f (x)e − d f (y)e k ≤ k d f (x) − d f (y) k · ke k .
i
i
i ∞
∂xi
∂xi Somit folgt aus stetig differenzierbar die Eigenschaft stetig partiell differenzierbar.
Wir haben somit folgenden Satz bewiesen.
10.1.16 Satz. Eine Funktion f : D ⊆ Rn → X ist genau dann stetig differenzierbar,
wenn sie stetig partiell differenzierbar ist.
10.1.17 Bemerkung. Wenn X mit einer zweiten, zu k.k äquivalenten Norm versehen ist,
bleiben die partiellen Ableitungen und die Ableitung unverändert, da für äquivalente
Normen Netze genau denn bezüglich der einen Norm konvergieren, wenn sie bezüglich
der anderen konvergieren, und in dem Fall auch die Grenzwerte übereinstimmen.
10.1.18 Proposition. Sei D ⊆ Rn offen. Sind f, g : D → X zwei stetig differenzierbare
Funktionen und λ, µ ∈ R, so ist es auch λ f + µg und es gilt für alle x ∈ D
d(λ f + µg)(x) = λd( f )(x) + µdg(x) .
Beweis. Der Beweis folgt unmittelbar durch eine entsprechende Linearkombination
der Gleichungen
f (x + z) = f (x) + d f (x)z + kzk∞ ǫ(z)
und
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ̃(z) .
❑
Wie im Eindimensionalen lassen sich auch im Mehrdimensionalen viele Funktionen als Zusammensetzung von einfacheren Funktionen schreiben. Zur Berechnung der
Ableitung dient dann folgender Satz, der die bekannte Kettenregel verallgemeinert.
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
74
10.1.19 Proposition (Kettenregel). Seien f : D̃ ⊆ Rm → X, und g : D ⊆ Rn → Rm
beide stetig differenzierbar, wobei g(D) ⊆ D̃.
Dann ist auch f ◦ g : D ⊆ Rn → X stetig differenzierbar, und es gilt für x ∈ D5
d( f ◦ g)(x) = d f g(x) dg(x) ,
wobei die rechte Seite die Hintereinanderausführung von zuerst dg(x) und dann
d f g(x) ist.
Beweis. Laut Voraussetzung haben wir für a, a + b ∈ D̃, b , 0 gemäß (10.5)
f (a + b) = f (a) + d f (a)b + kbk∞ ǫ̃(b) ,
und falls x, x + z ∈ D, z , 0
g(x + z) = g(x) + dg(x)z + kzk∞ ǫ(z) .
Wegen limb→0 ǫ̃(b) = 0 und limz→0 ǫ(z) = 0 können wir durch ǫ(0) = 0 und ǫ̃(0) = 0
diese beiden Funktion so fortsetzen, dass sie bei z = 0 bzw. b = 0 stetig sind.
Ist nun a = g(x) und b so, dass a + b = g(x + z), so folgt aus der ersten Gleichung
und durch Einsetzen der zweiten
f g(x + z) =
f g(x) + d f g(x) g(x + z) − g(x) + k g(x + z) − g(x) k∞ ǫ̃ g(x + z) − g(x) =
f g(x) + d f g(x) dg(x)z + kzk∞ ǫ(z) +
dg(x)z + kzk∞ ǫ(z) ∞ ǫ̃ g(x + z) − g(x) =
f g(x) + d f g(x) dg(x) z + kzk∞ γ(z) ,
wobei
1
γ(z) = d f g(x) (ǫ(z)) + k dg(x)(
z) + ǫ(z) k∞ ǫ̃ g(x + z) − g(x) .
kzk∞
Wir haben
kγ(z)k ≤ kd f (g(x))k · kǫ(z)k∞ + (kdg(x)k + kǫ(z)k∞ ) kǫ̃ g(x + z) − g(x) k .
Wegen ǫ̃(0) = 0 und der Stetigkeit von ǫ̃ bei 0 folgt aus limz→0 g(x+z)−g(x) = 0, dass
limz→0 ǫ̃ g(x + z) − g(x) = 0 (vgl. Proposition 6.1.4), und somit auch γ(z) → 0, z → 0.
Wir haben also d( f ◦ g)(x) = d f (g(x)) dg(x) gezeigt. Um mit Hilfe von Satz
10.1.16 sicher zu gehen, dass f ◦ g ∈ C 1 , brauchen wir noch die Stetigkeit von
x 7→ d f (g(x)) dg(x). Diese folgt aber aus Korollar 9.2.9.
❑
beachte, dass wegen dg(x) ∈ L(Rn , Rm ) und d f g(x) ∈ L(Rm , X) diese Hintereinanderausführung
linearer Abbildungen Sinn macht.
5 Man
10.1. PARTIELLE ABLEITUNGEN
75
10.1.20 Bemerkung. Ist v ∈ Rn , so folgt unmittelbar aus Proposition 10.1.19 zusammen
mit Korollar 10.1.6 und Definition 10.1.8, dass
∂
∂
f ◦ g(x) = d f g(x)
g(x) ,
∂v
∂v
wobei rechts die Anwendung der linearen Abbildung d f g(x) ∈ L(Rm , X) auf den
∂
g(x) ∈ Rm steht. Man beachte, dass die rechte Seite nicht dasselbe ist wie
Vektor ∂v
∂
∂
∂v f g(x) ∂v g(x). Letzterer Ausdruck mach nicht einmal Sinn.
10.1.21 Bemerkung. Hat man n = 1 in Proposition 10.1.19, dh. D ⊆ R, so gilt dg(t) =
g′ (t), wenn man g′ (t) mit der linearen Abbildung ξ 7→ ξ ·g′ (t) aus L(R, Rm ) identifiziert,
siehe Fakta 10.1.9, 1. Entsprechendes gilt für ( f ◦ g)′ (t). Also liest sich die Kettenregel
in dem Fall als
( f ◦ g)′ (t) = d f g(t) g′ (t), t ∈ D ,
(10.6)
wobei rechts die Anwendung der linearen Abbildung d f g(t) auf den Vektor g′ (t)
steht.
10.1.22 Bemerkung (*). Wir nehmen im Fall n = 1 nun sogar an, dass g ∈ C 1 (I) für
irgendein, nicht notwendigerweise offenes Intervall I ⊆ R mit g(I) ⊆ D̃. Dann gilt
(10.6) sogar für in I enthaltene Randpunkte t von I.
Dazu setze man g auf ein etwas größeres Intervall J := I ∪ (t − ǫ, t + ǫ) durch
g(s) := (s − t)g′ (t) + g(t) für s ∈ J \ I fort. Man überprüft unmittelbar, dass g ∈ C 1 (J),
und dass für eine hinreichend kleine Wahl von ǫ > 0 auch g(J) ⊆ D̃. Die Kettenregel
angewandt auf g|(t−ǫ,t+ǫ) ergibt dann (10.6).
10.1.23 Beispiel. Als Beispiel wollen wir sogenannte Parameterintegrale betrachten.
Sei h : (a, b) × (c, d) → R stetig und so, dass die Ableitung nach der ersten Variablen
für alle (s, t) ∈ (a, b) × (c, d) existiert, und dass
h1 (s, t) =
∂
h(s, t) ,
∂s
ebenfalls stetig ist. Weiters seien α, β : (a, b) → (c, d) zwei stetig differenzierbare
Funktionen. Wir wollen die Ableitung der Funktion
Z β(s)
h(s, t) dt
I(s) :=
α(s)
berechnen. Dazu wenden wir die eben gewonnene Kettenregel auf
Z η
3
T
h(ζ, t) dt
f : (c, d) × (c, d) × (a, b) ⊆ R → R, (ξ, η, ζ) 7→
ξ
und
g : (a, b) ⊆ R → R3 , s 7→ (α(s), β(s), s)T
an. Die partiellen Ableitungen von f sind nach dem Hauptsatz und nach Korollar 8.7.12
stetig, und die Matrixdarstellung von d f (x) ist (x = (ξ, η, ζ)T )
Z η
∂f
∂h
∂f
∂f d f (x) =
(x),
(x),
(x) = (−h(ζ, ξ), h(ζ, η),
(ζ, t) dt) .
∂ξ
∂η
∂ζ
ξ ∂ζ
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
76
Auch dg(s) = (α′ (s), β′ (s), 1)T ist stetig, und die Kettenregel ergibt
I ′ (s) = d( f ◦ g)(s) = d f (g(s))dg(s) =


α′ (s)
 ′ 
∂h
∂s (s, t) dt 
 β (s)  =
1
Z
β(s)
∂h
h(s, β(s))β′ (s) − h(s, α(s))α′ (s) +
(s, t) dt .
α(s) ∂s
R β(s)
−h(s, α(s)) h(s, β(s)) α(s)
Siehe Fakta 10.1.9, 1.
10.1.24 Lemma. Sei D ⊆ Rn offen und f : D → X stetig differenzierbar. Sind mit x, y
auch alle Punkte auf ihrer Verbindungsgeraden in D, also tx + (1 − t)y ∈ D, t ∈ [0, 1],
so folgt
k f (x) − f (y)k ≤ max k d f tx + (1 − t)y k · kx − yk∞ .
t∈[0,1]
Beweis. Wegen der Stetigkeit von t 7→ tx + (1 − t)y ist das Bild der kompakten Menge [0, 1] ebenfalls kompakt. Somit hat die stetige Funktion z 7→ kd f (z)k darauf ein
Maximum.
Die Funktion g(t) := f x + t(y − x) ist nach Lemma 10.1.5 stetig differenzierbar
mit g′ (t) = d f x + t(y − x) (y − x). Nach dem Hauptsatz (9.16) gilt
Z 1
k f (y) − f (x)k = kg(1) − g(0)k = d f x + t(y − x) (y − x) dt ≤
0
sup k d f x + t(y − x) (y − x) k ≤ max k d f x + t(y − x) k · ky − xk∞ .
t∈[0,1]
t∈[0,1]
❑
Aus Lemma 10.1.24 folgt unmittelbar
10.1.25 Korollar. Gilt mit der Notation aus Lemma 10.1.24 die Ungleichung
kd f (x)k ≤ C für alle x ∈ M, wobei M ⊆ D konvex ist, so gilt
k f (x) − f (y)k ≤ Ckx − yk∞ , x, y ∈ M .
Insbesondere ist dann f auf M gleichmäßig stetig.
10.1.26 Bemerkung. Man kann auch Funktionen f : D → X betrachten, wo D offene
Teilmenge eines allgemeinen Banachraumes Y ist, und sich fragen, ob und in welcher
Hinsicht f differenzierbar ist.
Es stellt sich heraus, dass der Zugang aus Definition 10.1.13 der zweckmäßigste
ist. Man spricht dann von der sogenannten Fréchet-Differenzierbarkeit. Mit fast den
selben Beweisen wie hier angegeben bleiben alle Behauptungen ab Definition 10.1.13
bis zum Ende dieses Abschnitt richtig.
Eine Ausnahme stellt Satz 10.1.16 dar. Es gilt nur, dass aus der Differenzierbarkeit
folgt, dass alle Richtungsableitungen existieren. Die Umkehrung gilt nicht, da es in
dieser allgemeinen Situation kein Analogon zu Lemma 10.1.5 gibt.
10.2. HÖHERE ABLEITUNGEN
77
10.2 Höhere Ableitungen
Sei f definiert auf einer offenen Menge D ⊆ Rn mit Werten in einem Banachraum X
– man stelle sich für X z.B. wieder R vor –, und existiere für alle x ∈ D die partielle
∂f
∂f
Ableitung ∂x
(x). Dann ist ∂x
selbst eine Funktion
i
i
∂f
: D → X.
∂xi
Also macht es Sinn, von der Differenzierbarkeit dieser Funktion zu sprechen. Existiert
an einer Stelle x ∈ X die Ableitung
!
∂ ∂f
(x) ,
∂x j ∂xi
so spricht man von einer zweiten Ableitung von f oder von der Ableitung zweiter
2
f
Ordnung und schreibt kürzer ∂x∂j ∂x
, d.h. f wird zuerst nach xi differenziert und dann
i
nach x j . Höhere partielle Ableitungen definiert man induktiv fortfahrend:
Ist schon definiert, was partielle Ableitungen k-ter Ordnung sind, und ist
(i1 , i2 , . . . , ik+1 ) ein (k + 1)-Tupel von Indizes il ∈ {1, . . . , n}, so setzt man
!
∂k+1 f
∂
∂k f
(x) ,
(x) :=
∂xik+1 ∂xik · · · ∂xi1
∂xik+1 ∂xik · · · ∂xi1
falls diese Ableitungen existieren und sprechen von Ableitungen (k + 1)-ter Ordnung.
10.2.1 Definition. Sei f : D ⊆ Rn → X definiert auf der offenen Menge D und sei
k ∈ N. Wir sagen, f ist k-mal stetig differenzierbar auf D, und schreiben f ∈ C k oder
f ∈ C k (D), falls alle partiellen Ableitungen k-ter Ordnung von f auf ganz D existieren
und stetig sind.
Falls f ∈ C k (D) für alle k ∈ N, so schreibt man f ∈ C ∞ oder f ∈ C ∞ (D) für diesen
Sachverhalt.
10.2.2 Bemerkung. Bezeichnet man mit C(D) die Menge aller stetigen Funktionen auf
D, dann gilt
C(D) ⊇ C 1 (D) ⊇ . . . ⊇ C k (D) ⊇ C k+1 (D) ⊇ . . . .
Die erste Inklusion gilt wegen Korollar 10.1.14. Zu den anderen Inklusionen:
Ist f ∈ C k+1 (D), dann existieren alle partiellen Ableitungen (k + 1)-ter Ordnung.
Nach der induktiven Definition der (k + 1)-ten partiellen Ableitungen müssen auch alle
k
f
eine solche. Dann
partiellen Ableitungen k-ter Ordnung existieren. Sei g = ∂xi ∂···∂x
i
k
1
existieren alle partiellen Ableitungen von g und sind stetig, d.h. g ∈ C 1 . Wegen C 1 (D) ⊆
C(D) folgt, dass g selbst stetig ist; vgl. Korollar 10.1.14. Also gilt f ∈ C k (D).
10.2.3 Satz (Satz von Schwarz). Sei f ∈ C 2 (D), D ⊆ Rn , und seien i, j ∈ {1, . . . , n},
2
2
sodass ∂x∂i ∂xf j und ∂x∂j ∂xf j auf ganz D existieren und stetig sind. Dann gilt
∂2 f
∂2 f
=
.
∂xi ∂x j ∂x j ∂xi
Allgemeiner gilt für f ∈ C k (D), dass es bei der Bildung einer partiellen Ableitung
höchstens k-ter Ordnung nicht darauf ankommt, in welcher Reihenfolge differenziert
wird.
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
78
Beweis. Sei x ∈ D und δ > 0, so dass Uδ (x) ⊆ D, wobei wir Rn mit k.k∞ versehen. Nach
dem Hauptsatz der Differential- und Integralrechnung (siehe (9.16)) gilt für |ξ|, |η| < δ
Z ξ
∂f
f (x + ξei + ηe j ) − f (x + ηe j ) =
(x + ζei + ηe j ) dζ .
0 ∂xi
2
f
(x + ζei + ηe j ), und daher stetig in
Die Ableitung des Integranden nach η ist gerade ∂x∂j ∂x
i
ζ und η. Somit können wir (9.19) – siehe auch Korollar 8.7.12 – anwenden und erhalten
bei der Ableitung obiger Gleichung nach η
Z ξ 2
∂f
∂ f
∂f
(x + ξei + ηe j ) −
(x + ηe j ) =
(x + ζei + ηe j ) dζ .
∂x j
∂x j
∂x
j ∂xi
0
Leiten wir nun nach ξ ab, so folgt mit dem Hauptsatz
∂2 f
∂2 f
(x + ξei + ηe j ) =
(x + ξei + ηe j ) .
∂xi ∂x j
∂x j ∂xi
Die Behauptung für Funktionen f ∈ C k (D) folgt aus dem Bewiesenen leicht durch
vollständiger Induktion, wenn man sich vor Augen hält, dass sich jede Permutation als
Hintereinanderausführung von Transpositionen schreiben lässt.
❑
10.2.4 Bemerkung. Ist (i1 , i2 , . . . , ik ) ∈ {1, . . . , n}k ein k-Tupel, und bezeichnet α j (∈
N ∪ {0}) für j = 1, . . . , n die Anzahl der m ∈ {1, . . . , k} mit im = j, so gilt für ein
f ∈ C k (D) wegen Satz 10.2.3
∂k f
∂k f
(x) = α1
(x) ,
∂xik · · · ∂xi1
∂x1 · · · ∂xαn n
(10.7)
α
wobei ∂x j j für α j mal nach x j abgeleitet steht. Offenbar gilt k = α1 + · · · + αn .
Man überzeugt sich z.B. durch eine Induktion nach n davon, dass es dabei genau
k!
α1 ! · · · · · αn !
viele k-Tupel (i1 , i2 , . . . , ik ) gibt, die im obigen Sinne dasselbe n-Tupel (α1 , . . . , αn ) ∈
(N ∪ {0})n erzeugen. Für den Ausdruck in (10.7) schreibt man auch
D(α1 ,...,αn ) f (x) .
Die n-Tupelen (α1 , . . . , αn ) ∈ (N ∪ {0})n nennt man auch Multiindizes.
10.2.5 Beispiel. Wir betrachten abermals die Funktion T : D → R2 definiert durch
!
!
r
r cos t
T
=
.
t
r sin t
mit D = R+ × R ⊆ R2 . Um die höheren Ableitungen dieser speziellen Funktion zu
studieren, bietet es sich an, die Bildmenge R2 als C zu betrachten, da man dann
!
r
T
= r · exp(it)
t
10.2. HÖHERE ABLEITUNGEN
79
schreiben kann. Die höheren partiellen Ableitungen sind dann


!
π r cos t + l π2 
∂l
r
l
T
= r · i exp(it) = r · exp i(t + l ) 
,
2
∂tl t
r sin t + l π2 


!
cos t + l π2 
∂1+l
r
l
 ,
T
= i exp(it)  ∂r ∂tl t
sin t + l π2 
und
!
∂k+l
r
T
= 0, k ≥ 2 .
∂rk ∂tl t
Für f ∈ C 1 (D) haben wir die Ableitung d f : D → L(Rn , X) so definiert, dass
d f (x)v genau die Richtungsableitung von f in Richtung v ist. Siehe Lemma 10.1.5.
Ist nun f ∈ C k (D) und sind v1 = (µ1,1 . . . , µ1,n )T , . . . , vk = (µk,1 . . . , µk,n )T Richtungsvektoren, so erhält man mit Lemma 10.1.5
X
∂f
∂f
(x) =
(x) .
µ1,l
∂v1
∂xl
l=1
n
Wendet man Lemma 10.1.5 nochmals an, so folgt
n
n
n
X
X
X
∂ ∂f
∂2 f
∂ ∂
f (x) =
(x) =
(x) .
µ1,l
µ1,l1
µ2,l2
∂v2 ∂v1
∂v2 ∂xl
∂xl1 ∂xl2
l=1
l =1
l =1
1
2
Macht man das nun insgesamt k-mal, so sieht man, dass die k-malige Hintereinanderausführung der Richtungsableitungen nach v1 bis vk existiert und mit
n
X
∂
∂
∂k f
...
f (x) =
(x)
µ1,l1 · · · · · µk,lk
∂vk
∂v1
∂xl1 . . . ∂xlk
l ,...,l =1
1
(10.8)
k
übereinstimmt.
10.2.6 Definition. Für eine mindestens k-mal stetig differenzierbare Funktion f : D →
X mit einem offenen D ⊆ Rn und einem Banachraum X und für x ∈ D sowie v1 , . . . , vk ∈
Rn bezeichnen wir mit d k f (x)(v1 , . . . , vk ) den Ausdruck in (10.8).
10.2.7 Fakta.
1. Im Falle k = 1 stimmt dieser gerade mit der Ableitung d f (x)v1 überein.
2. Für allgemeines k ∈ N ist dk f (x)(v1 , . . . , vk ) linear in jedem Argument, d.h.
dk f (x)(v1 , . . . , αvl + βv′l , . . . , vk ) =
αdk f (x)(v1 , . . . , vl , . . . , vk ) + βd k f (x)(v1 , . . . , v′l , . . . , vk ) .
Außerdem ist dk f (x)(v1 , . . . , vk ) symmetrisch in v1 , . . . , vk , hängt daher nicht von
der Reihenfolge der Richtungsvektoren ab. Das folgt unmittelbar aus Satz 10.2.3
und (10.8).
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
80
3. Somit ist dk f (x) : Rk×n → X eine symmetrische, multilineare Abbildung, sodass
dk f (x)(v1 , . . . , vk ) gerade ∂v∂k . . . ∂v∂1 f (x) ist. Wir nennen sie die k-te Ableitung
von f an der Stelle x.
4. Im Fall n = 1, also D ⊆ R, gilt dk f (x)(v1 , . . . , vk ) = v1 · · · · · vk f (k) (x).
5. Für einen späteren Gebrauch stellen wir noch heraus, dass wenn y, v ∈ Rn mit
y + tv ∈ D, t ∈ [0, 1], die k-te Ableitung der Funktion6
φ(t) = f (y + tv), t ∈ [0, 1] ,
∂
∂
. . . ∂v
f (y + tv) = dk f (y + tv)(v, . . . , v) ist. Ordnen wir für
nichts anderes als ∂v
v = v1 = · · · = vk die Ableitungen ∂xl in (10.8) nach aufsteigendem l wie in
(10.7), so erhalten wir mit v = (µ1 , . . . , µn )T
φ(k) (t) = dk f (y + tv)(v, . . . , v) =
X
µα1 1 · · · · · µαn n
(α1 ,...,αn )∈(N∪{0})n
α1 +···+αn =k
∂k f
k!
(y + tv) .
α1 ! · · · · · αn ! ∂xα1 1 · · · ∂xαn n
(10.9)
10.2.8 Beispiel. Wir betrachten die Funktion T aus Beispiel 10.2.5. Die lineare Abbil
dung dT (r, t)T haben wir in (10.4) berechnet.
Für m ∈ N, m ≥ 2 folgt aus Beispiel 10.2.5 mit x1 = r, x2 = t, µ j,1 = ρ j , µ j,2 = τ j
!
!!
!
!
2
X
∂m T
ρ
r
r ρ1
=
,..., m =
µ1,l1 · · · · · µm,lm
dm T
t τ1
τm
∂xl1 . . . ∂xlk t
l1 ,...,lm =1
!
!
∂m
∂m
r
r
T
=
T
+
τ
·
·
·
·
·
τ
1
m m
t
∂t
∂r ∂tm−1 t




cos t + (m − 1) π2 
r cos t + m π2 
 + τ1 · · · · · τm 
 .
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm )  sin t + (m − 1) 2π 
r sin t + m π2 
(ρ1 τ2 . . . τm + · · · + τ1 . . . τm−1 ρm )
Man erkennt unmittelbar aus (10.4), dass diese Beziehung auch für m = 1 richtig ist.
Wir können nun die mehrdimensionale Taylorsche Formel herleiten.
10.2.9 Satz (Taylorsche Formel). Sei f : D (⊆ Rn ) → X und q ∈ N, sodass f ∈
C q+1 (D). Weiters sei y ∈ D fest und x ∈ D so, dass die gesamte Strecke von y bis x in D
liegt7 . Dann gilt
f (x) = f (y) +
q
X
1 l
d f (y)(x − y, . . . , x − y) + Rq (x) ,
|
{z
}
l!
l=1
l−mal
wobei sich das Restglied Rq schreiben lässt als
1
Rq (x) =
q!
Z1
0
6 An
(1 − t)q · dq+1 f (1 − t)y + tx (x − y, . . . , x − y) dt .
|
{z
}
den Randpunkten ist die Ableitung einseitig zu verstehen.
stimmt immer, wenn D konvex ist.
7 Das
(q+1)−mal
(10.10)
10.2. HÖHERE ABLEITUNGEN
81
Beweis. Wir entwickeln die Funktion (h = x − y)
φ(t) = f (y + th), t ∈ [0, 1]
nach Taylor, wie in (9.20). Also gilt
φ(1) = φ(0) +
q
X
φ(l) (0)
l=1
l!
+
Z1
(1 − t)q (q+1)
φ
(t) dt .
q!
0
Aus (10.9) wissen wir, dass φ(l) (t) = dl f (y + th)(h, . . . , h), woraus unmittelbar die
behauptete Entwicklung folgt.
❑
10.2.10 Bemerkung. Den Ausdruck
pq (x) = f (y) +
q
X
1 l
d f (y)(x − y, . . . , x − y)
|
{z
}
l!
l=1
l−mal
nennt man das q-te mehrdimensionale Taylorsche Polynom der Funktion f an der Anschlussstelle y. Mit (10.9) folgt die Darstellung
pq (x) =
X
(α1 ,...,αn )∈(N∪{0})n
α1 +···+αn ≤q
1
∂α1 +···+αn f
(y) ,
(x1 − y1 )α1 · · · · · (xn − yn )αn α1
α1 ! · · · · · αn !
∂x1 · · · ∂xαn n
wenn wir für α1 + · · · + αn = 0 den entsprechenden Summanden als f (y) interpretieren. Wir sehen insbesondere, dass pq (x) tatsächlich ein Polynom in den n Variablen
x1 , . . . , xn mit Werten in X vom Grad ≤ q ist; vgl. Beispiel 10.2.11.
10.2.11 Beispiel. Setzen wir für α ∈ (N ∪ {0})n und x = (x1 , . . . , xn )T ∈ Rn
|α| = α1 + · · · + αn , α! = α1 ! · · · · · αn !, xα = xα1 1 · · · · · xαn n ,
und sind cα für |α| ≤ m Koeffizienten aus einem Banachraum X, so heißt die Funktion
f : Rn → X
X
f (x) =
xα cα
α∈(N∪{0})n
|α|≤m
Polynom in den Variablen x1 , . . . , xn vom Grad ≤ m mit Werten in X.
Durch Ausmultiplizieren erkennt man leicht, dass für jedes feste y ∈ Rn mit f auch
x 7→ f (x − y) ein Polynom vom Grad ≤ m ist.
Ebenfalls unschwer überprüft man, dass für α, β ∈ (N ∪ {0})n mit β ≤ α, dh. β1 ≤
α1 , . . . , βn ≤ αn , 8
α!
∂|β|(x 7→ xα )
(y) =
yα−β ,
(10.11)
∂xβ
(α − β)!
gilt, wobei α − β ∈ (N ∪ {0})n komponentenweise berechnet wird. Falls β j > α j für
|β|
α
mindestens ein j ∈ {1, . . . , n}, so gilt ∂ (x7∂x→β x ) ≡ 0.
8 Hier
und im Rest des Beispiels ist
∂|β| f
∂xβ
eine Kurzschreibweise für
∂β1 +···+βn f
β
β
∂x11 ···∂xnn
.
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
82
Wenden wir für ein festes y ∈ Rn Satz 10.2.9 auf ein Polynom f vom Grad ≤ m und
q ≥ m an, so folgt
X
1 ∂|α| f
(y) ,
f (x) =
(x − y)α
α! ∂xα
α∈(N∪{0})n
|α|≤m
da
|α|
∂ f
∂xα
= 0 für |α| > m und damit insbesondere wegen
dq+1 f (1 −t)y+tx (x − y, . . . , x − y) =
|
{z
}
(q+1)−mal
X
(x−y)α
α∈(N∪{0})n
|α|=q+1
(q + 1)! ∂q+1 f
((1 −t)y+tx) = 0
α!
∂xα
auch das Restglied verschwindet.
|α|
Für y = 0 folgt aus (10.11), dass cα = α!1 ∂∂xαf (0), womit die Koeffizienten cα eindeutig durch die Funktionswerte von f auf jeder beliebig kleinen offenen Kugel um die
Null bestimmt sind.
10.2.12 Proposition. Mit der Notation aus Satz 10.2.9 gilt:
(i) Ist C ≥ 0 so, dass sich die partiellen Ableitungen q + 1-ter Ordnung abschätzen
lassen durch
∂q+1 f
(10.12)
(u) ≤ C ,
∂xl1 · · · ∂xlq+1
für alle l1 , . . . , lq+1 ∈ {1, . . . , n} und u auf der Strecke von y bis x, dann gilt
kRq (x)k ≤ C
nq+1
kx − ykq+1
∞ .
(q + 1)!
(ii) Ist D konvex und f sogar in C ∞ (D) und gilt (10.12) für alle q und alle u ∈ D, so
konvergiert die Reihe
f (y) +
∞
X
1 l
d f (y)(x − y, . . . , x − y)
|
{z
}
l!
l=1
l−mal
(gleichmäßig auf beschränkten Teilmengen von D) gegen f (x).
Beweis.
(i) Aus (10.12) folgt wegen (10.8) für u = (1 − t)y + tx und h = (h1 , . . . , hn )T ∈ Rn
n
X
∂q+1 f
q+1
q+1
(u) ≤ Cnq+1 khk∞ .
k d f (u)(h, . . . , h) k ≤
|hl1 | . . . |hlq+1 | · ∂xl1 . . . ∂xlq+1 l1 ,...,lq+1 =1
Für h = x − y folgt daraus mit (10.10)
1
kRq (x)k ≤
q!
Z1
0
(1 − t)q · kd f q+1 (1 − t)y + tx (x − y, . . . , x − y)k dt ≤
nq+1 q+1
khk∞
C
q!
Z1
0
(1 − t)q dt = C
nq+1
khkq+1
∞ .
(q + 1)!
10.3. EXTREMWERTE
83
q+1
n
(ii) Bei fest gewähltem y konvergiert (q+1)!
kx − ykq+1 und damit Rq (x) für jedes x
gegen 0. In der Tat geht diese Konvergenz für x in beschränkten Teilmengen von
D gleichmäßig von statten.
❑
10.2.13 Beispiel. Sei T : D → R2 wie in Beispiel 10.2.5, wobei aber jetzt D : (0, α)×R
für irgend ein festes α ∈ R+ , α > 1. Wendet man Satz 10.2.9 für den Punkt y = (r, t)T =
(1, 0) an, so erhalten wir mit x − y = (ρ, τ)T aus Beispiel 10.2.8
T (x) = T (y) +
q
X
1 l
d T (y)(x − y, . . . , x − y) + Rq (x) =
|
{z
}
l!
l=1
l−mal
!
!
!!
q
π
π
1 X1
l−1 cos(l − 1) 2
l cos l 2
=
+
lρτ
+τ
+ Rq (x) .
0
sin(l − 1) 2π
sin l π2
l!
(10.13)
l=1
In Beispiel 10.2.5 haben wir insbesondere gesehen, dass (10.12) für C = α und k.k =
k.k∞ erfüllt ist. Also konvergiert die entsprechende Reihe in (10.13) gegen T (x).
10.3 Extremwerte
Wir haben im ersten Semester in Definition 7.2.1 definiert, was es bedeutet, dass eine
reellwertige Funktion f : D → R – D ist Teilmenge eines metrischen Raumes – in
einem Punkt x ∈ D ein lokales Maximum (lokales Minimum) hat:
∃δ > 0 : ∀t ∈ Uδ (x) : f (t) ≤ (≥) f (x) .
Ist D offene Teilmenge von R, und ist f differenzierbar in einem lokalen Maximum
(Minimum) x, so haben wir in Satz 7.2.2 gesehen, dass dann f ′ (x) = 0. Wir wollen
diese Tatsache nun für auf D ⊆ Rn definierte Funktionen herleiten.
10.3.1 Satz. Sei x ein lokales Extremum, d.h. Maximum oder Minimum, von
f : D ⊆ Rn → R. Falls für v ∈ Rn die Richtungsableitung
f (x + tv) − f (x)
∂f
(x) = lim
,
t→0
∂v
t
bei x existiert, so ist diese gleich Null. Für f ∈ C 1 folgt d f (x) = 0.
Beweis. Sei v ∈ Rn ein beliebiger Vektor. Betrachte die Funktion φ(t) = f (x + tv). Da
D offen ist, ist φ in einer Umgebung von 0 definiert, und wegen unserer Voraussetzung
ist auch φ bei 0 differenzierbar und hat die Ableitung φ′ (0) = ∂∂vf (x). Da x ein relatives
Extremum von f ist, hat auch φ ein relatives Extremum bei 0. Somit gilt φ′ (0) = 0.
Für f ∈ C 1 ist d f (x) derart definiert, dass d f (x)v = ∂∂vf (x) für alle v ∈ Rn . Es folgt
also d f (x) = 0.
❑
1
Für f ∈ C (D) ist also d f (x) = 0 eine notwendige Bedingung für ein Extremum.
Punkte mit d f (x) = 0 heißen stationäre Punkte. Wie im eindimensionalen ist d f (x) = 0
aber nicht hinreichend. Um dieses Problem genauer studieren zu können, wollen wir
folgende Sprechweise einführen.
84
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
10.3.2 Definition. Sei D ⊆ Rn offen und liege f : D → R in C k (D). Für gerades k heißt
die k-te Ableitung dk f (x) : Rk×n → R von f im Punkt x positiv definit bzw. positiv
semidefinit, wenn d k f (x)(h, . . . , h) > 0 bzw. d k f (x)(h, . . . , h) ≥ 0 für alle 0 , h ∈ Rn .
Entsprechend definiert man negativ definit bzw. negativ semidefinit.
10.3.3 Bemerkung. Ist n = 1, d.h. f : D ⊆ R → R, so gilt ja d k f (x)(h, . . . , h) =
hk · f (k) (x), und man sieht, dass d k f (x) genau dann positiv definit (semidefinit) ist, wenn
f (k) (x) > (≥) 0. Entsprechendes gilt für den negativ definiten (semidefiniten) Fall.
10.3.4 Bemerkung. Der für die meisten Anwendungen relevante Fall ist k = 2. Hier
lassen sich die Definitheitseigenschaften von d2 f (x) mit Mitteln der Linearen Algebra
betrachten. In diesem Fall ist d2 f (x) : R2×n → R eine symmetrische Bilinearform:
d2 f (x)(u, v) =
n
X
ul1 vl2
l1 ,l2 =1
u1
...
 ∂2 f

(x)
 ∂x1 ∂x.1

..
un 

 ∂2 f
∂xn ∂x1 (x)
...
∂2 f
(x) =
∂xl1 ∂xl2
..
.
...
2

∂2 f
 v1 
∂x1 ∂xn (x)
  
∂2 f
∂xn ∂xn
  . 
  .  .
  . 
(x) vn
Diese symmetrische n × n-Matrix H f (x) = ∂x∂i ∂xf j (x) heißt auch Hesse-Matrix.
Aus der Linearen Algebra ist bekannt, dass die Bilinearform positiv definit (semidefinit) ist, wenn alle Eigenwerte λ1 , . . . , λn – diese sind nicht notwendigerweise
paarweise verschieden – von H f (x) größer (größer gleich) Null sind. Entsprechendes
gilt für den negativen Fall.
Weiters ist diese Bilinearform positiv definit genau dann, wenn alle Hauptminoren9
von H f (x) größer Null sind. Entsprechend ist sie genau dann negativ definit, wenn die
Hauptminoren nicht verschwinden und abwechselndes Vorzeichen beginnend mit −
haben.
Für den Beweis des folgenden Satzes benötigen wir ein Lemma.
10.3.5 Lemma. Für k, n ∈ N sei ω : Rk×n → R eine symmetrische, multilineare
Abbildung. Gilt ω(v, . . . , v) = 0 für alle v ∈ Rn , so verschwindet ω(v1 , . . . , vk ) für alle
v1 , . . . , vk ∈ Rn .
Beweis. Für k = 1 ist nichts zu beweisen. Für größere k’s zeigen wir die Aussage durch
vollständige Induktion nach k. Ist k = 2, so gilt für beliebige v, w ∈ Rn
0 = ω(v + w, v + w) = ω(v, v) + ω(v, w) + ω(w, v) + ω(w, w) = ω(v, w) + ω(w, v) .
Also gilt ω(v, w) = −ω(w, v) und wegen der Symmetrie auch ω(v, w) = ω(w, v) und
damit ω(v, w) = 0.
Ist k > 2, so seien wieder v, w ∈ Rn beliebig. Weiters sei λ ∈ R. Nun gilt wegen der
Symmetrie
ω(v + λw, . . . , v + λw) =
9 Hauptminoren einer quadratischen Matrix (µ )
i j i, j=1,...,n sind die Determinanten aller Untermatrizen
(µi j )i, j=1,...,k für k = 1, . . . , n.
10.3. EXTREMWERTE
ω(v, . . . , v) +
85
k−1
X
j=1
λj
!
k
ω(v, . . . , v, w, . . . , w) + λk ω(w, . . . , w) .
| {z } | {z }
j
j−mal
(k− j)−mal
Für feste v, w ∈ Rn und variablem λ steht links immer Null und rechts ein Polynom
in λ, dessen Koeffizienten somit alle verschwinden müssen. Für j = k − 1 gilt daher
insbesondere
ω(v, . . . , v , w) = 0 ,
| {z }
(k−1)−mal
n
und zwar für alle v, w ∈ R . Somit erfüllt für festes w ∈ Rn die offensichtlich symmetrische und multilineare Abbildung
(v1 , . . . , vk−1 ) 7→ ω(v1 , . . . , vk−1 , w)
die Voraussetzungen unseres Lemmas für k − 1 anstatt für k. Nach Induktionsvoraussetzung verschwindet diese multilineare Abbildung für alle v1 , . . . , vk−1 ∈ Rn . Da w
zwar fest, aber beliebig war, verschwindet auch ω.
❑
10.3.6 Satz. Für ein offenes D ⊆ Rn sei f : D → R, f ∈ C r (D) mit r ∈ N, und sei
x ∈ D mit d f (x) = 0, . . . , d q−1 f (x) = 0, d q f (x) , 0, wobei q ≤ r. Dann gilt
(i) Hat f ein lokales Maximum bei x, so ist q gerade und dq f (x) ist negativ semidefinit.
(ii) Ist q gerade und dq f (x) negativ definit, so hat f ein lokales Maximum bei x.
(iii) Hat f ein lokales Minimum bei x, so ist q gerade und dq f (x) ist positiv semidefinit.
(iv) Ist q gerade und dq f (x) positiv definit, so hat f ein lokales Minimum bei x.
Beweis.
(i) Sei x ein relatives Maximum von f . Dann existiert ein δ > 0, sodass
f (y) ≤ f (x) für alle y ∈ Uδ (x) .
Für ein v ∈ Rn \ {0} definieren wir φv (t) = f (x + tv), |t| <
δ
kvk ,
und sehen wie in
Satz 10.3.1, dass φv bei Null ein lokales Maximum hat. Außerdem ist φ(k)
v (0) =
(0) = 0.
d f k (x)(v, . . . , v), k = 1, . . . , q. Also φ′v (0) = · · · = φ(q−1)
v
Nach Voraussetzung ist dq f (x) , 0, und wegen Lemma 10.3.5 muss
dq f (x)(v, . . . , v) , 0 in zumindest eine Richtung v. Also folgt φ(q)
v (0) , 0. Wäre
q ungerade, so wäre nach Korollar 7.4.7 die Zahl 0 aber kein lokales Extremum
von φv .
(q)
Damit ist q gerade. Wäre nun dq f (x) nicht negativ semidefinit, d.h. φv (0) =
dq f (x)(v, . . . , v) > 0 in zumindest eine Richtung v, so folgt wieder aus Korollar
7.4.7, dass 0 ein lokales Minimum von φv ist. Somit ist 0 lokales Minimum und
lokales Maximum. Also muss φv auf einem hinreichend kleinen Intervall um 0
konstant sein, was aber φv(q) (0) = 0 implizieren würde.
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
86
(ii) Sei q gerade und d q f (x) negativ definit. Nun gibt es ein δ > 0, sodass dq f (w)
ebenfalls negativ definit ist für alle w ∈ Uδ (x).
Um das einzusehen, nehme man das Gegenteil an. Dann gibt es zu jedem m ∈ N
ein xm , kxm − xk∞ < m1 , sodass dq f (xm ) nicht negativ definit ist. Es gibt daher ein
0 , hm ∈ Rn mit dq f (xm )(hm , . . . , hm ) ≥ 0. Wegen
dq f (xm )
hm
hm 1
q
,...,
=
q d f (xm )(hm , . . . , hm ) ≥ 0
khm k∞
khm k∞
khm k∞
können wir annehmen, dass die hm immer khm k∞ = 1 erfüllen – also in der
abgeschlossenen und beschränkten Teilmenge
K1 (0) \ U1 (0) = {h : khk∞ = 1} ⊆ Rn
liegen. Da diese Menge nach Korollar 5.2.9 kompakt ist, gilt hm( j) → h, j → ∞,
für eine Teilfolge und für ein h ∈ K1 (0) \ U1 (0).
Somit konvergieren die Komponenten von hm( j) gegen die entsprechenden
k
f
Komponenten von h und alle partiellen Ableitungen ∂xl ∂...∂x
(xm( j) ) gegen
l
1
∂k f
∂xl1 ...∂xlk
q
k
(x). Wegen (10.8) konvergiert dann auch d q f (xm( j) )(hm( j) , . . . , hm( j) ) gegen d f (x)(h, . . . , h), und wir erhielten d q f (x)(h, . . . , h) ≥ 0 im Widerspruch zur
Voraussetzung.
Nach Satz 10.2.9 hat man für w ∈ Uδ (x)
f (w) = f (x) +
q−1
X
1 l
d f (x)(w − x, . . . , w − x) + Rq−1 (w) = f (x) + Rq−1 (w) ,
|
{z
}
l!
l=1
l−mal
1
Rq−1 (w) =
(q − 1)!
Z1
0
d f q ((1 − t)x + tw)(w − x, . . . , w − x)(1 − t)q−1 dt .
|
{z
}
q−mal
Wegen der Wahl von δ ist der Integrand aber < 0. Also gilt f (w) = f (x)+Rq (w) <
f (x) für w , x, und somit ist x ein lokales Maximum.
Die Aussagen (iii) und (iv) zeigt man genauso wie (i) und (ii).
❑
Sucht man ein lokales Extremum einer überall differenzierbaren Funktion, so
braucht man nur unter jenen Punkten x mit d f (x) = 0 zu suchen. In der Praxis wird
man die Gleichung d f (x) = 0 aber meistens nicht explizit nach x auflösen können.
10.3.7 Bemerkung. Ob ein lokales Maximum (Minimum) einer Funktion f : D → R
mit offenem D ⊆ Rn ein globales Maximum (Minimum) ist, ist im Allgemeinen
nicht leicht zu beantworten. Zum Beispiel hat g : R2 → R, g(ξ, η)T = (ξ2 +
η2 )2 − 2(ξ2 + η2 ), bei (0, 0)T ein lokales Maximum aber kein globales Maximum, da
limk(ξ,η)T k→+∞ g(ξ, η)T = +∞.
Ist aber f stetig fortsetzbar auf den Abschluss c(D) von D und ist D beschränkt,
so muss wegen daraus resultierenden Kompaktheit von c(D) die Funktion f auf c(D)
mindestens ein globales Maximum (Minimum) y haben. Diese Maximum (Minimum)
kann nun in D oder im Rand c(D) \ D liegen. Im ersten Fall ist dann y klarerweise auch
10.3. EXTREMWERTE
87
Maximum (Minimum) von f |D und somit eine Lösung der Gleichung d f (x) = 0. Im
zweiten Fall ist y ein globales Maximum (Minimum) von f |c(D)\D .
Um also von einer gegebenen Funktion f : c(D) → R mit beschränktem und offenem D die globalen Maxima (Minima) auf c(D) zu suchen, sind zunächst alle Lösungen
der Gleichung d f (x) = 0 auf D zu suchen. Dann sucht man alle Maxima (Minima) von
f |c(D)\D auf dem Rand c(D) \ D und vergleicht schließlich die Funktionswerte an allen
erhaltenen Punkten von c(D).
10.3.8 Beispiel. Wir betrachten die Funktion
(
R2 → R
f :
.
(ξ1 , ξ2 )T 7→ 1 − ξ12 − ξ22
Der Graph dieser Funktion, daher alle Punkte (ξ1 , ξ2 , ξ3 )T ∈ R3 mit ξ3 = f (ξ1 , ξ2 )T , ist
ein Paraboloid.
ξ3
ξ2
ξ1
Abbildung 10.2: Graph der Funktion ξ3 = f
ξ 1
ξ2
für ξ12 + ξ22 ≤ 1
Die Ableitung von f berechnet sich als
d f (x) =
∂f
∂x1
(x),
∂f
(x) = (−2ξ1 , −2ξ2 ) .
∂x2
Schreibt man y ∈ R2 in Koordinaten (η1 , η2 )T bezüglich der kanonischen Basis,
so ergibt sich
d f (x)y = −2ξ1 η1 − 2ξ2 η2 .
Der einzige Punkt x mit d f (x) = (0, 0) ist offenbar x = (0, 0)T . Die zweiten
partiellen Ableitungen von f sind
∂2 f
∂2 f
∂2 f
∂2 f
=
= 0,
= −2,
= −2 .
2
∂x1 ∂x2 ∂x2 ∂x1
∂x1
∂x22
Die zweite Ableitung ist daher gleich
d2 f (x)(h, h) = −2h21 − 2h22 ,
und sie ist offenbar stets < 0, also negativ definit. Insbesondere ist (0, 0)T ein
lokales Maximum. Ist 0 nun auch ein globales Maximum? Das Bild, das man
von der Fläche hat, legt das sicherlich nahe. Aber wie lässt sich das zeigen?
88
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
Eine Möglichkeit ist, festzustellen, dass für (ξ1 , ξ2 )T , (0, 0)T sicherlich
f (ξ1 , ξ2 )T = 1 − (ξ12 + ξ22 ) < 1 = f (0, 0)T .
Man kann auch nach einem (globalen, lokalen) Minimum von f fragen. Ein
globales Minimum gibt es offensichtlich nicht, da z.B. für festes ξ2 und für
|ξ1 | → +∞ der Ausdruck f (ξ1 , ξ2 )T nach −∞ strebt.
Man kann aber z.B. fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 < 1}
ein lokales oder globales Minimum y = (η1 , η2 )T hat. Das ist aber auch nicht der
Fall, denn dann wäre dort d f (y) = 0, was aber nur für y = 0 der Fall ist.
Nun kann man z.B. auch fragen, ob f |D mit D = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 ≤
1} ein Minimum y = (η1 , η2 )T hat. Man beachte, dass man hier nicht unmittelbar
die Resultate dieses Abschnittes anwenden kann, da ja D nicht offen ist. In der
Tat ist D kompakt, und somit muss f auf D mindestens ein Minimum haben.
Ein solches kann aber nicht in D liegen, da es dann ein Minimum von f |D wäre,
von dem wir ja wissen, dass es diese nicht gibt.
Also muss y ∈ D \ D = T = {(ξ1 , ξ2 )T ∈ R2 : k(ξ1 , ξ2 )T k2 = 1}. Aber f ist auf T
konstant. Also sind alle y ∈ T Minima von f |D .
Wollen wir die Extrema von f auf dem abgeschlossenen Dreieck ∆ mit den Eckpunkten (0, 1)T , (2, 0)T , (2, 2)T finden, so gehen wir folgendermaßen vor.
Zunächst existieren zumindest ein Minimum und zumindest ein Maximum von
f auf ∆, da f stetig und ∆ abgeschlossen, beschränkt und somit kompakt ist.
Das Innere ∆o von ∆ ist eine offene Teilmenge von R2 , welche (0, 0)T nicht
enthält. Also kann ein Extremum von f nicht in ∆o liegen, da d f dort verschwinden müsste. Wir haben aber schon gesehen, dass (0, 0)T der einzige Punkt ist, wo
d f verschwindet.
Also müssen die Extrema am Rand ∂∆, dh. in der Vereinigung der drei Seiten
!
!
!
2α
2α
2
a={
: α ∈ [0, 1] }, b = {
: α ∈ [0, 1] }, c = {
: α ∈ [0, 1] } ,
1−α
1+α
2α
suchen. Die Extrema von f auf a, b und c sind aber die Extrema von
!
2α
fa (α) = f
= 1 − 4α2 − 1 + 2α − α2 = −5α2 + 2α,
1−α
!
2α
fb (α) = f
= 1 − 4α2 − 1 − 2α − α2 = −5α2 − 2α, bzw.
1+α
!
2
fc (α) = f
= 1 − 4 − 4α2 = −3 − 4α2 ,
2α
jeweils auf [0, 1].
Für fa gilt fa′ (α) = −10α + 2 und fa′′ (α) = −10. Also ist α = 51 ein lokales
Maximum mit fa ( 51 ) = 51 . Für die Randpunkte von [0, 1] gilt fa (0) = 0, fa (1) =
−3. Insgesamt hat fa auf [0, 1] ein Maximum bei α = 15 und ein Minimum bei
α = 1.
Die Funktion fb ist auf [0, 1] offensichtlich monoton fallend. Also ist α = 0 ein
Maximum mit fb (0) = 0 und α = 1 ein Minimum mit fb (1) = −7.
10.4. ÜBUNGSBEISPIELE
89
Die Funktion fc ist auf [0, 1] auch monoton fallend. Also ist α = 0 ein Maximum
mit fc (0) = −3 und α = 1 ein Minimum mit fc (1) = −7.
Somit hat f auf ∂∆ das Minimum bei (2, 2)T mit Wert f (2, 2)T = −7 und das
2 Maximum bei 1−5 2 mit Wert 15 .
5
10.4 Übungsbeispiele
10.1 Man betrachte die Funktion f : R2 → R2 , f (ξ, η)T = (ξ 2 η sin ξη, ξ2 +ηξ2 +1 )T . Berechne
alle partielle Ableitungen sowie d f (x), x = (ξ, η)T ∈ R2 . Schließlich berechne man die
Richtungsableitung ∂∂vf (x) für v = (1, 1)T und (1, −1)T .
10.2 Sei A ∈ Rn×n symmetrisch, dh. AT = A, und betrachte die Abbildung f (x) = xT Ax von
Rn nach R. Man zeige, dass d f (x) = 2(Ax)T , und berechne die Richtungsableitung entlang
von v = x.
10.3 Sei p ∈ N, p ≥ 2 und f : R p \ {0} → R definiert durch f (x) = ln kxk2 im Falle p = 2 und
1
1
T
f (x) =
p−2 wenn p > 2. Man zeige, dass grad f (x) = (d f (x)) = kxk p x.
(2−p)kxk2
2
10.4 Man betrachte die Funktion f aus Beispiel 6.1.11 und zeige, dass in (0, 0)T alle partiellen
Ableitungen existieren, sie aber in (0, 0)T nicht differenzierbar ist. Berechnen Sie von f
auch alle höheren Ableitungen zweiter Ordnung an allen Punkten der Ebene , (0, 0)T .
10.5 Man betrachte die Funktion g : R2 \ {(x, 0) : x ≤ 0} → R+ × (−π, π),
p
!
ξ 2 + η2
g(ξ, η)T =
,
arg(ξ + iη)
p
wobei das Argument arg(ξ + iη) ∈ (−π, π) so definiert ist, dass f ( ξ 2 + η2 , arg(ξ + iη))T =
(ξ, η)T , wobei f (r, φ)T = (r cos φ, r sin φ)T .
Berechne alle partiellen Ableitungen sowie dg(x) und det dg(x), x ∈ R2 .
Hinweis: Stellen Sie arg(x + iy) mit Hilfe des Arcustangens bzw. Arcuscotangens quadrantenweise dar!
R α2
10.6 Berechnen Sie I ′ (α), wobei I : R → R gegeben ist durch I(α) = − exp(α) cos(αt2 ) dt.
10.7 Sei h : (− π2 , π2 ) → R definiert durch h(t) = (cos t)sin t man berechne h′ auf 2 Arten. Zuerst
direkt und dann mittels Anwendung der Kettenregel auf f (t) = (cos t, sin t) und g(ξ, η)T =
ξ η . Man gebe auch geeignete offene Definitionsbereiche von f und g an!
10.8 Funktionen f : D → C R2 , D ⊆ C R2 , die stetig differenzierbar sind, und die
zusätzlich die sogenannten Cauchy-Riemannschen Differentialgleichungen
∂u
∂v
∂u
∂v
(x, y) =
(x, y),
(x, y) = − (x, y) ,
∂x
∂y
∂y
∂x
wobei u(x, y) = Re f (x + iy) und v(x, y) = Im f (x + iy), erfüllen, nennt man holomorph.
Man zeige, dass z 7→ exp(z), z 7→ z holomorph auf D = C und z 7→ 1z holomorph auf
D = C\{0} sind, indem man die Cauchy-Riemannschen Differentialgleichungen nachprüft!
10.9 Man betrachte die Funktion f (x, y)T = x3 − 2x2 y2 + 4xy3 + y4 + 10. Berechne alle partiellen
k+l
Ableitungen ∂x∂k ∂yl f (x, y) mit k, l = 1, 2, sowie dm f (x, y)T (v1 , . . . , vm ) für m = 1, 2. Schließlich berechne man das Taylorsche Polynom (in x, y) ohne Restglied mit q = 2 gemäß Satz
10.2.9.
10.10 Man berechne alle partiellen Ableitungen 1., 2. und 3. Grades von f (x, y, z) = sin(3x +
yz), sowie dm f (x, y, z)(v1 , . . . , vm ) für m = 1, 2. Schließlich berechne man das Taylorsche
Polynom (in x, y, z) ohne Restglied mit q = 3 gemäß Satz 10.2.9.
90
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
10.11 Sei p ∈ N, p ≥ 2 und f : R p \ {0} → R definiert durch f (x) = ln kxk2 im Falle p = 2 und
1
f (x) =
p−2 wenn p > 2.
(2−p)kxk2
Man zeige, dass f harmonisch ist! Weiters zeige man, dass für ein festes x0 ∈ R p auch
x 7→ f (x − x0 ), x ∈ R p \ {x0 } harmonisch ist.
Dabei heißt eine zweimal stetig differenzierbare Funktion h : B → X harmonisch, wenn
∆h(x) :=
∂2
∂2
h(x) + · · · +
h(x) = 0
∂x1 ∂x1
∂xm ∂xm
für alle x ∈ B. Hier ist X ein Banachraum und B ⊆ Rm offen.
10.12 Bestimmen Sie für
f (x, y)T = xe
√
y
die Ableitung in Richtung des Vektors v = (cos ϕ, sin ϕ)T . Für welchen Winkel ϕ wird
∂ f (2,3)T
maximal? Bestimmen Sie ebenfalls die Ableitung entlang der Parabel p(t) :=
∂v
(x(t), y(t))T = (t, t2 )T , dh. die Richtungsableitung von f in Richtung p′ (t) im Punkt p(t).
10.13 Sei h : (− 2π , π2 ) → R definiert durch h(t) = (cos t)sin t man berechne h′ auf 2 Arten. Zuerst
direkt und dann mittels Anwendung der Kettenregel auf f (t) = (cos t, sin t)T und g(ξ, η)T =
ξ η . Man gebe auch geeignete offene Definitionsbereiche von f und g an!
10.14 Lineare Regression: Seien (xi , yi ) ∈ R2 , i = 1, . . . , n endlich viele, fest vorgegebene Messdaten, wobei zumindest zwei verschiedene xi auftreten. Man bestimme eine linear Funktion
f (x) = kx + d so, dass der quadratische Abstand
n
X
( f (xi ) − yi )2
i=1
P
minimal wird! Man betrachte also F(k, d) = ni=1 ( f (xi ) − yi )2 als Funktion von (k, d) und
finden Sie die Kandidaten für lokale Extrema!
Begründen Sie auch, warum der erhaltene Kandidat Tatsächlich ein Minimum ist, indem
Sie u.a. limk(k,d)T k→+∞ F(k, d) = +∞ zeigen.
p
√
Hinweis zum letzten Teil: Zunächst ist F(k, d) ≥ (kx1 + d + y1 )2 + (kx2 + d + y2 )2 .
Zeigen Sie nun, dass k((kx1 + d + y1 ), (kx2 + d + y2 ))T k2 ≥ k(kx1 + d, kx2 + d)T!k2 − k(y1 , y2 )T k2
x 1
.
und dann kA−1 k · k((kx1 + d), (kx2 + d))T k2 ≥ k(k, d)T k2 , wobei A = 1
x2 1
10.15 Sei D ⊆ Rn offen und beschränkt. c(D) sei der Abschluss von D in Rn . Weiters sei f :
c(D) → R stetig und so, dass f |D : D → R aus C 2 ist mit ∆ f (x) ≥ 0 für alle x ∈ D, wobei
∆ f (x) :=
∂2
∂2
f (x) + · · · +
f (x) .
∂x1 ∂x1
∂xn ∂xn
Zeigen Sie, dass f : c(D) → R in c(D) und f |c(D)\D : c(D) \ D → R in c(D) \ D jeweils
mindestens eine Maximalstelle haben und dass maxt∈c(D) f (t) = maxt∈c(D)\D f (t).
Hinweis: Angenommen x0 ∈ D wäre Maximalstelle mit f (x0 ) > maxt∈c(D)\D f (t) =: η.
OBdA. sei f (x0 ) > 0 > η angenommen. Betrachte eine Maximalstelle von g(x) = f (x) +
c(kx − x0 k22 − d) für x ∈ c(D) mit geeignet gewählten c, d > 0, sodass kx − x0 k22 − d < 0 für
x ∈ c(D) \ D und sodass g(x0 ) > 0! Warum geht das? Wo können die Maximalstellen x1
von g nur liegen und was gilt für ∆g(x1 )?
10.16 Wo besitzt f : R2 → R ein globales bzw. lokales Extremum, wobei
f (x, y) = x3 ex−y .
10.17 Wo besitzt f : [0, 1] × [0, 1] → R ein globales Extremum, wobei
f (x, y)T = 3x2 − 2(y + 1)x + 3y − 1 .
Hinweis: Kandidaten für Extrema in (0, 1) × (0, 1) erfüllen d f (x, y) = 0. Kandidaten in
(0, 1) × {0} erfüllen ∂∂xf (x, 0) = 0 usw. .
10.4. ÜBUNGSBEISPIELE
91
10.18 Wie im letzten Beispiel, aber für f : {(x, y)T ∈ R2 : x2 + y2 ≤ 1} → R
f (x, y)T = 8x2 − 2yx + 3y − 1 .
10.19 Bestimmen Sie für die Funktion
f (z) = z(z − 2) − 2 Re z ,
z = x + iy ∈ C ,
alle lokalen Extrema der Funktion | f (z)| sowie deren Typ, dh. Maximum, Minimum.
10.20 Bestimmen Sie alle (lokalen) Extrema der Funktionen f, g : R2 → R. Sind diese (lokale)
Minima bzw. Maxima?
2 −y2
f (x, y) = (x2 + y2 )ex
, g(x, y) = (y2 − x2 )(y2 − 2x2 ) .
10.21 Sei K = {(cos t, sin t)T ∈ R2 : t ∈ R} und A = {(ξ, η)T : 2ξ + 3η = 10}. Man zeige,
dass K kompakt und A abgeschlossen ist. Weiters bestimme man x ∈ K, y ∈ A so, dass
d(x, y) = d(A, K); vgl. Übungsbeispiel 5.19. Schließlich zeige man, dass x normal auf die
Gerade A steht.
92
KAPITEL 10. ABLEITUNGEN NACH MEHREREN VARIABLEN
Kapitel 11
Wegintegrale
11.1 Wege
Wege im Rn sind der Anschauung nach etwas eindimensionales.
11.1.1 Definition.
Ein Weg γ im Rn ist eine Abbildung von einem Intervall [a, b] nach Rn . Ist γ
stetig, so sprechen wir von einem stetigen Weg.
Dabei heißen zwei Wege γ : [a, b] → Rn und γ̃ : [ã, b̃] → Rn äquivalent, falls
sie Umparametrisierungen voneinander sind, d.h. falls es eine streng monoton
wachsende Bijektion α : [a, b] → [ã, b̃] gibt, sodass γ̃ ◦ α = γ.1 Wir schreiben
auch γ ∼ γ̃ dafür.
Ist γ ein Weg, so sei
γ− : [a, b] → Rn der Weg [a, b] → Rn , t 7→ γ(a + b − t), also der in der
Gegenrichtung durchlaufene Weg.
Sind γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei (stetige) Wege mit b1 = a2 und
γ1 (b1 ) = γ2 (a2 ), so sei γ1 ⊕ γ2 : [a1 , b2 ] → Rn die (stetige) Funktion mit
(γ1 ⊕ γ2 )|[a1 ,b1 ] = γ1 , (γ1 ⊕ γ2 )|[a2 ,b2 ] = γ2 .
−−−−
Sind x0 , . . . , xm Punkte aus Rn , so bezeichnet −
x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
x→
m den stetigen
n
Weg γ : [0, m] → R definiert durch γ(t) = x j−1 + (t − ( j − 1))(x j − x j−1 ), wenn
t ∈ [ j − 1, j], j = 1, . . . , m. Solche Wege nennt man Polygonzüge.
Im Fall m = 1 nennt man γ(t) = tx1 + (1 − t)x0 die gerade Strecke von x0 nach
x1 und schreibt auch −
x−0−→
x1 dafür.
11.1.2 Beispiel. Sind x0 , . . . , xm Punkte aus Rn , und definiert man die Wege x]
j−1 x j :
[ j−1, j] → Rn , j = 1, . . . , m, durch x]
j−1 x j (t) := x j−1 +(t−( j−1))(x j −x j−1 ), t ∈ [ j−1, j],
−−−−−
→
so sind offenbar x]
j−1 x j und x j−1 x j äquivalent, und
−−−−
xg
]xm = −
x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
x→
0 x1 ⊕ · · · ⊕ xm−1
m.
1 Wegen Korollar 6.5.3 ist eine solche Bijektion α stetig. Umgekehrt ist eine stetige Bijektion α : [a, b] →
[ã, b̃] entweder streng monoton wachsend oder streng monoton fallend, vgl. Lemma 6.5.5.
93
KAPITEL 11. WEGINTEGRALE
94
11.1.3 Fakta.
1. Da mit α auch α−1 eine streng monoton wachsende Bijektion ist, ist ∼ eine Äquivalenzrelation. Man sieht auch unmittelbar, dass γ ∼ γ′ ⇔ γ− ∼ γ′ −.
2. Ist γ : [a, b] → Rn ein Weg und ist α(t) = a + t(b − a), so ist γ äquivalent zu
γ ◦ α : [0, 1] → Rn , also äquivalent zu einem Weg mit Parametermenge [0, 1].
3. Das Bild eines stetigen Weges ist als stetiges Bild einer kompakten und zusammenhängenden Menge wieder kompakt und zusammenhängend, siehe Proposition 6.1.13 und Proposition 6.2.4.
4. Man könnte glauben, dass das Bild eines stetigen Weges den Weg schon bestimmt. Das ist aber nicht der Fall, wenn man nur an ein Geradenstück denkt,
das man zuerst in die Hin- und dann in die Rückrichtung durchläuft.
5. Das Bild eines stetigen Weges kann auch ganz unerwartet aussehen. Man kann
z.B. einen Weg in R2 konstruieren, der [0, 1] × [0, 1] als Bild hat.
Um einem Weg eine Länge ℓ(γ) zuzuordnen, liegt es nahe, das zuerst bei den ein−
fachsten Arten von Wegen, nämlich den geraden Strecken γ = →
xy mit x, y ∈ Rn zu
tun:
ℓ(γ) := kx − yk2 .
Die Länge eines beliebigen Weges γ : [a, b] → Rn approximiert man dadurch, dass
man eine beliebige Zerlegung Z = {ξ j : j = 0, . . . , n(Z)} von [a, b] wie in Definition
8.1.2 nimmt und die Länge des dazugehörigen Polygonzugs
−−−−−−−−→
−−−−−−−−−−−−−−−→
γ(ξ0 )γ(ξ1 ), . . . , γ(ξn(Z)−1 )γ(ξn(Z) )
(11.1)
nämlich
L(Z) :=
n(Z)
X
j=1
kγ(ξ j ) − γ(ξ j−1 )k2
berechnet. Die Länge ist dann das Supremum von L(Z) über die Menge Z aller
Zerlegungen Z von [a, b]:
ℓ(γ) := sup L(Z) .
(11.2)
Z∈Z
Der Fall ℓ(γ) = +∞ kann dabei auftreten. Ist jedoch ℓ(γ) < +∞, so spricht man von
einem rektifizierbaren Weg.
11.1.4 Fakta.
1. Ist γ : [0, 1] → Rn , γ(t) = tx1 + (1 − t)x0 eine gerade Strecke, so gilt für eine
beliebige Zerlegung Z
L(Z) =
n(Z)
X
j=1
k(ξ j − ξ j−1 )(x1 − x0 )k2 = kx − yk2 .
Also ist unser Zugang zur Weglänge in sich konsistent.
11.1. WEGE
a = ξ0 ξ1
95
ξ2
ξ3 ξ4 ξ5
ξ6
ξ7 = b
:Z
γ(ξ7 )
γ
γ(ξ1 )
γ(ξ0 )
γ(ξ6 )
γ(ξ2 )
γ(ξ3 )
γ(ξ4 )
γ(ξ5 )
γ([a, b])
Abbildung 11.1: Polygonzüge zur Approximation der Weglänge
2. Da Z bezüglich ⊆ eine gerichtete Menge ist, und da wegen der Dreiecksungleichung, kγ(w) − γ(u)k2 ≤ kγ(w) − γ(v)k2 + kγ(v) − γ(u)k2, aus Z1 ⊆ Z2 folgt, dass
L(Z1 ) ≤ L(Z2 ), kann man ℓ(γ) als Limes eines monoton wachsenden Netzes
über (Z, ⊆) schreiben.
3. Ist γ nicht konstant, also ∃ t1 , t2 : γ(t1 ) , γ(t2 ), so folgt
L({a, b, t1 , t2 }) ≥ kγ(t1 ) − γ(t2 )k2 > 0, und damit ℓ(γ) > 0. Ist dagegen γ konstant,
so folgt sofort aus der Definition ℓ(γ) = 0. In jedem Fall gilt
ℓ(γ) ≥ L({a, b}) = kγ(b) − γ(a)k2
4. Da sich die Zerlegungen der Definitionsbereiche von äquivalenten Wegen bijektiv entsprechen, überzeugt man sich leicht, dass äquivalente Wege die selbe
Länge haben. Genauso leicht sieht man ℓ(γ) = ℓ(−γ).
5. Aus der Monotonie (vgl. 2) folgt für ein endliches A ⊆ [a, b] unmittelbar, dass
auch
ℓ(γ) = sup L(Z) .
Z∈Z, Z⊇A
Da ZA := {Z ∈ Z : Z ⊇ A} mit ⊆ zu einer gerichteten Menge wird, und da L(Z)
monoton von Z abhängt, gilt wegen (5.10) und Bemerkung 5.3.9 auch
ℓ(γ) = lim L(Z) .
Z∈ZA
6. Seien γ1 : [a1 , b1 ] → Rn , γ2 : [a2 , b2 ] → Rn zwei Wege mit b1 = a2 und
γ1 (b1 ) = γ2 (a2 ), sodass γ1 ⊕ γ2 : [a1 , b2 ] → Rn definiert ist. Weiters seien Z1 , Z2
bzw. Z die Menge aller Zerlegungen von [a1 , b1 ], [a2 , b2 ] bzw. [a1 , b2 ].
Für A = {a2 } und Z ∈ ZA gilt offenbar Z ∩ [a1 , b1 ] ∈ Z1 und Z ∩ [a2 , b2 ] ∈ Z2 ,
wobei
L(γ1 ⊕ γ2 , Z) = L(γ1 , Z ∩ [a1 , b1 ]) + L(γ2 , Z ∩ [a2 , b2 ]) .
KAPITEL 11. WEGINTEGRALE
96
Wegen Z j = {Z ∩ [a j , b j ] : Z ∈ ZA } gilt für j = 1, 2 auch
ℓ(γ j ) = sup L(γ j , Z ∩ [a j , b j ]) = lim L(γ j , Z ∩ [a j , b j ]) ,
Z∈ZA
Z∈ZA
womit (siehe 5)
ℓ(γ1 ⊕ γ2 ) = lim L(γ1 ⊕ γ2 , Z) =
Z∈ZA
lim L(γ1 , Z ∩ [a1 , b1 ]) + lim L(γ2 , Z ∩ [a2 , b2 ]) = ℓ(γ1 ) + ℓ(γ2 )
Z∈ZA
Z∈ZA
in dem Sinn, dass die linke Seite genau dann endlich ist, wenn die rechte Seite
endlich ist, dh. wenn ℓ(γ1 ) < +∞ und ℓ(γ2 ) < +∞.
7. Sei Z eine Zerlegung von [a, b], und betrachte den in (11.1) erwähnten Polygonzug p : [0, n(Z)] → Rn ,
p(t) = γ(ξ j−1 ) +
t − ξ j−1
γ(ξ j ) − γ(ξ j−1 ) , t ∈ [ξ j−1 , ξ j ] .
ξ j − ξ j−1
(11.3)
Da dieser Weg eine Zusammensetzung von geraden Strecken – genauer eine Zusammensetzung von zu geraden Strecken äquivalenten Wegen – ist, folgt aus
dem letzten Punkt, dass ℓ(p) = L(Z).
Obwohl sich ℓ(γ) für ein Funktion γ : [a, b] → R, also im Fall n = 1, nur schwer
als Weglänge interpretieren lässt, ist dieser Fall doch von Bedeutung. In der Tat sagt
man, dass γ : [a, b] → R von beschränkter Variation ist, wenn ℓ(γ) < +∞, und nennt
dann ℓ(γ) die Variation der Funktion γ.
11.1.5 Lemma. Ist γ : [a, b] → Rn ein rektifizierbarer Weg, so ist die Funktion ℓ(x) :=
ℓ(γ|[a,x] ), x ∈ [a, b] monoton wachsend. Ist γ bei x rechtsstetig (linksstetig, stetig), so
ist auch ℓ dort rechtsstetig (linksstetig, stetig)2 .
Beweis. x 7→ ℓ(γ|[a,x] ) ist offensichtlich monoton wachsend; vgl. Fakta 11.1.4, 6. Sei
γ in einem Punkt x ∈ [a, b) rechtsstetig. Somit gibt es zu gegebenem ǫ > 0 ein δ > 0,
sodass kγ(x) − γ(s)k2 < ǫ für alle s ∈ [x, x + δ].
Wegen ℓ(γ|[x,b] ) ≤ ℓ(γ) < +∞ gibt es zu gegebenem ǫ > 0 eine Zerlegung Z0 von
[x, b], sodass
ℓ(γ|[x,b] ) − ǫ < L(γ|[x,b] , Z0 ) ≤ ℓ(γ|[x,b] ) .
Da die L(Z) monoton von Z abhängen, können wir Z0 so wählen, dass die erste Stützstelle ξ rechts von x einen Abstand kleiner oder gleich δ hat.
Offenbar ist Z0 ∩ [ξ, b] eine Zerlegung von [ξ, b], wobei L(γ|[ξ,b] , Z0 ∩ [ξ, b]) =
L(γ|[x,b] , Z0 ) − kγ(ξ) − γ(x)k2 . Also gilt
L(γ|[x,b] , Z0 ) − kγ(ξ) − γ(x)k2 ≤ ℓ(γ|[ξ,b] )
und daher
ℓ(γ|[x,ξ] ) ≤ ℓ(γ|[x,ξ] ) + ℓ(γ|[ξ,b] ) − (L(γ|[x,b] , Z0 ) − kγ(ξ) − γ(x)k2 ) =
kγ(ξ) − γ(x)k2 + ℓ(γ|[x,b] ) − L(γ|[x,b] , Z0 ) < 2ǫ .
2 Rechtsstetig
bedeutet lim s→x+ ℓ(s) = ℓ(x) und linksstetig lim s→x− ℓ(s) = ℓ(x)
11.1. WEGE
97
Also ist ℓ(γ|[x,ξ] ) < 2ǫ. Wegen der Monotonie gilt auch ℓ(γ|[a,s] ) − ℓ(γ|[a,x] ) = ℓ(γ|[x,s] ) ≤
ℓ(γ|[x,ξ] ) < 2ǫ, wenn s ∈ [x, ξ].
Die Linksstetigkeit zeigt man analog.
❑
Konkret ausrechnen lässt sich die Weglänge für stetig differenzierbare Wege.
11.1.6 Satz. Falls γ ∈ C 1 [a, b], so ist γ rektifizierbar, und ℓ(x) ist differenzierbar mit
der Ableitung kγ′ (x)k2 . Dabei gilt
Z b
kγ′ (x)k2 dx .
ℓ(γ) =
a
Beweis. Wegen dem Hauptsatz der Differential- und Integralrechnung sowie (9.13) gilt
Z ξ
Z ξj
j ′
kγ(ξ j ) − γ(ξ j−1 )k2 = kγ′ (t)k2 dt .
γ (t) dt ≤
ξ j−1
ξ
j−1
2
Rb
′
Also L(Z) ≤ a kγ (t)k2 dt für jede Zerlegung Z von [a, b], und damit ℓ(γ) ≤
Rb
kγ′ (t)k2 dt.
a
Für a ≤ x < y ≤ b gilt
Z y
kγ(y) − γ(x)k2 ≤ ℓ(γ|[x,y] ) ≤
kγ′ (t)k2 dt .
x
Dividiert man diese Ungleichung durch (y − x) und lässt x → y streben, so konvergiert
in der
die linke und die rechte Seite gegen kγ′ (y)k2 ; also auch der Ausdruck ℓ(y)−ℓ(x)
y−x
Mitte, und damit ℓ′ (y)− = kγ′ (y)k2 . Lässt man y → x streben, so sieht man genauso
ℓ′ (x)+ = kγ′ (x)k2 , und insgesamt ℓ′ (x) = kγ′ (x)k2 , x ∈ [a, b], wobei wir an den
Rändern die jeweiligen einseitigen Grenzwerte meinen.
❑
11.1.7 Definition. Eine Abbildung f : [a, b] → X mit einem Banachraum X heißt
stückweise stetig differenzierbar , falls es eine Zerlegung a = t0 < · · · < tn = b von
[a, b] gibt, sodass jede Einschränkung f |(t j−1 ,t j ) eine stetig differenzierbare Fortsetzung
auf [t j−1 , t j ] hat.
Die Funktion γ : [a, b] → Rn ist offenbar stetig und stückweise stetig differenzierbar (vgl. Definition 11.1.7), wenn es eine Zerlegung Z = {ξ j }n(Z)
j=0 gibt, sodass
γ|[ξ j−1 ,ξ j ] ∈ C 1 [ξ j−1 , ξ j ] für j = 1, . . . , n(Z). Wendet man Satz 11.1.6 insgesamt n(Z)mal auf γ|[ξ j−1 ,ξ j ] , j = 1, . . . , n(Z) an, so erhalten wir
11.1.8 Korollar. Ist γ : [a, b] → Rn ein stetiger und stückweise stetig differenzierbarer
Rb
Weg, so ist dieser rektifizierbar mit ℓ(γ) = a kγ′ (x)k2 dx.
11.1.9 Beispiel. Man betrachte den Weg (siehe Definition 6.8.12, Beispiel 10.1.10)
!
cos s
γ(s) =
∈ R2 , s ∈ [0, 2π] .
sin s
Für ein t ∈ [0, 2π] gilt nach Satz 11.1.6
!
Z
Z t − sin s ℓ(γ|[0,t] ) =
cos s ds =
0
2
0
t
p
sin2 s + cos2 s ds = t .
KAPITEL 11. WEGINTEGRALE
98
γ(t) ≃ exp(it)
sin t
t
Also ist t genau die Weglänge
des Bogens γ|[0,t] .
−1
0
cos t
1
Das erklärt, warum man für ein w ∈ C ≃ R2 dargestellt in Polarkoordinaten (siehe
Definition 6.8.12), dh. w = r exp(it) = r(cos t + i sin t), die Zahl t auch als Bogenlänge
bezeichnet.
11.1.10 Bemerkung. Ist γ : [a, b] → Rn ein rektifizierbarer und stetiger Weg, so wissen
wir nun, dass ℓ das Intervall [a, b] monoton wachsend und surjektiv auf [0, ℓ(γ)] abbildet. Ist ℓ sogar bijektiv, so ist β = γ ◦ ℓ−1 ein zu γ äquivalenter Weg, sodass die Länge
des Weges β|[0,t] genau t ist.
Ist ℓ nicht injektiv, so kann man für t ∈ [0, ℓ(γ)], β(t) := γ(x) setzen, wobei x eine
Zahl aus [a, b] ist, sodass ℓ(x) = t. Im Fall, dass ℓ(x1 ) = t = ℓ(x2 ), hat γ|[x1 ,x2 ] Weglänge
Null und ist somit konstant. Also ist γ(x1 ) = γ(x2 ) und β somit wohldefiniert. Offenbar
gilt γ = β ◦ ℓ. Aus der Kompaktheit von [0, ℓ(γ)] folgert man aus γ = β ◦ ℓ leicht die
Stetigkeit von β.
Also ist β auch in diesem Fall ein zu γ fast äquivalenter“ Weg, sodass die Länge
”
des Weges β|[0,t] genau t ist.
11.1.11 Bemerkung (*). Bisher haben wir bei der Behandlung von Wegen und
Weglängen nirgends verwendet, dass γ in den Rn mit der k.k2 -Norm hinein abbildet.
Wir haben die euklidische Norm nur verwendet, weil sie dem als natürlich empfundenen Längenbegriff entspricht.
In der Tat kann man genauso ℓ(γ) definieren, wenn γ eine beliebige Funktion von
[a, b] in einen Banachraum (X, k.k) ist.
Es gelten dann dieselben Eigenschaften, die wir eben aufgezählt haben, und ist
ℓ(γ) < +∞, so spricht man von γ als einer Funktion von beschränkter Variation.
Äquivalente Normen k.k und |k.k|, d.h. αk.k ≤ |k.k| ≤ βk.k, induzieren zwar verschiedene Längenbegriffe, aber diese sind dennoch vergleichbar:
αℓk.k (γ) ≤ ℓ|k.k| (γ) ≤ βℓk.k (γ) .
Versieht man etwa Rn mit der Norm k.k∞ oder k.k1 , so erhält man für ein und dieselbe
Funktion verschiedene Längenbegriffe.
11.2 Wegintegrale
11.2.1 Beispiel. Wir betrachten ein Objekt im Gravitationsfeld einer Punktmasse, und
wollen die Arbeit berechnen, die verrichtet wird wenn man das Objekt von einer Positi-
11.2. WEGINTEGRALE
99
on zu einer anderen verschiebt. Dabei denken wir uns diese Punktmasse im Nullvektor
des R3 .
Das Newtonsche Gravitationsgesetz besagt, dass sich die Gravitationskraft umgekehrt proportional zum Quadrat ihres Abstandes r zur Punktmasse verhält – also durch
C r12 mit einer Konstante C berechnet werden kann. Vernachlässigen wir diese Konstante, und zerlegt man die Kraft, die auf einen Punkt x = (ξ, η, ζ)T ∈ R3 wirkt, in ihre
Komponenten, so erhält man den Kraftvektor
 
ξ 
1  
F(x) = − 3 η .
kxk2 ζ 
Verschiebt man nun einen Punkt P von x zu einer sehr nahen Position x + h, so ist die
Arbeit, die verrichtet wird, wegen der Formel Arbeit = Kraft × Weg“ ungefähr gleich
”
− F(x), h = −F(x)T h .
Sei nun P ein Punkt in der Position x0 , und werde P längs einer Kurve γ in die Position x1 verschoben. Sei γ gegeben in Parameterdarstellung γ : [0, 1] → R3 , γ(0) =
x0 , γ(1) = x1 , und sei vorausgesetzt, dass γ hinreichend glatt ist – etwa stetig und
stückweise stetig differenzierbar. Wir zerlegen die Kurve in kleine Abschnitte. Sei also
0 = t0 < t1 < t2 < . . . < tn−1 < tn = 1. Wird γ durch den Polygonzug mit Ecken in γ(ti )
approximiert, dann berechnet sich die verrichtete Arbeit ungefähr durch
ω≈
n
X
i=1
−F(γ(ti )
T
γ(ti ) − γ(ti−1 ) .
Wir werden unten sehen, dass dieser Ausdruck konvergiert, wenn man die Approximation immer genauer macht. Für diesen Grenzwert werden wir
Z
−F(x)T dx ,
γ
schreiben, und ihn das Wegintegral des Vektorfeldes φ = −F T längs des Weges γ
nennen.
Mathematisch lässt sich die Situation aus Beispiel 11.2.1 dadurch fassen, dass man
ein sogenanntes Vektorfeld gegeben hat. Das ist eine Abbildung φ : D → L(Rn , X) von
einer Teilmenge D ⊆ Rn in die Menge aller linearen3 Abbildungen von Rn in einen
Banachraum X – meistens ist, so wie in Beispiel 11.2.1, X = R.
Ist nun γ : [a, b] → D ⊆ Rn ein Weg, so entspricht die oben erwähnte Approxin(R) mation der Arbeit bei gegebener Riemannscher Zerlegung R = (ξ j )n(R)
j=0 ; (α j ) j=1 der
Summe
n(R)
X
φ γ(α j ) γ(ξ j ) − γ(ξ j−1 ) .
(11.4)
W(R) :=
j=1
11.2.2 Definition. Konvergiert das Netz W(R) R∈R in X, so nennen wir seinen Grenzwert
Z
φ(x) dx := lim W(R)
γ
3 Wegen
|R|→0
Beispiel 9.2.10 sind diese automatisch beschränkt, wenn wir Rn mit k.k2 versehen!
KAPITEL 11. WEGINTEGRALE
100
das Wegintegral von φ längs des Weges γ.
Für f : [a, b] → L(Rn , X), g : [a, b] → Rn und R ∈ R setzen wir zudem
P(R) :=
n(R)
X
j=1
Das Riemann-Stieltjes Integral
in X existiert.
Rb
a
f (α j ) g(ξ j ) − g(ξ j−1 ) .
f dg ist definiert als limR∈R P(R), falls dieser Limes
Wegintegrale sind spezielle Riemann-Stieltjes Integrale, da P(R) = W(R) und in
Rb
R
Folge a f dg = γ φ(x) dx, wenn g = γ und f = φ ◦ γ.
11.2.3 Fakta.
1. Ist γ̃ : [ã, b̃] → D ⊆ Rn ein Weg und γ = γ̃ ◦ β : [a, b] → D ein zu γ̃ äquivalenter
Weg mit einer streng monoton wachsenden Bijektion
β : [a, b] → [ã, b̃]. Da β und β−1 beide stetig sind, sind sie wegen Satz 6.3.3
sogar gleichmäßig stetig. Nun seien W(R) die Wegsummen von φ längs γ und
W̃(R̃) die Wegsummen von φ längs γ̃.
n(R) Ist R = (ξ j )n(R)
j=0 ; (α j )j=1 eine Riemann-Zerlegung von [a, b], so ist β(R) :=
n(R)
eine solche von [ã, b̃] und umgekehrt. Dabei gilt
β(ξ j ) n(R)
j=0 ; β(α j ) j=1
W̃(β(R)) = W(R).
Wegen der gleichmäßigen Stetigkeit gibt es dabei zu jeder Riemann-Zerlegung
R̃0 von [ã, b̃] ein δ > 0, sodass für jede Riemann-Zerlegung R von [a, b] aus
|R| ≤ δ auch |β(R)| ≤ |R̃0 | folgt. Gemäß Definition 5.3.6 ist somit W(R) R∈R =
W̃(β(R)) R∈R ein Teilnetz von W̃(R̃) R̃∈R̃ . Weil auch β−1 gleichmäßig stetig ist,
gilt auch die Umkehrung. Wegen Lemma 5.3.7 erhalten wir
Z
Z
φ(x) dx
φ(x) dx =
γ̃
γ
in dem Sinne, dass wenn eines dieser Integrale existiert, dann auch das andere
existiert und diese übereinstimmen.
Ist γ− der in die Gegenrichtung durchlaufene Weg, so entsprechen sich die
Riemann-Summen auch bijektiv, wobei die korrespondierenden
R Summen W(R)
R
nur im Vorzeichen unterscheiden, und somit γ− φ(x) dx = − γ φ(x) dx gilt.
2. Ist unser Weg rektifizierbar und stetig, d.h. ℓ(γ) < +∞, und ist φ stetig, so existiert das Integral.
Rb
Das folgt aus der allgemeineren Tatsache, dass a f dg existiert, falls f stetig
auf [a, b] und g rektifizierbar ist. Der Beweis für diese Tatsache ist ähnlich, wie
der Beweis für die Riemann-Integrierbarkeit stetiger Funktionen mit Hilfe des
Cauchy-Kriteriums.
n(R) n(R1 ) 1)
zwei
und R = (η j )n(R)
Beweis. Sind R1 = (ξ j )n(R
j=0 ; (β j ) j=1
j=0 ; (α j ) j=1
Riemann-Zerlegungen von [a, b], sodass die Stützstellen von R die von R1 umfassen.
Ist j ∈ {1, . . . , n(R1 )}, so gibt es Indizes k( j − 1) < k( j), sodass
ξ j−1 = ηk( j−1) < ηk( j−1)+1 < · · · < ηk( j)−1 < ηk( j) = ξ j .
|
{z
}
k( j)−k( j−1)−1 viele
11.2. WEGINTEGRALE
101
Mit g(ξ j ) − g(ξ j−1 ) =
Pk( j)
k=k( j−1)+1
g(ηk ) − g(ηk−1 ) folgt
kP(R) − P(R1 )k ≤
k( j)
n(R
X1 ) X
f (α j ) g(ξ j ) − g(ξ j−1 ) −
f (βk ) g(ηk ) − g(ηk−1 ) j=1
k=k( j−1)+1
≤
n(R
X1 )
k( j)
X
j=1 k=k( j−1)+1
k f (α j ) − f (βk )k · kg(ηk ) − g(ηk−1 )k2 .
Dabei ist k f (α j ) − f (βk )k die Abbildungsnorm auf L(Rn , X), wenn Rn mit der
euklidischen Norm versehen ist.
Wegen |α j − βk | ≤ (ξ j − ξ j−1 ) ≤ |R1 |, k ∈ {k( j − 1) + 1, . . . , k( j)} folgt
kP(R) − P(R1 )k ≤
n(R)
X
k=1
ρ(|R1 |) · kg(ηk ) − g(ηk−1 )k2 ≤ ρ(|R1 |) · ℓ(g) ,
(11.5)
wobei ρ(δ) := sups,t∈[a,b],|s−t|≤δ k f (s) − f (t)k.
Sind nun R1 und R2 zwei beliebige Riemann-Zerlegungen von [a, b] und wählt
man R so, dass die Stützstellen von R sowohl die von R1 also auch die von
R2 umfasst, so folgt aus (11.5) je einmal angewandt auf R1 und auf R2 , der
Dreiecksungleichung sowie der Monotonie von ρ
kP(R1 ) − P(R2 )k ≤ ρ(|R1 |) + ρ(|R2 |) · ℓ(g) .
Wegen der gleichmäßigen Stetigkeit von f gilt limδ→0 ρ(δ) = 0, woraus folgt,
dass P(R) R∈R ein Cauchy-Netz und daher konvergent ist.
❑
3. Als Grenzwert von Netzen mit Werten im Banachraum X erfüllen Wegintegrale
(µ, ν ∈ R):
Z
Z
Z
(µφ(x) + νψ(x)) dx = µ φ(x) dx + ν ψ(x) dx
γ
γ
γ
Entsprechend sind Riemann-Stieltjes Integrale linear nicht nur in f , sondern auch
in g.
4. Sind γ1 : [a1 , b1 ] → D, γ2 : [a2 , b2 ] → D zwei stetige und rektifizierbare Wege
mit b1 = a2 und γ1 (b1 ) = γ2 (a2 ), und ist φ : D → L(Rn , X) stetig, dann gilt
Z
Z
Z
φ(x) dx .
(11.6)
φ(x) dx +
φ(x) dx =
γ1 ⊕γ2
γ2
γ1
Allgemeiner folgt für ein stetiges f : [a, c] → L(Rn , X), ein rektifizierbares
g : [a, c] → Rn und ein b ∈ (a, c), dass
Z c
Z b
Z c
f dg .
f dg +
f dg =
a
a
b
Beweis. Die Voraussetzungen gewährleisten, dass alle Integrale existieren. Zu
Rb
gegebenem ǫ > 0 sei δ > 0 so klein, dass kP(R1 ) − a f dgk < ǫ,
KAPITEL 11. WEGINTEGRALE
102
Rc
Rc
kP(R2 ) − b f dgk < ǫ und kP(R) − a f dgk < ǫ für jede Riemann-Zerlegung R1
von [a, b], jede Riemann-Zerlegung R2 von [b, c] und jede Riemann-Zerlegung
R von [a, c] mit |R1 |, |R2 |, |R| < δ.
Sind R1 und R2 zwei beliebige Riemann-Zerlegungen von [a, b] bzw. [b, c] mit
|R1 |, |R2 | < δ, so sei R jene Riemann-Zerlegungen von [a, c], deren Stütz- und
Zwischenstellen genau jene von R1 und R2 umfasst. Dann gilt |R| < δ und P(R) =
P(R1 ) + P(R2 ). Somit folgt aus der Dreiecksungleichung
Z b
Z c
Z c
f dg ≤
f dg −
f dg +
a
b
a
Z c
Z b
Z c
f dg < 3ǫ .
f dg + P(R2 ) −
f dg + P(R) −
P(R1 ) −
a
a
b
Da ǫ > 0 beliebig war, gilt die behauptete Gleichheit.
❑
5. Es gilt
kP(R)k ≤
sup k f (t)k
t∈[a,b]
n(R)
X
j=1
n(R)
X
j=1
k f (α j )k · kg(ξ j ) − g(ξ j−1 )k2 ≤
kg(ξ j ) − g(ξ j−1 )k2 ≤ sup k f (t)k · ℓ(g) .
t∈[a,b]
Daraus sieht man, dass für konstantes g das Riemann-Stieltjes Integral existiert
und verschwindet. Entsprechend verschwindet das Wegintegral über einen konstanten Weg.
Existiert das Riemann-Stieltjes Integral, so ist seine Norm kleiner oder gleich
supt∈[a,b] k f (t)k · ℓ(g). Existiert das Wegintegral, so gilt entsprechend
Z
(11.7)
k φ(x) dxk ≤ sup kφ ◦ γ(t)k · ℓ(γ) .
t∈[a,b]
γ
6. Ist γ : [0, 1] → D ein gerade Strecke, also γ(t) = tx1 + (1 − t)x0 , und ist φ stetig,
P
so gilt W(R) = n(R)
j=1 (ξ j − ξ j−1 )φ γ(α j ) (x1 − x0 ) und daher
Z
φ(x) dx =
γ
Z
1
0
φ tx1 +(1−t)x0 (x1 −x0 ) dt =
Z
|
0
1
!
φ tx1 + (1 − t)x0 dt (x1 −x0 ) .
{z
}
∈L(Rn ,X)
11.2.4 Bemerkung. Die Stetigkeit eines Vektorfeldes φ : D → L(Rn , X) mit D ⊆ Rn ist
äquivalent zur Stetigkeit der Funktion x 7→ φ(x)e j , j = 1, . . . , n, wie man unmittelbar
aus
max kφ(x)e j − φ(y)e j k ≤ kφ(x) − φ(y)k =
j=1,...,n
X
k φ(x) − φ(y) vkX ≤
kφ(x)e j − φ(y)e j k
n
sup
v∈Rn ,kvk∞ =1
erkennt.
j=1
11.2. WEGINTEGRALE
103
Um konkret Riemann-Stieltjes Integrale bzw. in Folge Wegintegrale aus zurechnen
dient am besten folgender Satz.
11.2.5 Satz. Ist g ∈ C 1 [a, b] und f stetig, so folgt
Z b
Z b
f (t) g′ (t) dt .
f dg =
a
a
1
Ist γ ∈ C [a, b] und φ stetig, so gilt
Z
Z
φ(x) dx =
γ
b
a
φ γ(t) γ′ (t) dt .
Dasselbe gilt für stetige und stückweise stetig differenzierbare Wege g bzw. γ.
Beweis. Nach dem Hauptsatz der Differential- und Integralrechnung gilt (R ∈ R)
P(R) =
n(R)
X
j=1
X
f (α j ) g(ξ j ) − g(ξ j−1 ) =
f (α j )
n(R)
j=1
Z
ξj
ξ j−1
g′ (t) dt =
Z
a
b
fR (t) g′ (t) dt ,
wobei fR (t) die stückweise konstante Funktion mit fR (t) = f (α j ), t ∈ [ξ j−1 , ξ j ), j =
1, . . . , n(R), und fR (b) = f (αn(R) ) ist. Für t ∈ [ξ j−1 , ξ j ), 1 ≤ j < n(R), bzw. für t ∈
[ξn(R)−1 , ξn(R) ] gilt
k fR (t) g′ (t) − f (t) g′ (t)k ≤
k fR (t) − f (t)k · kg′ (t)k2 = k f (α j ) − f (t)k · kg′ (t)k2 ≤ ρ(|R|) · max kg′ (s)k2 ,
s∈[a,b]
wobei ρ(δ) := sups,t∈[a,b],|s−t|≤δ k f (s) − f (t)k. Somit gilt limR∈R fR (t) g′ (t) = f (t) g′ (t)
und zwar gleichmäßig in t ∈ [a, b]. Nach Satz 8.7.2 angewandt auf ein gleichmäßig
konvergentes Netz von Funktionen erhalten wir
Z b
Z b
Z b
lim P(R) = lim
f (t) g′ (t) dt .
lim fR (t) g′ (t) dt =
fR (t) g′ (t) dt =
R∈R
R∈R
a
a R∈R
a
Für stetige und stückweise stetig differenzierbare Kurven folgt die Behauptung aus
dem gerade bewiesenen und Fakta 11.2.3, 4.
❑
11.2.6 Bemerkung. Ist X = Rm , so stellt man φ : D → L(Rn , X) meist als m × n-Matrix
dar. Sind γ j (t) die Komponenten unseres Weges, so berechnet man das Wegintegral
durch

 ′ 
Z b  φ11 (γ(t)) · · · φ1n (γ(t))  γ1 (t)

  .. 
..
..

  .  dt .
.
.


a 
φm1 (γ(t)) · · · φmn (γ(t)) γn′ (t)
11.2.7 Bemerkung (*). Wie im Abschnitt über Wege ist bisher auch nirgends eingegangen, dass g bzw. γ in den (Rn , k.k2 ) hinein abbildet.
Die obigen Resultate samt Beweise bleiben gültig, wenn g bzw. γ das Intervall
[a, b] in eine Menge D ⊆ Y (Y ist Banachraum) abbilden, und f : [a, b] → L(Y, X) bzw.
φ : D → L(Y, X), also jedem t ∈ [a, b] bzw. y ∈ D eine beschränkte lineare Abbildung
von Y nach X zuordnet.
KAPITEL 11. WEGINTEGRALE
104
11.3 Offene Mengen in Rn und Gebiete
Ehe wir uns weiter mit Vektorfeldern beschäftigen, wollen wir uns die Struktur von
offenen Teilmengen des Rn anschauen. Dazu sei zunächst an den Begriff einer zusammenhängenden Teilmenge E eines metrischen Raumes aus Definition 6.2.2 erinnert. E heißt zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen schreiben kann. Dabei heißen A und B getrennt, wenn
c(A) ∩ B = A ∩ c(B) = ∅.
11.3.1 Lemma. Ist (Ei )i∈I eine Familie bestehend aus zusammenhängenden Teilmengen eines metrischen Raumes, sodass für ein gewisses i0 ∈ I und allen i ∈ I die Mengen
S
Ei0 und Ei nicht getrennt sind4 , so ist auch E := i∈I Ei zusammenhängend.
˙ mit getrennten, Mengen A und B. Es folgt Ei =
Beweis. Angenommen E = A∪B
˙ ∩ Ei ) für jedes i ∈ I. Wegen c(A ∩ Ei ) ∩ (B ∩ Ei ) ⊆ c(A) ∩ B = ∅ und
(A ∩ Ei )∪(B
(A ∩ Ei ) ∩ c(B ∩ Ei ) ⊆ A ∩ c(B) = ∅ sind auch A ∩ Ei und B ∩ Ei getrennt. Da Ei
zusammenhängend ist, muss eine dieser Mengen leer sein; also Ei ⊆ A oder Ei ⊆ B.
Wir wählen die Bezeichnung so, dass Ei0 ⊆ A. Wäre Ei ⊆ B für nur ein i ∈ I, so
wären Ei0 und Ei im Widerspruch zur Voraussetzung getrennt. Somit muss E ganz in
A enthalten sein; dh. B = ∅.
❑
11.3.2 Definition. Offene und zusammenhängende Teilmengen von Rn heißen Gebiete.
Die Eigenschaft Gebiet zu sein, lässt sich mit Hilfe von stetigen Wegen charakterisieren.
11.3.3 Lemma. Für ein offenes ∅ , D ⊆ Rn sind folgende Aussagen äquivalent.
(i) D ist zusammenhängend – also ein Gebiet.
(ii) Je zwei Punkte x, y aus D sind durch einen stetigen Weg in D verbindbar5.
(iii) Je zwei Punkte aus D sind durch einen stetigen und stückweise stetig differenzierbaren Weg in D verbindbar.
(iv) Je zwei Punkte aus D sind durch einen Polygonzug in D verbindbar.
(v) Je zwei Punkte aus D sind durch einen achsenparallelen6 Polygonzug in D verbindbar.
Beweis. Die Schlüsse (v) ⇒ (iv), (iv) ⇒ (iii) und (iii) ⇒ (ii) sind offensichtlich richtig.
Gelte nun (ii) und sei x irgendein fester Punkt aus D. Zu jedem y ∈ D gibt es einen
stetigen Weg γy : [ay , by ] → D mit γy (ay ) = x und γy (by ) = y. Es folgt
[
[
D=
{y} ⊆
γy ([ay , by ]) ⊆ D .
y∈D
y∈D
Also ist D die Vereinigung der nach Proposition 6.2.4 zusammenhängenden Mengen
γy ([ay , by ]), y ∈ D. Nach unserer Wahl von γy haben diese Mengen zumindest den
Punkt x gemein. Nach Lemma 11.3.1 ist D zusammenhängend; also gilt (i).
4 Diese
Voraussetzung ist sicher dann erfüllt, wenn Ei0 mit allen Ei einen nichtleeren Schnitt hat.
bedeutet, dass es einen stetigen Weg γ : [a, b] → D mit γ(a) = x und γ(b) = y gibt.
−−−−
6 Das ist ein Polygonzug −
x−0−→
x1 , −
x−1−→
x2 , . . . , −
x−m−1
x→
m , wo x j − x j−1 ein skalares Vielfaches eines gewissen
kanonischen Basisvektors ei( j) für j = 1, . . . , m ist.
5 Das
11.3. OFFENE MENGEN IN RN UND GEBIETE
105
Sei nun D zusammenhängend und x ∈ D wieder fest. Wir bezeichnen mit A die
Menge aller Punkte y ∈ D, die mit x durch einen achsenparallelen Polygonzug in D
→
verbindbar sind. Da −
xx auch ein solcher ist, folgt x ∈ A, also A , ∅. Klarerweise
ist B := D \ A die Menge aller y ∈ D, die mit x nicht durch einen achsenparallelen
Polygonzug in D verbindbar sind.
Sei y ∈ A und δ > 0 so klein, dass Uδ (y) – definiert bezüglich der k.k∞ -Norm auf Rn
−−−−
– ganz in D enthalten ist. Ist nun −
x−0−→
x1 , . . . , −
x−m−1
x→
m ein achsenparalleler Polygonzug von
x nach y in D, daher x0 = x und xm = y, und z ∈ Uδ (y), so gilt z = y + λ1 e1 + · · · + λn en
mit |λ1 |, . . . , |λn | < δ und daher ist
−−−−−−−−−−→
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−→
−
−−−−
x−0−→
x1 , . . . , −
x−m−1
x→
m , y (y + λ1 e1 ), . . . , (y + λ1 e1 + . . . λn−1 en−1 ) (y + λ1 e1 + . . . λn en )
|
{z
}
verläuft in Uδ (y)
ein achsenparalleler Polygonzug von x nach z in D. Also ist z ∈ A und daher Uδ (y) ⊆ A.
Somit ist A offen, und kein Punkt y aus A kann Häufungspunkt von B sein, da ja Uδ (y)
keine Punkte aus B enthält. Also gilt A ∩ c(B) = ∅.
Sei nun y ∈ B und δ > 0 so klein, dass Uδ (y) ⊆ D. Ist z = y+λ1 e1 +· · ·+λn en ∈ Uδ (y)
−−−−
und wäre z ∈ A mit einem achsenparalleler Polygonzug −
x−0−→
x1 , . . . , −
x−m−1
x→
m von x0 = x
nach xm = z in D, so wäre
−−−−−−−−−−−−−−−−−−−−−−−→
−−−−−−−−−−→
−
−−−−
x−0−→
x1 , . . . , −
x−m−1
x→
m , z (y + λ1 e1 + . . . λn−1 en−1 ), . . . , (y + λ1 e1 ) y
|
{z
}
verläuft in Uδ (y)
ein achsenparalleler Polygonzug von x nach y in D, und daher y ∈ A. Dieser Widerspruch zeigt, dass z ∈ B und somit Uδ (y) ⊆ B. Also ist auch B offen, und kein Punkt y
aus B kann Häufungspunkt von A sein, da ja Uδ (y) keine Punkte aus A enthält. Somit
gilt auch c(A) ∩ B = ∅.
Da D zusammenhängend ist, und da A , ∅, muss B = ∅ bzw. D = A, was aber
genau bedeutet, dass alle Punkte aus D mit x durch einen achsenparallelen Polygonzug
verbindbar sind. Klarerweise sind dann auch zwei beliebige Punkte aus D durch
einen achsenparallelen Polygonzug – zumindest via x – verbindbar, und wir haben (v)
nachgewiesen.
❑
11.3.4 Beispiel. Ist D ⊆ Rn offen und konvex, so lassen sich je zwei Punkte x, y aus D
−
durch die gerade Strecke →
xy verbinden. Gemäß Lemma 11.3.3 ist somit D ein Gebiet.
Insbesondere sind alle offenen Kugeln bzgl. jeder möglichen Norm in Rn Gebiete; vgl.
Bemerkung 10.1.4.
Um beliebigen offene Teilmengen des Rn eine Struktur geben zu können, benötigen
wir folgendes Lemma.
11.3.5 Lemma. Sei E eine nichtleere Teilmenge eines metrischen Raumes und sei ∼⊆
E × E die Relation auf E definiert durch
x ∼ y ⇔ ∃ Z ⊆ E : x, y ∈ Z, Z ist zusammenhängend ,
so ist ∼ eine Äquivalenzrelation auf E. Für ein x ∈ E ist die Äquivalenzklasse [x]∼ die
größte zusammenhängende Teilmenge von E, die x enthält.
Beweis. Da die einpunktige Menge {x} zusammenhängend ist, ist ∼ reflexiv. Die Symmetrie ist klar. Ist x ∼ y, y ∼ z, und sind Z1 und Z2 zusammenhängende Mengen, sodass
KAPITEL 11. WEGINTEGRALE
106
x, y ∈ Z1 und y, z ∈ Z2 , so ist nach Lemma 11.3.1 Z1 ∪ Z2 zusammenhängend, wobei
x, z ∈ Z1 ∪ Z2 . Also ist ∼ ein Äquivalenzrelation. Schließlich ist für x ∈ E die Menge
[
[x]∼ =
Z,
x∈Z
Z ist zusammenhängend
wegen Lemma 11.3.1 zusammenhängend. Klarerweise ist diese Menge dann auch die
größte zusammenhängende Teilmenge von E, die x enthält.
❑
11.3.6 Proposition. Für ein offenes ∅ , G ⊆ Rn sind die Äquivalenzklassen [x]∼
bezüglich der Äquivalenzrelation ∼ aus Lemma 11.3.5 angewandt auf E = G Gebiete.
Insbesondere, lässt sich G als disjunkte Vereinigung von Gebieten schreiben.
Beweis. Für y ∈ [x]∼ ⊆ G sei ǫ > 0, sodass Uǫ (y) ⊆ G. Wegen Lemma 11.3.1
zusammen mit Beispiel 11.3.4 ist [x]∼ ∪ Uǫ (y) zusammenhängend. Da [x]∼ die größte
zusammenhängende Teilmenge von D ist, welche x enthält, folgt [x]∼ ∪ Uǫ (y) = [x]∼ ,
also Uǫ (y) ⊆ [x]∼ .
Wir haben somit gezeigt, dass [x]∼ offen und daher ein Gebiet ist.
❑
11.4 Gradientenfelder
Rb
Wir wollen eingangs ein mehrdimensionales Analogon der Tatsache a f ′ (t) dt =
f (b) − f (a) für Wegintegrale herleiten. Dafür sei bemerkt, dass für ein stetig differenzierbares f : D → X mit offenem D ⊆ Rn und einem Banachraum X die Ableitung
d f : D → L(Rn , X) ein Vektorfeld ist.
11.4.1 Satz. Sei D ⊆ Rn offen, X ein Banachraum und f : D → X eine stetig differenzierbare Funktion. Für einen stetigen und stückweise stetig differenzierbaren Weg
γ : [a, b] → D gilt
Z
d f (x) dx = f γ(b) − f γ(a) .
γ
Beweis. Sind a = t0 < t1 < · · · < tl = b so, dass γ|[t j−1 ,t j ] ∈ C 1 [t j−1 , t j ], so folgt aus der
Kettenregel und dem Hauptsatz der Differential- und Integralrechnung Satz 8.4.5
Z
d f (x) dx =
γ
Z
a
l X
j=1
b
′
d f γ(t) γ (t) dt =
Z
a
b
( f ◦ γ)′ (t) dt =
f γ(t j ) − f γ(t j−1 ) = f γ(b) − f γ(a) .
❑
11.4.2 Beispiel. Wir betrachten nochmals Beispiel 11.2.1. Dort war das Vektorfeld
φ : R3 \ {0} → L(R3 , R) durch φ(x) = kxk1 3 (ξ, η, ζ) gegeben. Nun ist aber, φ(x) =
2
d f (x), wobei f (x) = − kxk1 2 . Insbesondere berechnet sich die Arbeit, die man verrichten
11.4. GRADIENTENFELDER
107
muss, um einen Punkt P von x0 nach x1 entlang eines stetigen und stückweise stetig
differenzierbaren Weges γ zu bewegen, durch
Z
1
1
φ(x) dx =
−
.
kx
k
kx
0 2
1 k2
γ
11.4.3 Definition. Vektorfelder φ : D → L(Rn , X), die Ableitungen d f stetig differenzierbarer Funktionen f : D → X sind, heißen Gradientenfelder. Jedes stetig differenzierbare f : D → X mit d f = φ nennt man Stammfunktion von φ.
11.4.4 Korollar. Ist D ein Gebiet und φ : D → L(Rn , X) ein Gradientenfeld, so ist die
Stammfunktion f ∈ C 1 (D) von φ, dh. d f = φ, bis auf eine additive Konstante aus X
eindeutig.
Beweis. Falls d f1 = φ = d f2 für zwei C 1 (D)-Funktionen f1 , f2 , so folgt für beliebige
x, y ∈ D aus Satz 11.4.1 angewandt auf 0 = d f1 − d f2 und irgendeinen geeigneten Weg γ : [a, b] → D mit γ(a) = x und γ(b) = y (vgl. Lemma 11.3.3), dass
( f1 − f2 )(x) = ( f1 − f2 )(y). Somit ist f1 − f2 auf D konstant.
❑
11.4.5 Bemerkung. Die Tatsache, dass φ ein Gradientenfeld ist, hängt entscheidend
von seinem Definitionsbereich ab D.
y
x In der Tat gilt für das Vektorfeld φ : R2 \{0} → L(R2 , R), φ (x, y)T = − x2 +y
2 , x2 +y2
und den Weg γ(t) = (cos t, sin t)T , t ∈ [0, 2π]
Z
φ(x) dx , 0 .
γ
Wegen γ(0) = γ(2π) erkennen wir aus Satz 11.4.1, dass φ : R2 \ {0} → L(R2 , R) kein
Gradientenfeld ist.
Macht man den Definitionsbereich R2 \ {0} von φ kleiner, z.B. D = R2 \ {(x, y)T :
x ≤ 0}, so ist φ sehr wohl ein Gradientenfeld; vgl. Beispiel 11.5.8.
Die in Satz 11.4.1 angegebene Eigenschaft, dass Wegintegrale über Gradientenfelder nicht vom konkreten Weg abhängen, charakterisiert in der Tat Gradientenfelder;
siehe Satz 11.4.7. Um das zu zeigen, brauchen wir folgende Begriffsbildung:
Zu c, x ∈ Rn und einer Permutation σ von {1, . . . , n}, dh. σ : {1, . . . , n} → {1, . . . , n}
σ
ist bijektiv, sei γc,x
: [0, n] → Rn der achsenparallele Polygonzug
−
−−−
→
y−0−→
y1 , −
y−1−→
y2 , . . . , −
y−n−1
yn ,
wobei
yk := c +
k
X
(xσ( j) − cσ( j) )eσ( j) , k = 0, . . . , n ,
j=1
und damit insbesondere y0 = c, yn = x.
Q
11.4.6 Lemma. Sei D = nk=1 (ak , bk ) ⊆ Rn , und φ : D → L(Rn , X) stetig. Falls für ein
festes c ∈ D und allen x ∈ D das Wegintegral
Z
φ(v) dv
σ
γc,x
KAPITEL 11. WEGINTEGRALE
108
unabhängig von der Permutation σ : {1, . . . , n} → {1, . . . , n} ist, so stellt
Z
φ(v) dv
f (x) :=
σ
γc,x
eine stetig differenzierbare Funktion f : D → X dar, wobei d f = φ.
Beweis. Sei δ > 0, sodass Uδk.k∞ (x) ⊆ D. Für 0 , |t| < δ, j ∈ {1, . . . , n} und irgendeiner
Permutation σ mit σ(n) = j gilt im Falle sgn(t · (x j − c j )) ≥ 0,
σ
γc,x+te
|
j [0,n−1+
und damit
Z
x j −c j
x j −c j +t ]
σ
σ
∼ γc,x
und γc,x+te
|
j [n−1+
Z
φ(v) dv =
φ(v) dv +
σ
γc,x
σ
γc,x+te
j
x j −c j
x j −c j +t ,n]
Z
−−−−−−−→
x (x+te j )
−−−−−−−−→
∼ x (x + te j )
φ(v) dv .
Im Falle sgn(t · (x j − c j )) < 0 gilt
−−−−−−−−→
σ
σ
σ
γc,x
|[0,n−1+ x j −c j +t ] ∼ γc,x+te
und γc,x
|[n−1+ x j −c j +t ,n] ∼ (x + te j ) x
j
x j −c j
und damit
Z
φ(v) dv =
σ
γc,x
x j −c j
Z
φ(v) dv +
σ
γc,x+te
j
Z
−−−−−−−→
(x+te j ) x
φ(v) dv .
Also gilt in jedem Fall
f (x + te j ) − f (x) 1
=
t
t
Z
φ(v) dv =
−−−−−−−→
x (x+te j )
Z
1
φ(x + tse j ) e j ds .
0
Wegen der Stetigkeit der Funktion φ konvergiert der Integrand für t → 0 gleichmäßig
∂f
in s ∈ [0, 1] gegen die Konstante φ(x)e j (∈ X). Also folgt ∂x
(x) = φ(x)e j ; vgl. Satz
j
8.7.2 bzw. (9.17). Da dieser Ausdruck für jedes j stetig in x ist, gilt f ∈ C 1 (D) mit
d f = φ; siehe Korollar 8.7.9 bzw. (9.18).
❑
11.4.7 Satz. Sei D ⊆ Rn eine offene Menge und sei φ : D → L(Rn , X) ein Vektorfeld.
φ ist genau dann ein Gradientenfeld, wenn φ stetig und derart ist, dass Wegintegrale
von φ über achsenparallele Polygonzüge nur von Anfangs- und Endpunkt des Weges
abhängen.
Beweis. Die Beweisrichtung ⇒ folgt sofort aus Satz 11.4.1.
Nun kommen wir zu ⇐. Gemäß Proposition 11.3.6 können wir D als disjunkte
Vereinigung von gewissen Gebieten θ schreiben. Nun greife man aus jedem solchen
Gebiet θ ein festes xθ ∈ θ heraus, und definiere für x ∈ θ
Z
φ(v) dv ,
f (x) =
ρθx
wobei ρθx : [a, b] → θ irgendein achsenparalleler Polygonzug mit ρθx (b) = x und ρθx (a) =
xθ ist; vgl. Lemma 11.3.3. Wegen der Wegunabhängigkeit und weil jedes x ∈ D in
irgendeinem solchen Gebiet liegt, ist auf diese Art und Weise eine Funktion f : D → X
wohldefiniert.
11.5. LOKALE GRADIENTENFELDER
109
Sei nun c ∈ D, θ das Gebiet mit c ∈ θ und δ > 0 so, dass Uδk.k∞ (c) ⊆ θ. Für
x ∈ Uδk.k∞ (c) gilt wegen der Wegunabhängigkeit
f (x) =
Z
ρθc
φ(v) dv +
Z
φ(v) dv .
σ
γc,x
Gemäß Lemma 11.4.6 ist f auf Uδk.k∞ (c) stetig differenzierbar mit d f |Uk.k∞ (c) = φ|Uk.k∞ (c) .
δ
δ
Da stetig differenzierbar zu sein eine lokale Eigenschaft ist, folgt f ∈ C 1 (D) mit
d f = φ.
❑
R
R
11.4.8 Bemerkung. Die Voraussetzung in Satz 11.4.7, dass γ φ(x) dx = γ φ(x) dx für
1
2
je zwei achsenparallele Polygonzüge
γ1 und γ2 mit gleichen Anfangs- und Endpunkten,
R
ist äquivalent dazu, dass γ φ(x) dx = 0 für alle achsenparallele Polygonzüge γ, deren
Endpunkt gleich dem Anfangspunkt ist. Das sieht man leicht dadurch, indem man γ =
γ̃1 ⊕ (γ̃2 −) betrachtet, wobei γ̃ j derart äquivalent zu γ j ist, sodass sich γ̃1 ⊕ (γ̃2 −) bilden
lässt.
11.5 Lokale Gradientenfelder
Etwas schwächer als Gradientenfeld ist folgender Begriff.
11.5.1 Definition. Sei D ⊆ Rn eine offene Menge und sei φ : D → L(Rn , X) ein stetiges
Vektorfeld. Dann heißt φ lokales Gradientenfeld, wenn es zu jedem x ∈ D ein offenes
D(x) ⊆ D7 mit x ∈ D(x) gibt, sodass φ|D(x) : D(x) → L(Rn , X) ein Gradientenfeld ist.
Dass die Begriffe lokales Gradientenfeld und Gradientenfeld nicht äquivalent sind,
werden wir in Beispiel 11.5.8 sehen.
11.5.2 Bemerkung. Seien 0 < ρ1 < ρ2 < +∞ zwei Radien, sodass φ|Uρ j (x) : Uρ j (x) →
L(Rn , X) für j = 1, 2 ein Gradientenfeld ist – also φ|Uρ j (x) = d f j für f j ∈ C 1 (Uρ j (x)).
Da die Addition einer Konstanten zu f j daran nichts ändert, können wir zusätzlich
f1 (x) = 0 = f2 (x) annehmen.
Da innerhalb einer Kugel ein Punkt durch eine gerade Strecke mit dem Mittelpunkt
verbunden werden kann, folgt aus Korollar 11.4.4, dass sich f1 und f2 auf der kleineren
Kugel Uρ1 (x) nur um eine additive Konstante aus X unterscheiden. Wegen f1 (x) = 0 =
f2 (x), folgt f1 = f2 |Uρ1 (x) .
Ist nun R ⊆ (0, +∞) die Menge aller positiver Zahlen ρ, sodass φ|Uρ (x) immer ein
Gradientenfeld ist, so gibt es also fρ ∈ C 1 (Uρ (x)) mit d fρ = φ|Uρ (x) , welche FortsetS
zungen voneinander sind. Auf ρ∈R Uρ (x) = Usup R (x) ist somit durch f (y) = fρ (y) mit
y ∈ Uρ (x) eine C 1 Funktion wohldefiniert, welche offenbar d f = φ|Usup R (x) erfüllt.
Insgesamt erkennen wir, dass es für ein lokales Gradientenfeld φ : D → L(Rn , X)
zu jedem x ∈ D ein maximales 0 < ρ ≤ +∞ gibt, sodass Uρ (x) ⊆ D und φ|Uρ (x) ein
Gradientenfeld ist.
Bei stetig differenzierbaren Vektorfeldern gibt es eine greifbarere Bedingung dafür,
dass ein Vektorfeld ein lokales Gradientenfeld ist.
7 Klarerweise kann man D(x) kleiner machen und daher immer als ǫ-Kugel bezüglich der k.k - oder der
2
k.k∞ -Norm annehmen.
KAPITEL 11. WEGINTEGRALE
110
11.5.3 Definition. Ein Vektorfeld φ : D → L(Rn , X) heißt stetig differenzierbar stetig
differenzierbar, falls für alle j = 1, . . . , n die Funktionen x 7→ φ(x)e j von D nach X
hinein stetig differenzierbar sind.
11.5.4 Bemerkung. Wegen Bemerkung 11.2.4 sind stetig differenzierbare Vektorfelder
auch stetig.
11.5.5 Lemma (*). φ : D → L(Rn , X) ist genau dann stetig differenzierbar, wenn φ
als Abbildung von D in den Banachraum L(Rn , X) (versehen mit der Abbildungsnorm)
stetig differenzierbar ist.
Beweis. Wegen Satz 10.1.16 ist die stetige Differenzierbarkeit von φ als Abbildung
von D in den Banachraum L(Rn , X) äquivalent dazu, dass für i = 1, . . . , n die partiellen
Ableitungen ∂x∂ i φ(x) ∈ L(Rn , X) für alle x ∈ D existieren und stetig von x abhängen. Da
L(Rn , X) ∋ A 7→ Ae j ∈ X beschränkt und linear ist, folgt daraus, dass auch
∂
(φ(.)e j)(x) ∈ X
∂xi
existiert und mit ( ∂x∂ i φ(x))e j übereinstimmt; vgl. Fakta 9.3.12, 4. Da letztere Funktion
stetig von x abhängt, sind somit für j = 1, . . . , n die Funktionen x 7→ φ(x)e j von D
nach X stetig differenzierbar.
Seien umgekehrt alle diese Funktionen D ∋ x 7→ φ(x)e j ∈ X stetig differenzierbar,
und sei i ∈ {1, . . . , n}. Für jedes feste x ∈ D wird durch
 
µ1 
n
X
 
∂
(φ(.)e j)(x)
B(x) : v =  ...  7→
µj
∂xi
 
j=1
µn
eine lineare Abbildung von Rn nach X definiert, die gemäß Beispiel 9.2.10, (ii), beschränkt ist. Wegen
X ∂
∂
(φ(.)e j)(y)k
kB(x) − B(y)k = sup k B(x) − B(y) vkX ≤
k (φ(.)e j)(x) −
∂x
∂x
i
i
kvk∞ =1
j=1
n
ist B : D → L(Rn , X) stetig. Schließlich ist wegen
!
1
1
k (φ(x + tei ) − φ(x)) − B(x)k = sup k (φ(x + tei ) − φ(x)) − B(x) vkX =
t
t
kvk∞ =1
sup k
kvk∞ =1
n
X
j=1
µj
!
1
∂
(φ(.)e j)(x) kX ≤
(φ(x + tei )e j − φ(x)e j ) −
t
∂xi
!
1
∂
t→0
k (φ(x + tei )e j − φ(x)e j ) −
(φ(.)e j )(x) kX −→ 0 ,
t
∂xi
j=1
n
X
B(x) nichts anderes als
∂
∂xi φ(x).
❑
Sei nun D ⊆ Rn offen, φ : D → L(Rn , X) ein stetig differenzierbares Vektorfeld.
Angenommen, φ ist auf einem offenen D(x) ⊆ D mit x ∈ D(x) ⊆ D die Ableitung einer
11.5. LOKALE GRADIENTENFELDER
111
Funktion f : D(x) → X, also φ = d f . Klarerweise ist dann f ∈ C 2 (D(x)), und wegen
dem Satz von Schwarz gilt (y ∈ D(x))
∂2 f
∂2 f
∂
∂
φ(y)e j =
(y) =
(y) =
φ(y)ei .
∂xi
∂xi ∂x j
∂x j ∂xi
∂x j
(11.8)
Wir sehen also, dass
∂
∂
φ(.)e j =
φ(.)ei , i, j ∈ {1, . . . , n} ,
∂xi
∂x j
(11.9)
eine notwendige Bedingung dafür ist, dass φ ein lokales Gradientenfeld ist.
Wir wollen als nächstes zeigen, dass (11.9) auch hinreichend dafür ist, dass ein
Vektorfeld ein lokales Gradientenfeld ist. In der Tat werden wir für ein Vektorfeld
Q
φ : D → L(Rn , X), wobei D ein offener Quaders D = ni=1 (ai , bi ) ist, aus der Gültigkeit
von (11.9) herleiten, dass φ ein Gradientenfeld auf D ist. Es sei daran erinnert, dass
diese offenen Quader tatsächlich offen sind; vgl. Fakta 8.7.8.
11.5.6 Satz. Sei φ : D → L(Rn , X) ein stetig differenzierbares Vektorfeld.
Q
Für D = nk=1 (ak , bk ) ⊆ Rn folgt aus (11.9), dass φ ein Gradientenfeld ist.
Für beliebiges offenes D ⊆ Rn folgt aus (11.9), dass φ ein lokales Gradientenfeld
ist.
Q
Beweis. Sei c ∈ D = nk=1 (ak , bk ) und sei σ = id{1,...,n} die identische Permutation von
{1, . . . , n}. Mit der Notation, die wir vor Lemma 11.4.6 eingeführt haben, ist durch
Z
φ(v) dv (∈ X) ,
f (x) :=
σ
γc,x
eine Funktion f : D → X wohldefiniert. Für f ∈ C 1 (D) mit d f = φ, reicht es zu zeigen,
∂f
(x) = φ(x)ek für alle k = 1, . . . , n und x ∈ D.
dass ∂x
k
Mit (11.6), mit Satz 11.2.5 und mit der Substitution s = (x j − c j )t folgt
f (x) =
=
=
n Z
X
−−−−−→
j=1 y j−1 y j
Z
n
1
X
φ(v) dv
φ (1 − t)y j−1 + ty j y j − y j−1 dt
j=1 0
n Z x j −c j
X
j=1
0
φ y j−1 + se j e j ds ,
(11.10)
P
wobei yk = c + kj=1 (x j − c j )e j . Nun leiten wir diese Gleichung nach xk ab, und werten
bei x aus. Da für j < k der Ausdruck y j−1 von xk unabhängig ist, und somit im j-ten
Summanden von (11.10) die Variable xk nicht vorkommt, ist seine Ableitung gleich
Null.
Für j = k ist y j−1 auch von xk unabhängig. Somit tritt beim k-ten Summanden xk
nur in der oberen Integralgrenze auf, weswegen seine Ableitung nach xk übereinstimmt
mit
φ yk−1 + (xk − ck )ek ek = φ yk ek .
KAPITEL 11. WEGINTEGRALE
112
Für j > k tritt xk nur im Integranden auf, da dann y j−1 sehr wohl von xk abhängt. Wegen
Korollar 8.7.12 (siehe auch (9.19)) kann man Integral und ∂x∂ k vertauschen. Also ist die
Ableitung des j-ten Summanden von (11.10) gleich
Z x j −c j
∂
φ(y j−1 + se j ) e j ds
∂xk
0
und wegen (11.9) weiter gleich
Z
0
x j −c j
∂
φ(y j−1 + se j ) ek ds =
∂x j
φ y j−1 + (x j − c j )e j ek − φ(y j−1 )ek = φ(y j ) ek − φ(y j−1 ) ek .
Somit stimmt die Ableitung von (11.10) nach xk überein mit
n
X
∂f
(x) = φ(yk ) ek +
φ(y j ) ek − φ(y j−1 ) ek = φ(yn ) ek = φ(x) ek .
∂xk
j=k+1
Ist D ⊆ Rn offen und ist x ∈ D, so gilt für hinreichend kleines ρ > 0, dass Uρk.k∞ (x) ⊆ D.
Q
Da Uρk.k∞ (x) = ni=1 (xi − ρ, xi + ρ) ein offener Quader ist, folgt aus (11.9), dass φ|Uρk.k∞ (x)
ein Gradientenfeld ist. Also ist φ ein lokales Gradientenfeld.
❑
11.5.7 Beispiel. Sei D = {(x, y)T ∈ R2 : x , 0, y < π2 + πZ}, und
φ : D → L(R2 , R) R1×2 definiert durch
!
!
1
tan y
x
2
2
2
+x +y .
φ
= − 2 + 2xy + x ,
y
x
x cos2 y
φ ist stetig differenzierbar, wobei
!
!
∂ x
1
∂ x
φ e1 = − 2
φ
e2 .
+
2x
=
∂y y
∂x y
x cos2 y
Also ist φ nach Satz 11.5.6 ein lokales Gradientenfeld.
Da D kein Quader ist, sind wir zu diesem Zeitpunkt weder sicher, ob es sich um ein
Gradientenfeld handelt, noch haben wir die Stammfunktion explizit in der Hand. Um
diese zu finden, nehmen wir einmal unbestimmt f : D → R so an, dass d f = φ. Also
!
!
∂f x
tan y
1
∂f x
2
= − 2 + 2xy + x ,
=
+ x2 + y2 .
∂x y
∂y y
x
x cos2 y
Wegen der ersten Gleichung folgt
! Z
x3
tan y
tan y
x
+ x2 y +
+ c(y) ,
f
=
− 2 + 2xy + x2 dx + c(y) =
x
3
y
x
mit einer C 2 Funktion c(y), die nur von y abhängt. Nun leiten wir das nach y ab, verwenden die zweite Gleichung von oben und erhalten
!
1
1
∂f x
2
′
=
+ x + c (y) =
+ x2 + y2 .
x cos2 y
∂y y
x cos2 y
11.5. LOKALE GRADIENTENFELDER
113
3
Also muss c(y) von der Gestalt c(y) = y3 + c sein. Wir sehen, dass
!
tan y
x
x3 + y3
f
=
+ x2 y +
.
y
x
3
tatsächlich φ = d f erfüllt und somit eine Stammfunktion von φ ist. Insbesondere ist φ
auf ganz D ein Gradientenfeld.
11.5.8 Beispiel. Für D = R2 \ {0} sei das Vektorfeld φ : R2 \ {0} → L(R2 , R) definiert
durch
!
−y
x
x
φ
=( 2
, 2
).
2
y
x + y x + y2
∂
∂
Man rechnet elementar nach, dass ∂y
φ yx e1 = ∂x
φ yx e2 , und somit φ ein lokales
Gradientenfeld ist.
Wir haben in Bemerkung 11.4.5 angedeutet, wie man zeigen kann, dass φ : D →
L(R2 , R) kein Gradientenfeld ist. Wir wollen diese Tatsache hier auf eine andere Art
und Weise nachweisen. Dazu nehmen wir an, dass es doch ein g : D → R gibt, sodass dg = φ, und leiten daraus einen Widerspruch her. Addieren wir eine geeignete
Konstante, so können wir oBdA. g((1, 0)T ) = 0 annehmen.
Auf die obere Halbebene (−∞, +∞)×(0, +∞) eingeschränkt ist φ gemäß Satz 11.5.6
ein Gradientenfeld mit Stammfunktion f darauf. Der Ansatz
!
−y
∂f x
= 2
∂x y
x + y2
ergibt durch unbestimmte Integration f ((x, y)T ) = − arctan yx + c(y). Nun leiten wir
das nach y ab, und erhalten die Gleichung
x
x
+ c′ (y) = 2
,
x2 + y2
x + y2
also c′ (y) = 0, womit c(y) konstant ist. Da gemäß Korollar 11.4.4 die Stammfunktion
eines Vektorfeldes eindeutig ist, und da g|(−∞,+∞)×(0,+∞) auch eine solche Stammfunktion von φ|(−∞,+∞)×(0,+∞) ist, folgt
g|(−∞,+∞)×(0,+∞) = − arctan
x
+c.
y
Lassen wir in dieser Gleichung (x, y)T ∈ (−∞, +∞) × (0, +∞) gegen (1, 0)T streben, so
folgt 0 = − π2 + c. Lassen wir in obiger Gleichung dann (x, y)T ∈ (−∞, +∞) × (0, +∞)
gegen (−1, 0)T streben, so schließen wir auf g((−1, 0)T ) = π2 + c = π.
Auf der unteren Halbebene (−∞, +∞) × (−∞, 0) erhalten wir ganz ähnlich
− arctan yx + d als Stammfunktion, und somit
g|(−∞,+∞)×(−∞,0) = − arctan
x
+d.
y
Lassen wir hier nun (x, y)T ∈ (−∞, +∞) × (−∞, 0) gegen (−1, 0)T streben, so konvergiert yx gegen −∞, womit wir π = g((−1, 0)T ) = − π2 + d, also d = 3π
2 erhalten.
T
T
Lassen wir schließlich (x, y) ∈ (−∞, +∞) × (−∞, 0) gegen (1, 0) streben, so folgt der
Widerspruch 0 = g((1, 0)T ) = π2 + d = 2π.
KAPITEL 11. WEGINTEGRALE
114
11.5.9 Bemerkung (*). Sei I ein reelles Intervall und x : I → Rn eine C 1 -Funktion mit
x(I) ⊆ D für eine gewisse offene Teilmenge D von Rn . Nun genüge x der Differentialgleichung
n
X
(11.11)
f j x(t) · x′j (t) = 0, t ∈ I ,
j=1
wobei f1 , . . . , fn : D → R alle in C(D) sind. Ziel ist es, mehr über die Funktion x in
Erfahrung zu bringen.
Das geht sicher dann, wenn ( f1 , . . . , fn ) : D → L(Rn , R) ein Gradientenfeld ist,
dh. wenn ( f1 , . . . , fn ) = dF für ein F ∈ C 1 (D). Man nennt (11.11) dann eine exakte
Differentialgleichung. In der Tat liest sich in diesem Fall (11.11) wegen der Kettenregel
(siehe auch Bemerkung 10.1.21) als
(F ◦ x)′ (t) = 0, t ∈ I ,
und daher F ◦ x ≡ c für eine gewisse reelle Konstante c.
Ist D ein offener Quader und sind die f j alle sogar C 1 , so ist gemäß Satz 11.5.6
∂
∂
fj =
fi , i, j ∈ {1, . . . , n} ,
∂xi
∂x j
eine hinreichende Bedingung dafür, dass (11.11) eine exakte Differentialgleichung ist.
Nun kann es sein, dass zwar (11.11) keine exakte Differentialgleichung ist, aber es
dennoch eine Funktion m : D → R gibt, sodass die aus (11.11) abgeleitete Differentialgleichung
X
X
m x(t) ·
f j x(t) · x′j (t) =
(m · f j ) x(t) · x′j (t) = 0, t ∈ I ,
n
n
j=1
j=1
eine solche ist. Dann folgt nämlich auch G ◦ x ≡ c für eine gewisse reelle Konstante c,
wobei G eine Stammfunktion des Gradientenfeldes (m · f1 , . . . , m · fn ) ist. Eine solche
Funktion m nennt man Integrierenden Faktor.
11.5.10 Beispiel (*). Sei b > 0 und y : (0, b) → R eine C 1 -Funktion, die der Differentialgleichung
4x + 3y(x)2 + 2xy(x)y′ = 0
(11.12)
genügt. Um diese Gleichung mit der in Bemerkung 11.5.9 vorgestellten Methode behandeln zu können, betrachten wir
!
!
x(t)
t
=
y(t)
y(t)
als Abbildung von (0, b) nach (0, b) × R. Dann schreibt sich unsere Gleichung als
!
!
x(t)
x(t)
f
· x′ (t) + g
· y′ (t) = 0 ,
(11.13)
y(t)
y(t)
wobei f (x, y)T = 4x + 3y2 und g (x, y)T = 2xy. Wegen
!
!
∂ x
∂ x
f
= 6y , 2y =
g
∂y y
∂x y
11.6. HOMOTOPIE UND EINFACHER ZUSAMMENHANG
115
ist (11.13) nicht exakt. Durch Multiplizieren mit m (x, y)T = x2 folgt aus (11.13) aber
!
!
!
!
x(t)
x(t)
x(t)
x(t)
m
·f
· x′ (t) + m
·g
· y′ (t) = 0 .
(11.14)
y(t)
y(t)
y(t)
y(t)
Wegen
!
!
∂
x
x
∂
2
2
(m · f )
(m · g)
= 6yx = 6x y =
∂y
∂x
y
y
zusammen mit Satz 11.5.6 ist (11.14) exakt.
Man sieht leicht, dass G (x, y)T = x4 +x3 y2 eine Stammfunktion von (m· f, m·g) ist.
Also muss G (x(t), y(t))T = c, t ∈ (0, b) für eine Konstante c ∈ R sein. Das bedeutet
t4 + t3 y2 (t) = c bzw.
c
y2 (t) = 3 − t .
t
Da dieser Ausdruck für alle t ∈ (0, b) nichtnegativ ist, muss c ≥ b4 . Also muss
r
c
− x, x ∈ (0, b) ,
y(x) = ε ·
x3
für gewisse ε ∈ {+1, −1}, c ∈ [b, +∞). Man überprüft sofort, dass auch jede derartige
Funktion tatsächlich eine Lösung von (11.12) ist.
11.6 Homotopie und einfacher Zusammenhang
Ehe wir den wichtigen Satz 11.6.4 beweisen können, brauchen wir noch eine grundlegende Begriffsbildung.
11.6.1 Definition. Sei D ⊆ Rn offen, und seien γ0 , γ1 : [a, b] → D zwei stetige Wege.
Eine stetige Abbildung Γ : [a, b] × [c, d] → D (c, d ∈ R, c < d) mit
Γ(t, c) = γ0 (t), Γ(t, d) = γ1 (t), t ∈ [a, b] ,
heißt Homotopie zwischen γ0 und γ1 .
Haben γ0 und γ1 gleichen Anfangs- und gleichen Endpunkt, dh. γ0 (a) = γ1 (a)
und γ0 (b) = γ1 (b), so heißen diese Wege homotop in D, wenn es eine Homotopie
Γ : [a, b] × [c, d] → D zwischen γ0 und γ1 gibt, sodass
Γ|{a}×[c,d] ≡ γ0 (a), Γ|{b}×[c,d] ≡ γ0 (b) .
Ein Gebiet D ⊆ Rn heißt einfach zusammenhängend, wenn je zwei stetige Wege mit
gleichen Anfangs- und gleichen Endpunkten homotop sind.
11.6.2 Bemerkung. Ist Γ : [a, b] × [c, d] → D eine Homotopie zwischen γ0 und γ1 , so
auch Γ̂ : [a, b] × [0, 1] → D, wobei
Γ̂(t, s) = Γ(t, sb + (1 − s)a) .
Also kann man für Homotopien immer oBdA. annehmen, dass [c, d] = [0, 1].
KAPITEL 11. WEGINTEGRALE
116
11.6.3 Beispiel. Ist D ⊆ Rn offen, und sind γ0 , γ1 : [a, b] → D zwei stetige Wege mit
gleichem Anfangs- und gleichem Endpunkt, sodass die Konvexkombinationen
γα (t) := α · γ1 (t) + (1 − α) · γ0 (t)
für alle α ∈ [0, 1] und alle t ∈ [a, b] in D liegen, so ist Γ(t, α) := γα (t) stetig auf
[a, b] × [0, 1]. Also sind γ0 und γ1 homotop.
Insbesondere sind konvexe und offene D einfach zusammenhängende Gebiete; vgl.
Beispiel 11.3.4.
11.6.4 Satz. Sei D ⊆ Rn offen und sei φ : D → L(Rn , X) ein lokales Gradientenfeld.
Sind γ0 , γ1 : [a, b] → D zwei stetige und stückweise stetig differenzierbare Wege mit
gleichen Anfangs- und gleichen Endpunkten, die homotop sind, so gilt
Z
Z
φ(x) dx .
φ(x) dx =
γ0
γ1
Ist D ein einfach zusammenhängendes Gebiet, so ist φ : D → L(Rn , X) genau dann ein
lokales Gradientenfeld wenn es ein Gradientenfeld ist.
Beweis. Sei Γ : [a, b] × [0, 1] → D eine Homotopie zwischen γ0 und γ1 wie in Definition 11.6.1. Voraussetzungsgemäß gibt es zu jedem x ∈ K := Γ([a, b] × [0, 1]) ein
0 < ρ x ≤ +∞ mit Uρx (x) ⊆ D8 , sodass φ|Uρx (x) ein Gradientenfeld ist. Gemäß Bemerkung 11.5.2 können wir die ρ x maximal wählen, sodass Uρx (x) ⊆ D und φ|Uρx (x) ein
Gradientenfeld ist.
Wäre nun ρ := inf{ρ x : x ∈ K} gleich Null, so gäbe es eine Folge (xn )n∈N aus
K mit limn→∞ ρ xn = 0. Da K als stetiges Bild einer kompakten Menge kompakt ist,
hat diese Folge eine gegen ein x ∈ K konvergente Teilfolge (xn( j) ) j∈N . Für alle hinreichend großen j ∈ N gilt daher xn( j) ∈ U ρ2x (x) und in Folge der Dreiecksungleichung
somit auch U ρ2x (xn( j) ) ⊆ Uρx (x). Also ist für alle hinreichend großen j das Vektorfeld
φ|U ρx (xn( j) ) ein Gradientenfeld und somit ρ2x ≤ ρ xn( j) , was aber lim j→∞ ρ xn( j) = 0 wider2
spricht.
Damit haben wir die Existenz eines ρ > 0 gezeigt, sodass für alle x ∈ D immer
Uρ (x) ⊆ D und φ|Uρ (x) ein Gradientenfeld ist. Gemäß Satz 6.3.3 gibt es ein η > 0,
sodass
max(|t1 − t2 |, |s1 − s2 |) = d∞ (t1 , s1 ), (t2 , s2 ) < η ⇒
kΓ(t1 , s1 ) − Γ(t2 , s2 )k∞ < ρ .
(11.15)
Seien a = t0 < t1 < · · · < t p = b, 0 = s0 < s1 · · · < s p = 1, sodass für alle j, k =
1, . . . , p die Ungleichung |t j − t j−1 |, |sk − sk−1 | < η gilt. Also verlaufen für j, k = 1, . . . , p
die Polygonzüge
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→
α jk := Γ(t j−1 , sk−1 ) Γ(t j−1 , sk ), Γ(t j−1 , sk ) Γ(t j , sk )
und
8 Bezüglich
−−−−−−−−−−−−−−−−−−−−→ −−−−−−−−−−−−−−−−→
β jk := Γ(t j−1 , sk−1 ) Γ(t j , sk−1 ), Γ(t j , sk−1 ) Γ(t j , sk )
k.k∞ .
11.6. HOMOTOPIE UND EINFACHER ZUSAMMENHANG
ganz in Uρ (Γ(t j , sk )) ⊆ D. Mit Satz 11.4.1 folgt
Z
Z
0=
φ(x) dx −
α jk
Z
φ(x) dx +
−−−−−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk−1 ) Γ(t j−1 ,sk )
Z
φ(x) dx =
β jk
−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk ) Γ(t j ,sk )
−
117
φ(x) dx
Z
φ(x) dx −
−−−−−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk−1 ) Γ(t j ,sk−1 )
Z
−−−−−−−−−−−−−−−−→
Γ(t j ,sk−1 ) Γ(t j ,sk )
φ(x) dx .
Aufsummieren über j und k ergibt
0=
p Z
X
−−−−−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk−1 ) Γ(t j−1 ,sk )
j,k=1
−
φ(x) dx +
p Z
X
j,k=1
−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk ) Γ(t j ,sk )
p Z
X
j,k=1
−−−−−−−−−−−−−−−−−−−−→
Γ(t j−1 ,sk−1 ) Γ(t j ,sk−1 )
φ(x) dx −
φ(x) dx
p Z
X
−−−−−−−−−−−−−−−−→
Γ(t j ,sk−1 ) Γ(t j ,sk )
j,k=1
φ(x) dx .
Nach Indexverschiebungen (k
k + 1 bzw. j
j − 1) in den letzten beiden Summen
kürzen sich die meisten Summanden der ersten (zweiten) Summe mit welchen aus der
vierten (dritten) Summe. Übrig bleibt
0=
p Z
X
k=1
φ(x) dx +
−−−−−−−−−−−−−−−−→
Γ(t0 ,sk−1 ) Γ(t0 ,sk )
−
p Z
X
k=1
p Z
X
j=1
−−−−−−−−−−−−−−−−→
Γ(t j−1 ,s p ) Γ(t j ,s p )
−−−−−−−−−−−−−−−−→
Γ(t p ,sk−1 ) Γ(t p ,sk )
φ(x) dx
φ(x) dx −
p Z
X
j=1
−−−−−−−−−−−−−−−−→
Γ(t j−1 ,s0 ) Γ(t j ,s0 )
φ(x) dx .
Man beachte, dass Γ(t0 , s) = Γ(a, s) = γ0 (a) und Γ(t p , s) = Γ(b, s) = γ0 (b) für alle
−−−−−−−−−−−−−−−−→
−−−−−−−−−−−−−−−−→
s ∈ [0, 1]. Also sind die gerade Strecken Γ(t0 , sk−1 ) Γ(t0 , sk ) und Γ(t p , sk−1 ) Γ(t p , sk )
konstant, und somit verschwinden alle Wegintegrale in der ersten und in der dritten
Summe. Also erhalten wir
p Z
p Z
X
X
φ(x) dx .
(11.16)
φ(x) dx =
−−−−−−−−−−−−−−−−→
−−−−−−−−−−−−−−−−→
j=1
Γ(t j−1 ,s p ) Γ(t j ,s p )
j=1
Γ(t j−1 ,s0 ) Γ(t j ,s0 )
−−−−−−−−−−−−−−−−→
Für jedes j = 1, . . . , p sind aber γ0 |[t j−1 ,t j ] und Γ(t j−1 , s0 ) Γ(t j , s0 ) zwei stetige und
stückweise stetig differenzierbare Wege, welche den selben Anfangspunkt γ0 (t j−1 ) =
Γ(t j−1 , s0 ) und den selben Endpunkt γ0 (t j ) = Γ(t j , s0 ) haben. Aus (11.15) folgt zudem,
dass beide Wege innerhalb von Uρ (γ0 (t j )) ⊆ D verlaufen, worauf φ ein Gradientenfeld ist. Wegen Satz 11.4.1 erhalten wir somit, dass die Wegintegrale von φ über diese
beiden Wege übereinstimmen, dh.
Z
Z
φ(x) dx.,
φ(x) dx =
−−−−−−−−−−−−−−−−→
Γ(t j−1 ,s0 ) Γ(t j ,s0 )
γ0 |[t j−1 ,t j ]
Wir
R erhalten nach dem Aufsummieren über die j, dass die rechte Seite in (11.16) mit
φ(x) dx übereinstimmt. Entsprechend zeigt man, dass die linke Seite in (11.16) mit
Rγ0
φ(x) dx übereinstimmt. Also folgt die behauptete Gleichheit.
γ
1
KAPITEL 11. WEGINTEGRALE
118
Wenn D ein einfach zusammenhängendes Gebiet ist, dann sind zwei Wege
mit gleichem Anfangs- und Endpunkten immer homotop. Gemäß Satz 11.4.7 und
dem ersten Teil des aktuellen Satzes ist dann jedes lokale Gradientenfeld sogar ein
Gradientenfeld.
❑
11.7 Komplexe Wegintegrale
Wir wollen diesen Abschnitt mit einer Bemerkung aus der Linearen Algebra beginnen.
11.7.1 Bemerkung. Vektorräume X und Y über dem Skalarkörper C lassen sich klarerweise auch als Vektorräume über R auffassen. Ist dabei A : X → Y eine C-lineare
Abbildung, so ist A sicherlich auch R-linear. Die Umkehrung gilt im Allgemeinen sicher nicht, wie etwa das Beispiel der Vektorräume X = C = Y und A(ξ + iη) = 3ξ + iη
zeigt.
Wir fragen also, wann eine R-lineare Abbildung A : X → Y auch C-linear ist. Eine
offensichtlich notwendige Bedingung ist
A(ix) = iA(x), für alle x ∈ X .
(11.17)
Diese Bedingung ist auch hinreichend, da wegen der R-Linearität A(x+y) = A(x)+A(y)
für x, y ∈ X und da (ξ, η ∈ R, x ∈ X)
A (ξ + iη)x = A(ξx) + A(iηx) = A(ξx) + iA(ηx) = ξA(x) + iηA(x) = (ξ + iη)A(x) .
Für ein R-lineares A : X → Y gilt (11.17) sicher schon, wenn A(ix) = iA(x) für alle x
aus einer Basis von X (als Vektorraum über R) gilt.
Da 1, i eine Basis von C (über R) abgibt, trifft im Falle X = C Gleichung (11.17)
genau dann zu, wenn
A(i) = iA(1) .
(11.18)
In dem Fall ist wegen
A((ξ + iη)) = A((ξ + iη) · 1) = (ξ + iη) · A(1)
(11.19)
die Abbildung A nichts anderes, als die skalare Multiplikation mit dem Vektor A(1) ∈
Y.
Im Spezialfall X = Y = C R2 können wir jede R-lineare Abbildung A : C → C
T
T
11 α12
als 2 × 2-Matrix A = αα21
α22 anschreiben. Wegen 1 (1, 0) , i (0, 1) und weil für
T
2
ξ + iη (ξ, η) aus C R
!
! !
−η
0 −1 ξ
i(ξ + iη) = −η + iξ =
ξ
1 0 η
gilt, bedeutet Bedingung (11.18) dann gerade
!
!
!
!
−α21
0 −1 α11
α12
.
=
=
1 0 α21
α11
α22
Das ist äquivalent dazu, dass A von der speziellen Form
!
!
α11 α12
a −b
=
α21 α22
b a
(11.20)
ist. Wegen (11.19) stellt A gerade die Multiplikation mit der festen komplexen Zahl
A(1) = a + ib dar.
11.8. HOLOMORPHE FUNKTIONEN
119
11.7.2 Definition. Ist D ⊆ C, Y ein Banachraum über C, f : D → Y eine Funktion und
γ : [a, b] → D ein Weg, so ist das komplexe Wegintegral definiert durch
Z
f (z) dz := lim
|R|→0
γ
n(R)
X
j=1
γ(ξ j ) − γ(ξ j−1 ) f γ(α j ) ,
(11.21)
falls dieser Limes existiert.
Bemerkung 11.7.1 lässt sich dazu benutzen, um komplexe Wegintegrale auf die uns
schon bekannten Wegintegral zurückzuführen.
Man beachte, dass die Summanden in (11.21) Produkte von komplexen Zahlen mit
Vektoren aus Y sind. Zum Vergleich dazu sind die Summanden in (11.4) Elemente
aus X, die man erhält, wenn man γ(ξ j ) − γ(ξ j−1 ) ∈ Rn auf die lineare Abbildung
φ γ(α j ) ∈ L(Rn , X) anwendet.
Um dennoch komplexe Wegintegrale als Wegintegrale betrachten zu können, identifizieren wir C mit R2 . Dann lässt sich gemäß Bemerkung 11.7.1 die komplexe Multiplikation als Anwendung eins Zweivektors auf eine lineare Abbildung aus L(R2 , Y)
wie in (11.19) realisieren.
Definieren wir also φ f : D → L(R2 , Y) durch φ f (z) = ( ηξ 7→ (ξ + iη) f (z)), so
können wir (11.21) als
Z
f (z) dz = lim
|R|→0
γ
n(R)
X
j=1
φ f γ(α j ) γ(ξ j ) − γ(ξ j−1 ) =
Z
φ f (x) dx
(11.22)
γ
anschreiben, wobei (γ(ξ j ) − γ(ξ j−1 )) jetzt als Element von C R2 zu interpretieren ist,
das auf φ f γ(α j ) ∈ L(R2 , Y) angewandt wird.
Die Stetigkeit von φ f ist wegen z 7→ φ f (z)e1 = f (z) und z 7→ φ f (z)e2 = i f (z) gemäß
Bemerkung 11.2.4 äquivalent zur Stetigkeit von f . Also existiert für stetiges f sowie
stetiges und rektifizierbares γ gemäß Fakta 11.2.3, 2, das Integral in (11.22). Ist γ sogar
stetig und stückweise stetig differenzierbar, so folgt aus Satz 11.2.5
Z
f (z) dz =
γ
Z
φ f (x) dx =
γ
Z
b
φ f (γ(t)) γ′ (t) dt =
Z
a
a
b
γ′ (t) · f (γ(t)) dt .
(11.23)
Wegen (11.7) lässt sich die Norm eines komplexen Wegintegrals folgendermaßen
abschätzen:
Z
f
(z)
dz
(11.24)
≤ max k f ◦ γ(t)k · ℓ(γ) .
γ
t∈[a,b]
11.8 Holomorphe Funktionen
In diesem Abschnitt sei f : D → Y eine Funktion, wobei D ⊆ R2 C offen ist und
wobei Y ein Banachraum über dem Skalarkörper C ist.
Ist f in einem Punkt z = x+iy (x, y)T ∈ D differenzierbar im Sinne von Definition
10.1.13, so ist d f (z) dabei eine R-lineare Abbildung von R2 C nach Y mit
d f (z)v =
∂f
∂f
∂f
(z) = v1 (z) + v2 (z) ∈ Y, für alle v = (v1 , v2 )T ∈ R2 ( C) .
∂v
∂x
∂y
KAPITEL 11. WEGINTEGRALE
120
Gemäß (11.18) ist somit d f (z) genau dann C-linear, wenn
∂f
∂f
(z) = i (z) ,
∂y
∂x
(11.25)
denn es gilt ja 1 (1, 0)T , i (0, 1)T , wenn man komplexe Zahlen als Elemente von
R2 betrachtet. In dem Fall gilt dann wegen (11.19) für v = (v1 , v2 )T ∈ R2
!
∂f
1
d f (z)v = (v1 + iv2 ) · d f (z)
= (v1 + iv2 ) ·
(z) .
(11.26)
0
∂x
11.8.1 Bemerkung. Ist Y = C und setzen wir u := Re f und v := Im f , so gilt
 ∂u
 (z)
d f (z) =  ∂x
∂v
∂x (z)
und die Vektorgleichung (11.25) lässt sich als

∂u

∂y (z)

∂v
∂y (z)
,
∂v
∂v
∂u
∂u
(z) = − (z),
(z) =
(z)
∂y
∂x
∂y
∂x
schreiben. Man spricht von den Cauchy-Riemannschen Differentialgleichungen.
11.8.2 Lemma. Sei D ⊆ C offen, Y ein Banachraum über C und f : D → Y eine
Funktion. Für ein z ∈ D sind folgende beiden Aussagen äquivalent:
f ist bei z im Sinne von Definition 10.1.13 differenzierbar, sodass d f (z) eine
C-lineare Abbildung ist bzw. äquivalent dazu, dass (11.25) gilt.
Der Grenzwert – man spricht von der komplexen Ableitung –
df
f (z + h) − f (z)
(z) = f ′ (z) := lim
h→0
dz
h
existiert in C.
Treffen diese Aussagen zu, so heißt f bei z komplex differenzierbar und es gilt
f ′ (z) =
∂f
∂f
(z) = −i ·
(z) .
∂x
∂y
(11.27)
Außerdem ist f bei z stetig.
Ist f bei allen z ∈ D komplex differenzierbar, so gilt f ∈ C 1 (D) genau dann, wenn
z 7→ f ′ (z) als Abbildung von D nach Y stetig ist.
Beweis. Gemäß Definition 10.1.13 und wegen der Äquivalenz der Normen k.k2 = |.|
und k.k∞ auf C R2 ist f bei z genau dann differenzierbar, wenn
f (z + h) = f (z) + d f (z)h + |h|ε(h), h , 0 ,
(11.28)
für irgendeine Funktion ε : (D−z) \ {0} → Y mit limh→0 ε(h) = 0. Der Ausdruck
d f (z)h
ist dabei die Anwendung von h = h1 + ih2 , interpretiert als Element hh12 von R2 , auf
lineare Abbildung d f (z) ∈ L(R2 , Y)
11.8. HOLOMORPHE FUNKTIONEN
121
Ist dabei (11.25) erfüllt, so folgt aus (11.26), dass d f (z)h = h · g(z) mit g(z) =
= −i · ∂∂yf (z) ∈ Y. Daraus erhält man
∂f
∂x (z)
lim
h→0
|h|
f (z + h) − f (z)
= g(z) + lim
· ε(h) = g(z) ,
h→0 h
h
da k |h|
h · ε(h)k = kε(h)k → 0 für h → 0.
Falls umgekehrt der komplexe Grenzwert g(z) := limh→0
f (z)
−
g(z)
für h , 0 unmittelbar
folgt mit ε(h) := |h|h f (z+h)−
h
f (z+h)− f (z)
h
existiert, so
f (z + h) = f (z) + h · g(z) + |h| ε(h), h , 0 ,
wobei ε(h) → 0 für h → 0. Da die Ableitung d f (z) eindeutig ist, folgt hieraus d f (z)h =
h · g(z) und damit die C-Linearität von d f (z). Wegen Korollar 10.1.14 ist f bei z stetig.
Die letzte Aussage folgt unmittelbar aus (11.27).
❑
11.8.3 Definition. Sei D ⊆ C offen und Y ein Banachraum über dem Skalarkörper C.
Eine Funktion f : D → Y heißt holomorph auf D, falls sie bei allen Punkten z ∈ D
komplex differenzierbar ist und die Funktion z 7→ f ′ (z) stetig ist.
Mit einiger Mühe lässt sich zeigen, dass die Forderung, dass z 7→ f ′ (z) stetig ist, in
dieser Definition weggelassen werden kann; vgl. Satz 11.9.2.
11.8.4 Beispiel.
(i) Ist y ∈ Y fest, und gilt f (z) = y, z ∈ C, so ist f an allen Punkten z ∈ C komplex
differenzierbar mit
f ′ (z) = lim
h→0
f (z + h) − f (z)
= 0 (∈ Y) .
h
Da z 7→ 0 als Abbildung von C nach Y stetig ist, ist f holomorph.
(ii) Für die Funktion f : z 7→ z von C nach C, dh. f = idC , gilt an jedem Punkt z ∈ C
f ′ (z) = lim
h→0
(z + h) − z
f (z + h) − f (z)
= lim
=1.
h→0
h
h
Da die konstante 1-Funktion stetig ist, folgt die Holomorphie von f .
(iii) Für die Funktion f : z 7→
z ∈ C \ {0}
1
z
als Abbildung von C \ {0} nach C gilt an jedem Punkt
f ′ (z) = lim
h→0
Da z 7→
von f .
− z12
1
z+h
−
h
1
z
z − (z + h)
1
=− 2.
h→0 hz(z + h)
z
= lim
als Abbildung von C \ {0} nach C stetig ist, folgt die Holomorphie
11.8.5 Proposition. Seien D, G ⊆ C offen, Y ein komplexer Banachraum, α, β ∈ C und
f, f1 , f2 : D → Y, φ : D → C sowie g : G → Y Funktionen. Dann gelten folgende
Aussagen:
KAPITEL 11. WEGINTEGRALE
122
Sind f1 und f2 in z ∈ D komplex differenzierbar, so ist es auch α f1 +β f2 : D → Y,
wobei (α f1 + β f2 )′ (z) = α f1′ (z) + β f2′ (z). Sind f1 und f2 holomorph auf D, so ist
es auch α f1 + β f2 .
Sind φ und f in z ∈ D komplex differenzierbar, so ist es auch φ · f : D → Y,
wobei (Produktregel)
(φ · f )′ (z) = φ′ (z) f (z) + φ(z) f ′ (z) .
Sind f und φ holomorph auf D, so ist es auch φ · f .
Sind φ und f in z ∈ D komplex differenzierbar mit φ(z) , 0, so ist es auch
f
9
φ : {z ∈ D : φ(z) , 0} → Y , wobei (Quotientenregel)
!′
f
φ(z) f ′ (z) − φ′ (z) f (z)
(z) =
.
φ
φ(z)2
Sind f und φ holomorph auf {z ∈ D : φ(z) , 0}, so ist es auch φf .
Ist z ∈ D, sodass φ(z) ∈ G, und sind φ im Punkt z ∈ D und g im Punkt φ(z)
komplex differenzierbar, so ist g ◦ φ : φ−1 (G) → Y 9 im Punkt z komplex differenzierbar, wobei (Kettenregel)
(g ◦ φ)′ (z) = φ′ (z) · g′ (φ(z)) .
Sind φ und g holomorph, so ist es auch g ◦ φ : φ−1 (G) → Y.
Beweis. Linearität, Produktregel und Quotientenregel zeigt man fast genauso, wie die
fürs reelle Differenzieren; vgl. Satz 7.1.7. Die Grenzübergänge limh→0 sind dabei aber
in C zu nehmen.
Für die Kettenregel sei z ∈ D mit φ(z) ∈ G derart, dass φ im Punkt z und g im Punkt
φ(z) komplex differenzierbar ist. Für |h| hinreichend klein gilt dann
g ◦ φ(z + h) − g ◦ φ(z) φ(z + h) − φ(z)
=
· r(φ(z + h)) ,
h
h
für w , φ(z) und r(φ(z)) := g′ (φ(z)) definiert
wobei r : G → Y durch r(w) = g(w)−g(φ(z))
w−φ(z)
ist. Wegen der komplexen Differenzierbarkeit von g ist r bei φ(z) stetig, wodurch
φ(z + h) − φ(z)
g ◦ φ(z + h) − g ◦ φ(z)
= lim
· r(lim φ(z + h)) = φ′ (z) · g′ (φ(z)) .
h→0
h→0
h→0
h
h
lim
Sind φ und g holomorph, so gilt für alle z ∈ φ−1 (G), dass (g ◦ φ)′ (z) = φ′ (z) · g′ (φ(z)),
wobei die rechte Seite als Produkt stetiger Funktionen stetig ist. Also ist auch (g ◦ φ)′
stetig.
❑
11.8.6 Beispiel.
(i) Durch vollständige Induktion nach n ∈ N ∪ {0} folgt aus (z 7→ z)′ = 1 zusammen
mit der Produktregel, dass auch z 7→ zn auf C holomorph ist, wobei (z 7→ zn )′ (w) =
nwn−1 .
9 Man beachte, dass der Definitionsbereich dieser Funktion als Urbild einer offenen Menge unter der
stetigen Funktion φ selber offen ist.
11.8. HOLOMORPHE FUNKTIONEN
123
(ii) Durch wiederholte Anwendung von Proposition 11.8.5 folgt, dass alle Polynome
f (z) = a0 + a1 z + · · · + an zn mit festen a0 , . . . , an ∈ Y auf C holomorph sind. Dabei
gilt f ′ (z) = a1 + 2za2 + · · · + nzn−1 an .
(iii) Mit der Quotientenregel zeigt man allgemeiner, dass f : C \ {w} mit (N ∈ N,
w ∈ C und a−N , . . . , aN ∈ Y fest)
f (z) =
N
X
n=−N
(z − w)n an
holomorph ist, wobei
f ′ (z) =
N
X
n=−N
n(z − w)n−1 an .
(iv) Die Funktion exp : C → C ist auch holomorph, wobei exp′ (z) = exp(z). Das folgt
zum Beispiel aus der Tatsache, dass für f : R → C, t 7→ exp(wt) wegen der
Rechnung in Beispiel 7.1.4 f ′ (t) = w exp(wt) gilt. Daraus folgt dann
∂
∂
exp(x + iy) = exp(iy) exp(x) = exp(x + iy) und
∂x
∂x
∂
∂
exp(x + iy) = exp(x) exp(iy) = i exp(x + iy) .
∂y
∂x
Da diese Funktionen auf C stetig sind, erhalten wir exp ∈ C 1 (C), wobei offensichtlich auch (11.25) erfüllt ist. Also ist exp holomorph, wobei wegen (11.27)
exp′ (z) = exp(z).
Die Tatsache, dass f : D → Y holomorph ist, lässt sich auch von einer anderen
Seite beleuchten. Dazu betrachte
man das stetig differenzierbare Vektorfeld φ f : D →
L(R2 , Y) durch φ f (z) = ( ηξ 7→ (ξ + iη) f (z)). Aus (11.25) folgt dann (z = x + iy)
∂
∂
∂f
∂
φ f (z)e1 =
f (z) = i (z) =
φ f (z)e2 .
∂y
∂y
∂x
∂x
Gemäß Satz 11.5.6 ist φ f ein lokales Gradientenfeld, und wir können Satz 11.6.4 anwenden, um folgendes Korollar herzuleiten.
11.8.7 Korollar. Sei f : D → Y holomorph auf der offenen Menge D ⊆ C. Sind
γ0 , γ1 : [a, b] → D zwei stetige und stückweise stetig differenzierbare Wege mit gleichen Anfangs- und gleichen Endpunkten, die homotop in D sind, so gilt
Z
Z
f (z) dz .
f (z) dz =
γ0
γ1
Ist D einfach zusammenhängend, dann gibt es eine, bis auf eine additive Konstante aus
Y eindeutige, holomorphe Funktion F mit F ′ (z) = f (z) für alle z ∈ D. Dabei gilt
Z
f (ζ) dζ
F(z) − F(w) =
γ
für alle z, w ∈ D. Hier ist die rechte Seite ein komplexes Wegintegral und γ irgendein
stetiger, stückweise stetig differenzierbarer und in D verlaufender Weg mit Anfangspunkt w und Endpunkt z.
KAPITEL 11. WEGINTEGRALE
124
R
R
R
R
Beweis. Wegen (11.22) gilt γ f (z) dz = γ φ f (x) dx und γ f (z) dz = γ φ f (x) dx.
0
0
1
1
Also folgt die erste Aussage sofort aus Satz 11.6.4.
Ist D einfach zusammenhängend, so folgt aus demselben Satz, dass φ f ein Gradientenfeld ist, dh. φ f = dF für ein stetig differenzierbares F : D → Y. Dieses F ist
gemäß Korollar 11.4.4 eindeutig bis auf eine additive Konstante aus Y. Da e1 , e2 eine
Basis von R2 ist, bedeutet aber φ f = dF nichts anderes, als
i·
∂F
∂F
(z) = i · φ f (z) e1 = i · f (z) = φ f (z) e2 =
(z) .
∂x
∂y
Also folgt die Holomorphie
von F, wobei wegen (11.27) F ′ = f . Schließlich erhält
R
man F(z) − F(w) = γ f (ζ) dζ unmittelbar aus (11.22) und Satz 11.4.1.
❑
11.8.8 Bemerkung. Angenommen D ⊆ C ist offen und w, z ∈ D sowie 0 < r1 < r2 <
+∞ derart, dass Kr1 (z) ⊆ Kr2 (w) und Kr2 (w) \ Ur1 (z) ⊆ D, wobei wir hier die Kugeln
bzgl. k.k2 = |.| meinen. Wir schließen dabei den Fall z = w nicht aus. Weiters seien
γ1 , γ2 : [0, 2π] → D die Wege γ1 (t) = z + r1 exp(it) bzw. γ2 (t) = w + r2 exp(it), für die
γ1 ([0, 2π]) = Kr1 (z) \ Ur1 (z) ⊆ Kr2 (w) und γ2 ([0, 2π]) = Kr2 (w) \ Ur2 (w) gilt.
Wir behaupten, dass für jedes holomorphe f : D → Y
Z
Z
f (z) dz .
(11.29)
f (z) dz =
γ1
γ2
Dazu betrachten wir für j = 1, 2 die Wege β j : [−1, 2π + 1] definiert durch

−t


, falls t ∈ [−1, 0)

2 γ1 (0) + γ2 (0) + (1 + t)γ j (0)



β j (t) = 
γ
(t)
, falls t ∈ [0, 2π]
j




 t−2π γ1 (0) + γ2 (0) + (1 − t + 2π)γ j(0) , falls t ∈ (2π, 2π + 1]
2
Beide Wege sind geschlossen, und
beide haben den Anfangs- bzw.
Endpunkt m := 12 γ1 (0) + γ2 (0) .
β j setzt sich zusammen aus
−−−−−→
dem zur Strecke mγ j (0) äquivalenten Teil β j |[−1,0] , aus γ j =
β j |[0,2π] und aus dem zur Strecke
−−−−−→
−−−−−→
γ j (0)m = mγ j (0)− äquivalenten
Teil β j |[2π,2π+1] .
z
β1 |[−1,0]
β1 |[2π,2π+1]
γ1 = β1 |[0,2π]
w
m
β2 |[−1,0]
β2 |[2π,2π+1]
γ2 = β2 |[0,2π]
Da Kr2 (w) konvex ist, verlaufen die Wege β1 und β2 ganz in Kr2 (w). Außerdem gilt
für alle ζ ∈ Kr2 (w)
Re ζ = Re w + Re(ζ − w) ≤ Re w + |ζ − w| ≤ Re w + r2 ,
11.8. HOLOMORPHE FUNKTIONEN
125
und somit
Re z + r1 = Re γ1 (0) ≤ Re w + r2 = Re γ2 (0) .
−−−−−−−−−→
Da die Bilder von β j |[−1,0] und β j |[2π,2π+1] ganz im Bild von γ1 (0)γ2 (0) enthalten sind,
sind diese auch ganz in der konvexen Teilmenge {ζ ∈ C : Re ζ ≥ Re z + r1 } von C
enthalten. Wegen Re ζ − Re z ≤ |ζ − z| gilt {ζ ∈ C : Re ζ ≥ Re z + r1 } ⊆ C \ Ur1 (z),
womit die Wege β1 und β2 ganz in Kr2 (w) \ Ur1 (z) ⊆ D verlaufen.
Definieren wir Γ : [−1, 2π + 1] × [0, 1] → C durch
Γ(t, s) := sβ1 (t) + (1 − s)β2 (t) ,
(11.30)
so folgt aus Konvexitätsgründen auch, dass das Bild von Γ ganz in Kr2 (w) liegt.
Andererseits gilt für t ∈ [0, 2π] und s ∈ [0, 1] wegen der zu Kr1 (z) ⊆ Kr2 (w) äquivalenten Tatsache, dass |z−w|+r1 ≤ r2 , und wegen der umgekehrten Dreiecksungleichung
r1 = (1 − s)r1 + sr1 ≤ (1 − s)r2 + sr1 − (1 − s)|z − w| ≤
((1 − s)r2 + sr1 ) · exp(it) − (1 − s)(z − w) = |sγ1 (t) + (1 − s)γ2 (t) − z| .
Somit liegt Γ(t, s) immer außerhalb von Ur1 (z).
Zudem liegt für t ∈ [−1, 0] ∪ [2π, 2π + 1] und s ∈ [0, 1] der Punkt Γ(t, s) wieder aus
Konvexitätsgründen ganz in {ζ ∈ C : Re ζ ≥ Re z + r1 }.
Insgesamt liegt das Bild von Γ in Kr2 (w) \ Ur1 (z) ⊆ D. Also sind die Wege β1 und
β2 homotop in D. Gemäß Korollar 11.8.7 gilt für die auf D holomorphe Funktion f
Z
Z
f (z) dz .
f (z) dz =
β1
β2
Da β j |[−1,0] äquivalent zu β j |[2π,2π+1] − ist, heben sich die Wegintegrale über die linearen
Teile von β j für j = 1, 2 auf (vgl. Fakta 11.2.3, 1), und es folgt (11.29).
11.8.9 Satz (Cauchysche Integralformel). Sei f : D → Y holomorph mit offenem
D ⊆ C, und seien w ∈ C und ρ > 0 derart, dass Kρ (w) ⊆ D.
Ist z ∈ Uρ (w), und ist γ : [0, 2π] → D der Weg γρ : t 7→ w + ρ · exp(it) oder ein in
D \ {z} zu γρ homotoper, stetiger und stückweise stetig differenzierbarer Weg, so gilt
Z
f (ζ)
1
dζ .
(11.31)
f (z) =
2πi γ ζ − z
Beweis. Man betrachte die Funktion
f (η) − f (z)
G(η) =
, η ∈ D \ {z} .
η−z
f (z)
Nach Proposition 11.8.5 ist G : D \ {z} → Y holomorph. Da limη→z f (η)−
existiert,
η−z
′
kann man G auf D durch G(z) := f (z) stetig fortsetzen; vgl. Bemerkung 6.4.4.
Wegen Kρ (w)\Ur (z) ⊆ D\{z} für ein hinreichend kleines r > 0 folgt aus Bemerkung
11.8.8, dass
Z
Z
G(ζ) dζ ,
G(ζ) dζ =
γρ
µǫ
für alle ǫ ∈ (0, r], wobei µǫ (t) = z + ǫ · exp(it). Andererseits kann man den Betrag der
rechten Seite mit Hilfe von (11.24) nach oben abschätzen durch
Z 2π
|µ′ǫ (t)| dt = sup kG(η)k · 2πǫ .
max kG ◦ µǫ (t)k · ℓ(µǫ ) ≤ sup kG(η)k ·
t∈[0,2π]
η∈Kρ (w)
0
η∈Kρ (w)
KAPITEL 11. WEGINTEGRALE
126
Da G auf das kompakte Kρ (w) stetig fortgesetzt wurde, sind obige Suprema endlich.
Damit geht der Ausdruck rechts für ǫ ց 0 gegen Null. Weil komplexe Wegintegrale
linear im Integranden sind, folgt
Z
Z
Z
f (ζ)
1
G(ζ) dζ =
0=
dζ − f (z) ·
dζ .
γρ ζ − z
γρ
γρ ζ − z
Wieder mit Bemerkung 11.8.8 und mit Hilfe von (11.23) berechnet man
Z
Z
1
1
dζ =
dζ = 2πi .
γρ ζ − z
µr ζ − z
Somit folgt (11.31) für γ = γρ . Ist γ in D \ {z} homotop zu γρ , so folgt (11.31) aus
Korollar 11.8.7.
❑
Schreiben wir (11.31) mit Hilfe von (11.23) als Riemann Integral, so erhalten wir
für alle z ∈ Uρ (w)
Z
Z 2π
f (ζ)
1
f (w + ρ exp(it))
1
dζ =
dt .
(11.32)
ρ exp(it) ·
f (z) =
2πi γρ ζ − z
2π 0
w + ρ exp(it) − z
11.8.10 Korollar. Ist f : D → Y holomorph mit offenem D ⊆ Y, so ist auch f ′ : D → Y
holomorph. Infolge sind alle Funktionen f (n) : D → Y, n ∈ N rekursiv definiert durch
f (n+1) = ( f (n) )′ , holomorph auf D. Insbesondere ist f ∈ C ∞ (D).
Dabei gilt für jedes w ∈ D und ρ > 0 mit Kρ (w) ⊆ D
Z
n!
f (ζ)
dζ für alle z ∈ Uρ (w) .
(11.33)
f (n) (z) =
2πi γ (ζ − z)n+1
Hier ist γ : [0, 2π] → D der Weg γρ : t 7→ w + ρ · exp(it) oder ein in D \ {z} zu γρ
homotoper, stetiger und stückweise stetig differenzierbarer Weg.
f (w+ρ exp(it))
Beweis. Sei ρ > 0 so, dass Kρ (w) ⊆ D. Der Integrand ht (z) := ρ exp(it) · w+ρ
exp(it)−z
der rechten Seite von (11.32) ist offensichtlich stetig als Funktion von (z, t) ∈ Uρ (w) ×
[0, 2π] nach Y; vgl. Korollar 6.1.8. Wie wir in Beispiel 11.8.6 gesehen haben, ist ht (z)
als Funktion der Variable z ∈ Uρ (w) holomorph mit (z = x + iy)
∂ht
∂ht
f (w + ρ exp(it))
.
(z) = −i ·
(z) = h′t (z) = ρ exp(it) ·
∂x
∂y
(w + ρ exp(it) − z)2
Diese Funktion ist stetig als Funktion von (z, t) ∈ Uρ (w) × [0, 2π] nach Y; vgl. Korollar
6.1.8. Insbesondere sind die Voraussetzungen von Korollar 8.7.12 (siehe auch (9.19))
erfüllt, und wir erhalten für z ∈ Uρ (w)
1
f (z) =
2π
′
Z
0
2π
∂
ht (z) dt =
∂x
Z 2π
Z
1
f (ζ)
f (w + ρ exp(it))
1
ρ exp(it) ·
dt =
dζ .
2π 0
2πi γρ (ζ − z)2
(w + ρ exp(it) − z)2
Nun ist h′t : Uρ (w) → Y ebenfalls holomorph mit
∂h′
∂h′t
f (w + ρ exp(it))
.
(z) = −i · t (z) = h′′t (z) = ρ exp(it) · 2
∂x
∂y
(w + ρ exp(it) − z)3
11.8. HOLOMORPHE FUNKTIONEN
127
Diese Funktion ist wieder stetig als Funktion von (z, t) ∈ Uρ (w) × [0, 2π] nach Y. Nach
Korollar 8.7.12 (siehe auch (9.19)) folgt für z ∈ Uρ (w)
1
∂f′
(z) =
∂x
2π
Z
2π
0
∂ ′
1
ht (z) dt =
∂x
2π
Z
0
2π
−i ·
∂ ′
∂f′
ht (z) dt = −i ·
(z) .
∂y
∂y
wobei diese Funktion gemäß Korollar 8.7.9 (siehe auch (9.18)) stetig von z ∈ Uρ (w)
abhängt. Es folgt f ′ ∈ C 1 (D), und nach Lemma 11.8.2 ist f ′ auf Uρ (w) holomorph mit
∂f′
1
( f ) (z) =
(z) =
∂x
2π
′ ′
Z
2π
h′′t (z) dt
0
2
=
2πi
Z
γρ
f (ζ)
dζ .
(ζ − z)3
Insbesondere gilt f ∈ C 2 (Uρ (w)). Da w ∈ D beliebig war, gilt f ∈ C 2 (D), und – da
Holomorphie offenbar eine lokale Eigenschaft ist – ist f ′ holomorph auf D.
Verfährt man induktiv weiter, so folgt insbesondere (11.33) und f ∈ C n (D) für alle
n ∈ N, wobei γ = γρ in (11.33). Für in D \ {z} zu γρ homotope γ folgt (11.33) aus
Korollar 11.8.7.
❑
11.8.11 Korollar (Satz von Liouville). Jedes auf ganz C holomorphe und beschränkte
f : C → Y ist eine konstante Funktion.
Beweis. Es gelte k f (z)k ≤ M, z ∈ C. Ist ρ > 0, w ∈ C und γ(t) = w + ρ · exp(it), so folgt
wegen (11.33) und (11.24)
Z
f (ζ)
1
M
1
1 ′
M · 2πρ =
.
dζ ≤
k f (w)k =
2π γ (ζ − w)2 2π ρ2
ρ
Da wir ρ > 0 beliebig groß wählen können, folgt f ′ (w) = 0. Da auch 0′ = 0, folgt aus
der Eindeutigkeitsaussage in Korollar 11.8.7, dass f konstant ist.
❑
Ein stetiger Weg γ : [a, b] → D heißt geschlossen, wenn γ(a) = γ(b).
11.8.12 Satz (Satz von Morera). Für ein offenes D ⊆ C und eine Funktion f : D → Y
sind folgende Aussagen äquivalent:
f ist holomorph.
f ist stetig und zu jedem w ∈ D gibt es ein offenes D(w) mit w ∈ D(w) ⊆ D,
sodass
Z
f (ζ) dζ = 0
(11.34)
γ
für alle geschlossenen, achsenparallelen Polygonzüge γ in D(w).
Das Vektorfeld φ f : D → L(R2 , Y) definiert durch φ f (z) = ( ηξ 7→ (ξ + iη) f (z))
ist ein lokales Gradientenfeld.
In dem Fall gilt (11.34) für alle einfach zusammenhängenden Gebiete D(w) mit w ∈
D(w) ⊆ D, etwa für alle offene, in D enthaltenen Kugeln um w.
KAPITEL 11. WEGINTEGRALE
128
Beweis. Ist f holomorph
und D(w) einfach zusammenhängendes Gebiet mit w ∈
R
D(w) ⊆ D, so folgt γ f (ζ) dζ = 0 sofort aus Korollar 11.8.7. Außerdem ist f stetig;
vgl. Lemma 11.8.2.
Sei nun f stetig und gelte (11.34) für jedes w ∈ D und jeden geschlossenen, achsenparallelen Polygonzug γ in D(w) mit einem offenen D(w), sodass w ∈ D(w) ⊆ D.
Wegen Bemerkung 11.2.4 ist die Stetigkeit von f zu der von φ f : D → L(R2 , Y) äquivalent. Gemäß (11.22) gilt
Z
Z
φ f (x) dx
f (ζ) dζ =
0=
γ
γ
für das Vektorfeld φ f |D(w) : D(w) → L(R2 , Y). Nach Bemerkung 11.4.8 sind daher die
Voraussetzungen für Satz 11.4.7 für φ f : D(w) → L(R2 , Y) erfüllt. Somit gilt φ f = dF
für ein Y-wertiges F ∈ C 1 (D(w)). Definitionsgemäß ist daher φ f : D → L(R2 , Y) ein
lokales Gradientenfeld.
Sei schließlich φ f : D → L(R2 , Y) ein lokales Gradientenfeld. Da e1 , e2 eine Basis
von R2 ist, bedeutet aber φ f = dF auf einer offenen, w enthaltenden Menge D(w) ⊆ D
nichts anderes, als
i·
∂F
∂F
(z) = i · φ f (z) e1 = i · f (z) = φ f (z) e2 =
(z) .
∂x
∂y
Damit folgt die Holomorphie von F auf D(w), wobei wegen (11.27) F ′ = f . Gemäß
Korollar 11.8.10 ist auch F ′ = f auf D(w) holomorph. Da w beliebig war, und da
Holomorphie eine lokale Eigenschaft ist, folgt die Behauptung.
❑
11.8.13 Lemma. Sei D ⊆ C offen, und fn : D → Y, n ∈ N, eine Folge holomorpher
Funktionen, die lokal gleichmäßig auf D gegen eine Funktion f : D → Y konvergiert,
dh. für jede kompakte Teilmenge K ⊆ D konvergiert ( fn |K )n∈N gleichmäßig auf K gegen
f |K . Dann ist auch f holomorph.
Beweis. Wähle zu w ∈ D die offene Menge D(w) wie Satz 11.8.12. Gemäß dieses
Satzes können wir sie sogar unabhängig von n so wählen, dass für alle n ∈ N
Z
fn (ζ) dζ = 0 ,
γ
wenn nur γ : [0, m] → D(w) ein geschlossener, achsenparalleler Polygonzug ist. K :=
γ([0, m]) ist als stetiges Bild einer kompakten Menge selber kompakt. Nun stimmt
wegen (11.23) obiges Wegintegral überein mit
Z m
γ′ (t) · fn (γ(t)) dt = 0 .
0
′
′
Wegen kγ (t) · fn (γ(t)) − γ (t) · f (γ(t))k ≤ k fn − f k∞,K · kγ′ k∞,[0,m] , t ∈ [0, m], und da γ ein
Polygonzug ist und daher kγ′ k∞,[0,m] < +∞, konvergiert die Funktionenfolge γ′ · fn ◦ γ
gleichmäßig gegen γ′ · f ◦ γ auf [0, m]. Aus Satz 8.7.2 (siehe auch (9.17)) folgt
Z m
Z m
Z
γ′ (t) · fn (γ(t)) dt = 0 .
γ′ (t) · f (γ(t)) dt = lim
f (ζ) dζ =
γ
0
n→∞
0
Nach Satz 11.8.12 ist daher f holomorph.
❑
11.8. HOLOMORPHE FUNKTIONEN
129
P
11.8.14 Korollar. Seien an ∈ Y, n ∈ N ∪ {0} derart, dass die Potenzreihe ∞
zn an
Pn=0
∞
10
einen Konvergenzradius R > 0 hat . Ist w ∈ C, so ist die Grenzfunktion f (z) = n=0 (z−
w)n an auf UR (w) holomorph. Dabei ist UR (w) die offene Kugel bzgl. |.|, dh. UR (w) =
{z ∈ C : |z − w| < R}.
Beweis. Für ein kompaktes K ⊆ UR (w) existiert r = maxz∈K |z − w| (< R), da z 7→ |z − w|
stetig auf der kompakten Menge K ist. Also gilt K ⊆ Kr (w) ⊆ UR (w).
Nach Satz 6.7.7 (siehe auch Fakta 9.3.8, 4) konvergiert die Funktionenfolge
PN
z 7→ n=0
(z − w)n an für N → ∞ gleichmäßig auf Kr (w) gegen f (z); somit auch auf
PN
K. Da gemäß Beispiel 11.8.6 alle Polynome n=0
(z − w)n an holomorph sind, ist nach
Lemma 11.8.13 auch f auf UR (w) holomorph.
❑
11.8.15 Satz. Sei D ⊆ C offen. Eine Funktion f : D → Y ist genau dann holomorph,
wenn f analytisch ist, dh. wenn es zu jedem w ∈ D eine offene Kreisscheibe Uρw (w) ⊆ D
P
n
bzgl. |.| gibt, sodass sich f darauf als Grenzfunktion einer Potenzreihe ∞
n=0 (z − w) an
mit Konvergenzradius ≥ ρw darstellen lässt; vgl. Bemerkung 6.7.11.
Dabei sind die Koeffizienten an ∈ Y eindeutig durch f auf folgende Weise bestimmt:
a0 = f (w), und an :=
f (n) (w)
, n ∈ N.
n!
Das größtmögliche ρw , sodass sich ein holomorphes f als Potenzreihe auf Uρw (w) darstellen lässt, ist ρw = sup{r > 0 : Ur (w) ⊆ D}, wobei ρw = +∞, wenn D = C.
Beweis. Lässt sich f um jedes w auf einem Uρw (w) ⊆ D lokal als Grenzfunktion einer
Potenzreihe darstellen, so ist f dort gemäß Korollar 11.8.14 holomorph. Da Holomorphie eine lokale Eigenschaft ist, muss f auf ganz D holomorph sein.
Sei nun f : D → Y holomorph, und setze ρw = sup{r > 0 : Ur (w) ⊆ D}. Offensichtlich ist das das größte ρw mit Uρw (w) ⊆ D. Für ρ ∈ (0, ρw ), ζ ∈ C mit |ζ − w| = ρ
und für z ∈ Uρ (w) gilt
!n
∞
X
1
1
1
1
z−w
=
·
·
.
z−w =
ζ − w n=0 ζ − w
ζ − w 1 − ζ−w
ζ−z
Aus (11.32) folgt (γρ (t) = w + ρ exp(it), t ∈ [0, 2π])
1
f (z) =
2πi
!n
Z X
∞
f (ζ)
z−w
·
dζ =
ζ
−
w
ζ
−w
γρ n=0
!n
Z 2π X
∞
z−w
1
· f (w + ρ exp(it)) dt .
2π 0 n=0 ρ exp(it)
Wegen
∞ X
sup
t∈[0,2π] n=0
10 Vgl.
z−w
ρ exp(it)
!n
!n
∞
X |z − w|
· f (w + ρ exp(it)) ≤
· k f k∞,Kρ (w) < +∞
ρ
n=0
(6.7), Satz 6.7.7 sowie Fakta 9.3.8.
KAPITEL 11. WEGINTEGRALE
130
konvergiert die Reihe im obigen Riemann Integral absolut und daher gleichmäßig; vgl.
Korollar 6.7.4. Aus Satz 8.7.2 (siehe auch (9.17)) folgt daher11
!n
Z 2π
∞
X
1
z−w
f (z) =
· f (w + ρ exp(it)) dt =
2π 0
ρ exp(it)
n=0


Z
∞
X

 1
f (ζ)
n 
dζ  .
(z − w) · 
n+1
2πi γρ (ζ − w)
n=0
|
{z
}
=:an
P∞
Die letzte Gleichheit folgt aus (11.23). Also konvergiert n=0 (z − w)n an und stimmt mit
(n)
f (z) überein, wobei wegen (11.31) bzw. (11.33) a0 = f (w) und an := f n!(w) , n ∈ N.
Aus (6.7) folgt schließlich, dass diese Potenzreihe einen Konvergenzradius
R ≥ |z − w| hat, und da z ∈ Uρ (w) beliebig war, gilt R ≥ ρ. Da auch ρ ∈ (0, ρw ) beliebig
war, folgt R ≥ ρw .
❑
11.8.16 Bemerkung (*). Wir haben gezeigt, dass jedes holomorphe f : D → Y unendlich oft differenzierbar ist. Somit existieren neben allen höheren partiellen Ableitungen
auch alle Ausdrücke der Form (10.8), dh. auch die alle Ausdrücke dk f (z)(v1 , . . . , vk )
aus Definition 10.2.6 für alle k ∈ N, alle z ∈ D und alle Richtungsvektoren v1 , . . . , vk ∈
R2 C. Gemäß (11.26) gilt für k = 1
∂f
(z) = d1 f (z)v1 = v1 · f ′ (z) .
∂v1
Ersetzen wir f durch die holomorphe Funktion z 7→ v1 · f ′ (z) und v1 durch v2 , so folgt
∂ ∂
f (z) = d2 f (z)(v1 , v2 ) = v2 · v1 · f ′ (z) .
∂v2 ∂v1
Fährt man so fort, so erhält man allgemein dk f (z)(v1 , . . . , vk ) = vk · . . . · v1 · f (k) (z).
Insbesondere stimmt die Reihe aus Proposition 10.2.12, (ii), für y = w ∈ D mit der
Potenzreihe aus Satz 11.8.15 überein.
11.9 Nochmals komplexe Differenzierbarkeit*
Wir werden in diesem Abschnitt zeigen, dass f : D → Y genau dann holomorph ist,
wenn f bei allen z ∈ D komplex differenzierbar ist. Man kann also bei der Definition
der Holomorphie in Definition 11.8.3 auf die Stetigkeit von f ′ verzichten.
11.9.1 Lemma. Sei R ⊆ C ein offenes Rechteck. Sei f : R → Y bei jedem z ∈ R
differenzierbar, und es gelte ∂yf (z) = i ∂xf (z) für alle z ∈ R. Eine gemäß Lemma 11.8.2
äquivalente Forderung ist, dass f bei allen z ∈ R komplex differenzierbar ist.
Ist weiters das Rechteck [α1 , β1 ] × [α2 , β2 ] in R enthalten, so gilt
Z
Z
f (z) dz ,
(11.35)
f (z) dz =
γ1
wobei γ1 =
γ2
−
−−→ −−−
−−→
−
−−→ −−−
−−→
−−
−−
α1 β1
α1 β1
β1 β1
α1 α1
,
,
und
γ
=
2
α2 β2
α2 β2
β2 β2 .
α2 α2
11 Insbesondere
konvergiert diese Reihe!
11.9. NOCHMALS KOMPLEXE DIFFERENZIERBARKEIT*
131
Beweis. Aus der Differenzierbarkeit von f folgt seine Stetigkeit bei allen z ∈ R; vgl.
Korollar 10.1.14. Somit existieren die obigen komplexen Wegintegrale. Außerdem ist
(11.35) dazu äquivalent, dass
Z
f (z) dz
I(Q) :=
∂Q
verschwindet, wobei Q = [α1 , β1 ] × [α2 , β2 ] und ∂Q der geschlossene Polygonzug
−−−−!−−−→! −−−−!−−−→! −−−−!−−−→! −−−−!−−−→!
α1 β1 β1 β1 β1 α1 α1 α1
,
,
,
α2 α2 α2 β2 β2 β2 β2 α2
ist. Unterteilen wir Q in die vier gleich großen Rechtecke
!
1!
k · β1 −α
1
α1
2
1
, k, l = 0, 1 ,
Qkl := ([0, β1 − α1 ] × [0, β2 − α2 ]) +
+
2
2
α2
l · β2 −α
2
so folgt
I(Q) =
Z
f (z) dz =
∂Q
1 Z
X
k,l=0
|
f (z) dz ,
∂Q1k,l
{z
:=I(Q1k,l )
}
da sich die Wegintegrale über die inneren Polygonzüge wegheben und die über die
äußeren Polygonzüge aufaddieren.
Wäre nun I(Q) , 0, so hätten wir auch I(Q1k,l ) , 0 für zumindest ein Paar k, l ∈
{0, 1}. Seien nun k1 , l1 ∈ {0, 1}, sodass kI(Q1k1 ,l1 )k ≥ kI(Q1k,l )k für alle k, l ∈ {0, 1}.
Offenbar gilt dann
1
X
kI(Q)k ≤
kI(Q1k,l )k ≤ 4kI(Q1k1 ,l1 )k .
k,l=0
Nun unterteilen wir jedes der Rechtecke Q1k,l in vier gleich großen Rechtecke und erhalten insgesamt die 16 Rechtecke Q2k,l , k, l = 0, . . . , 3. Unter den in Q1k1 ,l1 enthaltenen
Rechtecken aus {Q2k,l : k, l = 0, . . . , 3} wählen wir eines – Q2k2 ,l2 , k2 , l2 ∈ {0, . . . , 3} –
aus, sodass kI(Q2k2 ,l2 )k maximal ist, womit kI(Q1k1 ,l1 )k ≤ 4kI(Q2k2 ,l2 )k.
Setzen wir diese Prozedur fort, so haben wir im n-ten Schritt Q in 4n Rechtecke
!
1!
k · β12−α
n
α1
1
, k, l = 0, . . . , 2n − 1 ,
+
Qnk,l := n ([0, β1 − α1 ] × [0, β2 − α2 ]) +
2
2
α2
l · β22−α
n
P2n −1
n
unterteilt, auf dass k,l=0 I(Qk,l ) = I(Q). Zudem seien kn , ln ∈ {0, . . . , 2n − 1} so,
n
n
n
n−1
dass Qnkn ,ln ⊆ Qn−1
kn−1 ,ln−1 und kI(Qkn ,ln )k = max{kI(Qk,l )k : Qk,l ⊆ Qkn−1 ,ln−1 }, womit
n−1
n
kI(Qkn−1 ,ln−1 )k ≤ 4kI(Qkn ,ln )k.
Da die Rechtecke Qnkn ,ln , n ∈ N ineinander geschachtelt sind, erfüllt diese MengenT
folge die endliche Durchschnittseigenschaft. Somit ist n∈N Qnkn ,ln nichtleer. Da aber
die Durchmesser d(Qnkn ,ln ) von Qnkn ,ln für n → ∞ gegen Null konvergieren, ist dieser
T
Durchschnitt einpunktig, dh. n∈N Qnkn ,ln = {w}.
Die noch nicht verwendete Tatsache, dass f insbesondere bei w komplex differenzierbar ist, besagt, dass f (z) = f (w) + (z − w) f ′ (w) + |z − w|ε(z) mit limz→w ε(z) = 0.
Aus der Linearität von Wegintegralen folgt
Z
Z
|z − w|ε(z) dz .
f (w) + (z − w) f ′ (w) dz +
I(Qnkn ,ln ) =
∂Qnkn ,ln
∂Qnkn ,ln
KAPITEL 11. WEGINTEGRALE
132
Da z 7→ f (w) + (z − w) f ′ (w) holomorph ist, folgt aus (11.24) und Korollar 11.8.7
Z
n
|z − w|ε(z) dzk ≤ ℓ(∂Qnkn ,ln ) d(Qnkn ,ln ) sup kε(z)k .
kI(Qkn ,ln )k = k
z∈Qnkn ,ln
∂Qnkn ,ln
Wegen ℓ(∂Qnkn ,ln ) =
1
2n ℓ(∂Q)
und d(Qnkn ,ln ) =
1
2n d(Q)
kI(Q)k ≤ 41 kI(Q1k1 ,l1 )k ≤ · · · ≤ 4n kI(Qnkn ,ln )k ≤ 4n
folgt
1
n→∞
ℓ(∂Q)d(Q) sup kε(z)k −→ 0 .
4n
z∈Qnkn ,ln
Also gilt I(Q) = 0 im Gegensatz zu unserer Annahme I(Q) , 0.
❑
11.9.2 Satz. Sei Y ein Banachraum über C, D ⊆ C offen. Eine Funktion f : D → Y ist
genau dann holomorph, wenn f bei allen z ∈ D komplex differenzierbar ist.
Beweis. Definitionsgemäß ist jede holomorphe Funktion komplex differenzierbar; vgl.
Definition 11.8.3. Sei nun f : D → Y überall komplex differenzierbar, w ∈ D und δ > 0
so klein, dass das Quadrat D(w) := Uδk.k∞ (w) ganz in D enthalten ist. Wir können also
Lemma 11.9.1 auf R = D(w) anwenden.
Definieren wir φ f : D(w) → L(R2 , Y) durch φ f (z) = ( ηξ 7→ (ξ + iη) f (z)), so kann
wegen (11.22) die Gleichung (11.35) auch als
Z
Z
φ f (x) dx
φ f (x) dx =
γ1
γ2
angeschrieben. Insbesondere sind die Voraussetzungen von Lemma 11.4.6 erfüllt, womit sich φ f auf D(w) als Gradientenfeld und infolge auf D als lokales Gradientenfeld
herausstellt. Nach Satz 11.8.12 ist f holomorph auf D.
❑
11.10 Harmonische Funktionen*
Wir wollen in diesem Anschnitt den Zusammenhang von komplexwertigen, holomorphen Funktionen und sogenannten harmonischen Funktionen beleuchten.
11.10.1 Definition. Ist g : G → C mit offenem G ⊆ R2 C zweimal stetig differenzierbar, so bezeichnet ∆g : G → C (Laplace g) die Abbildung
!
!
!
∂2 g x
x
∂2 g x
∆g
:= 2
+ 2
.
y
∂x y
∂y y
Funktionen g : G → C, g ∈ C 2 (G) heißen harmonisch, falls ∆g ≡ 0.
Da die Ableitungen eintragsweise berechenbar sind, ist g offenbar genau dann harmonisch, wenn Re g und Im g es sind.
11.10.2 Proposition. Ist G ⊆ C offen und f : G → C holomorph, so ist f auch
harmonisch. Insbesondere sind dann Real- und Imaginärteil von f harmonisch.
Ist umgekehrt u : G → R harmonisch für ein einfach zusammenhängendes Gebiet
G ⊆ C, so gibt es ein bis auf eine imaginäre Konstante eindeutiges holomorphes f :
G → C, sodass u ≡ Re f .
11.10. HARMONISCHE FUNKTIONEN*
133
Beweis. Ist f : G → C analytisch, so gelten die Cauchy-Riemannschen Differentialgleichungen Cauchy-Riemannschen Differentialgleichungen (z = x + iy)
∂v
∂v
∂u
∂u
(z) = (z),
(z) = − (z) ,
∂x
∂y
∂x
∂y
(11.36)
wobei u = Re f und v = Im f . Offensichtlich kann man (11.36) auch schreiben als
∂f
∂f
(z) = −i ·
(z) .
∂x
∂y
(11.37)
Da holomorphe Funktionen beliebig oft differenzierbar sind, folgt aus dieser Gleichung
abgeleitet nach x
∂2 f
∂2 f
(z) .
(z)
=
−i
·
∂x∂y
∂x2
Wegen dem Satz von Schwarz und wegen (11.37) abgeleitet nach y ist dieser Ausdruck
gleich
∂2 f
∂2 f
(z) = (−i)2 · 2 (z) .
−i ·
∂y∂x
∂y
Daraus folgt sofort ∆ f = 0, womit offensichtlich auch u = Re f und v = Im f harmonisch sind.
Ist umgekehrt u : G → R harmonisch und G ⊆ C einfach zusammenhängendes
∂u
(z), β(z) := − ∂u
Gebiet, so setzen wir α(z) := ∂x
∂y (z) und F := α + iβ. Dann sind α :
1
G → R, β : G → R und F : G → C alle drei C -Funktionen, wobei wegen ∆u = 0 und
wegen dem Satz von Schwarz
∂2 u
∂F
∂α
∂β
∂2 u
(z) =
(z) + i (z) = 2 (z) − i
(z) =
∂x
∂x
∂x
∂x∂y
∂x
−
∂β
∂α
∂F
∂2 u
∂2 u
(z) =
(z) − i (z) = −i ·
(z) .
(z) − i
2
∂y∂x
∂y
∂y
∂y
∂y
Also ist F holomorph. Da G einfach zusammenhängend ist, gibt es eine Holomorphe
Stammfunktion f , dh. f : G → C mit f ′ = F; vgl. Korollar 11.8.7. Wegen f ′ = ∂∂xf =
−i ∂∂yf gilt
∂ Im f
∂ Re f
∂u
=
= Re F = α =
∂y
∂x
∂x
und
−
∂ Re f
∂ Im f
∂u
=
= Im F = β = − .
∂y
∂x
∂y
Insbesondere ist d(Re f )(z) = du(z) (∈ L(R2 , R)) für alle z ∈ G. Wegen Satz 11.4.1 und
da in G je zwei Punkte durch einen Polygonzug verbindbar sind, folgt daraus Re f =
u + c für ein c ∈ R. Nun ist f − c die gesuchte holomorphe Funktion.
Falls g : G → C eine weitere holomorphe Funktion mit Re g = u ist, so ist
f − c − g : G → C auch holomorph mit einem verschwindenden Realteil. Aus den
Cauchy-Riemannschen Differentialgleichungen folgt d( f − c − g)(z) = 0 und daraus,
dass f − c − g eine Konstante sein muss; vgl. Satz 11.4.1.
❑
KAPITEL 11. WEGINTEGRALE
134
11.11 Übungsbeispiele
11.1 Man berechne die Länge der Wege γ : [0, 1] → R2 :
3
γ(t) = (t, t 2 )T , γ(t) = (t, cosh(t))T ,
und gebe die zu den γ’s äquivalente Wege γ′ an, wobei der Parameter von γ die Bogenlänge
ist.
11.2 Man zeige, dass γ : [0, 1] → R2 mit γ(0) = 0 und γ(t) = (t, t2 cos tπ2 )T , t > 0 zwar stetig,
aber nicht rektifizierbar ist.
1
Hinweis: Berechne L(Z) für Z = {0, √1n , √n−1
, . . . , √12 , 1}.
11.3 Sei γ1 : [0, 1] → Rn , γ2 : [1, 2] → Rn und γ3 : [0, 2] → Rn mit γ3 (t) = γ1 (t), t ∈ [0, 1) und
γ3 (t) = γ2 (t), t ∈ [1, 2]. Es gilt nicht notwendigerweise γ1 (1) = γ2 (1)! Weiters sei γ1 bei
1 stetig, und seien γ1 und γ2 rektifizierbar. Man zeige, dass dann auch γ3 rektifizierbar ist
mit ℓ(γ3 ) = ℓ(γ1 ) + ℓ(γ2 ) + kγ2 (1) − γ1 (1)k2 !
Hinweis: Man zeige zunächst, dass limZ∈Z,1∈Z kγ2 (1) − γ1 (ξ j(Z) )k2 = kγ2 (1) − γ1 (1)k2 und
dass limZ∈Z,1∈Z kγ1 (1) − γ1 (ξ j(Z) )k2 = 0, wobei Z die Menge aller Zerlegungen von [0, 2]
ist, und ξ j(Z) das größte Element von Z ist, dass kleiner 1 ist.
11.4 Man betrachte f : [a, b] → R. Ist f rektifizierbar, so sagt man in diesem Fall (Rn = R),
dass die Funktion f von beschränkter Variation ist, und setzt V xy ( f ) := ℓ( f |[x,y] ), wenn
a ≤ x ≤ y ≤ b.
Man zeige:
(i) Sind f, g von beschränkter Variation und λ ∈ R, so auch f + g und λ f , wobei V xy ( f +
g) ≤ V xy ( f ) + V xy (g) und V xy (λ f ) = |λ|V xy ( f ).
(ii) Ist f monoton steigen, so gilt V xy ( f ) = f (y) − f (x).
(iii) Ist f Differenz zweier monoton steigender Funktionen, so ist f von beschränkter
Variation.
(iv) Ist f : [a, b] → R von beschränkter Variation, so ist f die Differenz g − h zweier
monoton steigender Funktionen.
Hinweis: Setze g(t) = Vat ( f ) und zeige von h, dass es dann monoton wächst!
11.5 Man gebe eine Formel für die Länge des Weges γ : [0, π2 ] → R2 an, der durch γ(t) =
( f (t) cos t, f (t) sin t)T definiert ist, wobei f ∈ C 1 .
Man berechne die Bogenlänge speziell für die Archimedische Spirale, dh. f (t) = t!
11.6 Man betrachte den Weg im R3 mit folgender Parameterdarstellung (Schraubenlinie):


 r cos t 


γ(t) =  r sin t  , t ∈ [0, 4π]


ht
Hierbei seien r, h > 0 fest gewählt. Zeichnen Sie eine Skizze! Weiters berechne man die
Bogenlänge, und parametrisiere γ(t) nach der Bogenlänge um. Daher schreibe γ(t) als
γ(t(s)), sodass die Bogenlänge der Kurve von γ(0) bis γ(t(s)) genau s ist.
R
11.7 Man berechne das Wegintegral γ ((x2 + 5y + 3yz)dx + (5x + 3xz − 2)dy + (3xy − 4z)dz),
wobei γ : [0, 2π] → R3 , γ(t) = (sin(t), cos(t), t)T .
R
Schreibweise: Wegintegrale γ φ(x) dx von Vektorfeldern φ : D → L(R3 , R), dh.
φ((ξ, η, ζ)T ) = (P(ξ, η, ζ), Q(ξ, η, ζ), R(ξ, η, ζ)) werden auch oft als
Z
P(ξ, η, ζ) dξ + Q(ξ, η, ζ) dη + R(ξ, η, ζ) dζ .
γ
angeschrieben. Entsprechendes gilt für Vektorfeldern φ : D → L(R2 , R).
11.11. ÜBUNGSBEISPIELE
135
R
√
φ(x) dx, wobei γ : [0, 1] → R2 , γ(t) = ( t, t)T und
!
ex ey
φ : R2 → L(R2 , R2 ) R2×2 , φ((x, y)T ) =
.
x y
R
11.9 Man berechne das Wegintegral γ φ(x) dx, wobei γ : [0, 2π] → R3 , γ(t) = (sin(t), cos(t), t)T
und φ : R3 → L(R3 , R) R1×3 , φ((x, y, z)T ) = (x2 + 5y + 3yz, 5x + 3xz − 2, 3xy − 4z).
11.8 Man berechne das Wegintegral
γ
2
3 T
11.10 Man betrachte den stetigen Weg γ : [0, 1] → R2 , γ(t)
R = (1 + t , 1 + t ) . Man bestimme
die Weglänge von γ und berechne das Wegintegral γ φ(x)dx, wobei φ : R2 → L(R2 , R) √
R1×2 , φ((x, y)T ) = (sin( x − 1), xy).
11.11 Seien f, g : [a, b] → R (vgl. Definition 11.2.2 mit X = R, n = 1 und somit L(Rn , X) = R)
beschränkt.
m+1
Weiters seien R1 = ((ξ j )mj=0 ; (α j )mj=1 ) und R2 = ((η j )m+1
j=0 ; (β j ) j=1 ) mit η j = α j , j = 1, . . . , m
und β1 = a, βm+1 = b, β j = ξ j−1 , j = 2, . . . , m.
Man zeige: P( f, g; R1 ) = f (b)g(b) − f (a)g(a) − P(g, f ; R2 ), wobei
P( f, g; R1 ) =
m
X
f (α j )(g(ξ j ) − g(ξ j−1 )),
P(g, f ; R2 ) =
m+1
X
g(β j )( f (η j ) − f (η j−1 )),
j=1
j=1
Rb
Rb
und leite daraus her, dass a f dg genau dann existiert, wenn a gd f existiert, und in diesem
Fall gilt:
Z b
Z b
f dg = f (b)g(b) − f (a)g(a) −
gd f.
a
a
Hinweis: Man leite aus Lemma 3.10.5 zunächst folgendes her:
m
X
n=1
an (bn − bn−1 ) = am bm − a1 b0 −
m−1
X
n=1
(an+1 − an )bn .
11.12 Sei γ : [a, b] → Rn rektifizierbar und man denke sich den Weg γ mit Masse belegt, sodass
an der Stelle t ∈ [a, b] die Dichte (Masse pro Längeneinheit) ρ(t) ist.
Die Gesamtmasse des Weges berechnet sich durch das Riemann-Stieltjes Integral
Z b
M=
ρdℓ,
a
wobei ℓ(x) = ℓ(γ|[ a, x]) (Weglänge des auf [a, x] eingeschränkten Weges), und der Schwerpunkt durch
Z b
1
f dℓ,
M a
wobei f : [a, b] → L(R, R2 ) R2×1 , f (t) = ρ(t)γ(t).
Man berechne für den Weg γ : [0, 1] → R2 , γ(t) = (t, t2 )T , der mit konstanten Dichte ρ = 1
die Gesamtmasse und den Schwerpunkt.
11.13 Ist das Vektorfeld R3 → L(R3 , R) R1×3 , φ((ξ, η, ζ)T ) = (ξ + ζ, ξ + η + ζ, ξ + ζ) ein
Gradientenfeld? Falls ja, berechne man die Stammfunktion, also ein f , sodass d f = φ!
, x ).
11.14 Man betrachte D = R2 \{0} und φ : D → L(R2 , R) definiert durch φ((x, y)T ) = ( x2−y
+y2 x2 +y2
Man berechne zunächst das Wegintegral dieser Funktion über den in positiver Richtung
durchlaufenen Einheitskreis (γ(t) = (cos t, sin t)T , 0 ≤ t ≤ 2π)!
Nun zeige man, dass auf D die Bedingung (11.8) aus dem Skriptum erfüllt ist und zeige,
dass es auf der rechten offenen Halbebene R2 \ {(x, y)T : x ≤ 0} eine reellwertige Funktion
f ∈ C 1 gibt, sodass dort d f = φ.
Kann es so eine Funktion f auf ganz D geben?
KAPITEL 11. WEGINTEGRALE
136
11.15 Im einfach zusammenhängenden Gebiet G = {(ξ, η, ζ)T ∈ R3 : η > 0, ζ > 0} sei K : G →
L(R3 , R) R1×3 durch
!
ξ ξ
K(ξ, η, ζ) = ln(ζη), , β ,
η ζ
mit einem festen β ∈ R definiert. Für welchen Wert von β ist K ein Gradientenfeld?
T
Für die geradlinige
R Verbindung γ von (0, 1, 1) nach (ξ0 , η0 , ζ0 ) in G berechne man man
das Wegintegral γ K(x) dx in den Fällen β = 1 und β = 2.
√ t
11.16 Zeigen Sie, dass der Weg γ(t) := 2 cos
, t ∈ [ π4 , 2π + π4 ] in R2 \ { 00 } homotop ist zum
sin t
Polygonzug −
x−0−→
x1 , −
x−1−→
x2 , −
x−2−→
x3 , −
x−3−→
x0 , wobei x0 = (1, 1)T , x1 = (−1, 1)T , x2 = (−1, −1)T , x3 =
T
(1, −1) .
11.17 Sei k ∈ Z und γ : [0, 2π] → C definiert durch γ(t) = a + r exp(it) mit festen, aber beliebigen
r > 0 und a ∈ C. Berechnen Sie das folgende komplexe Wegintegral direkt, dh. ohne
Zuhilfenahme der Cauchyschen Integralformel bzw. ihres Korollars:
Z
(z − a)k dz .
γ
11.18 RMan berechne wieder ohne Cauchyscher Integralformel das komplexe Wegintegral
1
dz, wobei γ(t) = exp(it), t ∈ [0, 2π], und |w| , 1.
γ z−w
P
1
zn
1
1 P∞ wn
Hinweis: Ist |w| > 1, so gilt z−w
= − w1 ∞
n=0 wn , und ist |w| < 1, so gilt z−w = z
n=0 zn .
Begründen Sie allfällige Vertauschungen von Limes und Integral!
11.19 Ist f : D → C im Punkt z ∈ D komplex differenzierbar, so zeige man, dass det d f (z) =
| f ′ (z)|2 .
11.20 Sei h : C \ [−∞, 0] → C definiert durchph(z) = ln |z| + i arg(z), wobei das Argument arg(ξ +
iη) ∈ (−π, π) so definiert ist, dass f ( ξ 2 + η2 , arg(ξ + iη))T = (ξ, η)T , wobei f (r, φ)T =
(r cos φ, r sin φ)T . Zeigen Sie, dass h holomorph ist, und berechnen Sie die h′ (z)!
Anmerkung: h wird als komplexer Logarithmus bezeichnet. In der Tat erfüllt h die Beziehung exp(h(z)) = z, z ∈ C \ [−∞, 0], und h(exp(z)) = z für z ∈ R × (−π, π).
11.21 Sei D ⊆ C ein Gebiet und f : D → C holomorph. Zeigen Sie, dass f konstant ist, wenn f
nur Werte aus R (⊆ C) oder nur Werte aus iR (⊆ C) annimmt.
Hinweis: Was gilt für d f (z)?
11.22 Für w ∈ C und einen geschlossenen, stetigen und stückweise stetig differenzierbaren Weg
γ : [a, b] → C mit w < γ([a, b]) ist die Umlaufzahl von γ um w definiert durch
Z
1
1
n(γ, w) :=
dz .
2iπ γ z − w
Zeigen Sie, dass n(γ, w) ∈ Z. Geschlossener Weg bedeutet γ(a) = γ(b).
R t γ′ (s)
Hinweis: Setzen Sie g(t) := a γ(s)−w
ds und leiten dann e−g(t) (γ(t) − w) nach t ab. Was
−g(b)
bedeutet das Ergebnis, wenn Sie e
und e−g(a) vergleichen?
11.23 Sei γ : [a, b] → C stetig und stückweise stetig differenzierbar aber nicht notwendigerweise
geschlossen. Zeigen Sie, dass dann die Abbildung
Z
1
1
w 7→
dz
2iπ γ z − w
von C \ γ([a, b]) nach C stetig ist.
11.24 Mit der Notation aus dem vorletzten Beispiel sei γ ein fester geschlossener, stetiger und
stetig differenzierbarer Weg . Weiters sei G ⊆ C ein Gebiet, sodass γ([a, b]) ∩ G = ∅.
Zeigen Sie, dass n(γ, w) für alle w ∈ G den selben Wert ergibt.
Zeigen Sie auch, dass dieser Wert Null ist, falls G nicht beschränkt ist.
11.11. ÜBUNGSBEISPIELE
137
11.25 Nun sei H ⊆ C ein einfach zusammenhängendes Gebiet und w ∈ C \ H. Zeigen Sie, dass
für jeden geschlossenen, stetigen und stetig differenzierbaren Weg γ : [a, b] → H (also
jeden Weg der in H verläuft) immer n(γ, w) = 0 gilt.
11.26 Überprüfen Sie die Kettenregel für holomorphe Funktionen auf 2 verschiedene Arten. Einmal ähnlich wie die eindimensionale Kettenregel aus dem Kapitel 7, und ein zweites mal
mit Hilfe der mehrdimensionalen Kettenregel.
11.27 Sei D ⊆ C offen, w ∈ D mit Kr (w) ⊆ D, c ∈ R, f : D → C stetig und γ j : [0, 2π] → D
( j = 1, 2) definiert durch γ1 (t) = w + r exp(it) bzw. γ2 (t) = w + r exp(i(t + c)). Skizzieren
Sie die Situation und zeigen Sie, dass
Z
Z
f (z) dz .
f (z) dz =
γ2
γ1
11.28 Weisen Sie die Holomorphie der Funktionen exp : C → C, cos : C → C und sin : C → C
nach, indem sie die Cauchy-Riemannschen Differentialgleichungen und die stetige Differenzierbarkeit zeigen! Weiters gebe man in dem Fall jeweils eine Stammfunktion dieser
Funktionen f an (also das F mit F ′ = f )! Schließlich gebe man auch eine Stammfunktion
von z2 (cos z)2 an!
11.29 Sei D ⊆ C offen und f : D → C holomorph. Man zeige, dass ∆ Re f = ∆ Im f = 0 und
dass ∆(| f |2 ) ≥ 0; vgl. Übungsbeispiel 10.15.
11.30 Verwenden Sie das vorherige Beispiel und Übungsbeispiel 10.15, um zu zeigen, dass wenn
G ⊆ C offen und f : G → C holomorph ist, dann für jedes w ∈ G und ρ > 0 mit Kρ (w) ⊆ G
für alle ζ ∈ Uρ (w)
| f (ζ)| ≤
max | f (z)|,
z∈Kρ (w)\Uρ (w)
min
Re f (z) ≤ Re f (ζ) ≤
z∈Kρ (w)\Uρ (w)
min
Im f (z) ≤ Im f (ζ) ≤
z∈Kρ (w)\Uρ (w)
z∈Kρ (w)\Uρ (w)
z∈Kρ (w)\Uρ (w)
max
Re f (z)
max
Im f (z)
gilt.
11.31 Sei G ⊆ C ein Gebiet und seien f, g : G → C zwei holomorphe Funktionen. Man zeige,
dass f ≡ g, falls f (zn ) = g(zn ) für eine Folge (zn ) aus G mit Häufungspunkt z in G, wobei
zn , z für unendlich viele n ∈ N.
Hinweis: Zeigen Sie, dass A = {z ∈ G : ∃ǫ > 0, f |Uǫ (z) ≡ g|Uǫ (z) } offen und nicht-leer ist;
werfen Sie dafür einen Blick auf Korollar 6.7.9. Zeigen Sie auch, dass c(A) ∩ G = A. Nun
betrachte man B := G \ c(A)....
11.32 Man leite die Potenzreihenentwicklung von z2 (cos z)2 um den Punkt 0 her! Wie groß ist
der Konvergenzradius dieser Potenzreihe?
11.33 Sei D ⊆ C offen und f : D → C holomorph. Zeigen Sie, dass dann auch f ∗ : D̄ → C
holomorph ist, wobei D̄ = {z̄ : z ∈ D} und f ∗ (z) = f (z̄).
11.34 Zeigen Sie, dass die Funktion f (x) aus 6.28 auch für x ∈ C \ Z eine wohldefinierte komplexwertige Funktion ist. Zeigen Sie, dass diese Funktion auch holomorph ist.
11.35 Zeigen Sie, dass die Funktion f (z) aus dem vorherigen Beispiel für alle z ∈ C \ Z mit
2
z 7→ sinπ2 (πz) übereinstimmt.
1
1
+ z−1
11.36 Berechnen Sie für die Funktion f (z) = z+1
Z
Z
Z
f (z) dz +
f (z) dz und
γ1
γ2
f (z) dz ,
γ3
wobei γ j : [0, 2π] → C ( j = 1, 2, 3) mit γ j (t) = (−1) j +
γ3 (t) = 4 exp(it).
1
2
exp(it) für j = 1, 2 und
138
KAPITEL 11. WEGINTEGRALE
Kapitel 12
Topologische Grundlagen
12.1 Topologische Grundbegriffe
Wir wollen in diesem und in den nächsten Abschnitten die Konvergenztheorie, wie wir
sie für metrische Räume entwickelt haben, verallgemeinern. Dabei werden wir Räume
betrachten, die gerade noch soviel Struktur tragen, dass wir von stetigen Funktionen,
Grenzwerten, Kompaktheit etc. sprechen können, nämlich die sogenannten topologischen Räume.
12.1.1 Beispiel (Metrische Räume). Sei (Y, d) ein metrischer Raum. Es gilt also
d(x, y) ≥ 0 und d(x, y) = 0 genau dann, wenn x = y.
d(x, y) = d(y, x).
d(x, y) ≤ d(x, z) + d(z, y).
Sei O die Menge aller offenen Teilmengen von Y gemäß Definition 5.1.4. Dabei haben
wir eine Teilmenge O von Y offen genannt, wenn sie die Eigenschaft hat, dass es zu
jedem x ∈ O ein ǫ > 0 gibt, sodass die ǫ-Kugel Uǫ (x) (= {y ∈ Y : d(y, x) < ǫ}) ganz in
O enthalten ist.
Wir haben in Proposition 5.1.7 gesehen, dass O folgende Eigenschaften hat.
∅ ∈ O, X ∈ O.
Für O1 , O2 ∈ O gilt auch O1 ∩ O2 ∈ O.
Ist I eine Indexmenge und Oi ∈ O, i ∈ I, so folgt
S
i∈I
Oi ∈ O.
Wir nehmen nun diese aufgezählten Eigenschaften als Ausgangspunkt unserer angestrebten Verallgemeinerung.
12.1.2 Definition. Sei X eine nichtleere Menge und T ⊆ P(X) ein System von Teilmengen von X. Erfüllt T die Eigenschaften
(01) ∅ ∈ T , X ∈ T .
(02) Für O1 , O2 ∈ T gilt auch O1 ∩ O2 ∈ T .
(03) Ist I eine Indexmenge und Oi ∈ T , i ∈ I, so folgt
139
S
i∈I
Oi ∈ T .
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
140
so heißt T eine Topologie auf X. Die Elemente von T heißen offene Mengen, und man
spricht von (X, T ) als topologischem Raum.
12.1.3 Bemerkung. Mittels Vollständiger Induktion sieht man sofort, dass (O2) äquivalent ist zu
T
(02’) Ist n ∈ N und O1 , . . . , On ∈ T , so folgt ni=1 Oi ∈ T .
12.1.4 Beispiel.
Wir haben oben gesehen, dass die Menge O aller offenen Mengen eines metrischen Raumes (Y, d) (01)-(03) erfüllt. Damit ist (Y, O) ein topologischer Raum.
Man sagt, O ist die von der Metrik d induzierte Topologie und schreiben auch
T (d) für O.
Ist Y = R p versehen mit der Metrik d2 , so heißt die von d2 induzierte Topologie
T (d2 ) Euklidische Topologie. Die Metriken d1 und d∞ induzieren ebenfalls die
Euklidische Topologie.
Sei T := P(X). Klarerweise sind (01)-(03) erfüllt, also ist (X, P(X)) ein topologischer Raum. Man spricht von der diskreten Topologie. Die diskrete Topologie
wird übrigens von der diskreten Metrik induziert (siehe Beispiel 3.1.5).
Sei T := {∅, X}. Wieder sind (01)-(03) trivialerweise erfüllt. Man spricht von der
Klumpentopologie.
Eines unserer Ziele wird es sein, Konvergenz gegen einen Punkt oder Stetigkeit bei
einem Punkt für unsere Räume zu verallgemeinern. Dazu benötigen wir ein Analogon
zum Begriff der ’ǫ-Kugel’.
12.1.5 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Eine Menge U ⊆
X heißt Umgebung von x, wenn es eine offene Menge O ∈ T gibt mit x ∈ O ⊆
U. Wir bezeichnen mit U(x) die Menge aller Umgebungen von x, den sogenannten
Umgebungsfilter von x.
Der Begriff Filter ist ein allgemeines mengentheoretisches Konzept.
12.1.6 Definition. Sei M eine nichtleere Menge. Dann heißt ein Mengensystem F ⊆
P(M) ein Filter, wenn
(F1) F , ∅ und ∅ < F,
(F2) F1 , F2 ∈ F ⇒ F1 ∩ F2 ∈ F,
(F3) F1 ∈ F, F1 ⊆ F2 ⊆ M ⇒ F2 ∈ F.
Ist (X, T ) ein topologischer Raum, so ist der Umgebungsfilter U(x) tatsächlich ein
Filter, da
offensichtlich X ∈ U(x) und jede Menge U ∈ U(x) den Punkt x enthält und damit
nicht leer ist,
aus U1 , U2 ∈ U(x) die Existenz von O1 , O2 ∈ T mit x ∈ O1 ⊆ U1 und x ∈
O2 ⊆ U2 folgt, und somit x ∈ O1 ∩ O2 ⊆ U1 ∩ U2 , wobei wegen (O2) sicherlich
O1 ∩ O2 ∈ T , und daher U1 ∩ U2 ∈ U(x),
12.1. TOPOLOGISCHE GRUNDBEGRIFFE
141
aus U1 ∈ U(x) und U1 ⊆ U2 ⊆ X die Inklusion x ∈ O ⊆ U1 für ein gewisses
O ∈ T und somit x ∈ O ⊆ U2 bzw. U2 ∈ U(x) folgt.
Die korrekte Verallgemeinerung des Systems aller ǫ-Kugeln um einen festen Punkt
in einem metrischen Raum für topologische Räume ist der Begriff der Filterbasis des
Umgebungsfilters.
12.1.7 Definition. Sei M eine nichtleere Menge und F ein Filter. Dann heißt ein Mengensystem B ⊆ F eine Filterbasis von F, wenn man zu jeder Menge F ∈ F ein B ∈ B
findet, sodass B ⊆ F.
12.1.8 Bemerkung. Mit der Notation aus Definition 12.1.7 folgt, dass
F = {F ∈ P(X) : ∃B ∈ B : B ⊆ F}.
(12.1)
Also ist B Filterbasis von genau einem Filter.
Betrachtet man jetzt B losgelöst von F, so erfüllt B
(FB1) B , ∅ und ∅ < B,
(FB2) B1 , B2 ∈ B ⇒ ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Die erste Eigenschaft ist klar wegen (F1). Die zweite folgt aus (F2): B1 , B2 ∈ B ⇒
B1 ∩ B2 ∈ F. Aus der Definition von Filterbasis folgt ∃B3 ∈ B : B3 ⊆ B1 ∩ B2 .
Nun kann man auch mit einem Mengensystem B, das (FB1) und (FB2) erfüllt,
starten, um daraus ein Mengensystem F durch (12.1) zu definieren.
Klarerweise ist ∅ < F. Sind F1 , F2 ∈ F, so gilt B1 ⊆ F1 und B2 ⊆ F2 für gewisse
B1 , B2 ∈ B, und wegen (FB2) B3 ⊆ B1 ∩ B2 ⊆ F1 ∩F2 für ein B3 ∈ B. Also F1 ∩F2 ∈ F.
Schließlich ist mit F1 auch jedes F2 ⊇ F1 Obermenge eines gewissen B ∈ B. Somit ist
F ein Filter, der B als eine Filterbasis hat.
12.1.9 Definition. Man sagt ein topologischer Raum (X, T ) erfüllt das erste Abzählbarkeitsaxiom (ABI), wenn für jedes x ∈ X der Umgebungsfilter U(x) eine Filterbasis
bestehend aus abzählbar vielen Mengen hat.
12.1.10 Beispiel.
(i) Klarerweise ist ein Filter eine Filterbasis von sich selbst.
(ii) Ist (X, T ) ein topologischer Raum und x ∈ X, so ist z.B. {O ∈ T : x ∈ O} eine
Filterbasis von U(x).
(iii) Sei (Y, d) ein metrischer Raum und T (d) die von der Metrik erzeugte Topologie.
Ist x ∈ Y, so ist {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x).
Dass Uǫ (x) eine Umgebung ist, folgt aus der Tatsache, dass Uǫ (x) sogar offen ist.
Nun sei U ∈ U(x). Dann gibt es eine offene Menge O ∈ T (d), sodass O ⊆ U. Aus
der Definition der offenen Mengen in metrischen Räumen folgt Uǫ (x) ⊆ O ⊆ U,
und damit ist obiges Mengensystem eine Filterbasis.
Auf ähnliche Weise sieht man, dass {Kǫ (x) : ǫ > 0} oder auch {Uǫn (x) : n ∈
N}, wenn (ǫn )n∈N eine Nullfolge aus positiven reellen Zahlen ist, eine Basis des
Umgebungsfilter U(x) ist. Insbesondere erfüllt jeder metrische Raum das erste
Abzählbarkeitsaxiom.
Folgendes Lemma passt nun zu der Konstruktion einer Topologie aus einer Metrik.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
142
12.1.11 Lemma. Sei (X, T ) ein topologischer Raum und sei für jeden Punkt x ∈ X
das System W(x) eine Filterbasis von U(x)1 . Dann ist eine Menge O ⊆ X genau dann
offen, d.h. O ∈ T , wenn
∀x ∈ O ⇒ O ∈ U(x) ,
(12.2)
bzw. genau dann, wenn
∀x ∈ O ∃W ∈ W(x) : W ⊆ O .
(12.3)
Beweis. Für ein festes x ∈ X bedeutet die Tatsache ∃W ∈ W(x) : W ⊆ O gemäß der
Definition einer Filterbasis nicht anderes als O ∈ U(x). Also sind (12.2) und (12.3)
äquivalent.
Ist O ∈ T und x ∈ O, so folgt daraus O ∈ U(x), vgl. Beispiel 12.1.10, (ii). Gilt
umgekehrt O ∈ U(x), ∀x ∈ O, so gibt es wegen der Definition von U(x) zu jedem
x ∈ O eine Menge O x ⊆ O, O x ∈ T , und daher
[
[
O=
{x} ⊆
Ox ⊆ O .
x∈O
x∈O
Als Vereinigung der offenen Mengen O x muss O nach (O3) selber offen sein.
❑
Nun können wir den Grenzwert eines Netzes auch für topologische Räume definieren.
12.1.12 Definition. Sei (I, ) eine gerichtete Menge und (xi )i∈I ein Netz in X, wobei
(X, T ) ein topologischer Raum ist. Man sagt, dass dieses Netz gegen einen Punkt x ∈ X
i∈I
konvergiert, in Zeichen xi −→ x, falls
∀U ∈ U(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ U ,
d.h. falls in jeder beliebigen Umgebung ab einem Index alle Glieder xi des Netzes
enthalten sind.
12.1.13 Fakta.
Ist W(x) eine Filterbasis von U(x), so ist die Konvergenzbedingung aus Definition
12.1.12 äquivalent zu
∀W ∈ W(x) ∃i0 ∈ I : ∀i i0 ⇒ xi ∈ W ,
da einerseits wegen W(x) ⊆ U(x) diese Bedingung sicherlich eine Konsequenz
aus der in Definition 12.1.12 ist, und da andererseits aus U ∈ U(x) die Existenz
eines W ∈ W(x) mit W ⊆ U folgt, und dann mit der gegenwärtigen Bedingung,
dass xi ∈ W ⊆ U, ∀i i0 für ein gewisses i0 ∈ I.
Ist (xi( j) ) j∈J ein Teilnetz von (xi )i∈I , d.h. i : J → I, wobei auch (J, ) eine gerichtete Menge ist, mit
∀i ∈ I∃ j0 ∈ J : ∀ j J j0 ⇒ i( j) I i ,
und konvergiert (xi )i∈I gegen x, so auch (xi( j) ) j∈J . Um das zu sehen, sei U ∈ U(x)
und i0 ∈ I, sodass i I i0 ⇒ xi ∈ U. Ist nun j0 ∈ J so, dass j J j0 ⇒ i( j) I i0 ,
so folgt auch xi( j) ∈ U für alle j J j0 .
1 Es
ist nicht ausgeschlossen, dass W(x) = U(x).
12.1. TOPOLOGISCHE GRUNDBEGRIFFE
143
12.1.14 Bemerkung. Wir sehen nun aus Fakta 12.1.13, dass diese Definition der Konvergenz mit der in metrischen Räumen konform geht. In der Tat haben wir x = limi∈I xi
in einem metrischen Raum (Y, d) genau dann, wenn
∀ǫ > 0 ∃i0 ∈ I : xi ∈ Uǫ (x) ∀i i0 .
Da {Uǫ (x) : ǫ > 0} eine Filterbasis von U(x) ist, stimmt diese Bedingung mit der aus
Fakta 12.1.13 überein.
Wir sehen insbesondere, dass die Konvergenz nicht von der konkreten Metrik, sondern nur von der von ihr erzeugten Topologie abhängt (vgl. Beispiel 12.3.10).
Wir haben in der Definition der Konvergenz absichtlich nicht die Schreibweise x =
limi∈I xi verwendet, denn es kann sein, dass x nicht der einzige Grenzwert ist.
12.1.15 Beispiel. Man betrachte eine Menge X mit mindestens zwei Elementen versehen mit der Klumpentopologie. Dann ist U(x) = {X} für alle x ∈ X. Damit konvergiert
aber jedes Netz gegen jeden Punkt x ∈ X.
Man muss eine zusätzliche Eigenschaft vom gegebenen topologischen Raum fordern, damit Grenzwerte eindeutig sind.
12.1.16 Definition. Ein topologischer Raum (X, T ) heißt T 2 -Raum (oder HausdorffRaum), wenn gilt:
(T 2 ) Zu je zwei Punkten x, y ∈ X, x , y, gibt es disjunkte offene Mengen O x und Oy ,
sodass x ∈ O x , y ∈ Oy .
Oy
y
Ox
x
Abbildung 12.1: Zweites Trennungsaxiom (T 2 )
Man sieht unmittelbar, dass diese Eigenschaft zu der Tatsache äquivalent ist, dass
es zu zwei verschiedenen Punkten x, y zwei Umgebungen U ∈ U(x), V ∈ U(y) gibt mit
U ∩ V = ∅.
12.1.17 Beispiel. Die von einer Metrik d auf einer Menge Y induzierte Topologie ist
Hausdorff. Sind nämlich x, y ∈ Y, x , y, so gilt d(x, y) > 0. Setze ǫ := 31 d(x, y) und
betrachte die Umgebungen
U := Uǫ (x), V := Uǫ (y) .
Angenommen es wäre z ∈ U ∩ V, dann erhielten wir den Widerspruch
d(x, y) ≤ d(x, z) + d(z, y) <
1
2
1
d(x, y) + d(x, y) = d(x, y) .
3
3
3
Der Beweis der Eindeutigkeit des Grenzwertes eines Netzes wird nun fast wörtlich
vom metrischen Fall übertragen.
144
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.1.18 Lemma. Sei (xi )i∈I ein konvergentes Netz in einem topologischen (T 2 )-Raum.
Dann ist der Grenzwert von (xi )i∈I eindeutig.
Beweis. Wären x, y zwei verschiedene Grenzwerte, so wähle man disjunkte Umgebungen U ∈ U(x) und V ∈ U(y). Dann wähle man i1 ∈ I und i2 ∈ I mit i i1 ⇒ xi ∈ U
und i i2 ⇒ xi ∈ V. Da I gerichtet ist, gibt es ein i ∈ I, i i1 , i i2 , und somit
xi ∈ U ∩ V, was aber ein Widerspruch zu U ∩ V = ∅ ist.
❑
12.2 Abgeschlossene Mengen
12.2.1 Definition. Sei (X, T ) ein topologischer Raum. Eine Menge A ⊆ X heißt abgeschlossen, wenn Ac offen ist.
12.2.2 Lemma. Sei X eine Menge. Ist T eine Topologie auf X und bezeichnet A die
Menge aller abgeschlossenen Mengen in (X, T ), so gilt:
(A1) ∅, X ∈ A.
(A2) A1 , . . . , An ∈ A, n ∈ N, so folgt A1 ∪ . . . ∪ An ∈ A.
T
(A3) Ai ∈ A, i ∈ I, so folgt i∈I Ai ∈ A.
Beweis. Die Axiome (A1) - (A3) gehen bei Komplementbildung genau in die Axiome
(O1) - (O3) über.
❑
12.2.3 Definition. Sei (X, T ) ein topologischer Raum, und sei B ⊆ X. Die Menge
\n
o
A ⊆ X : A abgeschlossen, A ⊇ B
(12.4)
B :=
heißt der Abschluss von B. Wenn man explizit klarstellen will, bezüglich welcher ToT
pologie der Abschluss zu bilden ist, dann schreibt man für B oft auch B .
Ist C ⊆ B ⊆ X und gilt B ⊆ C, so heißt C dicht in B. Ist C dicht in X, so sagt man,
C ist dicht.
Hat B ⊆ X eine in B dichte und abzählbare Teilmenge, so heißt B separabel.
12.2.4 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X. Dann ist B die kleinste abgeschlossene Menge, die B umfasst.
Beweis. Wegen (A1) ist die Menge, über die in (12.4) der Durchschnitt gebildet wird,
nicht leer. Wegen (A3) ist B abgeschlossen. Ist A abgeschlossen und A ⊇ B, so kommt
A auf der rechten Seite von (12.4) vor, also gilt A ⊇ B.
❑
12.2.5 Lemma. Sei (X, T ) topologischer Raum. Dann gilt:
(i) Für B ⊆ X gilt B ⊆ B.
(ii) Ist C ⊆ B ⊆ X, so folgt C ⊆ B.
(iii) Für C, B ⊆ X folgt C ∪ B = C ∪ B.
12.2. ABGESCHLOSSENE MENGEN
145
(iv) Eine Menge B ⊆ X ist genau dann abgeschlossen, wenn B = B.
Beweis.
(i) Folgt unmittelbar aus der Definition.
(ii) Wegen B ⊇ B ⊇ C ist B eine abgeschlossene Menge, die C umfasst, und da C die
kleinste derartige Menge ist, folgt B ⊇ C.
(iii) Die Menge C ∪ B ist eine abgeschlossene Menge, die C ∪ B umfasst. Also folgt
C ∪ B ⊆ C ∪ B.
Andererseits folgt aus C ⊆ C ∪ B, dass C ⊆ C ∪ B, und genauso B ⊆ C ∪ B.
Damit gilt auch C ∪ B ⊆ C ∪ B.
(iv) B = B gilt genau dann, wenn B die kleinste abgeschlossene Menge ist, die B
enthält. Somit ist das genau dann der Fall, wenn B abgeschlossen ist.
❑
Wenn man sich an die Definition von Abschluss und abgeschlossener Menge in
metrischen Räumen zurück erinnert, so haben wir dort einen Zugang über Häufungspunkte gewählt. Im nächsten Lemma werden wir sehen, dass auch in allgemeinen topologischen Räumen der Abschluss bzw. der Begriff der abgeschlossenen Menge so
charakterisiert werden kann. Um das einzusehen wollen wir zunächst ein kanonisches
Netz konstruieren, das gegen einen gegebenen Punkt konvergiert.
12.2.6 Lemma. Sei (X, T ) topologischer Raum, B ⊆ X und x ∈ X, sodass U ∩ B , ∅
für alle U ∈ U(x). Nun sei
I = {(y, U) : U ∈ U(x), y ∈ U ∩ B} ,
versehen mit der Relation (y1 , U1 ) (y2 , U2 ) :⇔ U1 ⊇ U2 .
Ist (xi )i∈I das Netz definiert durch xi := y, wenn i = (y, U), so konvergiert es gegen x.
Beweis. Die Relation ist offensichtlich reflexiv und transitiv. Sind (z, V), (y, U) ∈ I,
so folgt U ∩ V ∈ U(x). Voraussetzungsgemäß gibt es ein b ∈ U ∩ V ∩ B, und daher
(z, V), (y, U) (b, U ∩ V). Daraus folgt, dass (I, ) gerichtet ist.
Definitionsgemäß ist immer xi ∈ B. Da zu U ∈ U(x) und beliebigen y ∈ U ∩ B
aus i = (z, V) (y, U) folgt, dass xi = z ∈ V ⊆ U, sehen wir, dass (xi )i∈I gegen x
konvergiert.
❑
12.2.7 Proposition. Sei (X, T ) topologischer Raum, B ⊆ X, x ∈ X und W(x) eine
beliebige Filterbasis von U(x). Dann sind folgende Aussagen äquivalent.
(i) x ∈ B.
(ii) ∀U ∈ U(x) : B ∩ U , ∅.
(iii) ∀W ∈ W(x) : B ∩ W , ∅.
(iv) Es gibt ein Netz (xi )i∈I mit xi ∈ B, sodass x ein Grenzwert davon ist.
146
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Beweis. Laut Definition ist x < B zur Existenz einer abgeschlossenen Menge A
mit x < A, A ⊇ B äquivalent. Da die offenen Mengen genau die Komplemente
der abgeschlossenen sind, ist das äquivalent zur Existenz einer Menge O ∈ T mit
x ∈ O, O ∩ B = ∅. Geht man zu den Negationen über, so erhalten wir, dass
x ∈ B ⇔ ∀O ∈ T : x ∈ O, B ∩ O , ∅ .
Man erkennt sofort, dass die rechte Seite zu (ii) äquivalent ist. (ii) ⇔ (iii) folgt unmittelbar aus der Tatsache, dass W(x) eine Filterbasis von U(x) ist.
Gilt schließlich (iv) und ist U ∈ U(x), so folgt xi ∈ U ∩ B für alle i i0 mit einem
gewissen i0 . Also ist sicher U ∩ B , ∅.
❑
In Analogie zum Begriff des Häufungspunktes / isolierten Punktes einer Menge in
metrischen Räumen in Definition 5.1.8 definieren wir:
12.2.8 Definition (*). Sei (X, T ) topologischer Raum und B ⊆ X. Ein x ∈ X heißt
Häufungspunkt von B, wenn
∀U ∈ U(x) : (B \ {x}) ∩ U , ∅ .
Ein x ∈ B heißt isolierter Punkt von B, wenn
∃U ∈ U(x) : U ∩ B = {x} .
12.2.9 Bemerkung (*). Aus Proposition 12.2.7 erkennt man sofort, dass x genau dann
Häufungspunkt von B ist, wenn x ∈ B \ {x}, bzw. wenn (xi )i∈I → x für ein Netz aus
B \ {x}; vgl. Lemma 5.1.13.
Man erkennt auch leicht aus Proposition 12.2.7, dass B mit der Vereinigung von B
und der Menge aller Häufungspunkte von B übereinstimmt.
12.2.10 Bemerkung. Ist (X, d) ein metrischer Raum, B ⊆ X und nimmt man als W(x)
die Menge aller offenen ǫ-Kugeln um x, so sieht man durch einen Vergleich von Proposition 12.2.7 und (5.1), dass x ∈ B genau dann, wenn x ∈ c(B). Also stimmt der
Abschluss in metrischen Räumen mit dem topologischen Abschluss überein.
Der Grund, warum man in metrischen Räumen das Auslangen mit Folgen findet,
daher x ∈ B genau dann, wenn xn → x für eine Folge aus B, ist die Gültigkeit des
ersten Abzählbarkeitsaxioms. In der Tat, kann man unter der Voraussetzung (ABI) die
Konstruktion in Lemma 12.2.6 folgendermaßen abändern:
Sei W(x) = {Wn : n ∈ N} eine abzählbare Filterbasis von U(x), und wähle xn ∈
B ∩ W1 ∩ · · · ∩ Wn (∈ U(x)). Man erhält somit eine Folge (xn )n∈N in B, sodass zu
vorgegebenem U ∈ U(x) ein N ∈ N mit WN ⊆ U existiert, und daher
xn ∈ W1 ∩ · · · ∩ WN ∩ · · · ∩ Wn ⊆ U für alle n ≥ N .
Somit konvergiert (xn )n∈N für n → ∞ gegen x.
Genauso wie die abgeschlossenen Mengen via Komplementbildung den offenen
Mengen entsprechen, ist das duale Analogon des Abschlusses das sogenannte Innere.
12.2.11 Definition. Das Innere B◦ einer Teilmenge B eines topologischen Raumes
(X, T ) ist definiert durch
[
B◦ =
{O ∈ T : O ⊆ B} .
12.2. ABGESCHLOSSENE MENGEN
147
12.2.12 Fakta.
1. Man sieht unmittelbar, dass x ∈ B◦ ⇔ B ∈ U(x). Ähnlich wie beim Abschluss
sieht man, dass B◦ die größte in B enthaltene offene Menge ist. Damit ist B genau
dann offen, wenn B = B◦ .
2. Da die Komplemente von den offenen Mengen genau die abgeschlossenen Mengen sind, besteht der folgende Zusammenhang zum Abschluss von Mengen.
oc
c \ n
Bc =
A ⊆ X : A abgeschlossen, A ⊇ Bc =
\ n
Oc ⊆ X : O offen, O ⊆ B
oc
= B◦ .
Die Begriffsbildung, die der des Häufungspunktes einer Folge entspricht, ist die des
Häufungspunktes eines Netzes.
12.2.13 Definition (*). Sei (X, T ) ein topologischer Raum und (xi )i∈I ein Netz in X.
Dann heißt x ∈ X Häufungspunkt von (xi )i∈I , falls
∀U ∈ U(x)∀i ∈ I ∃ j ∈ I : i j ∧ x j ∈ U .
Man beachte, dass im Allgemeinen die Menge der Häufungspunkte eines Netzes
(xi )i∈I nicht mit der Menge der Häufungspunkte der Bildmenge {xi : i ∈ I} übereinstimmt; vgl. Definition 12.2.8. Als Beispiel betrachte man dazu einfach konstante Netze.
12.2.14 Bemerkung (*). Vergleicht man das mit Proposition 12.2.7, so ist x Häufungspunkt von (xi )i∈I genau dann, wenn er im Schnitt aller Mengen der Form
{x j : j ∈ I, i j} ,
also in
\
i∈I
{x j : j ∈ I, i j}
(12.5)
enthalten ist.
Offenbar ist ein Limes eines Netzes auch Häufungspunkt. Die Umkehrung gilt im
Allgemeinen nicht, wie man z. B. bei Folgen in R schon unschwer erkennen kann.
Eine alternative Charakterisierung von Häufungspunkten verwendet das Konzept
von Teilnetzen.
12.2.15 Lemma (*). Der Punkt x ist Häufungspunkt von (xi )i∈I genau dann, wenn x
Limes eines Teilnetzes (xi(k) )k∈K ist.
Beweis. Ist (xi(k) )k∈K ein Teilnetz, so gibt es zu i0 ∈ I ein k0 ∈ K, sodass i0 i(k), k0 k. Also gilt
{xi : i ∈ I, i0 i} ⊇ {xi(k) : k ∈ K, k0 k} ,
und damit
\
i0 ∈I
{xi : i ∈ I, i0 i} ⊇
\
k0 ∈K
{xi(k) : k ∈ K, k0 k} .
(12.6)
Ist nun x Limes von (xi(k) )k∈K , so ist er insbesondere Häufungspunkt dieses Teilnetzes,
und wegen (12.6) ein Häufungspunkt von (xi )i∈I .
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
148
Ist umgekehrt x Häufungspunkt von (xi )i∈I , so betrachte die Menge
K = {(i, U) : i ∈ I, U ∈ U(x), xi ∈ U}
versehen mit der Relation (i1 , U1 ) (i2 , U2 ) :⇔ i1 i2 ∧ U1 ⊇ U2 .
Ist (i1 , U1 ), (i2 , U2 ) ∈ K und ist i′ ∈ I, i1 , i2 i′ , so gibt es wegen der Voraussetzung
zu der Umgebung U3 = U1 ∩ U2 von x ein i3 ∈ I mit i′ i3 und xi3 ∈ U3 . Also
(i1 , U1 ), (i2 , U2 ) (i3 , U3 ), und wir sehen, dass (K, ) eine gerichtete Menge ist.
Definieren wir i(i, U) = i, so ist x(i,U) = xi(i,U) , (i, U) ∈ K ein Teilnetz von (xi )i∈I ,
das gegen x konvergiert.
❑
12.2.16 Lemma (*). Ein Netz (xi )i∈I konvergiert genau dann gegen x, wenn x
Häufungspunkt eines jeden Teilnetzes von (xi )i∈I ist.
Beweis. Sei (I, ) eine gerichtete Menge.
Konvergiert (xi )i∈I gegen x, so auch jedes Teilnetz, und daher ist x Häufungspunkt
dieses Teilnetzes.
Ist (xi )i∈I nicht gegen x konvergent, so gibt es eine Umgebung U von x, sodass
∀i ∈ I∃ j ∈ I, i j : x j < U .
Betrachte die gerichtete Menge (K, |K×K ) mit K = {i ∈ I : xi < U}. Dann hat das
Teilnetz (xi )i∈K den Punkt x sicherlich nicht als Häufungspunkt.
❑
12.3 Stetige Abbildungen
12.3.1 Definition. Seien (X, T ) und (Y, O) topologische Räume. Weiters sei f eine
Abbildung, f : X → Y. Ist x ∈ X, so heißt f stetig im Punkt x, wenn gilt:
(C x ) Für alle V ∈ U( f (x)) existiert ein U ∈ U(x) mit f (U) ⊆ V .
Die Abbildung f heißt stetig, wenn sie in jedem Punkt x ∈ X stetig ist.
12.3.2 Beispiel.
Sei (X, T ) topologischer Raum. Die Abbildung idX : (X, T ) → (X, T ) ist stetig.
Denn ist x ∈ X und V ∈ U(idX x) = U(x), so wähle U := V ∈ U(x), dann gilt
idX (U) = V ⊆ V.
Seien (X, T ), (Y, O) topologische Räume und sei a ∈ Y. Die Abbildung
(
(X, T ) → (Y, O)
fa :
x
7→
a
ist stetig. Denn ist x ∈ X und V ∈ U( fa (x)) = U(a), so wähle U := X ∈ U(x),
dann gilt fa (U) = {a} ⊆ V.
Sei X versehen mit der diskreten Topologie T = P(X), sei (Y, O) irgendein topologischer Raum und sei f : (X, P(X)) → (Y, O) irgendeine Abbildung. Dann ist
f stetig. Denn sei x ∈ X, V ∈ U( f (x)). Da {x} offen in der diskreten Topologie
ist, ist {x} ∈ U(x). Wähle U := {x}, dann gilt f (U) = { f (x)} ⊆ V.
12.3. STETIGE ABBILDUNGEN
149
Zieht man in Betracht, dass in einem metrischen Raum die ǫ-Kugeln eine Umgebungsbasis um einen Punkt bilden, so ist das im folgenden Lemma auftretende Kriterium (ii) für die Stetigkeit eine unmittelbare Verallgemeinerung des wohlbekannten ’ǫ’ ’δ’ Kriteriums.
Bei Funktionen auf metrischen Räumen haben wir auch gesehen, dass die Stetigkeit
in einem Punkt x auch durch
xn → x ⇒ lim f (xn ) = f (x)
n→∞
charakterisiert werden kann. Man hat in allgemeinen topologischen Räumen eine ähnliche Charakterisierung, wobei man jedoch nicht mehr mit Folgen das Auslangen findet,
siehe (iii) im folgenden Lemma.
12.3.3 Lemma. Seien (X, T ), (Y, O) topologische Räume, f : X → Y, x ∈ X, und seien
W(x) bzw. W( f (x)) beliebige Umgebungsbasen von x in (X, T ) bzw. von f (x) in (Y, O).
Dann sind folgende Aussagen äquivalent.
(i) f ist im Punkt x stetig.
(ii) Für jedes V ∈ W( f (x)) existiert ein U ∈ W(x) mit f (U) ⊆ V.
(iii) Für jedes gegen x konvergente Netz (xi )i∈I in X folgt, dass das Netz ( f (xi ))i∈I
gegen f (x) konvergiert.
Beweis.
(i) ⇒ (ii) : Sei V ∈ W( f (x)). Dann ist auch V ∈ U( f (x)) und daher gibt es Ũ ∈ U(x)
mit f (Ũ) ⊆ V (vgl. (C x )). Nun ist W(x) Umgebungsbasis von x. Also gibt es ein
U ∈ W(x) mit U ⊆ Ũ und daher f (U) ⊆ V.
(ii) ⇒ (i) : Sei V ∈ U( f (x)), und wähle W ∈ W( f (x)) mit W ⊆ V. Dann gibt es
U ∈ W(x) ⊆ U(x) mit f (U) ⊆ W ⊆ V, also gilt (C x ).
(i) ⇒ (iii) : Konvergiert (xi )i∈I gegen x, und ist V ∈ U( f (x)), so existiert wegen der
Stetigkeit ein U ∈ U(x) mit f (U) ⊆ V. Wegen der Konvergenz findet man ein
ein i0 ∈ I, sodass i i0 ⇒ xi ∈ U und damit auch f (xi ) ∈ V. Also konvergiert
( f (xi ))i∈I gegen f (x).
(iii) ⇒ (i) : Wäre f nicht bei x stetig, so gäbe es eine Umgebung V von f (x), sodass
f (U) ∩ V c , ∅, oder äquivalent U ∩ f −1 (V c ) , ∅, für alle U ∈ U(x). Nach
Lemma 12.2.6 gibt es ein Netz (xi )i∈I in f −1 (V c ), welches gegen x konvergiert.
Andererseits ist aber f (xi ) ∈ V c für alle i ∈ I, womit f (xi ) i∈I sicherlich nicht
gegen f (x) konvergieren kann.
❑
12.3.4 Bemerkung. Mit einer Konstruktion ähnlich wie in Bemerkung 12.2.10 sieht
man, dass, wenn X das erste Abzählbarkeitsaxiom erfüllt – daher insbesondere in metrischen Räumen, die Stetigkeit bei x mit Hilfe von Folgen dadurch charakterisiert werden, dass xn → x ⇒ limn→∞ f (xn ) = f (x).
12.3.5 Satz. Seien (X, T ), (Y, O) topologische Räume, und sei f : X → Y. Dann sind
folgende Aussagen äquivalent:
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
150
(i) f ist stetig.
(ii) f −1 (O) ∈ T für jede offene Menge O ∈ O, d.h. die Urbilder von offenen Mengen
sind offen.
(iii) Die Urbilder von abgeschlossenen Mengen sind abgeschlossen.
(iv) Für jede Teilmenge B ⊆ X gilt f (B) ⊆ f (B).
Beweis.
(i) ⇒ (ii) : Sei O ∈ O. Ist x ∈ f −1 (O), so gilt f (x) ∈ O. Da O offen ist, gilt O ∈ U( f (x)),
und daher gibt es eine Umgebung U ∈ U(x) mit f (U) ⊆ O, d.h. U ⊆ f −1 (O).
Mit Lemma 12.1.11 folgt f −1 (O) ∈ T .
(ii) ⇒ (iii) : Sei A abgeschlossene Teilmenge von Y. Dann ist (A)c offen und wegen
(ii) gilt
h
ic
f −1 (A) = f −1 (Ac ) ∈ T .
Also ist f −1 (A) abgeschlossen.
(iii) ⇒ (iv) : Wegen f (B) ⊇ f (B) gilt gilt f −1 ( f (B)) ⊇ B. Da nach Voraussetzung
f −1 ( f (B)) abgeschlossen in (X, T ) ist, folgt f −1 ( f (B)) ⊇ B und daher f (B) ⊇
f (B).
(iv) ⇒ (i) : Sei x ∈ X und V ∈ U( f (x)) gegeben. Wir müssen ein U ∈ U(x) mit f (U) ⊆
V konstruieren. Dazu setze man W := f −1 (V). Dann gilt f (W c ) = f ( f −1 (V c )) ⊆
V c und daher f (W c ) ⊆ f (W c ) ⊆ V c .
Da V ∈ U( f (x)) und V ∩ V c = ∅ folgt aus Proposition 12.2.7, dass f (x) < V c und
wegen obiger Inklusion x < W c . Wir sehen, dass x ∈ (W c )c = W ◦ =: U ∈ U(x),
wobei U ⊆ W = f −1 (V), und somit f (U) ⊆ f (W) ⊆ V.
❑
−1
Bedingung (ii) in Satz 12.3.5 lässt sich kurz durch f (O) ⊆ T beschreiben, wobei
wir für eine Abbildung f : X → Y die Schreibweise
n
o
f −1 (C) := f −1 (C) : C ∈ C ⊆ P(X) ,
und später auch
n
o
f (B) := f (B) : B ∈ B ⊆ P(Y) ,
für B ⊆ P(X) bzw. C ⊆ P(Y) verwenden.
12.3.6 Lemma. Seien (X, T ) und (Y, O) topologische Räume, wobei (Y, O) Hausdorff
ist. Ist D eine dichte Teilmenge von X, und sind f, g zwei stetige Funktionen von X nach
Y, sodass f |D = g|D , dann folgt f = g.
Beweis. Angenommen f (x) , g(x) für ein x ∈ X \ D. Wegen der HausdorffVoraussetzung gibt es O1 , O2 ∈ O mit O1 ∩ O2 = ∅ und f (x) ∈ O1 , g(x) ∈ O2 . Da
f und g stetig sind, gibt es U1 , U2 ∈ T , x ∈ U1 ∩ U2 , sodass f (U1 ) ⊆ O1 , g(U2 ) ⊆ O2 .
Insbesondere ist U1 ∩ U2 eine nichtleere offene Menge, und hat daher einen nichtleeren
Schnitt mit D. Wir erhalten den Widerspruch:
∅ , f (U1 ∩ U2 ∩ D) = g(U1 ∩ U2 ∩ D) ⊆ O1 ∩ O2 = ∅ .
12.3. STETIGE ABBILDUNGEN
151
❑
Alternativ kann man sich so argumentieren, dass es zu x ∈ X \ D wegen Propo
sition 12.2.7 ein gegen x konvergentes Netz (xi )i∈I in D gibt. Die Netze f (xi ) i∈I und
g(xi ) i∈I konvergieren wegen Lemma 12.3.3 gegen f (x) bzw. g(x). Andererseits sind
diese Netze f (xi ) i∈I und g(xi ) i∈I identisch und haben wegen Lemma 12.1.18 den
selben Grenzwert; also f (x) = g(x).
12.3.7 Lemma. Seien (X, T ), (Y, O), (Z, R) drei topologische Räume und seinen f :
X → Y, g : Y → Z Funktionen. Weiters sei x ∈ X. Ist f stetig im Punkt x und ist g stetig
im Punkt f (x), so ist g ◦ f stetig im Punkt x. Insbesondere ist g ◦ f stetig, wenn f, g es
sind.
Beweis. Sei W ∈ U((g ◦ f )(x)). Da g stetig im Punkt f (x) ist, gibt es V ∈ U( f (x))
mit g(V) ⊆ W. Da f stetig im Punkt x ist, gibt es U ∈ U(x) mit f (U) ⊆ V. Insgesamt
erhalten wir
(g ◦ f )(U) = g( f (U)) ⊆ g(V) ⊆ W .
❑
12.3.8 Definition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y.
Dann heißt f ein Homöomorphismus von (X, T ) nach (Y, O), wenn f bijektiv ist und
wenn gilt f (T ) = O. Zwei topologische Räume (X, T ) und (Y, O) heißen homöomorph,
wenn es einen Homöomorphismus von (X, T ) nach (Y, O) gibt.
12.3.9 Lemma.
(i) Sei f : (X, T ) → (Y, O) eine bijektive Abbildung. Dann ist f genau dann
Homöomorphismus, wenn sowohl f als auch f −1 stetig sind.
(ii) Sind f : (X, T ) → (Y, O), g : (Y, O) → (Z, R) Homöomorphismen, so ist auch
g ◦ f : (X, T ) → (Z, R) ein Homöomorphismus.
(iii) Die Abbildung idX : (X, T1 ) → (X, T2 ) ist ein Homöomorphismus genau dann
wenn T1 = T2 .
Beweis.
(i) Ist f bijektiv, so ist f (T ) = O genau dann wenn f −1 (O) ⊆ T und f (T ) ⊆ O.
(ii) Folgt unmittelbar aus (i) und Lemma 12.3.7.
(iii) Das folgt unmittelbar aus idX (T1 ) = T1 .
❑
12.3.10 Beispiel.
Die Abbildung tan : (− π2 , π2 ) → R ist ein Homöomorphismus, wenn man (− π2 , π2 )
und R jeweils mit der Euklidischen Topologie versieht.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
152
Ist eine gegebene Menge Y mit zwei verschiedenen Metriken d1 und d2 versehen,
die aber äquivalent sind, dh. es gibt α, β > 0, sodass für alle x, y ∈ Y
αd1 (x, y) ≤ d2 (x, y) ≤ d1 (x, y) ,
(12.7)
so zeigt man leicht mit Hilfe der Charakterisierung der Stetigkeit in metrischen
Räumen durch Folgen (siehe Proposition 6.1.4), dass dann idY : (Y, d1 ) → (Y, d2)
und idY : (Y, d2) → (Y, d1 ) beide stetig sind. Also induzieren diese Metriken die
selbe Topologie, dh. T (d1 ) = T (d2 ). Siehe dazu auch Übungsbeispiel 5.1.
Sei X ein Vektorraum versehen mit zwei Normen k.k1 und k.k2 . Sind diese äquivalent (vgl. Definition 9.2.1), so sieht man sofort, dass die jeweils induzierten
Metriken ebenfalls äquivalent sind. Somit stimmen die Topologien, die von den
zu k.k1 und k.k2 gehörigen Metriken erzeugt werden, überein.
Man betrachte C versehen mit der euklidischen Metrik d2 und mit der chordalen
Metrik χ. Es ist wohlbekannt, dass zn → z in C bezüglich d2 genau dann, wenn
zn → z bezüglich χ. Also ist die Abbildung idC als Abbildung von (C, d2 ) nach
(C, χ) und auch als Abbildung von (C, χ) nach (C, d2 ) stetig. Somit gilt T (d2 ) =
T (χ), obwohl die beiden Metriken nicht äquivalent im Sinne von (12.7) sind.
Man betrachte einerseits C ∪ {∞} versehen mit der chordalen Metrik χ. Andererseits sei S die Oberfläche der Kugel mit Durchmesser 1 im R3 , die so auf
die Ebene R2 zum liegen kommt, dass Ihr Südpol den Nullpunkt berührt. Wir
versehen S mit d2 , dh.
q
d2 ((α, β, γ)T , (ξ, η, ζ)T ) = (α − ξ)2 + (β − η)2 + (γ − ζ)2 .
Die Stereographische Projektion σ : S → C ∪ {∞} ist bekannterweise eine
Isometrie, dh. χ(σ(x), σ(y)) = d2 (x, y). Also sind σ und σ−1 stetig, und σ ist
somit ein Homöomorphismus.
12.4 Basis, Subbasis
Wir betrachten nun eine feste Menge X und die Menge x(X) aller möglichen Topologien auf X. Die Elemente T von x(X) sind also Teilmengen von P(X), und daher
x(X) ⊆ P(P(X)).
Wir sagen eine Topologie T1 ist gröber als eine Topologie T2 bzw. T2 feiner als
T1 , wenn T1 ⊆ T2 . Aus Satz 12.3.5 erkennt man leicht, dass T1 genau dann gröber als
T2 ist, wenn id : (X, T2 ) → (X, T1 ) stetig ist.
12.4.1 Lemma. Ist Ti , i ∈ I, eine Familie von Topologien, so ist es auch ∩i∈I Ti . In der
Tat, ist dieser Schnitt die feinste Topologie, die gröber als alle Ti ist.
Für ein Mengensystem C ⊆ P(X) ist
\
T (C) =
{T ∈ x(X) : C ⊆ T }
(12.8)
die gröbste Topologie, die C enthält.
Beweis. Wir müssen nachweisen, dass ∩i∈I Ti die Axiome (O1) - (O3) erfüllt. Die
Mengen ∅, X sind in allen Ti enthalten, da diese ja Topologien sind. Also sind diese
Mengen auch im Schnitt enthalten. Es folgt (O1).
12.4. BASIS, SUBBASIS
153
Aus O1 , O2 ∈ ∩i∈I Ti folgt O1 , O2 ∈ Ti , i ∈ I, und somit O1 ∩ O2 ∈ Ti , i ∈ I. Also
O1 ∩ O2 ∈ ∩i∈I Ti , und daher (O2).
Sind O j ∈ ∩i∈I Ti , j ∈ J, so folgt für jedes i ∈ I, dass O j ∈ Ti , j ∈ J, und weiter
S
S
j∈J O j ∈ Ti . Nun gilt das wieder für alle i ∈ I, also
j∈J O j ∈ ∩i∈I Ti , und somit (O3).
Klarerweise ist ∩i∈I Ti in allen Ti enthalten. Ist andererseits T ⊆ Ti , i ∈ I, so auch
T ⊆ ∩i∈I Ti . Also ist der Schnitt die feinste in allen Ti enthaltene Topologie.
Nun enthält der Schnitt T (C) von Mengensystemen, die alle C enthalten, ebenfalls
C. Ist andererseits T ⊇ C, so gehört T zur Menge auf der linken Seite von (12.8) und
daher T ⊇ T (C). Also ist T (C) die gröbste Topologie, die C enthält.
❑
12.4.2 Definition. Sei (X, T ) ein topologischer Raum. Ein Mengensystem B ⊆ P(X)
heißt Basis von T , wenn B ⊆ T und wenn es für alle O ∈ T und x ∈ O ein B ∈ B mit
x ∈ B ⊆ O gibt.
Man sagt ein topologischer Raum (X, T ) erfüllt das zweite Abzählbarkeitsaxiom
(ABII), wenn T eine abzählbare Basis besitzt.
Ein Mengensystem C ⊆ P(X) heißt Subbasis von T , wenn C ⊆ T und wenn es für
alle O ∈ T , O , X, und x ∈ O endlich viele C1 , . . . , Cn ∈ C mit x ∈ C1 ∩ · · · ∩ Cn ⊆ O
gibt.
12.4.3 Bemerkung. Sei O ⊆ X und B ⊆ P(X). Die Tatsache, dass es zu jedem x ∈ O
ein B ∈ B gibt mit x ∈ B ⊆ O, kann man kurz auch als
[
O=
B
B∈B, B⊆O
schreiben.
12.4.4 Bemerkung. Offensichtlich ist C ⊆ P(X) genau dann eine Subbasis von T , wenn
das Mengensystem E aller endlichen Schnitte von C samt X, also
E := {X} ∪
n
n\
i=1
Ci : n ∈ N, C1 , . . . , Cn ∈ C}
eine Basis von T abgibt. Klarerweise enthält E das Mengensystem C. Der Grund,
warum man X extra in E hineingeben muss ist der, dass wir in Definition 12.4.2 für
Subbasis nur verlangen, dass es zu jedem offenen O ungleich X und x ∈ O Mengen
C1 , . . . , Cn ∈ C gibt mit x ∈ C1 ∩ · · · ∩ Cn ⊆ O.
12.4.5 Beispiel.
Ist (Y, d) ein metrischer Raum, so folgt aus der Definition der von d induzierten
Topologie T (d) sofort, dass
{Uǫ (x) : x ∈ Y, ǫ > 0}
eine Basis von T (d) ist.
Die Euklidische Topologie T (d2 ) auf R hat die Menge aller offenen Intervalle
{(a, b) ⊆ R : a, b ∈ R, a < b}
154
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
als Basis. Da man zu a < x < b aus R wegen der Dichteeigenschaft von Q (siehe
Satz 2.8.3) sicherlich s, t ∈ Q findet, sodass a < s < x < t < b, ist auch
{(s, t) ⊆ R : s, t ∈ Q, s < t}
eine Basis von T (d2 ). Also ist (ABII) erfüllt.
Wegen (a, b) = (a, +∞) ∩ (−∞, b) folgt damit unmittelbar, dass
{(a, +∞) ⊆ R : a ∈ R} ∪ {(−∞, b) ⊆ R : b ∈ R}
eine Subbasis von T (d2 ) auf R ist.
Betrachte den R p versehen mit d∞ . Da dort für die ǫ-Kugeln
Uǫ (x) = (ξ1 − ǫ, ξ1 + ǫ) × · · · × (ξ p − ǫ, ξ p + ǫ)
gilt, wobei x = (ξ j ) pj=1 , folgt, dass die Menge aller p-dimensionalen Quader
{(a1 , b1 ) × · · · × (a p , b p ) : a j , b j ∈ R, a j < b j , j = 1, . . . , p}
eine Basis von T (d∞ ) abgibt. Wegen T (d∞ ) = T (d2 ) (siehe Beispiel 12.3.10)
sind diese trivialerweise auch Basis von T (d2 ).
Ähnlich wie für R sieht man, dass auch
{(s1 , t1 ) × · · · × (s p , t p ) : s j , t j ∈ Q, s j < t j , j = 1, . . . , p}
eine abzählbare Basis von T (d2 ) ist.
12.4.6 Satz. Ist B ⊆ P(X) Basis einer gegebenen Topologie T auf X, so erfüllt B
(B1) Ist B1 , B2 ∈ B, x ∈ B1 ∩ B2 , so existiert B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 .
S
(B2) B∈B B = X.
Außerdem ist T die gröbste Topologie, die B enthält, dh. T = T (B).
Ist C ⊆ P(X) Subbasis einer gegebenen Topologie T auf X, so ist T die gröbste
Topologie, die C enthält, dh. T = T (C).
Beweis. Wegen B ⊆ T muss T (B) ⊆ T . Ist andererseits O ∈ T , so folgt aus der
Tatsache, dass B eine Basis ist, zusammen mit Bemerkung 12.4.3
[
O=
B.
(12.9)
B∈B, B⊆O
Wegen B ⊆ T (B) und wegen (O3) ist jede dieser Mengen auch in T (B), dh. T ⊆ T (B).
Aus (12.9) angewandt auf O = X sieht man unmittelbar, dass (B2) erfüllt ist.
S
Für B1 , B2 ∈ B ⊆ T gilt B1 ∩ B2 ∈ T . Aus B1 ∩ B2 = {B ∈ B : B ⊆ B1 ∩ B2 } folgt
für jedes x ∈ B1 ∩ B2 die Existenz eines B3 ∈ B mit x ∈ B3 ⊆ B1 ∩ B2 . Also gilt auch
(B1).
Ist schließlich C ⊆ P(X) eine Subbasis von T , so folgt aus Bemerkung 12.4.4, dass
E eine Basis von T ist, und daher T = T (E). Wegen C ⊆ E gilt T (C) ⊆ T (E).
Ist andererseits E ∈ E, so gilt E = X oder E = C1 ∩ · · · ∩ Cn für
C1 , . . . , Cn ∈ C ⊆ T (C). Aus (O1) bzw. (O2) folgt dann E ∈ T (C), und daher
E ⊆ T (C). Somit gilt auch T (E) ⊆ T (C), und insgesamt T = T (E) = T (C).
❑
12.4. BASIS, SUBBASIS
155
12.4.7 Lemma. Seien (X, T ) und (Y, O) topologische Räume und f : X → Y eine
Abbildung. Ist C eine Subbasis von O, so ist f genau dann stetig, wenn f −1 (C) ⊆ T .
Beweis. Aus der Stetigkeit folgt unmittelbar f −1 (C) ⊆ f −1 (O) ⊆ T .
Ist umgekehrt f −1 (C) ⊆ T , so prüft man leicht nach, dass
O′ := {O′ ⊆ Y : f −1 (O′ ) ∈ T }
die Axiome (O1) - (O3) erfüllt, dh. eine Topologie ist. Da laut Voraussetzung C ⊆ O′ ,
muss auch O = T (C) ⊆ O′ , und daher f −1 (O) ∈ T für alle O ∈ O.
❑
Wir wollen nun den umgekehrten Weg wie in Satz 12.4.6 gehen.
12.4.8 Satz. Erfüllt B ⊆ P(X) die Axiome (B1) und (B2), so ist B eine Basis von T (B).
Außerdem stimmt T (B) mit dem System T aller Mengen O ⊆ X der Bauart
[
O=
B
B∈V
mit einem (von O abhängigen) Teilsystem V ⊆ B überein; also T (B) = T , wobei
[
T = {O ⊆ X : ∃V ⊆ B, O =
B}.
(12.10)
B∈V
Ist C ⊆ P(X), so ist C eine Subbasis von T (C). Außerdem stimmt T (C) mit dem
System
[
{O ⊆ X : ∃V ⊆ E, O =
B}
(12.11)
B∈V
überein, wobei
E := {X} ∪
n
n\
i=1
Ci : n ∈ N, C1 , . . . , Cn ∈ C} .
die Axiome (B1) und (B2) erfüllt.
Beweis.
Wir zeigen zunächst, dass T definiert in (12.10) eine Topologie auf X ist.
Zunächst ist
[
∅=
B∈T,
B∈∅
und wegen (B2)
X=
[
B∈B
B∈T .
Also gilt (O1). Die Bedingung (O3) folgt aus
[ [ [
B =
i∈I
B∈Vi
S
B∈ i∈I Vi
B.
S
S
Es bleibt (O2) zu zeigen. Seien also O1 = B∈V1 B, O2 = B∈V2 B gegeben.
Jedes x ∈ O1 ∩ O2 liegt somit in einem B1 ∈ V1 und einem B2 ∈ V2 . Nach (B1)
gibt es ein B ∈ B mit x ∈ B ⊆ B1 ∩ B2 ⊆ O1 ∩ O2 . Wir erhalten (vgl. Bemerkung
12.4.3)
[
B,
O1 ∩ O2 =
B∈V
wobei V := {B ∈ B : B ⊆ O1 ∩ O2 }. Also O1 ∩ O2 ∈ T .
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
156
Offensichtlich gilt B ⊆ T . Ist x ∈ O ∈ T , so folgt aus (12.10), dass x ∈ B ⊆ O
für ein gewisses B ∈ B. Also ist B Basis von T , und wegen Satz 12.4.6 ist damit
T die gröbste Topologie T (B), die B umfasst.
Ist C ⊆ P(X), so sieht man unmittelbar, dass X ∈ E und dass mit E1 , E2 ∈ E auch
E1 ∩ E2 ∈ E. Insbesondere erfüllt E (B1) und (B2). Nach dem oben gezeigten
ist E Basis von T (E), wobei T (E) mit der Topologie in (12.11) übereinstimmt.
Wegen Bemerkung 12.4.4 bedeutet das, dass C eine Subbasis von T (E) ist, und
aus Satz 12.4.6 folgt damit schließlich T (C) = T (E).
❑
12.5 Initiale Topologie
Mit dem Konzept Basis und Subbasis können wir auf einer gegebenen Menge ausgezeichnete Topologien definieren, die gewisse Eigenschaften haben.
12.5.1 Satz. Seien X eine Menge, (Yi , Ti ), i ∈ I, topologische Räume und fi : X → Yi ,
i ∈ I, Abbildungen.
fi
fj
X
fk
(Yi , Ti )
(Y j , T j )
(Yk , Tk )
Dann existiert genau eine Topologie T auf X mit der Eigenschaft
(IN1 ) T ist die gröbste Topologie auf X, sodass alle Abbildungen fi : (X, T ) →
(Yi , Ti ), i ∈ I, stetig sind.
Diese Topologie heißt initiale Topologie bezüglich der fi . Für sie gilt
S
(IN2 ) i∈I fi−1 (Ti ) ist eine Subbasis von T ,
und
(IN3 ) Ist (Y, O) ein beliebiger topologischer Raum und f : Y → X, so ist f : (Y, O) →
(X, T ) genau dann stetig, wenn alle Abbildungen
fi ◦ f : (Y, O) → (Yi , Ti ), i ∈ I ,
stetig sind.
Beweis.
12.5. INITIALE TOPOLOGIE
157
Ist T ′ eine beliebige Topologie auf X, so ist fi : (X, T ′ ) → (Xi , Ti ) genau dann
stetig, wenn fi−1 (Ti ) ⊆ T ′ . Also sind alle fi genau dann stetig, wenn
[
fi−1 (Ti ) ⊆ T ′ .
(12.12)
i∈I
S
Nach Lemma 12.4.1 gibt es eine gröbste Topologie T = T ( i∈I fi−1 (Ti )), die
(12.12) erfüllt. Damit ist aber auch T die gröbste Topologie, sodass alle fi stetig
sind. Also gilt (IN1 ).
S
Wegen Satz 12.4.8 ist i∈I fi−1 (Ti ) Subbasis von T , und es gilt auch (IN2 ).
Sei f : (Y, O) → (X, T ), wobei T die initiale Topologie der fi , i ∈ I, ist. Im Falle
der Stetigkeit von f sind auch alle fi ◦ f : (Y, O) → (Yi , Ti ) als Zusammensetzung
stetiger Abbildungen stetig.
Seien umgekehrt alle fi ◦ f stetig, d.h. es gelte ( fi ◦ f )−1 (Ti ) ⊆ O. Dann folgt
f −1 ( fi−1 (Ti )) ⊆ O und damit
[
f −1 (
fi−1 (Ti )) ⊆ O .
i∈I
S
Da i∈I fi−1 (Ti ) eine Subbasis von T ist, folgt aus Lemma 12.4.7, dass f stetig
ist. Die initiale Topologie T hat also die Eigenschaft (IN3 ).
❑
12.5.2 Bemerkung. Die initiale Topologie T ist in der Tat die einzige Topologie T ′ mit
der Eigenschaft (IN3 ). Um das einzusehen, sei T ′ eine weitere Topologie auf X mit der
Eigenschaft (IN3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (IN3 )
angewandt auf T ′ , dass alle fi ◦ idX : (X, T ′ ) → (Yi , Ti ) stetig sind. Aus (IN1 ) folgt
T ⊆ T ′.
Für idX : (X, T ) → (X, T ′ ) sind andererseits alle Abbildungen fi ◦ idX = fi :
(X, T ) → (Yi , Ti ) stetig. Mit (IN3 ) angewandt auf T ′ folgt die Stetigkeit von idX :
(X, T ) → (X, T ′ ), und daher T ′ ⊆ T . Insgesamt ist T ′ = T .
12.5.3 Lemma. Mit der Notation aus Satz 12.5.1 sei (x j ) j∈J ein Netz in X. Dieses
konvergiert bzgl. T gegen ein x ∈ X genau dann, wenn fi (x j ) j∈J für alle i ∈ I gegen
fi (x) konvergiert.
Beweis. Konvergiert (x j ) j∈J gegen x bzgl. T , so folgt aus der Stetigkeit der fi mit
Lemma 12.3.3, dass fi (x j ) j∈J gegen fi (x) konvergiert.
Gelte umgekehrt, dass fi (x j ) j∈J gegen fi (x) für alle i ∈ I konvergiert. Für ein
U ∈ U(x) mit oBdA. U , X und O ∈ T mit x ∈ O ⊆ U folgt aus der Tatsache,
S
dass i∈I fi−1 (Ti ) eine Subbasis von T ist (vgl. (IN2 ) aus Satz 12.5.1), und Definition
12.4.2, dass
x ∈ fi−1
(O1 ) ∩ · · · ∩ fi−1
(Om ) ⊆ O ,
1
m
wobei i1 , . . . , im ∈ I, O1 ∈ Ti1 , . . . , Om ∈ Tim . Also folgt fik (x) ∈ Ok , k = 1, . . . , m, und
laut Voraussetzung gibt es Indizes j1 , . . . , jm , ∈ J, sodass j jk ⇒ fik (x j ) ∈ Ok , k =
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
158
1, . . . , m. Ist nun j0 ∈ J derart, dass j0 jk , k = 1, . . . , m, so folgt für j j0 jedenfalls
fik (x j ) ∈ Ok , k = 1, . . . , m, und daher
x j ∈ fi−1
(O1 ) ∩ · · · ∩ fi−1
(Om ) ⊆ O ⊆ U .
1
m
❑
Die Konstruktion der Initialen Topologie ist assoziativ.
g ik ◦
fi
g i,k
Yi
fi
gi,l
(Zi,l , Ti,l )
gil ◦ fi
X
fj
g jk ◦ f j
Yj
g jl ◦
fj
(Zi,k , Ti,k )
(Z j,k , T j,k )
g j,k
g j,l
(Z j,l , T j,l )
Abbildung 12.2: Veranschaulichung der Assoziativität der Initialtopologiebildung
12.5.4 Korollar. Seien X, Yi , i ∈ I, topologische Räume und fi : X → Yi , i ∈ I, Abbildungen. Weiters seien zu jedem i ∈ I eine Indexmenge Ji und topologische Räume
(Zi, j , Ti, j ) und Abbildungen gi, j : Yi → Zi, j gegeben.
Versieht man Yi mit der initialen Topologie Ti bezüglich der Abbildungen gi, j , j ∈
Ji , so stimmt die initiale Topologie T1 auf X bezüglich der Abbildungen fi : X →
Yi , i ∈ I, mit der initialen Topologie T2 auf X bezüglich der Abbildungen gi, j ◦ fi : X →
Zi, j , i ∈ I, j ∈ Ji , überein.
Beweis. Wir versehen die Yi mit der initialen Topologie Ti bezüglich der Abbildungen
gi, j , j ∈ Ji . Ist T irgendeine Topologie auf X, so ist wegen (IN3 ) angewandt auf die
(Yi , Ti ) die Tatsache, dass alle Abbildungen fi : X → Yi , i ∈ I, stetig sind, dazu
äquivalent, dass alle Abbildungen gi, j ◦ fi : X → Zi, j , i ∈ I, j ∈ Ji , stetig sind.
Also stimmt die gröbste aller Topologien, die die erste Bedingung erfüllen, –
wegen (IN1 ) ist das T1 – mit der gröbsten aller Topologien, die die zweite Bedingung
erfüllen, – wegen (IN1 ) ist das T2 – überein.
❑
12.6 Spur- und Produkttopologie
12.6.1 Definition. Sei (Y, T ) ein topologischer Raum und X ⊆ Y. Weiters sei ι : X →
Y die kanonische Einbettung, ι(x) = x. Die initiale Topologie auf X bezüglich der
12.6. SPUR- UND PRODUKTTOPOLOGIE
159
Abbildung ι heißt die Spurtopologie von T auf X und wird bezeichnet als T |X . Man
spricht von (X, T |X ) als einem Teilraum von (Y, T ).
12.6.2 Fakta.
1. Wegen Satz 12.5.1 ist
ι−1 (T ) = {O ∩ X : O ∈ T } ⊆ P(X)
eine Subbasis für T |X . Nun erfüllt diese Menge selbst schon (O1) − (O3), d.h. es
gilt
T |X = {O ∩ X : O ∈ T } .
(12.13)
Damit erhält man leicht auch, dass der Umgebungsfilter U|X (x) eines Elementes
x ∈ X bezüglich T |X genau
U|X (x) = {U ∩ X : U ∈ U(x)}
ist.
2. Aus (12.13) erhält man auch, dass das System A|X der in (X, T |X ) abgeschlossenen Mengen gegeben ist durch
A|X = {A ∩ X : A ∈ A} .
Daraus folgt auch unmittelbar, dass für B ⊆ X
T |X
B
T
= B ∩X,
(12.14)
3. Erfüllt (Y, T ) das Axiom (T 2 ), so folgt aus (12.13) auch, dass in Folge (X, T |X )
dieses Axiom erfüllt.
4. Aus (IN3 ) folgt, dass eine Funktion f : (Z, O) → (X, T |X ) genau dann stetig ist,
wenn f : (Z, O) → (Y, T ) stetig ist.
5. Ist (x j ) j∈J ein Netz in X und x ∈ X, so folgt aus Lemma 12.5.3, dass (x j ) j∈J genau
dann gegen x bzgl. T konvergiert, wenn (x j ) j∈J bzgl. T |X gegen x konvergiert.
6. Ist schließlich X ⊆ Z ⊆ Y, so gilt wegen Korollar 12.5.4
T |X = (T |Z )|X .
(12.15)
12.6.3 Beispiel. Sei (Y, d) ein metrischer Raum, und sei X ⊆ Y versehen mit der Einschränkung von d|X×X . Klarerweise ist (X, d|X×X ) ein metrischer Raum.
Die von d|X×X auf X erzeugte Topologie ist genau die Spurtopologie, die von T (d)
auf X induziert wird:
Ist O ∈ T (d) und x ∈ O ∩ X, so gibt es ein ǫ > 0 mit UǫY (x) ⊆ O. Daraus folgt, dass
die ǫ-Kugel UǫX (x) = UǫY (x) ∩ X um x bezüglich d|X×X in O ∩ X enthalten ist. Also ist
jede Menge aus T (d)|X offen bezüglich d|X×X .
Ist umgekehrt P ∈ T (d|X×X ), so wähle man für jedes x ∈ P ein ǫ x > 0, sodass die
ǫ x -Kugel UǫXx (x) = X ∩ UǫYx (x) in X in P enthalten ist. Es folgt
[
[
P=
X ∩ UǫYx (x) = X ∩
UǫYx (x) .
x∈P
x∈P
Somit ist P der Schnitt einer in Y offenen Menge und X, also P ∈ T (d)|X .
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
160
Ein unscheinbares aber recht oft anwendbares Ergebnis ist folgendes.
12.6.4 Lemma. Seien (X, T ), (Y, O) topologische Räume und A1 , . . . , Am ⊆ X Teilmengen mit A1 ∪ · · · ∪ Am = X, wobei entweder alle Ak , k = 1, . . . , m, abgeschlossen oder
alle diese Teilmengen offen sind.
Sind fk : Ak → Y, k = 1, . . . , m stetige Funktionen, wobei die Ak mit der Spurtopologie (vgl. Definition 12.6.1) versehen sind, sodass f j und fk auf A j ∩ Ak für alle
j, k ∈ {1, . . . , m} übereinstimmen, dann ist auch die Funktion f1 ∪ · · · ∪ fm : X → Y 2
stetig.
Beweis. Seien A1 , . . . , Am ⊆ X alle abgeschlossen. Der offene Fall ist ähnlich zu beweisen. Für ein abgeschlossenes F ⊆ Y gilt zunächst
( f1 ∪ · · · ∪ fm )−1 (F) = f1−1 (F) ∪ · · · ∪ fm−1 (F) .
Wegen der Stetigkeit von fk : Ak → Y ist fk−1 (F) abgeschlossen in der Spurtopologie
T |Ak , und somit von der Bauart C ∩ Ak für eine in X abgeschlossene Menge C. Als
Schnitt zweier in X abgeschlossener Mengen ist fk−1 (F) in X abgeschlossen.
Als Vereinigung abgeschlossener Mengen ist dann auch ( f1 ∪ · · · ∪ fm )−1 (F)
abgeschlossen. Da F beliebig war, ist somit f1 ∪ · · · ∪ fm stetig.
❑
Q
12.6.5 Definition. Seien (Xi , Ti ), i ∈ I, topologische Räume, und sei X := i∈I Xi . Die
initiale Topologie auf X bezüglich der Familie πi : X → Xi der kanonischen Projektionen
πi (xk )k∈I = xi
Q
heißt die Produkttopologie der Ti auf X und wird bezeichnet mit i∈I Ti .
12.6.6 Fakta.
1. Für ein O ⊆ Xi gilt
π−1
i (O) =
Y
Ok
k∈I
wobei Ok = Xk , k , i, und Oi = O ist. Wieder mit (IN2 ) und Bemerkung 12.4.4
erhält man daraus, dass die Mengen der Gestalt
Y
Ok ,
(12.16)
k∈I
wobei Ok ∈ Tk , k ∈ I, und für alle k ∈ I bis auf endlich viele Ok = Xk gilt, eine
Q
Basis für i∈I Ti bilden.
Q
2. Die kanonischen Projektionen πi : X → Xi bilden offene Mengen aus k∈I Tk
auf offene Mengen aus Ti ab, also sind sie offene Abbildungen.
Um das einzusehen, sei zunächst i ∈ I fest. Dann gilt für Basismengen der GeQ
stallt (12.16) offenbar πi ( k∈I Ok ) = Oi . Also ist das Bild unter πi einer jeden
Q
Menge aus dieser Basis offen in (Xi , Ti ). Da jede offene Menge in k∈I Tk Vereinigung von Basismengen ist, folgt die Behauptung.
2 Das
ist die (wohldefinierte) Funktion, die für k = 1, . . . , m auf Ak mit fk übereinstimmt.
12.6. SPUR- UND PRODUKTTOPOLOGIE
161
3. Weiters sieht man leicht mit Hilfe der Basis bestehend aus Mengen der Form
(12.16), dass für einen Punkt (xi )i∈I ∈ X die Mengen
Y
Ui ,
i∈I
wobei Ui ∈ U(xi ), i ∈ I, und Ui = Xi für alle bis auf endlich viele i, eine UmgeQ
bungsbasis bezüglich i∈I Ti bilden.
Q
4. Aus Lemma 12.5.3 folgt, dass für ein Netz (x j ) j∈J und einem Punkt x aus i∈I Xi ,
d.h. x j = (ξ j,i )i∈I und x = (ξi )i∈I mit ξ j,i , ξi ∈ Xi ,
j∈J
j∈J
x j −→ x ⇔ ∀i ∈ I : ξ j,i −→ ξi .
(12.17)
Q
5. Aus (12.17) folgt, dass für abgeschlossene Ai ⊆ Xi , i ∈ I, das Produkt i∈I Ai ⊆
Q
i∈I Xi ebenfalls abgeschlossen ist. Alternativ kann man das auch daraus folgern,
dass
Y
\
Ai =
π−1
i (Ai )
i∈I
i∈I
als Durchschnitt von Urbildern abgeschlossener Mengen unter stetigen Funktionen selber wieder abgeschlossen ist.
12.6.7 Bemerkung. Wendet man diese Konstruktion der Produkttopologie etwa auf
zwei Räume (X1 , T1 ) und (X2 , T2 ) an, d.h. I = {1, 2}, so bilden insbesondere alle Mengen der Bauart O1 × O2 mit O1 ⊆ X1 , O2 ⊆ X2 eine Basis der Produkttopologie T1 × T2 .
Außerdem sind alle Mengen A1 × A2 für abgeschlossene A1 ⊆ X1 , A2 ⊆ X2 , ebenfalls
abgeschlossen.
12.6.8 Beispiel. Seien (Y1 , d1 ) und (Y2 , d2 ) zwei metrische Räume, und sei d : Y1 ×Y2 →
R definiert als d (x1 , x2 ), (y1 , y2 ) = max(d1 (x1 , y1 ), d2 (x2 , y2 )), vgl. Fakta 8.7.8.
Wir wissen schon, dass d eine Metrik auf Y1 × Y2 ist, und dass Uǫ (x1 , x2 ) =
Uǫ (x1 ) × Uǫ (x2 ).
Die von dieser Metrik erzeugte Topologie T (d) stimmt mit der Produkttopologie
von T (d1 ) und T (d2 ) überein. Um das einzusehen, sei O ⊆ Y1 × Y2 . Diese Menge ist in
T (d) genau dann, wenn
∀(x1 , x2 ) ∈ O ⇒ ∃ǫ > 0 : Uǫ (x1 , x2 ) = Uǫ (x1 ) × Uǫ (x2 ) ⊆ O ,
was aber äquivalent zu
∀(x1 , x2 ) ∈ O ⇒ ∃O1 ∈ T (d1 ), O2 ∈ T (d2 ) : (x1 , x2 ) ∈ O1 × O2 ⊆ O
ist. Da die Mengen der Form O1 × O2 eine Basis von T (d1 ) × T (d2 ) darstellen, bedeutet
das genau O ∈ T (d1 ) × T (d2 ).
Folgendes Korollar samt Beweis funktioniert übrigens auch für Funktionen mit
Werten in einem normierten Raum.
12.6.9 Korollar. Sei (X, T ) ein topologischer Raum, und f, g : X → R (C), sowie
λ, µ ∈ R (C). Sind f und g stetig, so auch λ f +µg und f g. Ist zusätzlich f (x) , 0, x ∈ X,
so ist auch 1f stetig.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
162
Beweis. Die Funktion (x, y) 7→ λx + µy, R × R → R ist bekannterweise stetig. Nach
(IN3 ) angewandt auf R × R ist a 7→ ( f (a), g(a)), X → R × R ebenfalls stetig. λ f + µg
ist nun als Zusammensetzung dieser Funktionen ebenfalls stetig.
Der Beweis für f g und 1f verläuft analog.
❑
12.7 Finale Topologie*
12.7.1 Satz. Sei X eine Menge, seien (Yi , Ti ), i ∈ I, topologische Räume und fi : Yi →
X, i ∈ I, Abbildungen.
(Yi , Ti )
fi
fj
(Y j , T j )
X
fk
(Yk , Tk )
Dann existiert genau eine Topologie T auf X mit der Eigenschaft:
(FI1 ) T ist die feinste Topologie auf X, sodass alle Abbildungen fi : (Yi , Ti ) → (X, T ),
i ∈ I, stetig sind.
Diese Topologie heißt finale Topologie bezüglich der fi . Sie ist gegeben durch
(FI2 ) T = {O ⊆ X : fi−1 (O) ∈ Ti für alle i ∈ I},
und erfüllt:
(FI3 ) Ist (Y, O) ein topologischer Raum und f : X → Y, so ist f : (X, T ) → (Y, O)
stetig genau dann, wenn alle Abbildungen
f ◦ fi : (Yi , Ti ) → (Y, O), i ∈ I ,
stetig sind.
Beweis.
Wir betrachten die durch (FI2 ) definierte Menge T ⊆ P(X). Es gilt
fi−1 (O1 ∩ . . . ∩ On ) = fi−1 (O1 ) ∩ . . . ∩ fi−1 (On )
und
fi−1
[
j∈J
[
fi−1 (O j ) .
Oj =
j∈J
Sind also O1 , . . . , On ∈ T bzw. O j ∈ T , j ∈ J, so folgt, da die Ti Topologien
S
sind, O1 ∩ . . . ∩ On ∈ T und j∈J O j ∈ T . D.h. T erfüllt (O2), (O3). Wegen
fi−1 (∅) = ∅ und fi−1 (X) = Yi gilt auch (O1) für T .
12.7. FINALE TOPOLOGIE*
163
Definitionsgemäß gilt fi−1 (T ) ⊆ Ti , womit alle fi : (Yi , Ti ) → (X, T ) stetig sind.
Ist T ′ eine Topologie auf X, sodass alle fi stetig sind, so folgt fi−1 (O) ∈ Ti für
alle O ∈ T ′ , also O ∈ T . Also gilt T ′ ⊆ T , und T erfüllt (FI1 ). Klarerweise gibt
es höchstens eine Topologie mit der Eigenschaft (FI1 ).
Sei T die finale Topologie bezüglich der fi , und sei f : X → Y. Ist f stetig,
so ist auch f ◦ fi : (Yi , Ti ) → (X, T ) → (Y, O) als Zusammensetzung stetiger
Abbildungen stetig. Sei umgekehrt f ◦ fi stetig für alle i. Dann gilt
fi−1 ( f −1 (O)) = ( f ◦ fi )−1 (O) ⊆ Ti , i ∈ I ,
und wir erhalten f −1 (O) ⊆ T , d.h. f stetig.
❑
12.7.2 Bemerkung. Die Finale Topologie ist die einzige Topologie auf X, die (FI3 )
erfüllt. Um das einzusehen, sei T ′ eine weitere Topologie auf X mit der Eigenschaft
(FI3 ).
Da die Abbildung idX : (X, T ′ ) → (X, T ′ ) trivialerweise stetig ist, folgt aus (FI3 )
angewandt auf T ′ , dass alle idX ◦ fi : (Yi , Ti ) → (X, T ′ ) stetig sind. Aus (FI1 ) folgt
T′ ⊆ T.
Für idX : (X, T ′ ) → (X, T ) sind andererseits alle Abbildungen idX ◦ fi = fi :
(Yi , Ti ) → (X, T ) stetig. Mit (FI3 ) angewandt auf T ′ folgt die Stetigkeit von idX :
(X, T ′ ) → (X, T ), und daher T ⊆ T ′ . Insgesamt ist T ′ = T .
12.7.3 Bemerkung. Das Finale Topologie Bilden ist assoziativ; dh. es gilt ein Korollar
12.5.4 entsprechendes Resultat.
12.7.4 Beispiel. Sei (Y, T ) ein topologischer Raum und ∼ eine Äquivalenzrelation auf
Y. Weiters sei π : Y → Y/∼ die kanonische Projektion, π(x) = [x]∼ . Die finale Topologie auf Y/∼ bezüglich π heißt Quotiententopologie und wird bezeichnet als T /∼ .
Ist A ⊆ Y, so heißt A gesättigt bezüglich ∼, wenn x ∈ A die Inklusion [x]∼ ⊆ A nach
sich zieht. Offenbar sind alle Mengen der Bauart π−1 (B) mit B ⊆ Y/∼ gesättigt, und A
ist genau dann gesättigt, wenn π−1 (π(A)) = A. Somit stellt A 7→ π(A) eine bijektive
Abbildung von allen gesättigten Teilmengen von Y auf alle Teilmengen von Y/∼ dar,
wobei B 7→ π−1 (B) ihre Umkehrung ist.
Eine Menge P ⊆ Y/∼ ist per definitionem genau dann offen in (Y/∼ , T /∼ ), wenn
π−1 (P) offen in (Y, T ) ist. Insbesondere ist O 7→ π(O) eine Bijektion von allen gesättigten offenen Teilmengen von Y auf T /∼ . Entsprechendes gilt für abgeschlossene Mengen.
12.7.5 Proposition. Sei f : (X, T ) → (Y, V) eine stetige Abbildung. Bezeichne mit ∼
die Äquivalenzrelation x ∼ y : ⇐⇒ f (x) = f (y), und seien π : X → X/∼ , ι : f (X) → Y,
die kanonische Projektion bzw. Einbettung. Weiters sei g : X/∼ → f (X) die Bijektion
mit ι ◦ g ◦ π = f .
Dann ist g : (X/∼ , T /∼ ) → ( f (X), V| f (X) ) stetig. Außerdem sind folgende Aussagen
äquivalent
(i) g ist ein Homöomorphismus von (X/∼ , T /∼ ) auf ( f (X), V| f (X) ).
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
164
(ii) Für jede bezüglich ∼ gesättigte offene Menge O ⊆ X ist f (O) offen in
( f (X), V| f (X) ).
(iii) Für jede bezüglich ∼ gesättigte abgeschlossene Menge A ⊆ X ist f (A) abgeschlossen in ( f (X), V| f (X) ).
Beweis. Nach Satz 12.5.1,(IN3), bzw. Fakta 12.6.2 ist auch f : (X, T ) → ( f (X), V| f (X) )
stetig. Somit können wir oBdA. Y = f (X) und damit auch ι = idY annehmen.
Jede Abbildung g : X/∼ → Y mit g ◦ π = f muss g([x]∼ ) = f (x) für x ∈ X erfüllen.
Betrachten wir das als Definition, so ist die Wohldefiniertheit davon zu zeigen. Diese
folgt aber unmittelbar aus der Definition von von ∼, da [x]∼ = [y]∼ immer x ∼ y und
damit f (x) = f (y) nach sich zieht. Also gibt es ein solches g und dieses ist eindeutig.
Außerdem ist g injektiv, da aus f (x) = g([x]∼ ) = g([y]∼) = f (y) per definitionem x ∼ y
bzw. [x]∼ = [y]∼ folgt. Wegen g(X/∼ ) = f (X) = Y ist g sogar bijektiv.
Die Stetigkeit von g folgt unmittelbar aus Satz 12.7.1, (FI3 ), da X/∼ die finale
Topologie T /∼ bzgl. π trägt und da g ◦ π = f stetig ist.
Die Funktion g ist nun genau dann Homöomorphismus, wenn noch g−1 stetig ist,
d.h. wenn g(P) ∈ V für alle P ∈ T /∼ . Nach Beispiel 12.7.4 durchläuft π−1 (P) aber alle
offenen und gesättigten Teilmengen von X. Zudem gilt
g(P) = g ◦ π(π−1 (P)) = f (π−1 (P)) ,
woraus man sofort die Äquivalenz von (i) und (ii) erkennt. Die Äquivalenz von (i) und
(iii) zeigt man genauso.
❑
12.8 Zusammenhang und Trennungseigenschaft (T 1)*
Der Begriff der Getrenntheit zweier Teilmengen eines topologischen Raumes, welchen
wir jetzt einführen wollen, entspricht dem der Disjunktheit zweier Mengen aus der
Mengenlehre. Dabei gibt es eine schwächere und eine stärkere Version.
12.8.1 Definition. Sei (X, T ) ein topologischer Raum und seien A, B Teilmengen von
X. Dann heißen A und B getrennt, wenn A ∩ B = A ∩ B = ∅.
A und B heißen in (X, T ) getrennt durch offenen Mengen, wenn es disjunkte offene
Mengen OA , OB gibt, sodass A ⊆ OA , B ⊆ OB . Dazu sagen wir auch, dass sich A und
B durch offene Mengen trennen lassen.
12.8.2 Fakta.
1. Offenbar sind getrennte Mengen und auch durch offenen Mengen getrennte Mengen disjunkt.
c
c
2. A ∩ B = A ∩ B = ∅ ist äquivalent zu B ⊆ A und A ⊆ B , und daher auch
zur Existenz offener Mengen OA und OB , sodass B ⊆ OB , A ∩ OB = ∅ und
A ⊆ OA , B ∩ OA = ∅.
Insbesondere sind A und B sicher dann getrennt, wenn sie durch offene Mengen
getrennt sind. Die Umkehrung gilt im Allgemeinen nicht.
3. Für A, B ⊆ X und C := A ∪ B gilt für den Abschluss von A in C bzgl. der
T |C
Spurtopologie T |C bekannterweise A = A ∩ C = A ∪ (B ∩ A). Entsprechendes
gilt für B.
12.8. ZUSAMMENHANG UND TRENNUNGSEIGENSCHAFT (T 1)*
165
Insbesondere sind disjunkte Mengen A und B genau dann getrennt, wenn A und
B beide in A ∪ B bzgl. der Spurtopologie abgeschlossen sind. Durch Komplementbildung in A ∪ B erkennt man dann auch, dass disjunkte Mengen A und B
genau dann getrennt sind, wenn A und B beide in A ∪ B bzgl. der Spurtopologie
offen sind.
Somit sehen wir auch, dass A und B in C = A ∪ B (versehen mit T |C ) genau dann
getrennt sind, wenn sie dort durch offene Mengen getrennt sind.
4. Aus dem letzten Punkt erkennen wir auch, dass die Eigenschaft getrennt zu sein,
nur von der Spurtopologie auf A∪ B abhängt. Insbesondere gilt für A, B ⊆ Y ⊆ X,
dass A und B genau in (Y, T |Y ) getrennt sind, wenn sie es in (X, T ) sind.
Die Eigenschaft getrennt durch offene Mengen zu sein, hängt dagegen ganz wesentlich von dem betrachteten topologischen Raum ab.
Für eine weitere Charakterisierung der Eigenschaft durch offene Mengen zu sein,
siehe Bemerkung 12.9.2.
12.8.3 Definition. Ein topologischer Raum (X, T ) erfüllt das erste Trennungsaxiom
(T 1 ), wenn gilt:
(T 1 ) Je zwei verschiedene einpunktige Mengen lassen sich trennen.
Das schon bekannte Trennungsaxiom (T 2) bedeutet im Gegensatz dazu, dass sich
je zwei verschiedene einpunktige Mengen durch offene Mengen trennen lassen. (T 2)
ist somit stärker als (T 1).
12.8.4 Lemma. Ein topologischer Raum (X, T ) erfüllt genau dann (T 1 ), wenn einpunktige Mengen abgeschlossen sind.
Beweis. Sei x ∈ X. Nach Fakta 12.8.2, 2, gibt es zu y ∈ {x}c eine offene Umgebung
von y, die x nicht enthält, bzw. ganz in {x}c enthalten ist. Wegen Lemma 12.1.11 ist {x}c
offen.
Sind umgekehrt einpunktige Mengen abgeschlossen, so gilt für verschiedene
x, y ∈ X, dass auch {x} und {y} in {x, y} abgeschlossen sind. Gemäß Fakta 12.8.2, 3,
sind diese Mengen dann getrennt.
❑
Eins zu eins kann man den Begriff einer zusammenhängenden Menge auf topologische Räume verallgemeinern; vgl. Definition 6.2.2.
12.8.5 Definition. Eine Teilmenge E eines topologischen Raumes (X, T ) heißt zusammenhängend, wenn man E nicht als Vereinigung zweier nichtleerer getrennter Mengen
schreiben kann.
Aus Fakta 12.8.2, 4, erhalten wir
12.8.6 Lemma. Sei (X, T ) ein topologischer Raume und E ⊆ X. Die Eigenschaft,
zusammenhängend zu sein, hängt nur von der Spurtopologie auf E ab. Insbesondere
gilt für E ⊆ Y ⊆ X, dass E genau dann in (Y, T |Y ) zusammenhängend ist, wenn E es in
(X, T ) ist.
Das wichtige Resultat Proposition 6.2.4 lässt sich unmittelbar auf topologische
Räume übertragen, wobei man fast den selben Beweis nehmen kann. Man muss nur
Folgen durch Netze ersetzen. Wir wollen diesen Beweis aber etwas anders führen.
166
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.8.7 Proposition. Seien (X, T ) und (Y, O) topologische Räume, und sei f : X → Y
eine stetige Funktion. Ist E ⊆ X zusammenhängend, so auch f (E).
Beweis. Mit f : X → Y ist auch f |E : E → f (E) stetig, wobei E und f (E) jeweils mit
der Spurtopologie versehen sind. Wäre f (E) nicht zusammenhängend, so hätten wir
f (E) = A ∪ B mit in f (E) abgeschlossenen und disjunkten A, B , ∅. Daraus ergibt sich
aber im Widerspruch zur Voraussetzung
−1
E = f |−1
E (A) ∪ f |E (B) ,
−1
wobei f |−1
E (A), f |E (B) , ∅ in E abgeschlossenen und disjunkt sind.
❑
Folgender recht trivialer Sachverhalt ist jedoch sehr nützlich.
12.8.8 Lemma. Sei E eine zusammenhängende Teilmenge eines topologischen Raumes
(X, T ). Weiters seien A, B ⊆ X getrennt und so, dass E ⊆ A ∪ B. Dann folgt entweder
E ⊆ A oder E ⊆ B.
Beweis. Offensichtlich sind A ∩ E und B ∩ E als Teilmengen zweier getrennter
Mengen getrennt. Wegen E = (A ∩ E) ∪ (B ∩ E) und da E zusammenhängend ist, folgt
A ∩ E = ∅ oder B ∩ E = ∅ bzw. E ⊆ B oder E ⊆ A. Beides kann nicht der Fall sein, da
getrennte Mengen immer disjunkt sind.
❑
Damit können wir auch das im letzten Kapitel bewiesene Resultat Lemma 11.3.1
über die Vereinigung von zusammenhängenden Mengen in allgemeinen topologischen
Räumen mit einem etwas kürzeren Beweis versehen.
12.8.9 Korollar. Ist (Ei )i∈I eine Familie bestehend aus zusammenhängenden Teilmengen eines topologischen Raumes, sodass für ein gewisses i0 ∈ I und allen i ∈ I die
S
Mengen Ei0 und Ei nicht getrennt sind3 , so ist auch E := i∈I Ei zusammenhängend.
Beweis. Sei E = A ∪ B mit getrennten A und B. Nach Lemma 12.8.8 folgt für jedes
i ∈ I immer entweder Ei ⊆ A oder Ei ⊆ B. Sei oBdA. Ei0 ⊆ A. Wäre Ei ⊆ B für nur ein
i ∈ I, so wären Ei0 und Ei im Widerspruch zur Voraussetzung getrennt. Somit muss E
ganz in A enthalten sein; dh. B = ∅.
❑
12.8.10 Korollar. Mit E ist auch jede Teilmenge C eines topologischen Raumes mit
E ⊆ C ⊆ E zusammenhängend.
Beweis. Sei C = A ∪ B mit getrennten A und B. Nach Lemma 12.8.8 folgt E ⊆ A oder
E ⊆ B. Im ersten Fall folgt aus C ∩ B ⊆ E ∩ B ⊆ A ∩ B = ∅, dass E ⊆ A und daher
B = ∅. Im zweiten Fall schließt man entsprechend auf A = ∅.
❑
Das folgende Korollar 12.8.11 ist eine unmittelbare Verallgemeinerung von Lemma
11.3.5 auf allgemeine topologische Räume.
12.8.11 Korollar. Sei (X, T ) ein topologischer Raum. Ist ∼⊆ X × X die Relation auf X
definiert durch
x ∼ y ⇔ ∃E ⊆ X : x, y ∈ E, E ist zusammenhängend ,
3 Diese
Voraussetzung ist sicher dann erfüllt wenn Ei0 mit allen Ei einen nichtleeren Schnitt hat.
12.9. TRENNUNGSEIGENSCHAFTEN (T 3) UND (T 4)
167
so ist ∼ eine Äquivalenzrelation. Für ein x ∈ X ist die Äquivalenzklasse [x]∼ die größte
zusammenhängende Menge, die x enthält. Schließlich ist [x]∼ abgeschlossen.
Beweis. Da die einpunktige Menge {x} zusammenhängend ist, ist ∼ reflexiv. Die Symmetrie ist klar. Ist x ∼ y, y ∼ z, und sind E und F zusammenhängende Mengen, sodass
x, y ∈ E und y, z ∈ F, so ist nach Korollar 12.8.9 E ∪ F zusammenhängend, wobei
x, z ∈ E ∪ F. Also ist ∼ ein Äquivalenzrelation. Schließlich ist für x ∈ X die Menge
[
[x]∼ =
E,
x∈E
E ist zusammenhängend
wegen Korollar 12.8.9 zusammenhängend. Klarerweise ist diese Menge dann auch die
größte Zusammenhängende Menge, die x enthält. Wegen Korollar 12.8.10 ist sie auch
abgeschlossen.
❑
12.9 Trennungseigenschaften (T 3) und (T 4)
Wir wollen dieses Kapitel mit der einfachen Bemerkung starten, dass in (T 2 ) Räumen
einpunktige Mengen {x} abgeschlossen sind. Das folgt aus der Beobachtung, dass es zu
y ∈ {x}c wegen (T 2 ) eine Umgebung gibt, die x nicht enthält, bzw. ganz in {x}c enthalten
ist. Wegen Lemma 12.1.11 ist {x}c offen.
12.9.1 Definition. Man sagt, dass sich zwei disjunkte Mengen A und B in einem Topologischen Raum getrennt durch offenen Mengen sind, wenn es disjunkte offene Mengen
OA , OB gibt, sodass A ⊆ OA , B ⊆ OB . Dazu sagen wir auch, dass sich A und B durch
offene Mengen trennen lassen.
Ein topologischer Raum (X, T ) heißt regulär, falls er neben dem Axiom (T 2 ) noch
das Trennungsaxiom (T 3 ) erfüllt:
(T 3 ) Abgeschlossene Mengen A und einpunktige Mengen {x} mit x < A lassen sich
durch offene Mengen trennen, d.h. ∃O x , OA ∈ T : x ∈ O x , A ⊆ OA , O x ∩ OA = ∅.
OA
A
Ox
x
Abbildung 12.3: Drittes Trennungsaxiom (T 3 )
Ein topologischer Raum (X, T ) heißt normal, falls er neben dem Axiom (T 2 ) noch
das Trennungsaxiom (T 4 ) erfüllt:
(T 4 ) Disjunkte abgeschlossene Mengen A und B lassen sich durch offene Mengen
trennen, d.h. ∃OA , OB ∈ T : A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
168
OB
B
OA
A
Abbildung 12.4: Viertes Trennungsaxiom (T 4 )
Offenbar ist das Axiom (T 2) äquivalent dazu, dass sich je zwei verschiedene einpunktige Mengen durch offene Mengen trennen lassen.
Da einpunktige Mengen in (T 2)-Räumen abgeschlossen sind, folgt aus normal auch
regulär. Im Allgemeinen gilt aber nicht die Umkehrung.
12.9.2 Bemerkung. Zwei disjunkte Mengen A und B – die Disjunktheit ist äquivalent
zu A ⊆ Bc – lassen sich genau dann durch offene Mengen trennen, wenn es ein offenes
O gibt, sodass
A ⊆ O ⊆ O ⊆ Bc .
(12.18)
In der Tat folgt aus A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅, dass A ⊆ OA ⊆ OcB ⊆ Bc und
daraus A ⊆ OA ⊆ OA ⊆ OcB ⊆ Bc .
c
c
Andererseits folgt aus (12.18) unmittelbar A ⊆ O, B ⊆ O , O ∩ O = ∅.
Zusammen mit Beispiel 12.1.10, (ii), folgt aus Bemerkung 12.9.2
12.9.3 Korollar. Das Axiom (T 3 ) ist äquivalent zur Tatsache, dass man zu dem Punkt
x und jedem offenen O ∋ x ein offenes P mit x ∈ P ⊆ P ⊆ O finden kann, bzw.
äquivalent zur Tatsache, dass man zu einer beliebigen Umgebung U ∈ U(x) eines
beliebigen Punktes x eine Umgebung V ∈ U(x) mit V ⊆ U finden kann.
12.9.4 Bemerkung. Im Gegensatz zu (T 4 ) vererben sich die Axiome (T 2 ) und (T 3 ) auf
Teilräume, d.h. ist Y ⊆ X und (X, T ) ein topologischer Raum, der (T 2 ) bzw. (T 3 ) erfüllt,
so erfüllt auch (Y, T |Y ) (T 2 ) bzw. (T 3 ).
Um das einzusehen, erfülle X zunächst das (T 2 ). Sind dann x , y ∈ Y und O x , Oy ∈
T disjunkt mit x ∈ O x bzw. y ∈ Oy , so folgt x ∈ O x ∩ Y ∈ T |Y , y ∈ Oy ∩ Y ∈ T |Y . Also
erfüllt Y auch das Axiom (T 2 ).
Gilt (T 3 ) auf X, und ist x ∈ Y und W eine Umgebung von x in Y, so haben wir in
Fakta 12.6.2 gesehen, dass dass W = U ∩ Y für eine Umgebung U von x in X. Wegen
(T 3 ) gibt es eine Umgebung V von x in X mit V ⊆ U und somit ist V ∩Y eine Umgebung
von x in Y mit
x∈V ∩Y
T |Y
T
= V ∩Y ∩Y ⊆ V ∩Y ⊆U ∩Y = W .
Also gilt (T 3 ) auch auf Y.
12.9.5 Bemerkung. Ähnlich zeigt man, dass sich die Axiome (T 2 ) und (T 3 ) von topoQ
Q
logischen Räumen (Xi , Ti ) auf den Produktraum ( i∈I Xi , i∈I Ti ) vererben.
12.10. DAS LEMMA VON URYSOHN*
169
12.9.6 Beispiel. Metrische Räume sind normal. Dazu seien A und B zwei disjunkte,
abgeschlossene Mengen.
Zu a ∈ A gibt es ein ǫa > 0 mit U2ǫa (a) ⊆ Bc . Entsprechend wählt man ǫb für b ∈ B.
Nun setze
[
[
OA :=
Uǫa (a), OB :=
Uǫb (b) .
a∈A
b∈B
Ist c ∈ OA ∩ OB , so gibt es a ∈ A, b ∈ B mit c ∈ Uǫa (a) ∩ Uǫb (b). O.B.d.A. sei ǫa ≥ ǫb .
Es folgt d(a, b) ≤ d(a, c) + d(c, b) < 2ǫa , was aber b ∈ U2ǫa (a) implizieren würde, im
Widerspruch zur Wahl von ǫa . Also gilt A ⊆ OA , B ⊆ OB , OA ∩ OB = ∅.
12.9.7 Bemerkung. Der Vollständigkeit halber sei hier noch das erste Trennungsaxiom
(T 1 ) erwähnt. Ein topologischer Raum erfüllt eben dieses erste Trennungsaxiom, wenn
es zu allen x , y immer zwei (nicht notwendigerweise disjunkte) offene Mengen O x
und Oy mit x ∈ O x und y ∈ Oy gibt, wobei x < Oy und y < O x . Man sieht unschwer,
dass (T 1 ) dazu äquivalent ist, dass alle einpunktigen Teilmengen abgeschlossen sind.
Offenbar folgt (T 1 ) aus dem (T 2 ), aber nicht umgekehrt.
12.10 Das Lemma von Urysohn*
S
12.10.1 Lemma. Sei Mk = { 2lk : l = 0, . . . , 2k } und M = ∞
k=0 Mk . Weiters sei (X, T )
ein topologischer Raum. Angenommen jedem r ∈ M ist eine offene Menge Or ∈ T
zugeordnet, sodass r, s ∈ M, r < s ⇒ Or ⊆ O s und O0 = ∅, O1 = X.
Ist dann f : X → [0, 1] definiert durch
so ist f stetig, wobei f auf
Eins annimmt.
T
f (x) = inf{r ∈ M : x ∈ Or },
r∈M,r>0
Or den Wert Null und auf X \
S
r∈M,r<1
Or den Wert
Beweis. Wegen O1 = X ist {r ∈ M : x ∈ Or } für jedes x ∈ X eine nichtleere Teilmenge
c
von [0, 1], wodurch f (x) ein Element von [0, 1] ist. Wegen O0 = ∅ ist {r ∈ M : x ∈ Or }
für jedes x ∈ X ebenfalls eine nichtleere Teilmenge von [0, 1], womit
c
g(x) := sup{r ∈ M : x ∈ Or }
auch in [0, 1] liegt.
c
Aus s ∈ {r ∈ M : x ∈ Or } und t ∈ {r ∈ M : x ∈ Or } folgt s < t, da s ≥ t die
c
c
Beziehung x ∈ O s ∩Ot ⊆ O s ∩O s = ∅ nach sich ziehen würde. Also folgt g(x) ≤ f (x).
Wäre aber g(x) < f (x), so folgt aus der Dichtheit von M in [0, 1], dass g(x) < r <
s < f (x) für zwei s, r ∈ M. Wegen Or ⊆ O s gilt für ein festes x ∈ X, dass x ∈ O s oder
c
x ∈ Ocs ⊆ Or , und damit f (x) ≤ s oder g(x) ≥ r. Das ist in jedem Fall ein Widerspruch;
also f (x) = g(x).
Die Stetigkeit von f : X → [0, 1] ist äquivalent zur Stetigkeit von f als Funktion
nach R hinein, vgl. Fakta 12.6.2. Wegen Lemma 12.4.7 reicht es dafür nachzuweisen,
dass alle Urbilder einer Subbasis der euklidischen Topologie auf R offen in X sind.
Da die Mengen der Bauart (t, +∞) und (−∞, t) für t ∈ R eine Subbasis der Topologie auf R sind, reicht es f −1 (t, +∞), f −1 (−∞, t) ∈ T für jedes t ∈ R zu zeigen. Dafür
zeigen wir für t ∈ R
[
[
c
Or (∈ T ),
f −1 (−∞, t) =
Or (∈ T ), und f −1 (t, +∞) =
r∈M,r<t
r∈M,r>t
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
170
womit wir die Stetigkeit nachgewiesen hätten. In der Tat ist
f (x) = inf{r ∈ M : x ∈ Or } < t ⇔ ∃r ∈ M, r < t, x ∈ Or ⇔ x ∈
[
Or .
r∈M,r<t
Außerdem gilt
c
c
f (x) = g(x) = sup{r ∈ M : x ∈ Or } > t ⇔ ∃r ∈ M, r < t, x ∈ Or ⇔ x ∈
[
c
Or .
r∈M,r>t
T
S
Schließlich folgt f ( r∈M,r>0 Or ) ⊆ {0} und f (X \ r∈M,r<1 Or ) ⊆ {1} unmittelbar aus
der Definition von f .
❑
Als Folgerung erhält man das in der Literatur als Lemma von Urysohn bezeichnete
Ergebnis.
12.10.2 Korollar. Erfüllt (X, T ) das vierte Trennungsaxiom (T 4) (siehe Definition
12.9.1), so sind je zwei disjunkte abgeschlossene Mengen A, B durch eine stetige Funktion f : X → [0, 1] trennbar, d.h. f (A) ⊆ {0}, f (B) ⊆ {1}.
Beweis. Sind A, B zwei abgeschlossene und disjunkte Teilmengen von X, so gibt es
wegen dem (T 4) zwei disjunkte offene Teilmengen O ⊇ A, P ⊇ B. Daraus folgt A ⊆
O ⊆ O ⊆ Pc ⊆ Bc .
Für k = 0 setzen wir O0 := O und O1 := Bc . Aus obiger Gleichung folgt Or ⊆ O s
für alle r < s, r, s ∈ M0 = {0, 1}.
Angenommen wir haben offene Or definiert, sodass Or ⊆ O s für alle r < s, r, s ∈
l
∈ Mk+1 \ Mk , d.h. l ∈ N \ 2N, l < 2k+1 , die Menge Ot
Mk , so definiere man für t = 2k+1
folgendermaßen:
l+1
Wegen r := 2l−1
k+1 , s := 2k+1 ∈ Mk folgt aus Or ⊆ O s , dass die abgeschlossenen
Mengen Or , Ocs disjunkt sind, und wie oben wegen dem (T 4) die Existenz einer offenen
Menge Ot , sodass Or ⊆ Ot ⊆ Ot ⊆ O s .
S
Also haben wir induktiv für alle r ∈ M = k∈N Mk offene Mengen definiert, sodass
Or ⊆ O s für alle r < s, r, s ∈ M. Definieren wir nun noch O0 und O1 um, indem
wir O0 := ∅ sowie O1 := X setzen, so sind alle Voraussetzungen von Lemma 12.10.1
erfüllt.
T
Wegen A ⊆ r∈M,r>0 Or erfüllt die stetige Funktion aus diesem Lemma f (A) ⊆ {0}
S
und wegen Or ⊆ Bc , r < 1, r ∈ M bzw. B ⊆ X \ r∈M,r<1 Or , auch f (B) ⊆ {1}.
❑
Als Folgerung des Lemmas von Urysohn erhalten wir den Fortsetzungssatz von
Tietze.
12.10.3 Satz (Fortsetzungssatz von Tietze). Ein topologischer Raum (X, T ) erfülle
(T 4 ). Ist A ⊆ X abgeschlossen und f : A → R stetig, so existiert eine stetige Fortsetzung g von f auf X, also ein stetiges g : X → R mit g|A = f , wobei
supt∈A | f (t)| = supt∈X |g(t)| (∈ R ∪ {+∞}).
Der Beweis beruht auf dem folgenden Lemma.
12.10.4 Lemma. Erfülle (X, T ) das Axiom T 4 und sei u : A → [−1, 1] stetig. Dann
existiert eine stetige Funktion v : X → [− 31 , 13 ], sodass |u(x) − v(x)| ≤ 32 , x ∈ A.
12.10. DAS LEMMA VON URYSOHN*
171
Beweis. Sei H := {x ∈ A : −1 ≤ u(x) ≤ − 13 } und K := {x ∈ A : 31 ≤ u(x) ≤ 1}. Dann
sind H, K abgeschlossen in A (bzgl. der Spurtopologie) und, da A abgeschlossen in X
ist, sind H, K auch abgeschlossen in X. Klarerweise gilt H ∩ K = ∅. Nach dem Lemma
von Urysohn, Korollar 12.10.2, gibt es eine stetige Funktion v : X → [− 31 , 31 ] mit
v(H) ⊆ {− 13 }, v(K) ⊆ { 13 }. Diese hat offensichtlich die gewünschte Eigenschaft.
❑
Beweis. (Satz 12.10.3)
Habe f zunächst Werte in [−1, 1]. Wir konstruieren eine Folge (hn )n∈N0 stetiger
Funktionen hn : X → [− 31 ( 32 )n , 13 ( 32 )n ].
Wendet man Lemma 12.10.4 auf die Funktion f an, so erhält man h0 : X →
[− 31 , 31 ] mit | f (x) − h0 (x)| ≤ 23 , x ∈ A.
Haben wir für j = 0, . . . , n stetige h j : X → [− 31 ( 23 ) j , 13 ( 32 ) j ], sodass
n
X
2
f (x) −
hn (x) ≤ ( )n+1 , x ∈ A ,
3
j=0
P
so wende man Lemma 12.10.4 auf u(x) := 32 n+1 f (x) − nj=0 hn (x) an. Die
resultierende Funktion wird mit 23 n+1 multipliziert, und wir erhalten eine Funktion hn+1 : X → [− 31 ( 23 )n+1 , 13 ( 23 )n+1 ], sodass
n+1
n
2 2 X
X
n+1
f (x) −
, x ∈ A.
hn (x) = f (x) −
hn (x) − hn+1 (x) ≤ ·
3
3
j=0
j=0
Wir werden in Lemma 12.14.9 sehen, dass der Raum Cb (X, R) aller reellwertigen, beschränkten und stetigen Funktionen auf X versehen mit k.k∞ ein Banachraum ist. Wegen
∞
∞
X
X
1 2 j
( ) =1
(12.19)
kh j k∞ ≤
3 3
j=0
j=0
P
konvergiert die Reihe ∞j=0 h j dort absolut; vgl. Definition 9.3.1. Gemäß Fakta
P
9.3.2 konvergiert somit ∞j=0 h j in Cb (X, R) bzgl. k.k∞ , dh. gleichmäßig, gegen
eine g ∈ Cb (X, R), wobei aus (12.19) die Abschätzung kgk∞ ≤ 1 folgt.
Schließlich ist g eine Fortsetzung von f , denn für x ∈ A gilt
n
X
2 n+1 n→∞
f (x) −
hn (x) ≤
−→ 0 .
3
j=0
Ist allgemeiner f : A → R beschränkt, dh. f : X → [−k f k∞ , k f k∞ ], so wenden
wir das gezeigte auf k f fk∞ an und erhalten nach Multiplikation der resultierenden
Funktion auf X mit k f k∞ die gewünschte Fortsetzung von f .
Sei nun f : A → R unbeschränkt. Da R homöomorph zu (−1, 1) vermöge eines
Homöomorphismus φ : R → (−1, 1) ist, können wir das bewiesene auf φ ◦ f :
A → (−1, 1) anwenden und erhalten eine Fortsetzung r : X → [−1, 1] davon.
Wegen A ⊆ r−1 (−1, 1) sind die abgeschlossenen Mengen A und r−1 {−1, 1}
disjunkt. Eine Anwendung von Korollar 12.10.2 ergibt eine stetige Funktion
s : X → [0, 1] mit s(A) ⊆ {1} und s(r−1 {−1, 1}) = {0}.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
172
Die ebenfalls stetige Funktion r · s : X → [−1, 1] nimmt nun offensichtlich die
Werte ±1 nicht an, dh. r · s : X → (−1, 1), und stimmt auf A mit φ ◦ f überein.
Die Funktion g : X → R definiert durch g = φ−1 ◦ (r · s) : X → R ist die gesuchte
Funktion.
❑
12.10.5 Bemerkung. Aus der Gültigkeit des Fortsetzungssatz von Tietze auf einem
topologischen Raum (X, T ) folgt sofort das Lemma von Urysohn, Korollar 12.10.2,
da für disjunkte und abgeschlossene Mengen A, B die Funktion f : A ∪ B → [−1, 1]
definiert durch f = 1B − 1A wegen Lemma 12.6.4 stetig ist, und daher eine stetige
Fortsetzung g : X → [−1, 1] hat. Die Funktion 21 (g + 1) hat dann die in Korollar
12.10.2 verlangten Eigenschaften.
Andererseits folgt aus der Gültigkeit des Lemma von Urysohn, Korollar 12.10.2,
auf einem topologischen Raum (X, T ), dass dieser das Axiom (T 4) erfüllt. Sind
nämlich A, B ⊆ X abgeschlossen und disjunkt und f : X → [0, 1] wie in Korollar
12.10.2, so folgt A ⊆ f −1 (−∞, 21 ), B ⊆ f −1 ( 21 , +∞), f −1 (−∞, 12 ) ∩ f −1 ( 21 , +∞) = ∅ und
f −1 (−∞, 12 ), f −1 ( 21 , +∞) ∈ T .
12.11 Kompaktheit
Bei metrischen Räumen haben wir den Begriff der Kompaktheit mit Hilfe von Folgen
eingeführt. Für allgemeine topologische Räume wollen wir anders starten. Wir werden
weiter unten sehen, dass dieser Zugang zur Kompaktheit bei metrischen Räumen mit
dem schon bekannten äquivalent ist.
12.11.1 Definition. Eine Teilmenge K eines topologischer Raum (X, T ) heißt kompakt,
wenn jede offene Überdeckung eine endliche Teilüberdeckung besitzt. D.h., ist V ⊆ T
eine Familie offener Mengen mit
[
V⊇K,
V∈V
so gibt es bereits endlich viele V1 , . . . , Vn mit
V1 ∪ . . . ∪ Vn ⊇ K .
Eine Teilmenge A ⊆ X heißt relativ kompakt, wenn A ⊆ X kompakt ist. Der Raum
(X, T ) heißt lokalkompakt, wenn jeder Punkt x eine kompakte Umgebung besitzt.
Sei C eine Familie von Teilmengen einer Mengen X, dh. C ⊆ P(X). Wir sagen, dass
C die endliche Durchschnittseigenschaft hat, wenn für je endlich viele C1 , . . . , Cn ∈ C
stets C1 ∩ . . . ∩ Cn , ∅ gilt.
12.11.2 Proposition. Sei (X, T ) ein topologischer Raum und K ⊆ X. Dann sind äquivalent:
(K1 ) K ist kompakt.
(K2 ) K betrachtet als Teilmenge von (K, T |K ) ist kompakt.
(K3 ) Jede Familie bzgl. T |K abgeschlossener Teilmengen von K mit der endlichen
Durchschnittseigenschaft hat nichtleeren Durchschnitt.
12.11. KOMPAKTHEIT
173
(K4 ) Jedes Netz (xi )i∈I in K hat ein gegen ein x ∈ K konvergentes Teilnetz.
Beweis.
(K1 ) ⇒ (K2 ): Sei V ⊆ T |K eine offene Überdeckung von K in (K, T |K ). Zu V ∈ V
existiert ein UV ∈ T mit UV ∩ K = V. Also ist U := {UV : V ∈ V} eine
Familie offener Mengen in X, die K überdeckt. Es gibt also UV1 , . . . , UVn mit
UV1 ∪ . . . ∪ UVn ⊇ K. Damit ist auch
V1 ∪ . . . ∪ Vn = (UV1 ∩ K) ∪ . . . ∪ (UVn ∩ K) = (UV1 ∪ . . . ∪ UVn ) ∩ K = K .
(K2 ) ⇒ (K1 ): Ist K als Teilmenge von (K, T |K ) kompakt, und ist U ⊆ T eine Überdeckung aus offenen Mengen in (X, T ), so ist
V := {U ∩ K : U ∈ U}
eine offene Überdeckung von (K, T |K ). Daher existiert eine endliche Teilüberdeckung {U1 ∩ K, . . . , Un ∩ K}, und daher U1 ∪ . . . ∪ Un ⊇ K.
(K2 ) ⇒ (K3 ): Sei C eine Familie in (K, T |K ) abgeschlossener Teilmengen von K mit
T
der endlichen Durchschnittseigenschaft. Angenommen C∈C C = ∅. Dann folgt
[
K \C = K ,
C∈C
wobei die K \ C in (K, T |K ) offen sind. Also gibt es eine endliche Teilüberdeckung, (K \ C1 ) ∪ . . . ∪ (K \ Cn ) = K, und wir erhalten C1 ∩ . . . ∩ Cn = ∅, was
aber der endlichen Durchschnittseigenschaft widerspricht.
(K3 ) ⇒ (K2 ): Sei V ⊆ T |K eine offene Überdeckung von K. Würde V keine endliche Teilüberdeckung besitzen, so wäre (K \ V1 ) ∩ . . . ∩ (K \ Vn ) , ∅ für jede
endliche Auswahl V1 , . . . , Vn ∈ V. Also hätte C = {K \ V : V ∈ V} die endliche Durchschnittseigenschaft, und nach Voraussetzung wäre der Schnitt aller
Mengen K \ V, V ∈ V nichtleer. Damit wäre V aber keine Überdeckung.
(K3 ) ⇒ (K4 ): Sei (xi )i∈I ein Netz in K. Für i ∈ I ist Ci = {xk : k i} ∩ K abgeschlossen
in (K, T |K ). Das System Ci , i ∈ I, hat die endliche Durchschnittseigenschaft,
denn sind i1 , . . . , in ∈ I und ist i ∈ I, i i1 , . . . , in , so gilt
∅ , {xk : k i} ⊆ {xk : k i1 } ∩ · · · ∩ {xk : k in } .
Nach Voraussetzung gibt es ein x ∈ ∩i∈I Ci .
Jetzt sei J = {( j, U) : j ∈ I, U ∈ U(x), x j ∈ U} versehen mit der offensichtlich
reflexiven und transitiven Relation
( j, U) (k, V) :⇔ j k ∧ U ⊇ V .
Für ( j1 , U1 ), ( j2 , U2 ) ∈ J sei k ∈ I mit k j1 , j2 . Wegen x ∈ {x j : j k} gibt es
ein x j ∈ U1 ∩ U2 mit j k, und somit ( j, U1 ∩ U2 ) ( j1 , U1 ), ( j2 , U2 ). Also ist
J gerichtet.
Mit xi( j,U) := x j erhalten wir ein Teilnetz (xi( j,U) )( j,U)∈J von (xi )i∈I , da für jedes
i0 ∈ I die Beziehung (i0 , X) ∈ J gilt und da ( j, U) (i0 , X) immer i( j, U) = j i0 = (i0 , U) nach sich zieht.
Zu V ∈ U(x) gibt es ein k ∈ I mit xk ∈ V. Für ( j, U) (k, V) folgt dann
xi( j,U) = x j ∈ U ⊆ V, und somit konvergiert dieses Teilnetz gegen x.
174
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
(K4 ) ⇒ (K3 ): Hat C = {Ci : i ∈ I} die endliche Durchschnittseigenschaft, so sei E(I)
die Menge aller endlichen Teilmengen von I gerichtet durch die Relation M1 M2 :⇔ M1 ⊆ M2 .
Für M ∈ E(I) sei x M irgend ein Punkt aus ∩i∈M Ci . Man beachte, dass nach
Voraussetzung dieser Schnitt nicht leer ist. Das Netz (x M ) M∈E(I) hat wegen (K4)
ein gegen ein x ∈ X konvergentes Teilnetz (x M( j) ) j∈J .
Ist k ∈ I, so gibt es wegen {k} ∈ E(I) ein j0 ∈ J mit M( j) ⊇ {k} für alle j j0 ,
und somit x M( j) ∈ ∩i∈M( j) Ci ⊆ Ck . Also liegt das ebenfalls gegen x konvergente
Netz (x M( j) ) j∈J j0 in der abgeschlossenen Menge Ck . Mit Proposition 12.2.7 folgt
daraus x ∈ Ck , und, da k ∈ I beliebig war, auch dass der Schnitt aller Ck ’s x
enthält und damit nicht leer ist.
❑
12.11.3 Bemerkung (*). Wegen Lemma 12.2.15 ist die Bedingung (K4) zu der Tatsache
äquivalent, dass jedes Netz einen Häufungspunkt in K hat.
12.11.4 Satz (*). Ein Netz (xi )i∈I in einer kompakten Menge K ⊆ X konvergiert genau
dann gegen ein x ∈ X, wenn x der einzige Häufungspunkt von (xi )i∈I ist.
Beweis. Wenden wir nun Lemma 12.2.16 an, und beachten, dass Häufungspunkte von
Teilnetzen von (xi )i∈I auch Häufungspunkte von (xi )i∈I sind (vgl. Lemma 12.2.15), so
erhalten wir aus Bemerkung 12.11.3 das behauptete Ergebnis.
❑
12.11.5 Definition (*). Eine Teilmenge A eines topologischen Raumes (X, T ) heißt
abzählbar kompakt, wenn jede unendliche Teilmenge von A einen Häufungspunkt in A
hat.
Eine Teilmenge A eines topologischer Raum (X, T ) heißt folgenkompakt, wenn jede
Folge in A eine gegen ein x ∈ A konvergente Teilfolge hat.
12.11.6 Bemerkung (*). Ist M ⊆ A unendlich, so gibt es sicher eine injektive Funktion
x : N → M. Das ist aber nichts anderes als eine Folge, daher x(n) = xn .
Ist A folgenkompakt, so folgt x = limk→∞ xn(k) für eine Teilfolge (xn(k) )k∈N und ein
x ∈ A. Für jede Umgebung U von x gibt es somit einen Index k0 ∈ N, sodass xn(k) ∈ U
für alle k ≥ k0 . Da die Folgenglieder alle verschieden sind, enthält U sicherlich einen
Punkt y := xn(k) ∈ M, der ungleich x ist. Also hat M einen Häufungspunkt in A; vgl.
Definition 12.2.8. Somit folgt für eine Teilmenge eines topologischen Raumes aus der
Eigenschaft folgenkompakt die Eigenschaft abzählbar kompakt. Die Umkehrung gilt
im Allgemeinen nicht.
Ist A kompakt, so folgt wegen Proposition 12.11.2 x = limi∈I xn(i) für ein Teilnetz
(xn(i) )i∈I und ein x ∈ A. Für jede Umgebung U von x gibt es somit einen Index i0 ∈ I,
sodass xn(i) ∈ U für alle i i0 .
Da die Folgenglieder alle verschieden sind, gibt es höchstens ein n0 ∈ N, sodass
xn0 = x. Die Teilnetzeigenschaft bedingt die Existenz eines i1 ∈ I, sodass i i1 ⇒
n(i) ≥ n0 + 1 ∧ xn(i) ∈ U. Für solche i liegt der Punkt y := xn(i) ∈ M in U und ist
ungleich x. Also hat M einen Häufungspunkt in A; vgl. Definition 12.2.8. Somit folgt
12.11. KOMPAKTHEIT
175
auch aus kompakt abzählbar kompakt. Die Umkehrung gilt im Allgemeinen auch hier
nicht.
Überraschenderweise gilt im Allgemeinen weder, dass kompakt folgenkompakt impliziert, noch, dass folgenkompakt kompakt impliziert. In metrischen Räumen sind alle
drei Begriffe äquivalent, siehe Satz 12.14.3.
12.11.7 Lemma. Sei (X, T ) ein topologischer Raum, A ⊆ X, sowie A1 , . . . , Am ⊆ X.
Es gilt:
(i) Sei A kompakt, B ⊆ A abgeschlossen in (A, T |A ). Dann ist B ⊆ X kompakt.
(ii) Sind A1 , . . . , Am kompakt, so auch A1 ∪ . . . ∪ Am .
Sei zusätzlich vorausgesetzt, dass (X, T ) Hausdorff ist. Dann gilt:
(iii) Ist A kompakt, so ist A abgeschlossen.
Beweis.
(i) Die Menge A \ B ist offen in (A, T |A ). Also existiert O ∈ T mit O ∩ A = A \ B. Sei
U eine Überdeckung von B aus in X offenen Mengen, dann überdeckt U ∪ {O}
ganz A. Daher gibt es U1 , . . . , Un ∈ U mit U1 ∪ . . . ∪ Un ∪ O ⊇ A. Es folgt
U1 ∪ · · · ∪ Un = U1 ∪ . . . ∪ Un ∪ (O ∩ B) ⊇
| {z }
=∅
⊇ (U1 ∩ B) ∪ . . . ∪ (Un ∩ B) ∪ (O ∩ B) = (U1 ∪ . . . ∪ Un ∪ O) ∩ B ⊇ B .
(ii) Sei U eine Überdeckung von A1 ∪ . . . ∪ Am aus in X offenen Mengen. Dann
überdeckt U jedes Ai , also existieren Uki , k = 1, . . . , ni , i = 1, . . . , m, mit
U1i ∪ . . . ∪ Uni i ⊇ Ai ,
und es folgt
[
k,i
Uki ⊇ A1 ∪ . . . ∪ Am .
(iii) Sei A kompakt, und sei x < A. Da (X, T ) Hausdorff ist, gibt es zu jedem Punkt
y ∈ A offene Umgebungen Uy ∈ U(y), Vy ∈ U(x), mit Uy ∩ Vy = ∅. Klarerweise
ist {Uy : y ∈ A} eine offene Überdeckung von A. Daher gibt es y1 , . . . , yn ∈ A,
sodass bereits Uy1 ∪ . . . ∪ Uyn ⊇ A gilt. Die Menge Vy1 ∩ . . . ∩ Vyn ist als endlicher
Durchschnitt von Umgebungen von x ebenfalls eine Umgebung von x, und es gilt
Uy1 ∪ . . . ∪ Uyn ∩ Vy1 ∩ . . . ∩ Vyn = ∅.
Also ist x ein innerer Punkt von Ac . Nach Lemma 12.1.11 ist Ac offen und daher
A abgeschlossen.
❑
12.11.8 Lemma. Sei f : (X, T ) → (Y, O) stetig. Ist A ⊆ X kompakt, so ist auch
f (A) ⊆ Y kompakt.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
176
Beweis. Ist U ⊆ O eine Überdeckung von f (A), so ist f −1 (U) eine Überdeckung von A,
die wegen der Stetigkeit von f aus offenen Mengen besteht. Es gibt also U1 , . . . , Un ∈
U, sodass
f −1 (U1 ) ∪ . . . ∪ f −1 (Un ) ⊇ A .
Wendet man darauf f an, so folgt U1 ∪ . . . ∪ Un ⊇ f (A).
❑
Nimmt man die Charakterisierung (K4) aus Proposition 12.11.2 her, so kann man
Lemma 12.11.8 auch ganz ähnlich wie in Proposition 6.1.13 beweisen. Ist nämlich
(yi )i∈I ein Netz in f (A), und wählt man zu jedem i ∈ I ein xi ∈ A, sodass f (xi ) = yi , so
hat nach (K4) das Netz (xi )i∈I ein gegen ein x ∈ A konvergentes Teilnetz (xi( j) ) j∈J . Aus
Lemma 12.3.3 schließen wir, dass (yi( j) ) j∈J = f (xi( j) ) j∈J gegen f (x) =: y konvergiert.
Also hat jedes Netz aus f (A) ein gegen ein y ∈ f (A) konvergentes Teilnetz. Nach (K4)
aus Proposition 12.11.2 ist f (A) somit kompakt.
12.11.9 Korollar. Es gilt:
(i) Sei (X, T ) kompakt und (Y, O) Hausdorff. Weiters sei f : (X, T ) → (Y, O) bijektiv
und stetig. Dann ist f ein Homöomorphismus.
(ii) Sei X eine Menge und T , O Topologien auf X, sodass T kompakt und O Hausdorff
ist, und sodass O ⊆ T . Dann gilt sogar O = T .
Beweis.
(i) Wir müssen nachweisen, dass f −1 stetig ist. Dazu zeigen wir, dass das Urbild
unter f −1 einer in (X, T ) abgeschlossenen Menge in (Y, O) abgeschlossen ist, siehe
Satz 12.3.5. Sei A ⊆ X abgeschlossen, dann ist A kompakt, und daher ist nach
Lemma 12.11.8 auch
( f −1 )−1 (A) = f (A) ⊆ Y
kompakt. Nach Lemma 12.11.7, (iii), ist ( f −1 )−1 (A) auch abgeschlossen.
(ii) Wegen O ⊆ T ist idX : (X, T ) → (X, O) stetig, und (i) zeigt, dass idX sogar ein
Homöomorphismus ist, d.h. T = O.
❑
12.11.10 Lemma. Sei (X, T ) ein topologischer Raum.
(i) Ist X Hausdorffsch, und ist A ⊆ X kompakt und x ∈ X \ A, so lassen sich x und
A durch offene Mengen trennen, d.h. es gibt disjunkte offene Mengen O x ∋ x und
OA ⊇ A.
(ii) Erfüllt X das Axiom (T 3 ), und sind A ⊆ X kompakt, B ⊆ X abgeschlossen und
A ∩ B = ∅, so lassen sich A und B durch offene Mengen trennen.
(iii) Ist (X, T ) kompakt und Hausdorffsch, so ist (X, T ) sogar normal.
Beweis.
12.12. FILTER UND NETZE*
177
(i) Zu jedem y ∈ A gibt es zwei disjunkte offene Mengen Qy ∋ y und Py ∋ x. Klarerweise ist dann {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem ist mit
O x := Py1 ∩ · · · ∩ Pyn
O x ∩ OA = O x ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅ .
(ii) Zu jedem y ∈ A gibt es wegen (T 3 ) zwei disjunkte offene Mengen Qy ∋ y und
Py ⊇ B. Dann ist {Qy : y ∈ A} eine Überdeckung von A. Wegen der Kompaktheit
gibt es y1 , . . . , yn ∈ A, sodass A ⊆ Qy1 ∪ · · · ∪ Qyn := OA . Außerdem gilt für
OB := Py1 ∩ · · · ∩ Pyn
OB ∩ (Qy1 ∪ · · · ∪ Qyn ) ⊆ (Py1 ∩ Qy1 ) ∪ · · · ∪ (Pyn ∩ Qyn ) = ∅ .
Also lassen sich A und B durch offene Mengen trennen.
(iii) Da jede abgeschlossene Teilmenge von X nach Lemma 12.11.7 kompakt ist, folgt
aus (i), dass X regulär ist, dh. es gilt (T 2 ) und (T 3 ). Nach (ii) ist X dann sogar
normal.
❑
12.12 Filter und Netze*
Wir wollen in diesem Abschnitt die Konvergenz von Filtern und Filterbasen behandeln.
Wir werden sehen, dass diesbezüglich ganz ähnliche Resultate gelten wie für Netze. In
der Tat kann man die Netzkonvergenz durch Konvergenz eines durch das Netz bestimmten Endfilters charakterisieren. Andererseits werden wir sehen, dass jeder Filter
als Endfilter eines Netzes beschrieben werden kann.
Zunächst wollen wir eine nützliche Schreibweise einführen. Ist B eine Filterbasis
auf einer Menge X, so bezeichne [B] den von B auf X gemäß (12.1) erzeugten Filter,
also
[B] = {F ∈ P(X) : ∃B ∈ B : B ⊆ F} .
12.12.1 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung. Ist
B eine Filterbasis auf X, so ist f (B) eine Filterbasis auf Y. Dabei gilt
[ f (B)] = [ f ([B])] = {E ⊆ Y : f −1 (E) ∈ [B]}
Beweis. Aus ∅ < B , ∅ folgt sofort ∅ < f (B) , ∅. Zu f (B1 ), f (B2) ∈ f (B) mit
B1 , B2 ∈ B gibt es gemäß (FB2) ein B3 ∈ B, sodass B3 ⊆ B1 ∩ B2 , woraus sofort
f (B3 ) ⊆ f (B1 ∩ B2 ) ⊆ f (B1 ) ∩ f (B2 ) folgt. Also ist f (B) eine Filterbasis auf Y.
Offenbar gilt f (B) ⊆ f ([B]) und daher auch [ f (B)] ⊆ [ f ([B])]. E ∈ [ f ([B])]
bedeutet f (F) ⊆ E für ein F ∈ [B]. Also folgt B ⊆ F und somit f (B) ⊆ E bzw.
B ⊆ f −1 (E) für ein B ∈ B. Somit gilt f −1 (E) ∈ [B].
Schließlich folgt aus f −1 (E) ∈ [B], dass B ⊆ f −1 (E) und infolge
f (B) ⊆ f ( f −1 (E)) ⊆ E für ein B ∈ B. Also gilt E ∈ [ f (B)].
❑
Für Urbilder gilt folgende Aussage, die leicht zu verifizieren ist.
178
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
12.12.2 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung. Ist
C eine Filterbasis auf Y. Falls f −1 (C) , ∅ (bzw. äquivalent dazu C ∩ f (X) , ∅) für alle
C ∈ C, so ist f −1 (C) eine Filterbasis auf X. Dabei gilt
[ f −1 (C)] = [ f −1 ([C])]
Sei X eine Menge. Betrachte die Menge aller Filter auf X. Dies ist eine gewisse
Teilmenge von P(P(X)), und da die Potenzmenge jeder Menge mit der mengentheoretischen Inklusion geordnet ist, ist auch die Menge aller Filter auf X in dieser Weise
eine geordnete Menge. Ist F1 ⊆ F2 , so sagt man, dass F2 feiner als F1 ist oder, dass F1
gröber als F2 ist.
12.12.3 Definition. Sei (X, T ) ein topologischer Raum und x ∈ X. Ein Filter F auf X
heißt konvergent gegen x, wenn F feiner ist als der Umgebungsfilter U(x) von x, dh.
F ⊇ U(x). Wir schreiben F → x dafür.
Eine Filterbasis B auf einem topologischen Raum (X, T ) heißt konvergent gegen
ein x ∈ X, in Zeichen B → x, wenn der von dieser Basis erzeugte Filter [B] gegen x
konvergiert.
Offenbar gilt für zwei Filter F1 , F2 auf (X, T ), dass
F1 → x, F1 ⊆ F2 ⇒ F2 → x .
Die Tatsache F → x ist wegen der Filtereigenschaft (F3) äquivalent zu
∀U ∈ U(x)∃F ∈ F : F ⊆ U .
(12.20)
Da B eine Filterbasis von [B] ist, ist B → x äquivalent zu
∀U ∈ U(x) ∃B ∈ B : B ⊆ U .
(12.21)
12.12.4 Bemerkung. Sind X und Y zwei topologische Räume, f : X → Y und x ∈ X,
so bedeutet die Stetigkeit von f bei x, dass es für jedes U ∈ U( f (x)) ein V ∈ U(x) mit
f (V) ⊆ U gibt. Das ist aber äquivalent dazu, dass der von f (U(x)) erzeugte Filter auf Y
feiner als U( f (x)) ist, dh. dass f (U(x)) → f (x).
In dem Fall gilt auch für jede gegen x konvergente Filterbasis B, dass [ f (B)] =
[ f ([B])] ⊇ [ f (U(x))] ⊇ U( f (x)), und somit f (B) → f (x).
Da auch U(x) eine gegen x konvergente Filterbasis ist, sehen wir, dass f bei x genau
dann stetig ist, wenn aus B → x immer f (B) → f (x) folgt.
Für das kommende sei daran erinnert, dass für ein Netz (xi )i∈I auf (X, T ) die Konvergenz (xi ) → x per definitionem gerade
∀U ∈ U(x) ∃i0 ∈ I : ∀i i0 : xi ∈ U
bedeutet. Die Ähnlichkeit zur Konvergenz einer Filterbasis lässt sich formalisieren.
12.12.5 Definition. Ist (I, ) eine gerichtete Menge, so setzen wir
BI := {{i : i k} : k ∈ I} .
Wegen {i : i j} ⊆ {i : i k} ∩ {i : i l} für ein j k, l ist BI eine Filterbasis auf
I; vgl. Bemerkung 12.1.8.
12.12. FILTER UND NETZE*
179
Ein Netz (xi )i∈I in einem topologischen Raum (X, T ) über der gerichteten Menge I
ist eine Abbildung x : I → X. Das Bild von BI unter x ist dann gerade die Filterbasis
(vgl. Lemma 12.12.1)
x(BI ) = {{xi : i k} : k ∈ I} .
[x(BI )] bezeichnet man auch als den Endfilter des Netzes (xi )i∈I .
Die Konvergenz von (xi )i∈I gegen ein x ∈ X besagt gerade
∀U ∈ U(x) : ∃k ∈ I : {xi : i k} ⊆ U ,
was aber genau x(BI ) → x bedeutet; vgl. Definition 12.12.3. Also
i∈I
xi −→ x ⇔ x(BI ) → x .
(12.22)
Implizit ist die Konstruktion des nun folgenden Lemma schon in Lemma 12.2.6
aufgetreten.
12.12.6 Lemma. Sei X ein nichtleere Menge und B eine Filterbasis auf X. Dann ist
I = {(y, B) ∈ X × B : y ∈ B}
mit der Relation (y1 , B1) (y2 , B2 ) :⇔ B1 ⊇ B2 eine gerichtete Menge. Für das Netz
(xi )i∈I definiert durch xi = y, wenn i = (y, B) gilt
x(BI ) = B .
Beweis. Die Richtungseigenschaft folgt aus der Filterbasiseigenschaft (FB2), denn für
(y1 , B1 ), (y2 , B2) ∈ I gilt (y3 , B3 ) (y1 , B1), (y2 , B2 ), wenn B ∋ B3 ⊆ B1 ∩ B2 und
y3 ∈ B3 . Reflexivität und Transitivität von sind klar. Schließlich gilt für k = (z, B) ∈ I
x({i ∈ I : i k}) = {xi : i k} = B ,
da (y, C) (z, B) ⇔ C ⊆ B und da {y : ∃C ∈ B, y ∈ C ⊆ B} = B.
❑
Aus Bemerkung 12.12.4 zusammen mit (12.22) und Lemma 12.12.6 können wir
unschwer die schon bekannte Tatsache herleiten, dass f : X → Y bei x genau dann
stetig ist, wenn für jedes Netz auf X aus xi → x immer f (xi ) → f (x) folgt.
12.12.7 Lemma. Sei X eine nichtleere Menge und ∅ , C ⊆ P(X). Dann gibt es genau
dann einen Filter, der C umfasst, wenn der Schnitt von endlich vielen Mengen aus C immer nichtleer ist. Das ist äquivalent dazu, dass das bzgl. ∩ abgeschlossene, nichtleere
Mengensystem
B = {C1 ∩ · · · ∩ Cn : n ∈ N, C1 , . . . , Cn ∈ C}
∅ nicht enthält, bzw. dass B eine Filterbasis ist.
In dem Fall ist [B] der gröbste Filter, der C enthält. Für [B] schreiben wir auch
[C].
Beweis. ⇒ folgt sofort aus der Filtereigenschaft (F2) des C enthaltenden Filters.
Umgekehrt bildet unter der Voraussetzung, dass der Schnitt von endlich vielen Mengen
aus C immer nichtleer ist, das Mengensystem B eine Filterbasis, vgl. Bemerkung
12.1.8. Offenbar gilt [B] ⊇ B ⊇ C. Da jeder Filter mit C auch B enthält, ist [B] der
gröbste C enthaltende Filter.
❑
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
180
12.12.8 Bemerkung. Wir wollen dieses Resultat verwenden um für einen topologischen
Raum (X, T ), x ∈ X, und D ⊆ X die Tatsache x ∈ D neu zu beleuchten. Bekannterweise
gilt
x ∈ D ⇔ ∀U ∈ U(x) : U ∩ D , ∅ .
Wegen Lemma 12.12.7 angewandt auf C = {D} ∪ U(x) ist das äquivalent dazu, dass
{U ∩ D : U ∈ U(x)} eine Filterbasis bestehend aus Teilmengen von D abgibt. Diese
konvergiert offenbar gegen x.
Ist andererseits B eine Filterbasis bestehend aus Teilmengen von D mit B → U(x),
so gibt es zu jedem U ∈ U(x) ein B ∈ B mit ∅ , B ⊆ U ∩ D. Somit gibt {U ∩ D : U ∈
U(x)} eine Filterbasis ab, was wieder x ∈ B bedeutet.
Also gilt x ∈ D genau dann, wenn B → x für eine gewisse Filterbasis bestehend
aus Teilmengen von D. Mit Hilfe von (12.22) und Lemma 12.12.6 kann man wieder
leicht die schon bekannte Tatsache herleiten, dass das auch zur Existenz eines Netzes
aus D mit Grenzwert x äquivalent ist.
12.12.9 Korollar. Ist B j , j ∈ J, eine Familie von Filtern auf X, sodass endlich viele
S
Mengen aus C := j∈J B j immer einen nichtleeren Schnitt haben, so gibt es einen
gröbsten Filter [C], der alle B j , j ∈ J, umfasst. Dabei gilt
h[
i
[C] =
[B j ] .
(12.23)
j∈J
Man schreibt auch
W
j∈J [B j ]
für diesen Filter.
Beweis. Die erste Aussage folgt sofort aus Lemma 12.12.7. Außerdem gilt [C] ⊇ [B j ]
S
S
für jedes j ∈ J, und damit ⊇ in (12.23). ⊆ folgt sofort aus j∈J B j ⊆ j∈J [B j ].
❑
12.12.10 Lemma. Seien X eine Menge, (Yi , Ti ), i ∈ I, topologische Räume und fi :
X → Yi , i ∈ I, Abbildungen, und sei X versehen mit der entsprechenden initialen Topologie T . Eine Filterbasis B auf X konvergiert genau dann gegen ein x ∈ X, wenn
fi (B) → fi (x) für alle i ∈ I.
S
−1
U fi (x) . Man beachte dabei, dass
Beweis. Für x ∈ X betrachte C :=
i∈I fi
[ fi−1 U fi (x) ] = [ fi−1 W fi (x) ], wenn W fi (x) eine Filterbasis von U fi (x) ist; vgl.
Lemma 12.12.2. Nach Korollar 12.12.9 gilt
h[
i
[C] =
fi−1 W fi (x) .
j∈J
Sei W fi (x) die Filterbasis aller fi (x) enthaltenden offenen Teilmengen von Yi .
T
Die Mengen der Bauart i∈J fi−1 (Oi ), wobei J ⊆ I endlich ist und Oi ∈ Ti , i ∈ J,
bilden eine Basis der Topologie T . Für x ∈ X ist die Menge aller solchen Mengen,
die x enthalten, ein Basis des Umgebungsfilter von x bzgl. T . Nun
genau
ist dasaber
S
die die Menge aller endlichen Schnitte von Mengen aus j∈J fi−1 W fi (x) . Also gilt
[C] = U(x).
fi (B) → fi (x) bedeutet [ fi (B)] ⊇ U( fi (x)) für alle i ∈ I. Nach Lemma 12.12.1 ist
das zu fi−1 (U( fi (x))) ⊆ [B], i ∈ I, äquivalent. Da die rechte Seite ein Filter ist, erkennt
man, dass das zu [C] ⊆ [B], dh. zu B → x, äquivalent ist.
❑
In Analogie zum Häufungspunkt eines Netzes definieren wir
12.12. FILTER UND NETZE*
181
12.12.11 Definition. Sei (X, T ) ein topologischer Raum und B eine Filterbasis in X.
Dann heißt x ∈ X Häufungspunkt von B, falls
\
B =: HP(B) .
x∈
B∈B
12.12.12 Fakta.
1. Offenbar gilt HP(B) = HP([B]) und B1 ⊆ B2 ⇒ HP(B1 ) ⊇ HP(B2 ).
2. Aus Bemerkung 12.12.8 erkennen wir, dass x ∈ HP(B) äquivalent ist zu U ∩ B ,
∅ für alle U ∈ U(x) und B ∈ B.
3. Daraus leitet man unmittelbar her, dass aus B → x, dh. B ⊇ U(x), immer x ∈
HP(B) folgt.
4. Gemäß 2 und Lemma 12.12.7 bedeutet x ∈ HP(B), dass der Filter [U(x) ∪ B]
existiert, wobei [U(x) ∪ B] ⊇ U(x). Also gibt es einen feineren Filter als [B], der
gegen x strebt.
Diese Tatsache ist sogar äquivalent zu x ∈ HP(B), denn ist umgekehrt F ein
Filter mit F → x und F ⊇ [B], so folgt x ∈ HP(F) ⊆ HP(B).
12.12.13 Lemma. Eine Filterbasis auf einem topologischen Raum (X, T ) konvergiert
genau dann gegen x ∈ X, wenn x ∈ HP(C) für jede Filterbasis C mit [C] ⊇ [B].
Beweis. Aus [B] → x, dh. [B] ⊇ U(x), und [C] ⊇ [B] folgt sofort [B] → x und daher
x ∈ HP(C).
[B] 6→ x bedeutet andererseits [B] + U(x), dh. U < [B] für ein U ∈ U(x). Es
folgt B \ U , ∅ für alle B ∈ B, da ja aus B ⊆ U immer U ∈ [B] folgt. Somit ist
C := {B \ U : B ∈ B} eine Filterbasis mit [C] ⊇ [B]. x kann aber wegen Fakta 12.12.12,
2, kein Häufungspunkt von C sein.
❑
Vergleichen wir Fakta 12.12.12, 4, mit Lemma 12.2.15, so stellt sich die Frage, was
Teilnetze mit feineren Filtern zu tun haben.
12.12.14 Bemerkung. Sei (xi )i∈I ein Netz in einem topologischen Raum (X, T ). Aus
(12.5) erkennt man sofort, dass x genau dann Häufungspunkt von (xi )i∈I ist, wenn x
Häufungspunkt der Filterbasis x(BI ) ist.
Sei nun (xi( j) ) j∈J ein Teilnetz von (xi )i∈I , dh. für jedes i0 ∈ I gibt es ein j0 ∈ J
mit {i( j) : j j0 } ⊆ {i : i i0 }. Wir sehen, dass die Teilnetzeigenschaft zu [BI ] ⊆
[i(B J )] = i[[B J ]] äquivalent ist. Man beachte, dass damit die Eigenschaft Teilnetz zu
sein, nicht von den Netzen, sondern nur von den betrachteten gerichteten Mengen und
der Abbildung i : J → I abhängt.
Aus [BI ] ⊆ [i(B J )] folgt (vgl. Lemma 12.12.1)
[x(BI )] = x[BI ] ⊆ x[i(B J )] = [x(i(B J ))] = [x ◦ i(B J )]
Insbesondere erkennt man, dass aus (xi )i∈I → x auch (xi( j) ) j∈J → x folgt.
Ist nun C eine Filterbasis auf X mit [C] ⊇ [x(BI )], so kann man andererseits ein
Teilnetz (xi( j) ) j∈J von (xi )i∈I konstruieren, sodass [C] = [x ◦ i(B J )]4 . Dazu setzen wir
J := {(k, C) : k ∈ I, C ∈ C, xk ∈ C} ,
4 Diese
Konstruktion tritt implizit schon im Beweis von Proposition 12.11.2 auf.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
182
und definieren
(k1 , C1 ) (k2 , C2 ) :⇔ k1 k2 ∧ C1 ⊇ C2 .
ist offenbar reflexiv und transitiv. Für (k1 , C1 ), (k2 , C2 ) ∈ J gibt es C3 ∈ C mit C3 ⊆
C1 ∩ C2 und k ∈ I mit k k1 , k2 . Aus [C] ⊇ [x(BI )] folgt C3 ∩ {xi : i k} ∈ [C]. Also
ist dieser Schnitt nicht leer, und wir finden k3 k mit xk3 ∈ C3 , dh. (k1 , C1 ), (k2 , C2 ) (k3 , C3 ) ∈ J. Also ist J eine gerichtete Menge.
Setzen wir noch i (k, C) = k, so ist (xi( j) ) j∈J nach der Definition von auf J ein
Teilnetz. Für den entsprechenden Endfilter gilt ( j0 = (k0 , C0 ))
{xi( j) : j j0 } = {xk : k0 k ∈ I, ∃C ∈ C, xk ∈ C ⊆ C0 } = C0 ∩ {xk : k k0 } .
Wegen [C] ⊇ [x(BI )] gilt schließlich [C] = [x ◦ i(B J )].
12.13 Satz von Tychonoff*
12.13.1 Proposition. Einen topologischer Raum (X, T ) ist genau dann kompakt, wenn
jede Filterbasis einen Häufungspunkt hat.
Beweis. Ist B eine Filterbasis auf einem kompakten X, so hat B und daher auch
{B : B ∈ B}
die endliche Durchschnittseigenschaft. Aus Proposition 12.11.2 folgt HP(B) =
T
B∈B B , ∅.
Hat C ⊆ P(X) bestehend aus abgeschlossenen Mengen die endliche Durchschnittseigenschaft, so existiert nach Lemma 12.12.7 ein gröbster, C enthaltender Filter [C].
Falls jede Filterbasis einen Häufungspunkt hat, folgt
\
\
C , ∅.
C⊇
C∈C
C∈[C]
Nach Proposition 12.11.2 ist X kompakt.
❑
12.13.2 Definition. Ein Filter F auf einer Menge X , ∅ heißt Ultrafilter, wenn er ein
maximales Element in der Menge aller Filter auf X, geordnet mit der mengentheoretischen Inklusion, ist, dh. wenn aus G ⊇ F für einen Filter G immer G = F folgt.
12.13.3 Proposition. Sei X eine Menge, und F ein Filter auf X. Dann existiert ein
Ultrafilter F1 mit F1 ⊇ F.
Beweis. Wir wollen das Lemma von Zorn (siehe Satz 13.0.7) anwenden, und zwar
auf die Menge aller Filter auf X, die feiner als F sind. Diese Menge ist nichtleer –
sie enthält sicher F, und sie ist als Teilmenge der Menge aller Filter bezüglich der
mengentheoretischen Inklusion geordnet.
Sei (Fi )i∈I , I , ∅ eine totalgeordnete Menge von Filtern Fi mit Fi ⊇ F. Definiere
S
G := i∈I Fi . Dann gilt G ⊇ F, denn I , ∅ und alle Fi enthalten F. Insbesondere ist G
nichtleer.
Zu F1 , F2 ∈ G existiert i1 , i2 ∈ I mit F1 ∈ Fi1 und F2 ∈ Fi2 . Nun gilt entweder Fi1 ⊆
Fi2 oder Fi2 ⊆ Fi1 . Im ersten Fall sind F1 , F2 beide Elemente des Filters Fi2 , und daher
ist auch F1 ∩ F2 ∈ Fi2 ⊆ G. Im zweiten Fall erhält man genauso F1 ∩ F2 ∈ Fi1 ⊆ G. Ist
12.13. SATZ VON TYCHONOFF*
183
schließlich F1 ∈ G und F2 ⊇ F1 , so gilt für i ∈ I mit F1 ∈ Fi , sicherlich F2 ∈ Fi ⊆ G.
Also ist G ein Filter.
Nach dem Lemma von Zorn existiert in der Menge aller Filter auf X, die feiner
als F sind, ein maximales Element. Es verbleibt zu bemerken, dass ein maximales
Element in der Menge aller Filter auf X, die feiner als F sind, auch maximal in der
Menge aller Filter ist.
❑
12.13.4 Lemma. Seien X und Y nichtleere Mengen und f : X → Y eine Abbildung. Ist
F eine maximaler Filter, so ist es auch [ f (F)].
Beweis. Gemäß Lemma 12.12.1 ist [ f (F)] = {E ⊆ Y : f −1 (E) ∈ F} ein Filter.
Ist [ f (F)] ⊆ G für einen Filter G auf Y, so folgt f (F) ∩ G , ∅ und damit auch
F ∩ f −1 (G) , ∅ für alle F ∈ F, G ∈ G. Also ist die Menge {F ∩ f −1 (G) : F ∈ F, G ∈ G}
die Filterbasis eines Filters, der offenbar F und f −1 (G) umfasst. Wegen der Maximalität muss dieser mit F übereinstimmen. Somit gilt f −1 (G) ⊆ F bzw. G ⊆ [ f (F)].
❑
12.13.5 Korollar. Ein topologischer Raum (X, T ) ist genau dann kompakt, wenn jeder
Ultrafilter auf X konvergiert.
Beweis. Ist X kompakt und F ein Ultrafilter, so hat dieser nach Proposition 12.13.1
einen Häufungspunkt x ∈ X. Gemäß Fakta 12.12.12, 4, gibt es einen feineren, gegen x
konvergenten Filter. Wegen der Maximalität muss dieser aber mit F übereinstimmen.
Konvergiere umgekehrt jeder Ultrafilter. Ist B eine beliebige Filterbasis, so gibt es
nach Proposition 12.13.3 einen Ultrafilter F ⊇ [B]. Da F einen Grenzwert hat, muss er
auch einen Häufungspunkt haben. Somit hat aber auch B einen Häufungspunkt; vgl.
Fakta 12.12.12. Die Kompaktheit folgt aus Proposition 12.13.1.
❑
12.13.6 Satz (Tychonoff). Sei (Xi , Ti ), i ∈ I, eine Familie topologischer Räume, und
Q
Q
Q
Q
sei i∈I Ti die Produkttopologie auf i∈I Xi . Dann ist ( i∈I Xi , i∈I Ti ) genau dann
kompakt, wenn alle Räume (Xi , Ti ), i ∈ I, kompakt sind.
Beweis. Wir setzten
X :=
Y
i∈I
Xi und T :=
Y
i∈I
Ti ,
und bezeichnen mit πi : X → Xi die Projektion auf die i-te Komponente. Bekannterweise sind die πi : (X, T ) → (Xi , Ti ) stetig.
Setzt man voraus, dass (X, T ) kompakt ist, so ist jeder Raum (Xi , Ti ) als stetiges
Bild eines kompakten Raumes ebenfalls kompakt, vgl. Lemma 12.11.8.
Sei nun vorausgesetzt, dass (Xi , Ti ) für jedes i ∈ I kompakt ist, und sei F ein
Ultrafilter auf X. Für jedes i ∈ I folgt aus Lemma 12.13.4, dass [πi (F)] ein Ultrafilter
auf Xi ist. Nach Korollar 12.13.5 konvergiert [πi (F)] gegen einen Punkt xi ∈ Xi . Setzen
wir x := (xi )i∈I (∈ X), so folgt aus Lemma 12.12.10, dass F gegen x konvergiert. Nach
Korollar 12.13.5 ist X damit kompakt.
❑
Die folgende Aussage ist oft praktisch wenn man mit Ultrafiltern arbeitet.
12.13.7 Lemma. Ein Filter F in X ist genau dann Ultrafilter, wenn für alle A ⊆ X
entweder A ∈ F oder Ac ∈ F gilt.
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
184
Beweis. Habe F die angegebene Eigenschaft, und sei G ⊇ F. Für F ∈ G gilt also
entweder F ∈ F oder F c ∈ F. Im zweiten Fall wäre dann aber F c ∈ G, womit wir den
Widerspruch ∅ = F ∩ F c ∈ G erhielten. Also muss stets der erste Fall eintreten, womit
G ⊆ F. Also ist F ein Ultrafilter.
Sei F ein Ultrafilter, A ⊆ X, und sei Ac < F. Dann gilt A ∩ B , ∅ für jedes
B ∈ F, denn wäre A ∩ B = ∅, also B ⊆ Ac , so müssten wir Ac ∈ F haben. Also ist die
Menge B := {A ∩ B : B ∈ F} eine Filterbasis. Offenbar gilt [B] ⊇ F, und wegen der
Maximalität von F sogar [B] = F. Wegen A ∈ B erkennen wir, dass F die angegebene
Bedingung erfüllt.
❑
12.14 Kompaktheit in metrischen Räumen
In diesem Abschnitt wollen wir uns speziell kompakte metrische Räume anschauen.
Im ersten Semester haben wir die Kompaktheit einer Teilmenge K eines metrischen
Raumes (X, d) so definiert, dass jede Folge eine gegen einen Punkt aus K konvergente
Teilfolge hat.
Wir werden hier unter anderem sehen, dass die Definition aus dem ersten Semester
mit der aus Definition 12.11.1 übereinstimmt. Außerdem werden wir die Kompaktheit
auch mit Hilfe des folgenden Begriffes charakterisieren.
12.14.1 Definition. Sei (X, d) ein metrischer Raum und sei M ⊆ X. Die Menge M heißt
total beschränkt, wenn es zu jedem ǫ > 0 endlich viele Teilmengen M1 , . . . , Mn ⊆ M
vom Durchmesser d(M j ) := supx,y∈M j d(x, y) kleiner als ǫ gibt, sodass
M = M1 ∪ · · · ∪ Mn .
12.14.2 Fakta.
1. Man sieht sofort, dass Teilmengen von total beschränkten Mengen wieder total
beschränkt sind.
2. Da einerseits Kugeln mit Radius ǫ einen Durchmesser kleiner oder gleich 2ǫ
haben und da andererseits jede Teilmenge M j ⊆ M mit d(M j ) < ǫ für ein beliebiges η j ∈ M j in Uǫ (η j ) enthalten ist, lässt sich totale Beschränktheit auch
folgendermaßen charakterisieren:
Zu jedem ǫ > 0 gibt es y1 , . . . , yn ∈ M, sodass M ⊆ Uǫ (y1 ) ∪ · · · ∪ Uǫ (yn ).
3. Ist M j ⊆ X und sind x, y ∈ M j , so gibt es wegen Lemma 5.1.13 gegen x
bzw. y konvergente Folgen (xn )n∈N und (yn )n∈N aus M j . Somit folgt d(x, y) =
limn→∞ d(xn , yn ) ≤ d(M j ), und daher d(M j ) = d(M j ).
Ist M total beschränkt und ǫ > 0, so gilt M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j =
1, . . . , n. Es folgt nunmehr M = M1 ∪ · · · ∪ Mn mit d(M j ) < ǫ, j = 1, . . . , n,
womit auch M total beschränkt ist.
Ist M schon selbst abgeschlossen, so erkennt man daraus, dass man die Mengen
M j auch abgeschlossen wählen kann.
12.14.3 Satz. Sei K eine Teilmenge eines metrischen Raumes (X, d). Dann sind äquivalent:
12.14. KOMPAKTHEIT IN METRISCHEN RÄUMEN
185
(i) K ist kompakt im Sinne von Definition 12.11.1.
(ii) Jede unendliche Teilmenge von K hat einen Häufungspunkt in K.
(iii) Jede Folge in K hat eine gegen einen Punkt in K konvergente Teilfolge.
(iv) K ist total beschränkt und (K, d|K×K ) ist ein vollständiger metrischer Raum.
Beweis.
(i) ⇒ (ii): Sei M ⊆ K unendlich. Hätte M keinen Häufungspunkt in K, so gibt es zu
jedem y ∈ K ein ǫ(y) > 0, sodass (vgl. Definition 5.1.8)
M ∩ Uǫ(y) (y) ⊆ {y} .
Da y ∈ K beliebig war, ist {Uǫ(y) (y) : y ∈ K} eine offene Überdeckung von
K, die voraussetzungsgemäß eine endliche Teilüberdeckung hat. Also gibt es
y1 , . . . , yk ∈ K, sodass K ⊆ Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk ). Somit erhalten wir
M = M ∩ K ⊆ M ∩ Uǫ(y1 ) (y1 ) ∪ · · · ∪ Uǫ(yk ) (yk ) ⊆ {y1 , . . . , yn } ,
womit M aber endlich wäre.
(ii) ⇒ (iii): Habe jede unendliche Teilmenge von K einen Häufungspunkt in K, und
sei (xn )n∈N eine Folge aus K. Ist {xn : n ∈ N} endlich, so gilt sicherlich xn = x
für ein x ∈ K und für unendlich viele n ∈ N. Somit hat (xn )n∈N eine Teilfolge, die
konstant gleich x ist. Also ist x ein Häufungspunkt unserer Folge.
Anderenfalls ist {xn : n ∈ N} ⊆ K unendlich, und laut Voraussetzung hat sie
einen Häufungspunkt x in K. Da jede ǫ-Kugel um x unendlich viele Punkte aus
{xn : n ∈ N} enthält (vgl. Fakta 5.1.11), muss für N ∈ N jede ǫ-Kugel auch
unendlich viele Punkte aus {xn : n ∈ N, n ≥ N} enthalten. Insbesondere gilt
x ∈ {xn : n ∈ N, n ≥ N}. Nach Lemma 5.2.2 ist x Häufungspunkt von (xn )n∈N .
(iii) ⇒ (iv): Angenommen K wäre nicht total beschränkt. Dann gibt es ein ǫ > 0, sodass, wenn immer M1 , . . . , Mn endlich viele Teilmengen von K sind mit Durchmesser < ǫ, niemals M1 ∪ · · · ∪ Mn = K ist. Aus dieser Tatsache werden wir nun
auf die Existenz einer Folge ohne Häufungspunkt schließen.
Sei x1 ∈ K beliebig. Angenommen wir haben x1 , . . . , xk ∈ K definiert, dann
hat für j ∈ {1, . . . , k} nach der Dreiecksungleichung die Kugel U 3ǫ (x j ) einen
Durchmesser ≤ 2ǫ3 . Wegen unserer Wahl von ǫ ist (U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk )) ∩ K
eine echte Teilmenge von K. Wir wählen
xk+1 ∈ K \ U 3ǫ (x1 ) ∪ · · · ∪ U 3ǫ (xk ) .
Diese induktiv definierte Folge (xk )k∈N hat offensichtlich die Eigenschaft, dass
für k ∈ N der Punkt xk nicht in U 3ǫ (x1 )∪· · ·∪U 3ǫ (xk−1 ) liegt, und somit d(xk , xl ) ≥
ǫ
3 für l < k.
Damit kann keine Teilfolge von (xk )k∈N eine Cauchy-Folge sein und schon gar
nicht konvergieren. Das widerspricht aber der Voraussetzung (iii).
Es bleibt die Vollständigkeit von (K, d|K×K ) zu zeigen. Dazu sei (xk )k∈N eine
Cauchy-Folge in K. Diese hat voraussetzungsgemäß eine konvergente Teilfolge. Gemäß Lemma 3.5.7 ist (xk )k∈N konvergent.
186
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
(iv) ⇒ (i): Zunächst folgt wegen Lemma 9.1.6 aus der Vollständigkeit, dass K abgeschlossen ist. Sei nun U eine offene Überdeckung von K, und sei angenommen,
dass U keine endliche Teilüberdeckung enthält.
Die Menge K ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 1. Mindestens eine von diesen Mengen
kann nicht durch endlich viele Mengen aus U überdeckt werden. Diese sei K1 .
Die Menge K1 ist gleich der Vereinigung von endlich vielen abgeschlossenen
Mengen mit Durchmesser kleiner als 12 . Mindestens eine von diesen kann nicht
durch endlich viele Mengen aus U überdeckt werden. Diese sei K2 . Verfährt man
induktiv weiter, so erhält man eine Folge
K ⊇ K1 ⊇ K2 ⊇ K3 ⊇ . . .
von abgeschlossenen Mengen, sodass Kn einen Durchmesser kleiner als
und kein Kn durch endlich viele Mengen aus U überdeckt werden kann.
1
n
hat,
Wähle xn ∈ Kn . Dann ist (xn )n∈N eine Cauchy-Folge. Sei x ∈ K, sodass xn → x.
Also existiert V ∈ U mit x ∈ V. Da V offen ist, gibt es eine Kugel Uǫ (x) ⊆ V.
Sei n ∈ N, sodass 1n < 2ǫ und d(xn , x) < 2ǫ . Da der Durchmesser von Kn kleiner
als n1 ist, folgt für y ∈ Kn :
d(x, y) ≤ d(x, xn ) + d(xn , y) < ǫ .
Also ist Kn ⊆ V, im Widerspruch zur Tatsache, dass Kn nicht durch endlich viele
Mengen aus U überdeckt werden kann.
❑
12.14.4 Bemerkung. Eine Situation, wo obiger Satz Anwendung findet, ist die, dass
(X, d) ein vollständig metrischer Raum ist, und dass G eine total beschränkte Teilmenge
von X ist. Der Abschluss K von G ist dann auch total beschränkt und vollständig, also
kompakt.
12.14.5 Bemerkung (*). Satz 12.14.3 besagt insbesondere, dass in metrischen Räumen
die Begriffe kompakt, abzählbar kompakt und folgenkompakt zusammenfallen, vgl.
Definition 12.11.5.
12.14.6 Korollar (*). Sei (X, d) ein metrischer Raum. Ist K ⊆ X kompakt, dann ist K
separabel, hat also eine dichte abzählbare Teilmenge.
Beweis. Nach Satz 12.14.3 gibt es zu n ∈ N endlich viele Punkte xn1 , . . . , xnm(n) ∈ K,
sodass
U 1 (xn1 ) ∪ · · · ∪ U 1 (xnm(n) ) ⊇ K .
(12.24)
n
n
S
n
n
Setzen wir D := n∈N {x1 , . . . , xm(n) }, so ist D sicher eine abzählbare Teilmenge von
K. Ist y ∈ K und ǫ > 0, so sei n ∈ N so groß, dass ǫ ≤ n1 . Wegen (12.24) gibt es ein
j ∈ {1, . . . , m(n)} mit d(y, xnj ) < 1n ≤ ǫ und daher xnj ∈ Uǫ (y). Also ist y ∈ D.
❑
12.14.7 Proposition (*). Ein metrischer Raum (X, d) ist genau dann separabel, wenn
er das zweite Abzählbarkeitsaxiom erfüllt, also eine abzählbare Basis hat.
12.14. KOMPAKTHEIT IN METRISCHEN RÄUMEN
187
Beweis. Ist B eine abzählbare Basis von T (d), so sei xB irgendein Punkt aus B für jede
nichtleere Teilmenge B ∈ B. Klarerweise ist D := {xB : ∅ , B ∈ B} abzählbar. Ist y ∈ X
und O ∋ y offen, so gilt sicher y ∈ B ⊆ O für ein B ∈ B. Somit gilt O ∩ D ∋ xB und
daher y ∈ D. Also ist X separabel.
Ist umgekehrt (X, d) separabel mit einer abzählbaren und dichten Teilmenge D ⊆ X,
so besteht B := {U 1 (x) : n ∈ N, x ∈ D} sicherlich aus abzählbar vielen Mengen. Ist
n
2 (y) ⊆ O.
nun O ⊆ X offen, so sei für jedes y ∈ O die Zahl n(y) ∈ N so groß, dass U n(y)
Wir zeigen nun, dass
[
O=
(12.25)
U 1n (x) ,
x∈D∪O
n∈N:U 1 (x)⊆O
n
und somit dass B eine Basis von T (d) ist. Klarerweise ist die rechte Seite in O enthal1 (y) ⊆ D ∩ O. Somit folgt
ten. Ist y ∈ O, so gibt es wegen der Dichtheit ein x ∈ D ∩ U n(y)
1 (x) und für jedes t ∈ U 1 (x)
y ∈ U n(y)
n(y)
d(t, y) ≤ d(t, x) + d(x, y) <
1
1
2
+
=
,
n(y) n(y) n(y)
also t ∈ U 2 (y) und somit U 1 (x) ⊆ U 2 (y) ⊆ O. Also liegt jedes y ∈ O in der
n(y)
n(y)
n(y)
Vereinigung auf der rechten Seite von (12.25).
❑
12.14.8 Bemerkung (*). Da wir im ersten Beweisteil nicht verwendet haben, dass T (d)
eine metrische Topologie ist, gilt allgemein in topologischen Räumen, dass aus (ABII)
die Separabilität folgt.
Ein wichtiges Beispiel von kompakten Teilmengen eines vollständigen metrischen
Raumes liefert uns der Satz von Ascoli. Dabei betrachtet man den Raum Cb (X, R) bzw.
Cb (X, C) aller beschränkten, stetigen und reell- bzw. komplexwertigen Funktionen auf
einem topologischen Raum (X, T ). Wir haben solche Räume schon kennengelernt, aber
nur in dem Fall, dass X ein metrischer Raum ist.
Wir wollen zunächst bemerken, dass wenn X kompakt ist, jede stetige Funktion f
automatisch beschränkt ist, denn nach Lemma 12.11.8 ist dann f (X) kompakt und nach
Proposition 5.2.8 ist f (X) beschränkt.
12.14.9 Lemma. Die Räume Cb (X, R) und Cb (X, C) sind abgeschlossene Teilräume der
Banachräume B(X, R) und B(X, C) versehen mit k.k∞ und daher selbst Banachräume.
Beweis. Wir wissen aus Beispiel 9.1.8, dass B(X, R) und B(X, C) Banachräume sind.
Laut Definition sind Cb (X, R) und Cb (X, C) Teilmengen von B(X, R) bzw. B(X, C).
Wegen Korollar 12.6.9 sind sie sogar lineare Teilräume.
Sei nun fn ∈ Cb (X, R) (Cb (X, C)) mit fn → f in B(X, R) (B(X, C)) bezüglich k.k∞ ,
also gleichmäßig. Ist x ∈ X und (x j ) j∈J ein gegen x konvergentes Netz, so wissen wir
aus Lemma 8.7.1, dass lim j∈J limn→∞ fn (x j ) = lim j∈J f (x j ) existiert und mit
lim lim fn (x j ) = lim fn (x) = f (x)
n→∞ j∈J
n→∞
übereinstimmt. Da das Netz beliebig war, ist f stetig, dh. f ∈ Cb (X, R) (Cb (X, C)).
❑
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
188
12.14.10 Satz (Ascoli). Sei (X, T ) ein kompakter topologischer Raum und sei Φ eine
punktweise beschränkte und gleichgradig stetige Teilmenge von Cb (X, C), d.h. Φ ⊆
Cb (X, C) mit:
(i) Für jedes x ∈ X ist sup{| f (x)| : f ∈ Φ} beschränkt.
(ii) Für jedes x ∈ X und ǫ > 0 gibt es eine Umgebung V ∈ U(x) mit | f (y) − f (x)| < ǫ
für alle y ∈ V, f ∈ Φ.
Dann ist Φ total beschränkt. Ist umgekehrt Φ total beschränkt, so gelten (i) und (ii).
Eine entsprechende Aussage gilt für Cb (X, R).
Beweis. Erfülle Φ die Bedingungen (i) und (ii). Wir zeigen, dass Φ total beschränkt ist.
Dazu sei ǫ > 0 gegeben. Zu jedem x ∈ X können wir eine Umgebung V x von x
wählen, sodass (ii) für V = V x erfüllt ist. Da jede Umgebung von x eine x enthaltende
offene Menge enthält, können wir die V x offen wählen. Offensichtlich ist V x , x ∈ X,
eine offene Überdeckung von X.
S
Da X kompakt ist, existieren x1 , . . . , xn ∈ X, sodass schon X = ni=1 V xi und
| f (x) − f (xi )| < ǫ, x ∈ V xi , f ∈ Φ, i = 1, . . . , n .
Wegen (i) ist sicher
M := sup{ f (xi ) : i = 1, . . . , n, f ∈ Φ} < ∞ .
n
C
Sei K M
(0) = {(z1 , . . . , zn )T ∈ C : k(z1 , . . . , zn )T k ≤ M} die abgeschlossene Kreisscheibe
mit Radius M im Cn bezüglich der Norm k(w1 , . . . , wn )T k := max j=1,...,n |w j | auf Cn .
Cn
Dann haben wir eine Abbildung p : Φ → K M
(0), definiert als
p( f ) := f (x1 ), . . . , f (xn )
n
T
.
n
C
C
Nun ist K M
(0) ⊆ Cn kompakt und daher total beschränkt; vgl. Satz 12.14.3. Mit K M
(0)
Cn
ist auch die Teilmenge p(Φ) von K M (0) total beschränkt; vgl. Fakta 12.14.2. Also
existieren endlich viele f1 , . . . , fm ∈ Φ, sodass es für jedes f ∈ Φ ein k ∈ {1, . . . , m}
gibt mit kp( f ) − p( fk )k < ǫ, bzw. äquivalent dazu mit
| f (xi ) − fk (xi )| < ǫ, i = 1, . . . , n .
Sei nun f ∈ Φ und k ∈ {1, . . . , m}, sodass | f (xi ) − fk (xi )| < ǫ, i = 1, . . . , n. Jedes x ∈ X
liegt in einer Menge V xi , und für dieses i gilt
| f (x) − f (xi )| < ǫ, | fk (x) − fk (xi )| < ǫ .
Es folgt
| f (x) − fk (x)| ≤ | f (x) − f (xi )| + | f (xi ) − fk (xi )| + | fk (x) − fk (xi )| < 3ǫ
für alle x ∈ X und somit k f − fk k∞ ≤ 3ǫ. Die abgeschlossenen Kugeln mit Radius 3ǫ
und Mittelpunkt fk überdecken also ganz Φ, und somit ist Φ total beschränkt.
Zur Umkehrung sei zunächst bemerkt, dass total beschränkte Mengen sicherlich
beschränkt in (Cb (X, C), k.k∞ ) und somit auch punktweise beschränkt sind; also gilt (i).
Wegen der totalen Beschränktheit gibt es zu ǫ > 0 endlich viele f1 , . . . , fm ∈ Φ,
sodass es zu jedem f ∈ Φ ein fk mit k f − fk k∞ < ǫ gibt.
12.15. ÜBUNGSBEISPIELE
189
Zu einem x ∈ X gibt es wegen der Stetigkeit der fk ’s für k = 1, . . . , m, Umgebungen
Vk ∈ U(x) mit | fk (y) − fk (x)| < ǫ für alle y ∈ Vk . Setzen wir V = V1 ∩ · · · ∩ Vm , so ist
V ∈ U(x) und für f ∈ Φ folgt für das richtige fk und y ∈ V
| f (y) − f (x)| < | f (y) − fk (y)| + | fk (y) − fk (x)| + | f (x) − fk (x)| < 3ǫ ,
und somit (ii).
❑
12.14.11 Korollar. Für Φ ⊆ Cb (X, C) ist Φ genau dann kompakt, wenn Φ punktweise
beschränkt und gleichgradig stetig ist. Insbesondere enthält in diesem Fall jede Folge
in Φ eine gleichmäßig konvergente Teilfolge.
Eine entsprechende Aussage gilt für Cb (X, R).
Eine wichtige Anwendung dieses Satzes gibt es in der Theorie der gewöhnlichen
Differentialgleichungen, wo dieser die Existenz von Lösungen von einer großen Klasse
von Differentialgleichungen liefert.
12.15 Übungsbeispiele
12.1 Sei hX, di ein metrischer Raum. Zeige: Die Abbildung
d̂(x, y) :=
d(x, y)
, x, y ∈ X ,
1 + d(x, y)
ist eine Metrik auf X, sodass T (d) = T (d̂). Es gilt stets 0 ≤ d̂(x, y) ≤ min 1, d(x, y) .
Anmerkung: d und d̂ erzeugen zwar die selbe Topologie, sind aber im Allgemeinen nicht
äquivalent im Sinne von (12.7).
12.2 Sei f : M → N eine Funktion, und F ein Filter auf M. Man zeige, dass f (F) = { f (F) : F ∈
F} eine Filterbasis eines Filters G auf N ist. Man zeige auch, dass G = {G ⊆ N : f −1 (G) ∈
F} ist. Man gebe schließlich ein Beispiel an, sodass f (F) zwar eine Filterbasis, aber kein
Filter ist.
12.3 Sei X eine nichtleere Menge und d die diskrete Metrik, dh. d(x, y) = 1, x , y und d(x, x) =
0. Man zeige, dass dann T (d) = P(X).
12.4 Man betrachte X := {1, 2, 3}, T := {∅, {1}, {1, 2}, X}. Man zeige, dass (X, T ) ein Topologischer Raum ist. Ist er Hausdorffsch? Weiters bestimme man den Umgebungsfilter und eine
möglichst kleine Filterbasis davon um jeden Punkt x ∈ X.
Schließlich bestimme man den Abschluss einer jeden Teilmenge von X!
12.5 Man zeige: Ist (X, T ) ein Hausdorffraum und x ∈ X, so gilt immer ∩U∈U(x) U = {x}. Weiters
zeige man, dass {x} ⊆ X abgeschlossen ist.
12.6 Sei X eine nichtleere Menge, und definiere T1 , T2 ⊆ X als
T1 := A ⊆ X : A = ∅ oder X \ A endlich ,
T2 := A ⊆ X : A = X oder A endlich .
Für welche X sind T1 bzw. T2 Topologien? Begründen Sie Ihre Antwort!
Hinweis: Unterscheide die Fälle, dass X endlich oder unendlich ist.
12.7 Sei T die Topologie T1 aus dem letzten Beispiel! Man spricht von der cofiniten Topologie
auf der Menge X.
(i) Ist die cofinite Topologie Hausdorff?
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
190
(ii) Erfüllt sie das Trennungsaxiom T 3 ?
(iii) Erfüllt sie das Trennungsaxiom T 4 ?
12.8 Sei T wie im vorherigen Beispiel die cofiniten Topologie auf der Menge X.
(i) Bestimme alle abgeschlossenen Teilmengen und den Abschluss einer beliebigen Teilmenge von X.
(ii) Ist hX, T i kompakt?
(iii) Für welche X ist T eine metrische Topologie, dh. es gibt eine Metrik d, sodass T =
T (d)?
12.9 Für eine topologischen Raum (X, T ) zeige man:
(i) B ⊆ X ⇒ B◦ ⊆ B.
(ii) C ⊆ B ⇒ C ◦ ⊆ B◦ .
(iii) B ⊆ X ist genau dann offen, wenn B = B◦ .
(iv) C, B ⊆ X ⇒ (C ∩ B)◦ = C ◦ ∩ B◦.
12.10 Für eine topologischen Raum (X, T ) und M ⊆ X sei ∂M := M \ M ◦ ! Man zeige:
(i) ∂M ist immer abgeschlossen.
(ii) ∂M = {x ∈ X : ∀U ∈ U(x) ⇒ U ∩ M , ∅ , U \ M}.
(iii) ∂M = ∂(M c ).
(iv) ∂M = ∅ ⇐⇒ M, M c ∈ T .
12.11 Zeigen Sie, dass in einem topologischen Raum der Durchschnitt von endlich vielen offenen
und dichten Mengen wieder offen und dicht ist.
12.12 Sei G eine Gruppe und T eine Topologie auf G, sodass für alle g ∈ G die Abbildungen
h 7→ gh und h 7→ hg stetig sind. Zeigen Sie, dass für jedes g ∈ G diese Abbildungen sogar
Homöomorphismen sind. Zeigen Sie, auch dass eine Untergruppe H von G, welche bzgl.
T offen ist, auch abgeschlossen ist!
Hinweis: Zeigen Sie, dass {gH : g ∈ G} eine Partition abgibt, also dass dieses Mengensystem die Restklassenmenge einer Äquivalenzrelation ist.
12.13 Sei X = R2 versehen mit der von d2 induzierten Topologie. Weiters sei Y = (−1, 1)×(−1, 1)
versehen mit der von der Einschränkung d2 |Y×Y von d2 auf Y induzierten Topologie. Man
gebe einen Homöomorphismus von X auf Y an!
12.14 Zeigen Sie, dass die chordale Metrik χ (siehe Übungsbeispiel 6.38) und die 2-Metrik d2
auf R2 C die selbe Topologie induzieren, aber dort nicht äquivalent sind!
12.15 Sei f : X → Y mit topologischen Räumen (X, TX ) und (Y, TY ), wobei (X, TX ) das erste
Abzählbarkeitsaxiom erfüllt. Zeigen Sie, dass f bei x ∈ X genau dann stetig ist, wenn für
jede Folge (xn ) aus X mit Grenzwert x folgt, dass f (xn ) → f (x)!
12.16 Ist (X, T ) ein topologischer Raum und B eine Basis von T , so zeige man zunächst, dass für
jedes x ∈ X {B ∈ B : x ∈ B} eine Filterbasis des Umgebungsfilters U(x) von x ist. Schließlich zeige man, dass (X, T ) separabel ist (enthält also eine abzählbare dichte Teilmenge),
wenn (X, T ) das zweite Abzählbarkeitsaxiom erfüllt!
Hinweis für den zweiten Teil: Man greife aus jedem B einen Punkt heraus, wobei B alle
Mengen einer abzählbaren Basis durchläuft, und zeige die Dichtheit dieser Menge in X!
12.17 Zeigen Sie, dass für einen metrischen Raum (X, d) auch die Umkehrung gilt: Ist (X, T (d))
separabel (enthält also eine abzählbare dichte Teilmenge), dann erfüllt (X, T (d)) das zweite
Abzählbarkeitsaxiom!
Hinweis: Betrachte {Uǫ (x) : x ∈ D, Q ∋ ǫ > 0} mit D ⊆ X abzählbar und dicht!
12.15. ÜBUNGSBEISPIELE
191
12.18 Mit der Notation aus dem Übungsbeispiel 12.4 zeige man: Jede Basis B der Topologie T
muss schon mit T oder mit {{1}, {1, 2}, X} übereinstimmen. Weiters zeige man: V ist eine
Subbasis von T genau dann wenn V ⊇ {{1}, {1, 2}}.
12.19 Sei (X, T ) ein kompakter topologischer Raum und f : X → R stetig. Dann zeigen Sie, dass
f ein Maximum und ein Minimum auf X hat.
12.20 Seien (Xn , dn ), n ∈ N, metrische Räume. Weiters seien (cn )n∈N und (c̃n )n∈N Folgen positiver
P
Q
2
reeller Zahlen mit cn → 0 bzw. ∞
→
n∈N Xn
n=1 c̃n < ∞. Definiere Abbildungen d, d̃ :
R durch
dn ( fn , gn ) ,
d( f, g) := max cn
n∈N
1 + dn ( fn , gn )
d̃( f, g) :=
∞
X
c̃n
n=0
dn ( fn , gn )
,
1 + dn ( fn , gn )
Q
wobei f = ( fn )n∈N , g = (gn )n∈N ∈ n∈N Xn . Zeige, dass d und d̃ Metriken sind, und dass
Q
sowohl T (d) als auch T (d̃) mit n∈N T (dn ) übereinstimmt.
12.21 Sei (Y, T ) ein Topologischer Raum und sei X ⊆ Y versehen mit der Spurtopologie T |X .
Man weise nach:
(i) U ⊆ X ist genau dann eine Umgebung eines x ∈ X bezüglich T |X , falls U = X ∩ V
für eine Umgebung V von x bezüglich T .
(ii) Ist A ⊆ X und ist A der Abschluss von A in (Y, T ), so ist A ∩ X genau der Abschluss
von A in (X, T |X ).
(iii) Sei (Z, O) ein weiterer topologischer Raum und f : Y → Z eine stetige Funktion.
Dann ist auch f |X : X → Z stetig, wenn man X mit T |X versieht.
12.22 Gibt es in R nichttriviale Teilmengen, dh. , ∅ und , R, die bzgl. E := T (d2 ) gleichzeitig
offen und abgeschlossen sind?
Hinweis: Der Begriff Zusammenhang aus dem ersten Semester!
12.23 Seien hXi , Ti i, i ∈ I, topologische Räume, sei Y eine Menge, und seien fi : Y → Xi ,
i ∈ I, Abbildungen. Bezeichne mit T die initiale Topologie auf Y bezüglich der Familie
{ fi : i ∈ I} von Abbildungen.
Sei vorausgesetzt, dass die Familie { fi : i ∈ I} punktetrennend operiert, d.h. dass es zu je
zwei verschiedenen Punkten a, b ∈ Y eine Funktion fi0 gibt mit fi0 (a) , fi0 (b). Zeigen Sie:
Sind alle Räume hXi , Ti i Hausdorff, so hat auch hY, T i diese Eigenschaft. Zeigen Sie auch:
Q Q
Sind alle Räume (Xi , Ti ) Hausdorff, so auch ( Xi , Ti ).
Q
12.24 Sei X = R[0,1] = x∈[0,1] R die Menge aller reellwertigen Funktionen mit Definitionsbereich
D = [0, 1] versehen mit der Produkttopologie.
Man zeige, dass für f ∈ X das Mengensystem
{V x1 ,...,xn ;ǫ ( f ) : n ∈ N; x1 , . . . , xn ∈ D; ǫ > 0} ,
wobei
V x1 ,...,xn ;ǫ ( f ) := {g ∈ X : |g(x j ) − f (x j )| < ǫ, j = 1, . . . , n} ,
eine Filterbasis des Umgebungsfilters U( f ) von f abgibt. Sind die Mengen V x1 ,...,xn ;ǫ ( f )
offen bzgl. der Produkttopologie? Zeigen Sie auch, dass der Umgebungsfilter von f keine
Filterbasis bestehend aus abzählbar vielen Mengen besitzt. Gibt es dann eine Metrik d,
sodass T (d) = T ?
Hinweis: Falls es eine abzählbare Filterbasis (Uk )k∈N von U( f ) gibt, so konstruiere man
induktiv x11 , . . . x1n1 , x21 , . . . x2n2 , · · · ∈ [0, 1] und eine Nullfolge ǫ1 ≥ ǫ2 ≥ · · · > 0, sodass
V x1 ,...x1n ,...,xk ,...xkn ;ǫk ( f ) ⊆ Uk und daher auch (V x1 ,...x1n ,...,xk ,...xkn ;ǫk ( f ))k∈N eine Filterbasis abgibt.
1
1
1
1
1
k
1
k
T
Nun zeige man g ∈ k∈N V x1 ,...x1n ,...,xk ,...xkn ;ǫk ( f ) ⇔ g(xkj ) = f (xkj ), ∀k ∈ N, j ∈ {1, . . . , nk }.....
1
1
1
k
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
192
12.25 Mit der Notation aus dem vorherigen Beispiel sei B(D) die Teilmenge aller beschränkten
Funktion von X. Also B(D) = { f ∈ X : supt∈D | f (t)| < +∞}.
Sei nun T1 die von der Supremumsmetrik (d∞ ( f, g) := supt∈D | f (t) − g(t)|) erzeugte Topologie auf B(D), und sei T2 die Spurtopologie T |B(D) , wobei T die Produkttopologie aus dem
vorherigen Beispiel ist.
Man zeige: Wenn f j → f für ein Netz aus B(D) bzgl. T1 dann gilt auch f j → f bzgl.
T2 . Die Umkehrung gilt aber nicht. Man zeige auch, dass T1 echt feiner als T2 ist, bzw.
äquivalent dazu dass id : (B(D), T1 ) → (B(D), T2 ) stetig ist, aber id : (B(D), T2 ) →
(B(D), T1 ) nicht stetig ist.
12.26 Indem man eine offene Überdeckung angibt, die keine endliche Teilüberdeckung hat, zeige
man, dass (0, 1] als Teilmenge von R versehen mit E = T (d2 ) nicht kompakt ist und dass
eine unendliche Menge X versehen mit der diskreten Topologie nicht kompakt ist.
12.27 Sei M eine dichte Teilmenge von R. Man zeige, dass {(−∞, q) : q ∈ M} ∪ {(q, ∞) : q ∈ M}
eine Subbasis der von der Euklidischen Metrik erzeugten Topologie (Euklidischen Topologie) ist.
12.28 Zeigen Sie, dass jeder metrische, kompakte Raum auch separabel ist, also eine abzählbare
dicht Menge enthält!
12.29 Seien (X1 , T1 ) und (X2 , T2 ) kompakte topologische Räume. Man zeige ohne den Satz von
Tychonoff, dass X1 × X2 versehen mit der Produkttopologie kompakt ist!
Hinweis: Siehe Fakta 8.7.8 für den metrischen Fall!
12.30 Sei [−∞, +∞) versehen mit T := {[−∞, a) : a ∈ [−∞, +∞]}. Zeigen Sie, dass T eine
Topologie ist, die nicht Hausdorffsch ist! Bestimmen Sie U(x) für x ∈ [−∞, +∞)! Zeigen
Sie, dass für ein Netz (xi )i∈I aus [−∞, +∞), (xi )i∈I → x bzgl. T genau dann wenn x ∈
[lim supi∈I xi , +∞), wobei man allgemein für ein Netz aus [−∞, +∞) definiert
lim sup xi = inf sup xi (∈ [−∞, +∞]) .
i∈I
k∈I I∋ik
12.31 Für die Topologie aus dem vorherigen Beispiel zeige man, dass eine Teilmenge von
[−∞, +∞) genau dann kompakt ist, wenn sie nach oben beschränkt ist und ihr Supremum
enthält! Gibt es in [−∞, +∞) kompakte, nicht abgeschlossene Teilmengen?
12.32 Sei I eine gerichtete Menge und ∞ ein nicht in I enthaltenes Element. Man versehe I ∪ {∞}
derart mit einer Topologie, sodass für jeden topologischen Raum X und jedes Netz (xi )i∈I
in X mit betrefflicher Menge I als Indexmenge und jedes x ∈ X folgende beiden Aussagen
äquivalent sind:
xi → x, i ∈ I.
f : I ∪ {∞} → X ist stetig, wobei f (i) = xi und f (∞) = x.
12.33 Sei (G, T ) eine topologische Gruppe, also eine Gruppe versehen mit einer Topologie, sodass (g, h) 7→ gh als Abbildung von G × G (versehen mit der Produkttopologie) nach G und
g 7→ g−1 als Abbildung von G nach G stetig sind. Weiters seien M1 , M2 Teilmengen von G.
Weisen Sie nach, dass wenn (I, ) eine gerichtete Menge und (xi )i∈I , (yi )i∈I zwei Netze in
G über dieser gerichteten Menge mit xi → x und yi → y für x, y ∈ G sind, dann auch
xi yi → xy.
Weiters zeige man, dass wenn M1 und M2 kompakt sind, dann auch M1 · M2 eine kompakte
Teilmenge von G ist.
12.34 Mit der Notation aus vorherigen Beispiel zeige man, dass M1 · M2 abgeschlossen ist, wenn
eine der beiden Mengen abgeschlossen und die andere kompakt ist.
Hinweis: Nehmen Sie an, dass z im Abschluss von M1 · M2 ist, und betrachten Sie ein Netz,
dass aus M1 · M2 heraus gegen z konvergiert!
Anmerkung: M1 · M2 ist am Allgemeinen nicht abgeschlossen, wenn man nur fordert, dass
M1 und M2 abgeschlossen
sind. Beispielsweise sind in der
√
√ topologischen Gruppe (R, +)
die Mengen Z und 2Z abgeschlossen. Die Menge Z + 2Z ( R ist aber dicht in R und
damit nicht abgeschlossen.
12.15. ÜBUNGSBEISPIELE
193
12.35 Zeigen Sie, dass Φ = { f ∈ C 1 [0, 1] : f (0) = 0, k f ′ k∞ ≤ 1} als Teilmenge von C([0, 1], R)
relativ kompakt ist, dh. dass Φ kompakt ist.
12.36 Man gebe an, ob Φ ⊆ C(K, R) total beschränkt ist, wobei
(a) K = [0, 1] und Φ = {(t 7→ tn ) : n ∈ N}
(b) K = [0, 1] und Φ = { f ∈ C(K, R) : k f k∞ ≤ 1}
(c) K = [0, 1] und Φ = {(t 7→
(d) K = [0, 2] und Φ = {(t 7→
tn
)
n
tn
n
: n ∈ N}
) : n ∈ N}
12.37 Ist Φ = {(t 7→ tn ) : n ∈ N} ⊆ C([0, 1), R) gleichgradig stetig? Begründung!
12.38 Zeigen Sie, dass für einen kompakten metrischen Raum K ein Φ ⊆ C(K, R) genau dann total beschränkt ist, wenn Φ als Teilmenge des normierten Raumes (C(K, R), k.k∞ ) beschränkt
ist und wenn Φ gleichmäßig und gleichgradig stetig ist.
Letzteres bedeutet, dass es zu jeden ǫ > 0 ein δ > 0 gibt, sodass | f (x) − f (y)| < ǫ für alle
f ∈ Φ und alle x, y ∈ X mit d(x, y) < δ.
194
KAPITEL 12. TOPOLOGISCHE GRUNDLAGEN
Kapitel 13
Lemma von Zorn*
In diesem Anhang wollen wir insbesondere einen Beweis des Lemmas von Zorn bringen, das im Beweis des Satzes von Tychonoff, Satz 12.13.6, verwendet wurde.
Ordnungen
13.0.1 Definition. Sei M eine Menge, und eine Relation auf M, d.h. ist eine Teilmenge von M × M. Dann heißt Halbordnung auf M, oder kurz (M, ) Halbordnung,
falls folgende drei Axiome gelten:
Reflexiv: x ∈ M ⇒ x x.
Antisymmetrisch: x y ∧ y x ⇒ x = y.
Transitiv: x y ∧ y z ⇒ x z.
Eine Halbordnung (M, ) heißt Totalordnung, falls je zwei Elemente vergleichbar
sind, d.h.
x, y ∈ M ⇒ x y ∨ y x.
13.0.2 Definition. Sei eine Halbordnung auf der Menge M.
Ist R ⊆ M, dann heißt y obere (untere) Schranke von R, falls x y (y x) für alle
x ∈ R.
Ist R ⊆ M, dann heißt ein m ∈ R maximales (minimales) Element von R, falls aus
x ∈ R ∧ m x (x ∈ R ∧ x m) folgt, dass x = m. Ein maximales (minimales) Element
m heißt größtes (kleinstes) Element von R, wenn x m (m x) für alle x ∈ R.
Ist R ⊆ M, dann heißt y Supremum oder kleinste obere Schranke (Infimum oder
größte unter Schranke) von R, falls y eine obere (untere) Schranke von R ist, und gleichzeitig y x (x y) für alle oberen (unteren) Schranken x von R gilt.
13.0.3 Definition. Sei eine Halbordnung auf der Menge M. Dann heißt (M, ) Verband, wenn jede zweielementige Teilmenge von M ein Supremum und ein Infimum
hat.
Ein Verband (M, ) heißt vollständig, falls jede Teilmenge von M ein Supremum
und ein Infimum hat.
195
KAPITEL 13. LEMMA VON ZORN*
196
Ist M eine Menge, so ist P(M) versehen mit der Mengeninklusion ein vollständiger
Verband. Ein weiters Beispiel ist die Menge aller Topologien auf einer Menge.
Das nun folgende Lemma von Zorn ist ein fundamentales Hilfsmittel aus der Mengenlehre. Es ist äquivalent zum Auswahlaxiom und zum Wohlordnungssatz und war
von daher vor allem in der ersten Hälfte des 20. Jahrhunderts umstritten. Mittlerweile
sind die Mathematiker entspannter, auch wenn ein möglicher Verzicht auf das Auswahlaxiom immer noch in manchen Situationen explizit hervorgehoben wird.
13.0.4 Definition (Auswahlaxiom). Gegeben sei eine Indexmenge I und eine Familie
von nichtleeren Mengen Ai , i ∈ I, so existiert eine Funktion (Auswahlfunktion) f :
S
I → i∈I Ai , sodass f (i) ∈ Ai .
Q
Man beachte, dass das Auswahlaxiom nichts anderes besagt als, dass i∈I Ai , ∅.
13.0.5 Definition. Sei (M, ≤) eine halbgeordnete Menge. Wenn für jede total geordnete Teilmenge von M eine obere Schranke existiert, dann heißt M induktiv geordnet.
Wenn sogar jeweils eine kleinste obere Schranke existiert, dann heißt M strikt induktiv
geordnet.
Folgendes Lemma ist der zentrale Hilfsatz zum Beweis des Lemma von Zorn.
13.0.6 Lemma. Es sei (M, ≤) eine nichtleere halbgeordnete Menge mit einem kleinsten
Element o, sodass M strikt induktiv ist. Schließlich sei F : M → M eine Abbildung mit
der Eigenschaft (Monotonie)
m ≤ F(m), m ∈ M.
Dann gibt es ein m ∈ M mit F(m) = m.
Beweis. Wie nennen eine Teilmenge S von M zulässig, wenn die folgenden drei Bedingungen gelten: o ∈ S , F(S ) ⊆ S , und für jede total geordnete Teilmenge T ⊆ S
liegt auch die kleinste obere Schranke sup T in S . Zum Beispiel ist M selbst zulässig.
Nun sei S 0 der Durchschnitt aller zulässigen Teilmengen von M. Da in jeder
zulässigen Teilmenge auch o liegt, enthält der Durchschnitt zumindest das Element
o . Außerdem gelten auch die beiden anderen Bedingungen für Zulässigkeit. Also ist
S 0 selbst zulässig und damit die kleinste aller zulässigen Teilmengen von M.
Wenn wir nun zeigen können, dass S 0 total geordnet ist, dann folgt daraus für die
kleinste obere Schranke sup S 0 , dass sup S 0 das größte Element von S 0 ist. Somit gilt
wegen der Zulässigkeit F(sup S 0 ) ≤ sup S 0 . Wir bekommen insgesamt
sup S 0 ≤ F(sup S 0 ) ≤ sup S 0 ,
und damit die gewünschte Gleichheit. Noch zu zeigen ist also die Behauptung, dass S 0
total geordnet ist.
Für den Beweis nennen wir e ∈ S 0 ein extremales Element, wenn für alle s ∈ S 0
mit s ≤ e, s , e (s < e) gilt, dass F(s) ≤ e. Zum Beispiel ist o extremal. Für ein
extremales e setzen wir
S e := {s ∈ S 0 : s ≤ e ∨ F(e) ≤ s}.
Dann ist für jedes extremale e die Menge S e zulässig:
• o liegt in S e .
197
• Für jedes Element s ∈ S e folgt aus s < e schon F(s) ≤ e, aus s = e folgt F(s) =
F(e), und aus s e folgt F(e) ≤ s ≤ F(s). Also gilt insgesamt F(S e ) ⊆ S e .
• Es sei T eine total geordnete Teilmenge von S e . Wenn dann für alle t ≤ sup T
die Ungleichung t ≤ e gilt, dann gilt auch sup T ≤ e. Wenn es aber mindestens
ein t gibt, sodass t e gilt, dann ist F(e) ≤ t ≤ sup T . Wir sehen also in beiden
Fällen, dass sup T ∈ S e .
Da aber S 0 die kleinste zulässige Teilmenge von M ist, muss also für alle extremalen e gelten:
S e = S 0.
Nun müssen wir noch zeigen, dass jedes e ∈ S 0 extremal ist. Dann folgt nämlich für
s ∈ S 0 , dass s ∈ S e bzw.
s ≤ e ∨ e ≤ F(e) ≤ s,
also die Tatsache, dass S 0 total geordnet ist.
Um zu beweisen, dass jedes e ∈ S 0 extremal ist, betrachten wir
E := {e ∈ S 0 : e ist extremal}.
Wir weisen nach, dass E zulässig und damit gleich S 0 ist.
• o ∈ E ist klar.
• Wir müssen zeigen, dass mit e auch F(e) in E liegt. Ist s ∈ S 0 = S e und s < F(e),
so müssen wir F(s) ≤ F(e) folgern. Da s ∈ S e , gilt s ≤ e oder F(e) ≤ s, wobei
wir letzteres wegen unserer Voraussetzung ausschließen können. Aus s = e folgt
trivialerweise F(s) ≤ F(e) und aus s < e folgt wegen e ∈ E, dass F(s) ≤ e ≤
F(e).
• Nun sei noch T ⊆ E total geordnet. Zu zeigen ist, dass sup T ∈ E. Sei dazu
s ∈ S 0 , s < sup T . Wenn für jedes t ∈ T die Relation F(t) ≤ s gelten würde,
dann wäre wegen t ≤ F(t) auch sup T ≤ s. Das ist ein Widerspruch. Also gibt es
ein extremales e ∈ T mit F(e) s, und da S 0 = S e gilt, folgt daraus zwangsweise
s ≤ e. Ist s , e, so folgt wegen e ∈ E, dass F(s) ≤ e ≤ sup T . Da sup T ∈ S 0 =
S e , s < sup T folgt aus s = e, dass F(s) = F(e) ≤ sup T . Damit folgt insgesamt,
dass sup T extremal ist.
❑
Nun können wir das Lemma von Zorn aus dem Auswahlaxiom herleiten.
13.0.7 Satz. Es sei (M, ≤) eine nichtleere induktiv geordnete Menge. Dann besitzt M
ein maximales Element.
Beweis. Wir behandeln zuerst den Fall einer strikt induktiv geordneten Menge.
Sei x ∈ M fest. Ist m maximales Element von {y ∈ M : x ≤ y}, so ist m auch
maximales Element von M. Also dürfen wir uns auf den Fall beschränken, dass M
ein kleinstes Element enthält. Wir nehmen an, es gebe kein maximales Element. Dann
finden wir für jedes m ∈ M ein größeres Element F(m) und definieren damit eine
Funktion F : M → M, für die gilt:
∀m ∈ M : m < F(m).
198
KAPITEL 13. LEMMA VON ZORN*
Man beachte, dass man für die Existenz einer solchen Funktion F das Auswahlaxiom
verwendet. In der Tat ist F eine Auswahlfunktion der Familie (Am )m∈M , wobei Am =
{x ∈ M : m ≤ x, m , x}. Da M strikt induktiv geordnet ist, folgt aus Lemma 13.0.6 der
Widerspruch F(m) = m für ein m ∈ M.
Nun sei M induktiv geordnet, und sei H die Menge aller total geordneten Teilmengen von M. Dann ist H bezüglich der Inklusion eine Halbordnung, und zwar eine strikt
S
induktive, denn ist T ⊆ H totalgeordnet (bzgl. ⊆), so ist es auch N∈T N (bzgl. ≤),
und diese Teilmenge von M ist auch die kleinste obere Schranke von T (bzgl. ⊆).
Also besitzt H nach dem ersten Beweisteil ein maximales Element T . Es sei O
eine obere Schranke von T . Dann muss O zu T gehören, da sonst T ∪ {O} eine total
geordnete Menge wäre, die T echt umfasste.
Dieses Element O ist dann ein maximales Element von M, denn für jedes m ∈ M
folgt aus O ≤ m, dass m eine obere Schranke von T ist, und somit ebenfalls zu T
gehören muss. Insbesondere folgt m ≤ O und damit m = O.
❑
Literaturverzeichnis
[B] N.Bourbaki: Elements of Mathematics: General Topology. Part 1,2, Hermann,
Paris 1966.
[F] G.M.Fichtenholz: Differential- und Integralrechnung I-III, Deutscher Verlag der
Wissenschaften, Berlin 1964.
[H] H.Heuser: Lehrbuch der Analysis 1,2, Teubner Verlag, Stuttgart 1989.
[L] S.Lang: A first course in calculus, Springer Verlag, Heidelberg 1986.
[R] W.Rinow: Lehrbuch der Topologie, VEB Deutscher Verlag der Wissenschaften,
Berlin 1975.
[R1] W.Rudin: Principles of Mathematical Analysis, McGraw-Hill, New York 1953,
third edition 1976.
[R2] W.Rudin: Real and Complex Analysis, McGraw-Hill, New York 1966, third edition 1987.
[W] W.Walter: Analysis 1,2, Springer Verlag, Heidelberg, New York Tokoyo.
199
Index
(T 1 ), 162, 166
(T 2 ), 141
(T 3 ), 164
(T 4 ), 164
Cb (E), 44
Cb (E, Y), 44
Cb (X, C), 184
Cb (X, R), 184
Cb [0, 1], 65
L(X, Y), 47
[B], 174
∆ f , 90
ℓ∞ (N, C), 64, 65
c0 , 44
c0 (N), 44
c0 (N, C), 64, 65
dk f (x), 79
d f (x), 70
k-te Ableitung, 80
l∞ , 44
l∞ (N), 44
B(E, Y), 43
C 1 , 68
C 1 (D), 68
C k , 77
Abbildung
Norm, 46
Abbildungsnorm, 46
Ableitung, 70
partielle, 67
Richtungs-, 67
absolut uneigentlich integrierbar, 19
Abzählbarkeitsaxiom
erstes, 139
zweites, 151
analytisch, 130
Archimedische Spirale, 133
Banachraum, 42
Basis
eines Filters, 139
beschränkt, 46
Bilinearform, 84
Bogenlänge, 98
Cauchy-Netz, 11
Cauchy-Riemannschen Differentialgleichungen, 119, 131
Cauchysche Integralformel, 126
Cauchyscher Integralsatz, 128
charakteristische Funktion, 13
Darbouxsches Integral, 3
dicht, 142
in B, 142
Differentialgleichung
exakte, 113
differenzierbar, 72
k-mal stetig, 77
partiell, 68
stetig, 72
stetig partiell, 68
Dreiecksungleichung, 41
Durchmesser einer Menge, 181
einfach zusammenhängend, 114
Endfilter, 176
endliche Durchschnittseigenschaft, 169
Euklidische Topologie, 138
Euler-Mascharonische Konstante, 36
Exponentialfunktion
Matrix-wertig, 61
Feinheit
einer Riemann-Zerlegung, 5
Filter, 138
feiner, 175
gröber, 175
konvergent, 175
Filterbasis, 139
konvergent, 175
folgenkompakt, 171
200
INDEX
Fréchet-differenzierbar, 76
Funktion
charakteristische, 13
ganze, 120
harmonische, 131
Indikator-, 13
von beschränkter Variation, 132
Funktion von beschränkter Variation, 98
Funktionen
stückweise stetig, 14
stückweise stetig differenzierbar, 97
Gebiet, 104
Gradient, 70
Gradientenfeld
lokales, 112
Gradientenfelder, 106
Häufungspunkt einer Filterbasis, 178
Häufungspunkt einer Menge, 144
Häufungspunkt eines Netzes, 145
Höldersche Ungleichung, 64
harmonisch, 131
Hausdorff, 141
Hesse-Matrix, 84
holomorph, 120
homöomorph, 149
Homöomorphismus, 149
Homotopie, 114
Indikatorfunktion, 13
Integral, 3
absolut konvergentes, 19
absolut uneigentliches, 19
Darbouxsches, 3
obere, 3
Riemann, 5
Riemann-Stiltjes, 100
uneigentliches, 19
von stetigen Funktionen, 12
Integration
Vertauschbarkeit der Reihenfolge, 26
von Funktionen in mehreren Variablen, 28
integrierbar, 3
Riemann-, 5
Integrierenden Faktor, 113
Kettenregel, 74, 122
kompakt, 169
201
abzählbar, 171
folgen-, 171
komplexen Ableitung, 120
Konvergenz
lokal gleichmäßige, 129
Konvergenz einer Reihe, 49
absolute, 49
Laplace, 131
Lemma von Urysohn, 167
lineare Abbildung
beschränkt, 46
Lipschitz stetig, 11, 15
lokales Gradientenfeld, 112
lokalkompakt, 169
Maximum
lokales, 83
Menge
abgeschlossene, 142
Abschluss einer, 142
gesättigte, 160
Inneres einer, 144
kompakte, 169
konvexe, 68
offene, 138
relativ kompakte, 169
total beschränkte, 181
zusammenhängende, 162
Mengen
durch offenen Mengen getrennte,
161, 164
getrennte, 161
Metriken
äquivalente, 149
Minimum
lokales, 83
Mittelwertsatz
der Integralrechnung, 32
Multiindex, 78
negativ definit, 84
negativ semidefinit, 84
Netz
Cauchy-, 11
Norm, 41
äquivalente, 45
normal, 164
Obersumme, 3
INDEX
202
offene Abbildung, 158
Oszillation, 11
Parameterintegral, 26
Parameterintegrale, 75
Differenzierbarkeit, 28
partielle Ableitung, 67
Partielle Integration, 17
Polygonzug, 93
Polynom in mehreren Variablen, 81
positiv definit, 84
positiv semidefinit, 84
Potenzreihe
Ableitung, 24
Produkt metrischer Räume, 25
Produkt von metrischen Räumen, 25
Produktregel, 122
Stammfunktion, 15
eines Gradientenfeldes, 106
stationärer Punkt, 83
stetig, 146
in einem Punkt, 146
Lipschitz, 11, 15
stetig differenzierbar, 72
k-mal, 77
Stetigkeit
gleichgradige, 185
Stirlingsche Formel, 37
Strecke
gerade, 93
Subbasis einer Topologie, 151
Substitutionsregel, 17
Tangentialebene, 72
Tangentialvektor, 54
Quotientenregel, 122
Taylorreihe
areatanh, 38
Raum
ln(1 − x), 25
T 2 -, 141
Taylorsche Formel, 80
Hausdorff, 141
Taylorsche Polynom
normierter, 41
mehrdimensionale, 81
topologischer, 138
Teilraum, 156
regulär, 164
Topologie, 138
Reihe
Basis von, 151
Banachraum-wertig, 49
diskrete, 138
von Neumannsche, 52
feinere, 150
Richtungsableitung, 67
finale, 159
Riemann-Stieltjes Integral, 100
gröbere, 150
Riemann-Zerlegung, 5
initiale, 154
Riemannsumme, 5
Klumpentopologie, 138
normale, 164
Satz
Produkt-, 157
Fortsetzungssatz von Tietze, 167
Quotienten-, 160
Hauptsatz
der
Differentialreguläre, 164
Integralrechnung, 14
Spur-, 156
Taylorsche Formel, 80
Subbasis von, 151
von Ascoli, 185
von einer Metrik, 138
von Fubini, 26
von Liouville, 128
Ultrafilter, 179
von Morera, 128
Umgebung, 138
von Schwarz, 77
Umgebungsfilter, 138
von Tychonoff, 180
uneigentlich integrierbar, 19
Schraubenlinie, 133
Ungleichung
separabel, 142
Höldersche, 64
stückweise stetig, 14
Untersumme, 2
stückweise stetig differenzierbar, 97
Vektorfeld, 99
Stützstellen, 5
INDEX
wegunabhängig, 106
Vektorfelder
stetig differenzierbare, 108
Vertauschbarkeit
Integrationsreihenfolge, 26
Grenzwert und Ableitung, 23
Grenzwert und Integration, 22
von Neumannsche Reihe, 52
Wallische Produktformel, 36
Weg, 93
geschlossener, 128
rektifizierbar, 94
stetig, 93
Wege
homotope, 114
Wegintegral, 99
komplexes, 117
zusammenhängend, 162
Zwischenstellen, 5
203