Vorlesungsskript zum 2. Teil der Analysis 2

Vorlesungsskript zum zweiten Teil der Analysis 2:
Analysis in mehreren Veränderlichen
Prof. Dr. Helge Glöckner
Vorwort. In der Vorlesung “Analysis 2” im Sommersemester 2014 an der
Universität Paderborn wurde zunächst die Analysis für Funktionen einer
Variablen abgeschlossen. Das folgende Skript ist dem zweiten Teil der
Analysis 2 gewidmet, dem Studium von mehrerer Variablen (Stoff ab 20.5.2014).
Für den ersten Teil der Analysis 2 (über Funktionen einer Variablen) verweise
ich auf das Ihnen zugängliche Vorlesungsskript zur Analysis 1 von Prof. Dr.
Karl-Hermann Neeb (Universität Erlangen).
In Teil 1 behandelte Themen:
• Treppenfunktionen und Riemann-integrierbare Funktionen,
Definition und Eigenschaften des Riemann-Integrals
• Stammfunktionen und uneigentliches Integral,
Hauptsatz der Integral- und Differentialrechnung,
(verallgemeinerter) Mittelwertsatz
• Substitutionsregel, partielle Integration,
Integration rationaler Funktionen durch Partialbruchzerlegung
• Uneigentliche Integrale und Majorantenkriterium;
Integralvergleichskriterium für Reihen
• Taylorentwicklung für Funktionen einer Variablen
• punktweise und gleichmäßige Konvergenz von Funktionenfolgen,
Supremumsnorm, Weierstraßscher Konvergenzsatz,
Stetigkeit von Grenzfunktionen,
Vertauschen von Integralen und Grenzwerten,
Vertauschen von Ableitungen und Grenzwerten,
Potenzreihen können gliedweise abgeleitet werden
1
Vorschau auf Teil 2:
• Normen auf Rn und Topologie,
Stetigkeit für Funktionen mehrerer Variablen
Begriff des Banachraums
• Abschluss, Inneres und Rand einer Teilmenge
• Kompaktheit und Anwendungen
• Wege, Wegintegrale und Bogenlänge
• Differenzierbarkeit für Funktionen mehrerer Variablen.
Ableitung, Gradient, Kettenregel,
partielle Ableitungen und Richtungsableitungen
• Höhere Ableitungen, Hessematrix
• Taylorentwicklung für Funktionen mehrerer Variablen
• Lokale Extrema für Funktionen mehrerer Variablen
• Vektorfelder und Existenz von Potentialfunktionen
• Parameter-abhängige Integrale
• Satz über die Umkehrfunktion, implizite Funktionen,
Banachscher Fixpunktsatz
• Anwendungen der Sätze über die Umkehrfunktion und
über implizite Funktionen
2
Nachtrag: Lipschitz-Stetigkeit
Es ist nützlich, vorab einen weiteren Stetigkeitsbegriff zu diskutieren.
Definition. Es seien (X, dX ) und (Y, dY ) metrische Räume. Eine Abbildung
f : X → Y heißt Lipschitz-stetig, wenn ein L ∈ [0, ∞[ existiert derart, dass
(∀x, y ∈ X)
dY (f (x), f (y)) ≤ L dX (x, y).
Lemma. Ist f : X → Y Lipschitz-stetig, so ist f gleichmäßig stetig (insb.
also stetig).
Beweis. Ist ε > 0 gegeben, so setzen wir δ :=
dX (x, y) < δ gilt dann
ε
.
L+1
dY (f (x), f (y)) ≤ L dX (x, y) ≤ Lδ = L
Für alle x, y ∈ X mit
ε
< ε.
L+1
2
Also ist f gleichmäßig stetig.
3
1
Normen und die Topologie des Rn
Auf R haben wir den Betrag
|.| : R → [0, ∞[,
x 7→ |x|
zur Verfügung und betrachten üblicherweise die Metrik
d : R × R → [0, ∞[,
d(x, y) := |x − y|.
Analog auf C. Entsprechend wollen wir nun auf Rn Metriken d betrachten,
die nur von der Differenz x − y zweier Punkte abhängen. Sie werden von der
Form
d(x, y) := kx − yk
sein mit einer sogenannten“Norm” k.k auf Rn (die ähnliche Eigenschaften
wie der Betrag hat).
Definition 1.1 Es sei E ein (reeller) Vektorraum. Eine Abbildung
k.k : E → [0, ∞[,
x 7→ kxk
heißt Norm, wenn gilt:
Definitheit. Für alle x ∈ E \ {0} ist kxk > 0.
Subadditivität. Für alle x, y ∈ E ist kx + yk ≤ kxk + kyk.
Positive Homogenität. Für alle t ∈ R und x ∈ E ist ktxk = |t| · kxk.
Für den Nullvektor 0 ∈ E gilt stets k0k = 0, denn aufgrund der positiven
Homogenität ist k0k = k0 · 0k = |0| · k0k = 0 · k0k = 0 (wobei die linke Null
stets 0 ∈ R meint).
Ist E ein Vektorraum und k.k eine Norm auf E, so nennt man das Paar
(E, k.k) einen normierten Raum.
Satz 1.2 Ist (E, k.k) ein normierter Raum, so ist
d : E × E → [0, ∞[,
d(x, y) := kx − yk
eine Metrik auf E.
4
Wir versehen E stets mit dieser Metrik, wenn nichts anderes gesagt wird.
Beweis. Für x, y ∈ E ist 0 = d(x, y) = kx − yk genau dann, wenn x − y = 0,
also x = y.
Sind x, y, z ∈ E, so gilt
d(x, z) = kx − zk = kx − y + y − zk ≤ kx − yk + ky − zk = d(x, y) + d(y, z)
unter Benutzung der Subadditivität. Also erfüllt d die Dreiecksungleichung.
Schließlich gilt d(y, x) = ky − xk = k(−1)(x − y)k = |−1| · kx − yk =
1 · d(x, y) = d(x, y), d.h. d ist symmetrisch.
2
Beispiele 1.3 (a) Die euklidische Norm ist die Abbildung
q
n
k.k2 : R → [0, ∞[, kxk2 := x21 + · · · + x2n
für x = (x1 , . . . , xn ). Die zugehörige Metrik
d : Rn × Rn → [0, ∞[,
d(x, y) := kx − yk2 =
p
(x1 − y1 )2 + · · · + (xn − yn )2
heißt euklidischer Abstand. In Ebene und Raum ist also kx − yk2 der übliche,
aus der Schule bekannte Abstand der Vektoren x und y.
(b) Die Abbildung
k.k∞ : Rn → [0, ∞[,
kxk∞ := max{|x1 |, . . . , |xn |}
heißt Maximum-Norm. Der zugehörige Abstand ist für x = (x1 , . . . , xn ) und
y = (y1 , . . . , yn ) gegeben durch
kx − yk∞ = max{|x1 − y1 |, . . . , |xn − yn |}.
Dies ist also das Maximum der Abstände der einzelnen Komponenten. Für
Rechnungen ist dieser Abstand oft bequemer als der euklidische.
(c) Die Abbildung
k.k1 : Rn → [0, ∞[,
kxk1 := |x1 | + · · · + |xn |
heißt 1-Norm. Der zugehörige Abstand ist für x = (x1 , . . . , xn ) und y =
(y1 , . . . , yn ) gegeben durch
kx − yk1 = |x1 − y1 | + · · · + |xn − yn |.
5
Satz 1.4 Die euklidische Norm, die 1-Norm und die Maximum-Norm sind
Normen auf Rn .
Beweis. Seien x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) aus Rn und t ∈ R.
Maximum-Norm:
Definitheit. Es ist 0 = kxk∞ = max{|x1 |, . . . , |xn |} genau dann, wenn
|x1 | = · · · = |xn | = 0, also x = 0.
Subadditivität. Für jedes k ∈ {1, . . . , k} ist
|xk + yk | ≤ |xk | + |yk | ≤ kxk∞ + kyk∞ .
Bilden des Maximums über alle k liefert
kx + yk∞ ≤ kxk∞ + kyk∞ .
Positive Homogenität. Es ist ktxk∞ = max{|tx1 |, . . . , |txn |} = max{|t| ·
tx1 |, . . . , |t| · |xn |} = |t| max{|x1 |, . . . , |xn |} = |t| · kxk∞ .
Euklidische Norm:
p
Definitheit: Es ist 0 = kxk2 = x21 + · · · + x2n genau dann, wenn x1 =
· · · = xn = 0, also x = 0.
Subadditivität: Als Hilfsmittel benutzen wir das Skalarprodukt auf Rn ,
hx, yi :=
n
X
xk yk ∈ R.
k=1
Dieses erfüllt hy, xi = hx, yi und ist für festes x linear in y. Dann ist also
p
kxk2 = hx, xi.
Nach der (aus der Linearen Algebra bekannten) Cauchy-Schwarzschen Ungleichung gilt
|hx, yi| ≤ kxk2 kyk2 .
Somit ist
(kx + yk2 )2 = hx + y, x + yi = hx, xi + hx, yi + hy, xi + hy, yi
= (kxk2 )2 + 2hx, yi + (kyk2 )2 ≤ (kxk2 )2 + 2kxk2 kyk2 + (kyk2 )2
= (kxk2 + kyk2 )2 .
6
Da die Quadratwurzel eine monoton wachsende Funktion ist, bleibt die vorige
Ungleichung bestehen, wenn wir die Wurzel ziehen:
kx + yk2 ≤ kxk2 + kyk2 .
Positive Homogenität: Es ist
ktxk2
q
p
2
2
=
(tx1 ) + · · · + (txn ) = t2 x21 + · · · + t2 x2n
q
√ q
2
2
2
=
t (x1 + · · · + xn ) = t2 x21 + · · · + x2n = |t| · kxk2 .
1-Norm: Die 1-Norm wird in der Übung diskutiert.
2
Definition 1.5 Sei (E, k.k) ein normierter Raum. Für x ∈ E und r > 0
definieren wir die offene Kugel um x vom Radius r als
Br (x) := Brk.k (x) := {y ∈ E : ky − xk < r}
und die entsprechende abgeschlossene Kugel als
k.k
B r (x) := B r (x) := {y ∈ E : ky − xk ≤ r}.
Dies sind also genau die in der Analysis 1 kennen gelernten Kugeln im
metrischen Raum (E, d) mit d(x, y) := kx − yk.
Bemerkung 1.6 Kugeln bzgl. der euklidischen Norm in Rn sind übliche
Kugeln,
p
Brk.k2 (x) = {y ∈ Rn : (y1 − x1 )2 + · · · + (yn − xn )2 < r}.
k.k
Für n = 2 ist insbesondere B1 2 (0) die offene Einheitskreisscheibe.
Im Fall der Maximum-Norm ist r > ky − xk∞ = max{|y1 − x1 |, . . . , |yn − xn |}
genau dann, wenn |yk − xk | < r für k ∈ {1, . . . , n}, also yk ∈ ]xk − r, xk + r[.
Somit ist
Brk.k∞ (x) = ]x1 − r, x1 + r[× · · · × ]xn − r, xn + r[
ein Würfel im Rn . Für n = 2 ist insbesondere
k.k∞
B1
(0) = ]−1, 1[ × ]−1, 1[
7
(ein Quadrat).
k.k
Im Falle der 1-Norm ist im Zweidimensionalen Br 1 (x) das Quadrat mit den
Eckpunkten (x1 − r, x2 ), (x1 , x2 − r), (x1 + r, x2 ), (x1 , x2 + r) (Skizze siehe
Vorlesung). Zur Vereinfachung stellen wir zunächst fest, dass
Brk.k1 (x) = x + Brk.k1 (0),
d.h. die Kugel um x entsteht durch Verschieben aus der Kugel um 0 (Begründung:
k.k
Es ist y = x+(y −x) und y −x ist genau dann in Br 1 (0), wenn ky −xk1 < r,
k.k
also wenn y ∈ Br 1 (x). Ist nun (x1 , x2 ) ∈ R2 , etwa im ersten Quadranten
k.k
(also x1 , x2 ≥ 0), so ist (x1 , x2 ) ∈ Br 1 (0) genau dann, wenn
r > |x1 | + |x2 | = x1 + x2 ,
d.h. (x1 , x2 ) liegen im von der x-Achse, y-Achse und der Geraden x1 + x2 = r
eingeschlossenen Gebiet (ausschließlich der Geraden). Analog in den anderen
Quadranten.
B1 (0) nennt man übrigens auch die (offene) Einheitskugel. Die vorigen Beispiele
von Kugeln sind konvex, d.h. mit je zwei Punkten enthalten sie auch deren
Verbindungsstrecke. Dies ist ein allgemeines Phänomen.
Definition 1.7 Es sei E ein reeller Vektorraum. Eine Teilmenge M ⊆ E
heißt konvex, wenn für alle x, y ∈ M ihre Verbindungsstrecke
{x + t(y − x) : t ∈ [0, 1]}
in M liegt, d.h.
(∀t ∈ [0, 1]) (1 − t)x + ty ∈ M.
Satz 1.8 Für jeden normierten Raum (E, k.k), x ∈ E und r > 0 sind die
k.k
k.k
Kugeln Br (x) und B r (x) konvexe Teilmengen von E.
k.k
Beweis. Seien y, z ∈ Br (x) und t ∈ [0, 1]. Ist t = 0 oder t = 1, so
ist (1 − t)y + tz ∈ {y, z}, also in der Kugel. Nun sei t ∈ ]0, 1[. Dann ist
auch 1 − t > 0 und folglich (1 − t)ky − xk < (1 − t)r und tkz − xk < tr.
Subadditivität und positive Homogenität liefern nun
k(1 − t)y + tz − xk =
≤
=
=
k(1 − t)y + tz − (1 − t)x + txk
k(1 − t)(y − x)k + kt(z − x)k
|1 − t| · ky − xk + |t| · kz − xk
(1 − t)ky − xk + tkz − xk < (1 − t)r + tr = r.
8
k.k
Also ist (1 − t)y + tz ∈ Br (x).
k.k
Entsprechend erhalten wir für y, z ∈ Br (x) und t ∈ [0, 1], dass
k(1−t)y+tz−xk ≤ k(1−t)(y−x)k+kt(z−x)k = |1−t|·ky−xk+|t|·kz−xk =
k.k
(1 − t)ky − xk + tkz − xk ≤ (1 − t)r + tr = r. Also (1 − t)y + tz ∈ B r (x). 2
Bemerkung 1.9 Sei (E, k.k) ein normierter Raum (z.B. Rn mit k.k∞ ). Da
d(x, y) = kx − yk eine Metrik ist, können wir nicht nur von Kugeln in E
reden, sondern auch von offenen und von abgeschlossenen Mengen, wie in
jedem metrischen Raum (siehe Analysis 1). Zur Erinnerung: Eine Teilmenge
k.k
V ⊆ E heißt offen, wenn es zu jedem x ∈ V ein r > 0 gibt mit Br (x) ⊆ V .
Eine Teilmenge A ⊆ E heißt abgeschlossen, wenn E \ A offen ist. Wir wissen
aus der Analysis 1, dass A genau dann abgeschlossen ist, wenn
lim an ∈ A
n→∞
für jede Folge (an )n∈N in A, die in E konvergiert.
Bemerkung 1.10 Im Moment nehmen wir auf Rn immer die Maximumnorm. Wir werden später sehen, dass alle Normen auf Rn in gewissem Sinne
“äquivalent” sind: insb. definieren sie alle die gleiche Topologie auf Rn . Daher ist die Wahl der Norm auf Rn egal für alle Fragen der Konvergenz oder
Stetigkeit.
Bemerkung 1.11 Wir kennen Stetigkeit von Abbildungen zwischen metrischen
Räumen (und allgemeiner Stetigkeit von Abbildungen zwischen topologischen
Räumen) aus der Analysis 1.1 Seien (E, k.kE ) und (F, k.kF ) normierte Räume
(z.B. E = Rm und F = Rn ) und f : E → F eine Abbildung. Da wir mit den
Metriken kx − ykE bzw. kx − ykF arbeiten, ist eine Funktion
f: E →F
genau dann stetig an der Stelle x, wenn
(∀ε > 0) (∃δ > 0) (∀y ∈ E) ky − xkE < δ ⇒ kf (y) − f (x)kF < ε.
1
Quereinsteiger in die Analysis 2 könnten erste Grundlagen zu Metriken und Topologien
z.B. auch nachlesen auf den ersten Seiten von O. Forsters “Analysis 2”, Vieweg Verlag.
9
Allgemeiner ist eine Abbildung f : U → F auf einer Teilmenge U ⊆ E (bzgl.
der induzierten Metrik U × U → [0, ∞[, (x, y) 7→ ky − xkE ) an einer Stelle
x ∈ U genau dann stetig, wenn
(∀ε > 0) (∃δ > 0) (∀y ∈ U ) ky − xkE < δ ⇒ kf (y) − f (x)kF < ε.
Beispiel 1.12 Für jedes k ∈ {1, . . . , n} ist die Projektion
πk : Rn → R,
(x1 , . . . , xn ) 7→ xk
Lipschitz-stetig (siehe Seite 3) und somit (sogar gleichmäßig) stetig.
Für x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) in Rn ist nämlich
|πk (x)−πk (y)| = |xk −yk | ≤ max{|xj −yj | : j = 1, . . . , n} = kx−yk∞ = Lkx−yk∞
mit L := 1.
Beispiel 1.13 Die Funktion f : R2 → R, (x, y) 7→ x2 ist stetig, denn f = q ◦
π1 mit der stetigen Projektion π1 : R2 → R und der stetigen Polynomfunktion
q : R → R, q(y) := y 2 .
Beispiel 1.14 Für jeden normierten Raum (E, k.k) ist die Norm k.k : E →
[0, ∞[⊆ R Lipschitz-stetig und somit stetig.
Für x, y ∈ E ist nämlich kxk = kx − y + yk ≤ kx − yk + kyk wegen der
Subadditivität und somit
kxk − kyk ≤ kx − yk.
Vertauschen der Rollen von x und y liefert
−(kxk − kyk) = kyk − kxk ≤ ky − xk = kx − yk.
Also ist kxk − kyk ≤ kx − yk = Lkx − yk mit L = 1.
Satz 1.15 Es sei X ein metrischer (oder topologischer) Raum und x ∈ X.
Eine Abbildung
f = (f1 , . . . , fn ) : X → Rn
ist genau dann stetig an der Stelle x, wenn all ihre Komponenten f1 , . . . , fk : X →
R an der Stelle x stetig sind.
10
Beweis. Ist f = (f1 , . . . , fn ) stetig an der Stelle x, so auch die Komposition
fk = πk ◦ f , da πk nach Beispiel 1.12 stetig ist.
Seien umgekehrt f1 . . . , fn an der Stelle x stetig. Damit f an der Stelle x
stetig ist, müssen wir zeigen, dass es für jedes ε > 0 eine Umgebung W von
x in X gibt derart, dass
(∀y ∈ W ) kf (y) − f (x)k∞ < ε.
Da fk stetig ist an der Stelle x, gibt es eine Umgebung Wk von x in X mit
(∀y ∈ Wk ) |fk (y) − fk (x)| < ε.
T
Dann ist W := nk=1 Wk eine Umgebung von x und für alle y ∈ W ist auch
y ∈ Wk für alle k, somit
|fk (y) − fk (x)| < ε.
Somit auch kf (y) − f (x)k∞ = max{|fk (y) − fk (x)| : k ∈ {1, . . . , n}} < ε. 2
Beispiel 1.16 Die Funktion f : R2 → R2 , f (x, y) := (y 3 , sin(x)) ist stetig,
denn man sieht wie im vorigen Beispiel, dass beide Komponenten stetig sind.
Die Addition eines Vektorraums ist ein Beispiel einer Abbildung
α : E × E → E.
Solche Abbildungen treten also sehr natürlich auf. Ist E normiert, so brauchen
wir noch eine Norm auf dem Produkt E × E auf der linken Seite, um von
Stetigkeit von α sprechen zu können.
Satz 1.17 Sind (E, k.kE ) und (F, k.kF ) normierte Räume, so ist
k.k : E × F → [0, ∞[,
k(x, y)k := max{kxkE , kykF }
eine Norm auf E × F .
Wir versehen das Produkt immer mit dieser Norm und der zugehörigen
Metrik und Topologie, wenn nichts anderes gesagt wird.
Ist E = Rn sowie F = Rm und ist k.kE und k.kF die jeweilige MaximumNorm, so ist
Rn × Rm ∼
= Rn+m
und k(x, y)k = max{kxk∞ , kyk∞ } = max{|x1 |, . . . , |xn |, |y1 |, . . . , |ym |}, also
k(x, y)k = k(x, y)k∞ .
11
Satz 1.18 Für jeden normierten Raum (E, k.k) sind die folgenden Abbildungen stetig:
(a) Für festes t ∈ R die Homothetie ht : E → E, x 7→ tx;
(b) Für festes x ∈ E die Translation tx : E → E, y 7→ y + x;
(c) Die Addition α : E × E → E, α(x, y) := x + y
(d) Die Multiplikation µ mit Skalaren, µ : R × E → E, µ(t, x) := tx.
Beweis. (a) Es ist kht (x) − ht (y)k = ktx − tyk = kt(x − y)k = |t| · kx −
yk unter Benutzung der positiven Homogenität, also ht Lipschitz-stetig mit
Lipschitzkonstante L = |t|. Insbesondere ist ht stetig.
(b) Es ist ktx (y) − tx (z)k = k(x + y) − (x + z)k = ky − zk ≤ Lky − zk mit
L = 1, d.h. tx ist Lipschitz-stetig mit Lipschitzkonstante L = 1.
(c) Es ist kx + yk ≤ kxk + kyk ≤ 2 max{kxk, kyk} = 2k(x, y)k. Also ist
α Lipschitz-stetig mit Lipschitzkonstante 2, insbesondere also stetig.
(d) Es sei (x, t) ∈ R × E und ε > 0. Für alle (y, s) ∈ R × E mit
ε
|s − t| ≤ min 1,
2(kxk + 1)
und
ky − xk ≤
ε
2(|t| + 1)
gilt dann |s| = |s − t + t| ≤ |s − t| + |t| ≤ |t| + 1 und
ktx − syk = k((t − s)x + s(x − y)k ≤ k(t − s)xk + ks(y − x)k
= |t − s| · kxk + |s| · ky − xk
ε
ε
≤
kxk + (|t| + 1)
= ε.
2(kxk + 1)
2(|t| + 1)
2
Also ist µ an der Stelle (t, x) stetig.
Ist t 6= 0, so ist ht ◦ ht−1 = ht−1 ◦ ht = idE . Also ist ht : E → E eine
stetige invertierbare Abbildung mit stetiger Umkehrfunktion, ein sogenannter
Homöomorphismus.
Hierbei heißt eine Abbildung
f: X →Y
12
zwischen topologischen Räumen ein Homöomorphismus, wenn f stetig ist,
invertierbar und die Umkehrfunktion f −1 : Y → X ebenfalls stetig ist.
Wegen tx ◦t−x = t−x ◦tx = idE ist auch tx : E → E stets ein Homöomorphismus.
Folgerung 1.19 Es sei X ein topologischer Raum, x ∈ X und f : X → R,
g : X → Rn und h : X → Rn Abbildungen, die an der Stelle x stetig sind.
Dann sind auch die folgenden Funktionen an der Stelle x stetig:
(a) g + h : X → Rn , y 7→ g(y) + h(y);
(b) f · g : X → Rn , y 7→ f (y)g(y).
(c)
g
f
: X → Rn , y 7→
1
g(y),
f (y)
wenn f (X) ⊆ R \ {0}.
Beweis. (a) und (b): Mit den stetigen Abbildungen α : Rn × Rn → Rn und
µ : R × Rn → Rn aus Satz 1.18 ist g + h = α ◦ (g, h), wobei (g, h) an der Stelle
x stetige reellwertige Komponenten hat und somit an der Stelle x stetig ist.
Da α stetig ist, ist die Komposition g + h = α ◦ (g, h) an der Stelle x stetig.
Weiter ist f · g = µ ◦ (f, g), wobei (f, g) an der Stelle x stetige reellwertige
Komponenten hat und somit an der Stelle x stetig ist. Da µ stetig ist, ist
die Komposition f · g = µ ◦ (f, g) an der Stelle x stetig.
(c) Die Funktion f ist stetig an der Stelle x als Funktion nach R und ihr
Bild f (X) liegt in der Teilmenge R× . Aus der Analysis 1 wissen wir, dass
f dann auch stetig an der Stelle x ist als Funktion nach R× , versehen mit
×
der induzierten Topologie (oder induzierten Metrik), d.h. f |R : X → R× ist
stetig an der Stelle x. Nun ist
η : R× → R,
t 7→
1
t
×
stetig. Also ist f1 = η ◦ (f |R ) stetig an der Stelle x. Nach (b) ist dann auch
g
= f1 · g an der Stelle x stetig.
2
f
Beispiel 1.20 Wir wissen bereits, dass alle Projektionen πk : Rn → R stetig
sind. Monome (und reelle Vielfache solcher) sind Produkte aus solchen Projektionen, also stetig nach Satz 1.19 (b). nach Satz 1.19 (a) sind dann auch
Summen solcher Ausdrücke (also beliebige Polynomfunktionen Rn → R)
stetig.
13
Beispiel 1.21 Die Abbildung R2 → R2 , (x, y) 7→ (x cos(y), sin(x + y)) ist
stetig, weil sie über Produkte, Kompositionen und Anwenden stetiger Funktionen aus π1 und π2 aufgebaut ist.
Folgen in Rn konvergieren genau dann, wenn sie komponentenweise konvergieren:
Satz 1.22 Es sei (xm )m∈N eine Folge von Punkten xm ∈ Rn , wobei xm =
(xm,1 , . . . , xm,n ). Sei weiter y = (y1 , . . . , yn ) in Rn . Dann sind äquivalent:
(a) xm → y in (Rn , k.k∞ ) für m → ∞;
(b) Für jedes k ∈ {1, . . . , n} gilt xm,k → yk in R für m → ∞.
Beweis. Für jedes k ∈ {1, . . . , n} ist die Projektion πk : Rn → R auf die
k-te Komponente stetig (siehe Beispiel 1.12). Da stetige Funktionen mit
Grenzwerten vertauschen, folgt aus xm → y also
xm,k = πk (xm ) → πk (y) = yk
für m → ∞.
Gelte umgekehrt
lim xm,k = yk
m→∞
für alle k ∈ {1, . . . , n}. Zu ε > 0 gibt es dann also ein Nk ∈ N mit
(∀m ≥ Nk ) |xm,k − yk | < ε.
Setzen wir N := max{N1 , . . . , Nn }, so gilt für alle m ≥ N insb. m ≥ Nk für
alle k, somit ist
|xm,k − yk | < ε
für alle k, somit
kxm − yk∞ = max{|xm,1 − y1 |, . . . , |xm,n − yn |} < ε.
2
Also xm → y in Rm .
Definition 1.23 Es seien X1 , . . . , Xn topologische Räume und O die Menge
aller Teilmengen
V ⊆ X1 × · · · × X n
14
mit folgender Eigenschaft: Für jedes x = (x1 , . . . , xn ) ∈ V existieren offene
Umgebungen Wk von xk in Xk für k ∈ {1, . . . , n} derart, dass
W1 × · · · × Wn ⊆ V.
Dann ist O eine Topologie auf X1 × · · · × Xn (wie wir gleich nachprüfen),
genannt die Produkttopologie. Per Definition ist jedes Produkt
W1 × · · · × Wn
aus offenen Mengen Wk ⊆ Xk in O (also offen in X1 × · · · × Xn ); solche
Produkte nennt man auch “offene Kästchen.” Weiter gehört per Definition eine Teilmenge V ⊆ X1 × · · · × Xn genau dann zu O (ist also offen in
X1 × · · · × Xn ), wenn sie eine Vereinigung offener Kästchen ist.
O ist eine Topologie auf X1 ×· · ·×Xn : Da Xk offen in Xk ist, ist X1 ×· · ·×Xn
ein offenes Kästchen, also in O. Weiter ist ∅ in O, denn es gibt kein x, für
das man etwas nachprüfen müsste.
Ist (Vj )j∈J eine Familie von Mengen
Vj ∈ O, so ist
S
S jedes Vj eine Vereinigung offener Kästchen, also auch j∈J Vj . Somit ist j∈J Vj ∈ O.
Sind schließlich V, W ∈ O, so ist V ∩ W ∈ O: Ist nämlich x ∈ V ∩ W , so
gibt es offene Kästchen V1 × · · · × Vn ⊆ V und W1 × · · · × Wn ⊆ W , die x
enthalten. Dann ist
(V1 ∩ W1 ) × · · · × (Vn ∩ Wn )
ein offenes Kästchen, das x enthält und
(V1 ∩ W1 ) × · · · × (Vn ∩ Wn ) = (V1 × · · · × Vn ) ∩ (W1 × · · · × Wn ) ⊆ V ∩ W.
Lemma 1.24 Sind X1 , . . . , Xn Hausdorffsche topologische Räume, so ist
auch X := X1 × · · · × Xn mit der Produkttopologie Hausdorffsch.
Beweis. Sind x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) zwei verschiedene Elemente von X, so ist xk 6= yk für ein k ∈ {1, . . . , n}. Da Xk Hausdorffsch ist,
gibt es offene Umgebungen V von xk und W von yk in Xk mit V ∩ W = ∅.
Dann sind die offenen Kästchen
X1 × · · · × Xk−1 × V × Xk+1 × · · · Xn
und
X1 × · · · × Xk−1 × W × Xk+1 × · · · Xn
offene Umgebungen von x bzw. y in X, deren Schnitt ebenfalls leer ist.
15
2
Satz 1.25 (Rn , k.k∞ ) trägt die Produkttopologie von R × · · · × R (mit n
Faktoren).
Beweis. Sei O die Produkttopologie und T die zur Metrik d(x, y) = kx−yk∞
gehörige Topologie auf Rn .
Es sei V ∈ T eine in Rn offene Menge bzgl. d. Für jedes x = (x1 , . . . , xn ) ∈
V gibt es dann ein ε > 0 mit
Bεk.k∞ (x) = ]x1 − ε, x1 + ε[ × · · · × ]xn − ε, xn + ε[ ⊆ V.
Da das auftretende Produkt ein offenes Kästchen in Rn ist, ist V offen in der
Produkttopologie, also V ∈ O. Somit T ⊆ O.
Sei umgekehrt V ∈ O, also V eine Teilmenge von Rn , die in der Produkttopologie offen ist. Zu x = (x1 , . . . , xn ) ∈ V gibt es dann offene Teilmengen
V1 , . . . , Vn ⊆ R mit
x ∈ V1 × · · · × Vn ⊆ V.
Da Vk eine offene Umgebung von xk in R ist, gibt es ein εk > 0 mit
]xk − εk , xk + ε[ ⊆ Vk . Sei ε := min{ε1 , . . . , εn }. Dann ist
]xk − ε, xk + ε[ ⊆ ]xk − εk , xk + ε[ ⊆ Vk
für alle k ∈ {1, . . . , n} und somit
Bεk.k∞ (x) = ]x1 − ε, x1 + ε[ × · · · × ]xn − ε, xn + ε[ ⊆ V1 × · · · × Vn ⊆ V.
Also ist V offen bzgl. k.k∞ , d.h. V ∈ T . Somit O ⊆ T . da die umgekehrte
Inklusion bereits gezeigt wurde, folgt O = T .
2
Die Produkttopologie hat ähnliche Eigenschaften, wie wir sie oben für Rn
bereits nachgerechnet haben. Zum Beispiel gilt:
Satz 1.26 Es seien X und Y1 , . . . , Yn topologische Räume und x ∈ X. Versieht man Y := Y1 × · · · × Yn mit der Produkttopologie, so sind die Projektionen
πk : Y → Yk , (y1 , . . . , yn ) 7→ yk
stetig. Weiter ist eine Abbildung
f = (f1 , . . . , fn ) : X → Y1 × · · · × Yn
genau dann stetig an der Stelle x, wenn jede der Komponenten fk : X → Yk
an der Stelle x stetig ist.
16
Beweis. Die Projektionen πk : Y → Yk , (y1 , . . . , yn ) 7→ yk sind stetig, denn
für jede offene Menge V ⊆ Yk ist
πk−1 (V ) = {(y1 , . . . , yn ) ∈ Y : yk ∈ V }
= Y1 × · · · × Yk−1 × V × Yk+1 × · · · × Yn
ein offenes Kästchen und somit offen. Ist also f stetig an der Stelle x, so
auch fk = πk ◦ f .
Seien umgekehrt f1 , . . . , fn an der Stelle x stetig und V ⊆ Y eine offene
Umgebung von f (x). Damit f stetig ist, müssen wir zeigen, dass f −1 (V )
eine Umgebung von x ist. Per Definition der Produkttopologie enthält V ein
offenes Kästchen
W = W1 × · · · × Wn
mit offenen Mengen Wk ⊆ Yk , so dass f (x) ∈ W . Da fk : X → Yk stetig ist
an der Stelle x, ist fk−1 (Wk ) eine Umgebung von x. Nun gilt aber
f −1 (V ) ⊇ f −1 (W ) = {x ∈ X : f (x) ∈ W }
= {x ∈ X : (f1 (x), . . . , fn (x)) ∈ W1 × · · · × Wn }
= {x ∈ X : (∀k ∈ {1, . . . , n}) fk (x) ∈ Wk }
n
\
=
fk−1 (Wk ).
k=1
T
Als Durchschnitt endlich vieler Umgebungen ist nk=1 fk−1 (Wk ) eine Umgebung von x und somit auch f −1 (V ) (wie benötigt).
2
Beispiel 1.27 Sind X und Y topologische Räume, so ist für jedes feste
x ∈ Y die Abbildung
ιx : Y → X × Y,
y 7→ (x, y)
stetig, denn ihre zweite Komponente ist idY , ihre erste Komponente konstant
(und konstante Abbildungen sind immer stetig). Ist also f : X × Y → Z eine
stetige Abbildung in einen topologischen Raum Z, so ist auch für jedes x ∈ X
die durch Festhalten der ersten Variablen erhaltene “partielle Abbildung”
Y → Z,
y 7→ f (x, y)
stetig, denn diese ist die Komposition f ◦ ιx .
17
Bemerkung 1.28 Seien (E, k.kE ) und (F, k.kF ) normierte Räume und k(x, y)k :=
max{kxkE , kykF } für x ∈ E, y ∈ F . Aus der Definition der Norm als ein
Maximum folgt, dass die Kugeln von der Gestalt
Bεk.k (x, y) = Bεk.kE (x) × Bεk.kF (y)
sind, für alle ε > 0 und x ∈ E, y ∈ F . Analog zum Beweis von Satz 1.222
und Satz 1.253 zeigt man:
(a) Eine Folge (xm , ym )m∈N in E × F konvergiert genau dann gegen (x, y)
in (E × F, k.k), wenn xn → x in (E, k.kE ) und yn → y in (F, k.kF ).
(b) Die durch die Norm k.k auf E × F definierte Topologie ist die Produkttopologie.
Definition 1.29 Ein normierter Raum (E, k, k) heißt Banachraum, wenn E
bezüglich der zugehörigen Metrik
d : E × E → [0, ∞[,
d(x, y) := kx − yk
vollständig ist.
Zum Beispiel ist (R, |.|) ein Banachraum (denn die Vollständigkeit wurde in
Analysis 1 bewiesen).
Definition
P 1.30 Eine Reihe in einem normierten Raum (E, k.k) ist eine
Folge ( nk=1 ak )n∈N von Anfangssummen mit Summanden ak ∈ E. Die Reihe
heißt konvergent, wenn der Limes
lim
n
X
n→∞
ak
k=1
der Anfangssummen in E existiert; in diesem Fall schreiben wir auch
für diesen Limes. Die Reihe heißt absolut konvergent, wenn
∞
X
kan k < ∞.
n=1
2
3
Dort ersetze man |.| durch k.kE und k.kF .
k.k
k.k
Aus den ε-Umgebungen ]xk − ε, xk + ε[ wird nun Bε E (x) und Bε F (y).
18
P∞
n=1
an
Satz 1.31 Ein normierter Raum (E, k.k) ist genau dann ein Banachraum,
wenn in E jede absolut konvergente Reihe konvergiert.
P
Beweis. Sei zunächst (E, k.k) ein Banachraum und an ∈ E mit ∞
n=1 kan k <
∞. Für ε > 0 existiert dann ein N ∈ N derart, dass für alle n ≥ N
∞
n
∞
X
X
X
ε>
kak k −
kak k =
kak k.
k=1
k=1
k=n+1
Für alle n, m ≥ N , mit n ≥ m etwa, gilt dann
n
n
m
n
∞
X
X
X
X
X
ak −
ak = ak ≤
kak k ≤
kak k < ε.
k=1
k=1
k=m+1
k=m+1
k=m+1
P
Also ist ( nk=1 ak )n∈N eine Cauchyfolge in E und somit konvergent.
Sei umgekehrt jede absolut konvergente Reihe in E konvergent und (xn )n∈N
eine Cauchyfolge in E. Wir brauchen nur zu zeigen, dass die Cauchyfolge
eine konvergente Teilfolge besitzt - die Cauchyfolge konvergiert dann ebenfalls gegen den Grenzwert der Teilfolge (siehe Analysis 1).
Nun finden wir nacheinander N1 < N2 < · · · derart, dass
(∀n, m ≥ Nk ) kxn − xm k ≤ 2−k .
Somit ist (xNk )k∈N eine Teilfolge derart, dass kxNi − xNj k ≤ 2−k für alle
i, j ≥ k. Nach Ersetzen von (xn )n∈N durch die Teilfolge (xNk )k∈N dürfen wir
also annehmen, dass
(∀i, j ≥ k) kxi − xj k ≤ 2−k .
Insbesondere ist also kxk+1 − xk k ≤ 2−k und somit
∞
X
kxk+1 − xk k ≤
∞
X
2−k < ∞
k=1
k=1
(Abschätzung durch geometrische Reihe). Per Voraussetzung existiert also
∞
X
(xn+1 − xn ) = lim
n→∞
n=1
Also konvergiert auch x1 +
auch die Folge (xn )n∈N .
Pn
k=1 (xk+1
19
n
X
(xk+1 − xk ).
k=1
− xk ) = xn+1 für n → ∞ und somit
2
Definition 1.32 Ist X eine nicht-leere Menge, so bezeichnet `∞ (X) die
Menge aller beschränkten Funktionen f : X → R. Dies ist ein Untervektorraum des Vektorraums RX aller Funktionen von X nach R. Aus dem Abschnitt über Konvergenz von Funktionenfolgen kennen wir die Supremumsnorm
k.k∞ : `∞ (X) → [0, ∞[, kf k∞ := sup{|f (x)| : x ∈ X}.
Ist X = N, so schreibt man auch einfach `∞ := `∞ (N). Also ist `∞ die Menge
aller beschränkten reellen Folgen.
Lemma 1.33 k.k∞ ist eine Norm auf `∞ (X).
Beweis. Definitheit. Es ist 0 = kf k∞ = sup{|f (x)| : x ∈ X} genau dann,
wenn |f (x)| = 0 für alle x ∈ X, also x = 0.
Subadditivität. Seien f, g ∈ `∞ (X). Für jedes x ∈ X ist
|f (x) + g(x)| ≤ |f (x)| + |g(x)| ≤ kf k∞ + kgk∞ .
Bilden des Supremums über alle x liefert
kf + gk∞ = sup{|f (x) + g(x)| : x ∈ X} ≤ kf k∞ + kgk∞ .
Positive Homogenität. Es ist ktf k∞ = sup{|tf (x)| : x ∈ X} = sup{|t| ·
|f (x)| : x ∈ X} = |t| sup{|f (x)| : x ∈ X} = |t| · kf k∞ .
2
Folgerungen zu Satz 1.31:
Folgerung 1.34 Für jede nicht-leere Menge X ist (`∞ (X), k.k∞ ) ein Banachraum.
P∞
∞
Beweis. Sind
f
∈
`
(X)
mit
n
n=1 kfn k∞ < ∞, so konvergiert die FunkP∞
tionenreihe n=0 fn nach dem Konvergenzsatz von Weierstraß gleichmäßig
gegenP
eine beschränkte Funktion
f . Dann ist also f ∈ `∞ (X) und es gilt
P
2
kf − nk=1 fk k∞ → 0, somit nk=1 fk → f in (`1 (X), k.k∞ ).
Folgerung 1.35 (Rn , k.k∞ ) ist ein Banachraum für jedes n ∈ N.
Beweis. (a) Dies ist ein Spezialfall von Folgerung 1.34, da Rn = R{1,2,...,n}
und die Maximums-Norm hier gleich der Supremums-Norm ist.
20
(b) Alternativer, direkter Beweis: Sei (xm )m∈N eine Cauchy-Folge in Rn ,
mit xm = (xm,1 , . . . , xm,n ) ∈ Rn . Gegeben ε > 0 existiert ein N ∈ N derart,
dass
(∀m, ` ≥ N ) kxm − x` k∞ < ε.
Für jedes k ∈ {1, . . . , n} ist dann
|xm,k − x`,k | ≤ kxm − x` k∞ < ε,
d.h. (xm,k )m∈N ist eine Cauchy-Folge in R und somit konvergent gegen ein
yk ∈ R. Setzen wir y := (y1 , . . . , yn ), so konvergiert also xm komponentenweise gegen y und mit Satz 1.22 folgt
lim xm = y
m→∞
2
in (Rn , k.k∞ ).
Ist X ein topologischer Raum, so ist die Menge BC(X) aller beschränkten,
stetigen Funktionen f : X → R offenbar ein Untervektorraum von `∞ (X).
Folgerung 1.36 Für jeden topologischen Raum X ist BC(X) abgeschlossen
in `∞ (X). Also ist BC(X) ein Banachraum bzgl. der Supremums-Norm.
Beweis. Ist f ∈ `∞ (X) derart, dass fn → f bzgl. k.k∞ für eine Folge (fn )n∈N
in BC(X), so gilt kf −fn k∞ → 0, also fn → f gleichmäßig. Als gleichmäßiger
Grenzwert stetiger Funktionn ist f stetig. Also ist f ∈ BC(X). Somit ist
BC(X) abgeschlossen und somit nach dem folgenden Satz vollständig, also
ein Banachraum.
2
Satz 1.37 Ist (X, d) ein vollständiger metrischer Raum, so ist auch jede
abgeschlossene Teilmenge A ⊆ X vollständig (bzgl. der induzierten Metrik
dA : A × A → [0, ∞[, dA (x, y) := d(x, y) für x, y ∈ A).
Beweis. Ist (xn )n∈N eine Cauchyfolge in A, so gibt es zu jedem ε > 0 ein
N ∈ N derart, dass für alle n, m ≥ N
ε > dA (xn , xm ) = d(xn , xm ).
Also ist (xn )n∈N auch eine Cauchyfolge in X und somit konvergent gegen ein
x ∈ X, da X vollständig ist. Weil A abgeschlossen ist und alle xn in A liegen,
folgt
x = lim xn ∈ A.
n→∞
21
Weiter gilt dA (x, xn ) = d(x, xn ) → 0 für n → ∞, also xn → x in (A, dA ).
Somit ist (A, dA ) vollständig.
2
Beispiel 1.38 Man schreibt C[a, b] := C([a, b], R) für die Menge aller stetigen reellwertigen4 Funktionen f : [a, b] → R auf dem abgeschlossenen Intervall [a, b]. Da jede solche Funktion f : [a, b] → R nach dem Satz vom
Maximum der Analysis ein Maximum und ein Minimum annimmt und somit
beschränkt ist, ist
C[a, b] = BC([0, 1]).
Nach Folgerung 1.36 ist C[a, b] mit der Supremums-Norm also ein Banachraum.
Bemerkung 1.39 Der Banachraum (C[a, b], k.k∞ ) ist von großer Wichtigkeit
für die Analysis. Zum Beispiel werden wir in der Reellen Analysis diesen Banachraum (und seine Vollständigkeit) benutzen, um die Existenz von Lösungen
von Differentialgleichungen zu beweisen.
Satz 1.40 Sind (E, k.k) und (F, k.kF ) normierte Räume und ist A : E → F
eine lineare Abbildung,5 so definiert man die Operator-Norm von A als
kAkop := sup{kAxkF : x ∈ E mit kxkE ≤ 1} ∈ [0, ∞].
Die folgenden Aussagen sind äquivalent:
(a) A : E → F ist stetig an der Stelle 0;
(b) A : E → F ist stetig;
(c) A ist ein sogenannter beschränkter linearer Operator, d.h. kAkop < ∞.
In diesem Fall ist A Lipschitz-stetig, insb. also gleichmäßig stetig. Weiter
gilt
(∀x ∈ E)
kAxkF ≤ kAkop kxkE .
(1)
4
Das Symbol C[a, b] wird manchmal auch für die stetigen komplexwertigen Funktionen
benutzt.
5
Also A(tx + sy) = tA(x) + sA(y) für alle x, y ∈ E, t, s ∈ R.
22
Beweis. (b)⇒(a) ist trivial.
(a)⇒(b): Gegeben ε > 0 existiert ein δ > 0 derart, dass
(∀y ∈ E) kykE < δ ⇒ kAykF < ε.
Für x ∈ E und alle y ∈ E mit ky − xk < δ gilt dann
kA(y) − A(x)kF = kA(y − x)kF < ε.
Also ist A an der Stelle x stetig.
(a)⇒(c): Ist A stetig in 0, so gibt es ein δ > 0 derart, dass kAxkF ≤ 1
für alle x ∈ E mit kxkE ≤ δ. Für alle x ∈ E mit kxkE ≤ 1 ist kδxkE =
δkxkE ≤ δ, somit
1
1
kAxkF = kAδxkF ≤ ,
δ
δ
1
somit kAkop = sup{kAxkF : kxkE ≤ 1} ≤ δ < ∞.
(c)⇒(a): Wir überlegen zunächst, dass aus (c) die Abschätzung (1) folgt.
Ist x = 0, so ist (1) klar. Ist x 6= 0, so ist wegen der positiven Homogenität
1 1
kxkE x = kxkE kxkE = 1 ≤ 1,
E
somit
1 x ≤ kxkE kAkop .
kAxkF = kxkE A
kxkE F
Also gilt (1). Ersetzen wir dort x durch x − y, so sehen wir, dass
(∀x, y ∈ E)
kAx − AykF = kA(x − y)kF ≤ kAkop kx − ykE .
Also ist A Lipschitz-stetig mit Lipschitzkonstante L = k.kop .
2
Beispiele 1.41 (a) πk : Rn → R ist stetig mit kπk kop = 1.
(b) Es sei C[0, 1] der Raum der stetigen reellwertigen Funktionen auf [0, 1]
und C 1 [0, 1] der Raum der C 1 -Funktionen. Versehen wir beide Räume mit
der Maximumnorm, so ist der Ableitungsoperator D : C 1 [0, 1] → C 0 [0, 1]
unstetig. Sei nämlich fn (t) := sin(nt) für n ∈ N, t ∈ [0, 1]. Dann ist
kfn k∞ = 1 aber wegen fn0 (t) = n cos(nt)
kDfn k = kfn0 k = n
für alle n ∈ N, somit kDkop ≥ n für jedes n und somit kDkop = ∞.
23
Satz 1.42 Jede lineare Abbildung A : Rm → Rn ist stetig. Jede bilineare
Abbildung β : Rm × Rn → R` ist stetig.6
Beweis. Es seien e1 = (1, 0, · · · , 0), . . ., em =
(0, . . . , 0, 1) die StandardPm
m
Basisvektoren des R . Für x = (x1 , . . . , xm ) = k=1 xk ek ist
Ax = A
m
X
xk e k =
k=1
m
X
xk A(ek ).
k=1
Diese Abbildung ist in jeder Komponente ein Polynom, somit stetig. Seien
f1 , . . . , fn die Standard-Basisvektoren für Rn . Analog ist
β(x, y) =
m X
n
X
xi yj β(ei , fj )
i=1 j=1
in jeder Komponente ein Polynom, somit stetig.
2
Sind (E, k.kE ) und (F, k.kF ) normierte Räume, so schreiben wir L(E, F )
für die Menge aller stetigen linearen Abbildungen (beschränkten linearen
Operatoren) A : E → F . Man kürzt weiter ab:
Satz 1.43 Sind (E, k.kE ) und (F, k.kF ) normierte Räume, so ist L(E, F )
ein Untervektorraum des Vektorraums F E aller Abbildungen von E nach F .
Weiter ist L(E, F ) mit k.kop ein normierter Raum.
Beweis. Sind A, B ∈ L(E, F ) und t ∈ R, so ist
k(A + tB)xkF = kAx + tBxkF ≤ kAxk + |t| · kBxkF ≤ kAkop + tkBkop
für alle x ∈ E mit kxkE ≤ 1. Also ist A + tB ein beschränkter Operator
(somit L(E, F ) ein Untervektorraum von F E ) und
kA+tBk = sup{k(A+tB)xkF : x ∈ E mit kxkE ≤ 1} ≤ kAkop +|t|·kBkop . (2)
Nehmen wir t = 1, so zeigt (2) die Subadditivität von k.kop .
6
Sind E1 , E2 und F reelle Vektorräume, so nennt man eine Abbildung β : E1 × E2 → F
bilinear, wenn β(x, .) : E2 → F , y 7→ β(x, y) linear ist für jedes x ∈ E1 und β(., y) : E1 →
F , x 7→ β(x, y) linear ist für jedes y ∈ E2 . Also β(x1 + x2 , y) = β(x1 , y) + β(x2 , y),
β(x, y1 + y2 ) = β(x, y1 ) + β(x, y2 ) und β(tx, y) = tβ(x, y) = β(x, ty).
24
Definitheit: Ist A 6= 0, so existiert ein x ∈ E mit Ax 6= 0. Dann ist x 6= 0,
und nach Ersetzen von x durch den normierten Vektor kxk1 E x dürfen wir
annehmen, dass x normiert ist, also kxkE = 1. Dann ist kxkE ≤ 1, somit
kAkop = sup{kAykF : y ∈ E mit kykE ≤ 1} ≥ kAxkF > 0.
Positive Homogenität: ktAkop = |t| · kAkop ist klar, wenn t = 0. Ist t 6= 0, so
haben wir nach (2)
ktAkop ≤ |t| · kAkop .
Andererseits liefert (2), mit tA statt A und 1t statt t:
1
≤ 1 ktAkop .
(tA)
kAkop = t
|t|
op
Wir multiplizieren beide Seiten mit |t| und schließen, dass ktAkop ≥ |t|·kAkop
gilt und somit ktAkop = |t| · kAkop .
2
Satz 1.44 Ist (F, k.kF ) ein Banachraum, so ist auch L(E, F ) mit k.kop ein
Banachraum.
Beweis. Nach dem vorigen Satz wissen wir schon, dass (L(E, F ), k.kop ) ein
normierter Raum ist. Um die Vollständigkeit nachzuweisen, sei (An )n∈N eine
Cauchy-Folge in L(E, F ). Für jedes ε > 0 gibt es also ein N ∈ N derart,
dass
(∀n, m ≥ N ) kAn − Am kop ) ≤ ε.
(3)
Für festes x ∈ E folgt aus (3):
(∀n, m ≥ N ) kAn x − Am xkF ≤ kAn − Am kop kxkE ≤ εkxkE .
(4)
Also ist (An x)n∈N eine Cauchy-Folge in F und somit konvergent. Wir definieren
Ax := lim An x
n→∞
und erhalten so eine Abbildung A : E → F , x 7→ Ax. Für x, y ∈ E und t ∈ R
gilt7
A(x+ty) = lim An (x+ty) = lim (An x+tAn y) = lim An x+t lim An y = Ax+tAy
n→∞
n→∞
n→∞
7
n→∞
weil An linear ist und die Addition E × E → E und Skalarmultiplikation R × E → E
stetig (also mit Grenzwerten vertauscht werden können).
25
und somit ist A linear. Lassen wir n → ∞ in (4), so erhalten wir
(∀m ≥ N )(∀x ∈ E) kAx − Am xkF ≤ εkxkE .
(5)
Insbesondere gilt für alle x ∈ E mit kxkE ≤ 1:
kAxkF = kAx−AN x+AN xkF ≤ kAx−AN xkF +kAN xkE ≤ εkxkE +kAN kop kxk≤ ε+kAN kop .
Bilden des Supremums über all diese x liefert
kAN kop ≤ ε + kAN kop < ∞.
Also ist A ∈ L(E, F ). Bilden wir in (5) das Supremum über alle x ∈ E mit
kxkE ≤ 1, so folgt
(∀m ≥ N ) kA − Am kop ≤ ε.
2
Also gilt An → A für n → ∞.
Bemerkung 1.45 Sind E1 , E2 und E3 normierte Räume, A ∈ L(E2 , E3 )
und B ∈ L(E1 , E2 ), so ist A ◦ B : E1 → E3 stetig und linear, also A ◦ B ∈
L(E1 , E3 ). In der Übung rechnen wir nach, dass
kA ◦ Bkop ≤ kAkop kBkop .
(6)
Weiter gilt für E 6= {0} stets
k idE kop = 1
(ist E = {0}, so ist k idE kop = 0).
Beispiel 1.46 (Matrixexponentialfunktion). Ist (E, k.k) ein Banach-Raum
und A ∈ L(E) := L(E, E), so definieren wir eA ∈ L(E) via
∞
X
1 k
e :=
A .
k!
k=0
A
Wir müssen uns überzeugen, dass die Reihe konvergiert. Da nach dem
vorigen Satz L(E) ein Banach-Raum ist, brauchen wir nach Satz 1.31 nur
26
die absolute Konvergenz der Reihe zu zeigen. Mit kA0 kop = k idE kop ≤ 1
und kAk kop ≤ kAkkop ist jedoch
∞
∞ X
1 k X
1
A kAkkop = ekAkop < ∞
k! k!
op k=0
k=0
und somit die absolute Konvergenz der Reihe nachgewiesen.
Ist E = Rn , so können wir L(E) mit dem Raum Mn (R) der (n × n)-Matrizen
identifizieren (siehe Lineare Algebra 1) und haben nach dem Vorigen eine
Matrix-Exponentialfunktion zur Verfügung: Für A ∈ Mn (R) haben wir die
Matrix
∞
X
1 k
A
e :=
A ∈ Mn (R).
k!
k=0
Die Matrix-Exponentialfunktion wird in der Vorlesung “Reelle Analysis” eine
Rolle spielen. Wir werden sehen, dass für A ∈ Mn (R) und y0 ∈ Rn die
Differentialgleichung
φ0 (t) = Aφ(t)
φ(0) = y0
genau eine Lösung φ : R → Rn , t 7→ φ(t) besitzt, nämlich
φ(t) = etA y0 .
Anhang zu Kapitel 1: Mehr zur Stetigkeit bilinearer Abbildungen
In der Übung zeigen wir den folgenden Satz:
Satz 1.47 Es seien (E1 , k.k1 ), (E2 , k.k2 ) und (F, k.kF ) normierte Räume.
Für eine bilineare Abbildung β : E1 × E2 → F sind äquivalent:
(a) β ist stetig.
(b) β ist stetig in (0, 0).
(c) Es ist
kβkop := sup{kβ(x, y)kF : (x, y) ∈ E1 × E2 mit kxk1 ≤ 1 und kyk2 ≤ 1} < ∞.
27
In diesem Fall gilt
(∀x ∈ E1 )(∀y ∈ E2 )
kβ(x, y)kF ≤ kβkop kxk1 kyk2 .
(7)
Die folgenden Beispiele können Sie erst einmal überspringen.
Beispiele 1.48 (a) Sind (E, k.kE ) und (F, k.kF ) normierte Räume, so ist die
Auswertungsabbildung
ε : L(E, F ) × E → F,
ε(A, x) := A(x)
bilinear. Nach (1) gilt für alle A ∈ L(E, F ) mit kAkop ≤ 1 und alle x ∈ E
mit kxkE ≤ 1
kε(A, x)kF = kA(x)kF ≤ kAkop kxkE ≤ 1.
Bilden des Supremums über all diese (A, x) liefert
kεkop ≤ 1.
Insbesondere is ε stetig.
(b) Es seien (E1 , k.k1 ), (E2 , k.k2 ) und (F, k.kF ) normierte Räume. Dann ist
die Kompositionsabbildung
Γ : L(E2 , E3 ) × L(E1 , E2 ) → L(E1 , E3 ),
Γ(A, B) := A ◦ B
bilinear. Nach (6) gilt
kΓ(A, B)kop = kA ◦ Bkop ≤ kAkop kBkop ≤ 1
für alle (A, B) ∈ L(E2 , E3 ) × L(E1 , E2 ) mit kAkop ≤ 1 und kBkop ≤ 1. Die
bilineare Abbildung Γ ist also stetig mit kΓkop ≤ 1.
28
2
Abschluss, Inneres und Rand
einer Teilmenge
Im Falle von Funktionen einer Variablen war es oft ausreichend, Funktionen
auf recht einfachen Teilmengen von R zu betrachten, den Intervallen. Typische Definitionsbereiche von Funktionen mehrerer Variablen können komplizierter sein. Dies motiviert, Teilmengen M ⊆ Rn besser verstehen zu
wollen. Beispielsweise haben die Randpunkte a und b eines Intervalls [a, b]
mitunter eine besondere Rolle gespielt. Somit wollen wir auch bei Teilmengen M ⊆ Rn von Randpunkten reden können.
Da dies keine zusätzlichen Schwierigkeiten verursacht, diskutieren wir alle
Begriffe allgemeiner für Teilmengen metrischer (oder topologischer Räume).
Definition 2.1 Es sei X ein topologischer Raum (z.B. ein metrischer Raum,
z.B. Rn ) und M ⊆ X eine Teilmenge.
(a) Das Innere M 0 von M ist definiert als
[
M 0 :=
V,
V ⊆X offen
mit V ⊆M
die Vereinigung aller in M enthaltenen offenen Teilmengen von X. Da
Vereinigungen offener Mengen offen sind, ist M 0 offen. Also ist M 0 die
größte in M enthaltene offene Menge (d.h. M 0 ist eine offene Menge,
die in M enthalten ist; und es ist V ⊆ M 0 für jede offene Menge V mit
V ⊆ M ).
Manche Autoren schreiben auch int(M ) statt M 0 .
(b) Der Abschluss M von M ist definiert als
\
M :=
A,
A⊆X abgeschlossen
mit M ⊆A
der Durchschnitt aller abgeschlossenen Teilmengen A von X, welche A
enthalten.8 Da Durchschnitte abgeschlossener Mengen abgeschlossen
sind, ist M abgeschlossen. Also ist M die kleinste abgeschlossene Teilmenge von X, welche M enthält.9
8
Eine solche Menge A gibt es immer, nämlich A = X.
D.h. M ist eine abgeschlossene Menge, die M enthält; und es ist M ⊆ A für jede
abgeschlossene Menge A mit M ⊆ A.
9
29
(c) Der Rand von M ist definiert als die Menge ∂M aller x ∈ X derart,
dass jede Umgebung V von x sowohl einen Punkt aus M wie auch einen
nicht zu M gehörenden Punkt enthält, also
V ∩ M 6= ∅ und V ∩ (X \ M ) 6= ∅.
Die folgenden zwei Sätze helfen uns, Inneres, Abschluss und Rand besser zu
verstehen und zu berechnen. Wir benutzen die Notation
·
C=A∪B
für eine disjunkte Vereinigung, d.h. C = A ∪ B mit A ∩ B = ∅.
Satz 2.2 Es sei X ein topologischer Raum und M ⊆ X eine Teilmenge.
Dann gilt:
(a) M 0 ist die Menge aller x ∈ M , für welche M eine Umgebung von x
in X ist.
(b) M ist die Menge aller x ∈ X derart, dass V ∩ M 6= ∅ für jede offene
Umgebung V von x.
(c) ∂M ist in M enthalten.
·
(d) Es ist M = M 0 ∪ ∂M . Insb. ist ∂M abgeschlossen.
(e) M is genau dann abgeschlossen, wenn M = M .
(f) M ist genau dann offen, wenn M = M 0 .
Beweis. (a) Sei V := {x ∈ M : M ist Umgebung von x in X}. Da M 0 offen
ist, ist M 0 eine Umgebung von jedem x ∈ M 0 (und es ist dann x ∈ M 0 ⊆ M ).
Somit M 0 ⊆ V . Umgekehrt ist aber V in M enthalten und wir zeigen, dass
V offen ist; somit ist V ⊆ M 0 per Definition des Inneren und somit V = M 0 .
Sei nämlich x ∈ V . Per Definition von V ist dann M eine Umgebung von
x, es gibt also eine offene Teilmenge Wx von X mit x ∈ Wx ⊆ M . Dann ist
M eine
S Umgebung von jedem y ∈ Wx , also y ∈ V , also Wx ⊆ V . Somit ist
V = x∈V Wx offen als Vereinigung offener Mengen.
(b) Wir erinnern daran, dass die Aussage (nicht A) ⇔ (nicht B) äquivalent
ist zur Aussage A ⇔ B. Wir brauchen daher nur erstere zu zeigen. Sei x ∈ X.
Existiert eine offene Umgebung V von x mit V ∩ M = ∅, so ist X \ V eine
30
abgeschlossene Teilmenge von X mit M ⊆ X \ V , somit M ⊆ X \ V , somit
x 6∈ M (da x ∈ V ). Ist umgekehrt x ∈ X \ M =: W , so ist W eine offene
Umgebung von x mit W ∩ M = ∅.
(c) Sei x ∈ ∂M . Per Definition des Randes enthält dann jede Umgebung
von x ein Element aus M und somit ist x ∈ M , nach (b). Also ∂M ⊆ M .
(d) Sei x ∈ M . Nach (b) hat dann jede Umgebung von x nichtleere
Schnitt mit M . Nun gibt es entweder eine Umgebung V von x in X mit
V ⊆ M (in welchem Fall x ∈ M 0 ), oder es ist V ∩ (X \ M ) 6= ∅ für alle
Umgebungen V von x in X. Da auch V ∩ M 6= ∅ wie vorab festgestellt, ist
dann x ∈ ∂M .
(e) und (f) werden in der Übung diskutiert.
2
Satz 2.3 Es sei (X, d) ein metrischer Raum mit offenen Kugeln Br (x) und
M ⊆ X eine Teilmenge. Dann gilt:
(a) M 0 ist die Menge aller x ∈ M , für welche ein ε > 0 existiert mit
Bε (x) ⊆ M.
(b) Der Abschluss M ist die Menge aller x ∈ X derart, dass
x = lim xn
n→∞
in X für eine Folge (xn )n∈N in M .
Beweis. (a) x ∈ M 0 ist nach Satz 2.2 (a) dazu äquivalent, dass M eine
Umgebung von x ist. Dies ist genau dann der Fall, wenn Bε (x) ⊆ M für ein
ε > 0.
(b) Ist x ∈ M , so existiert nach Satz 2.2 (b) für jedes n ∈ N ein xn ∈
B1/n (x) ∩ M . Wegen d(x, xn ) < 1/n → 0 gilt xn → x für n → ∞.
Ist umgekehrt x ∈ X und
x = lim xn
n→∞
mit Elementen xn ∈ M , so existiert für jede Umgebung V von x in X (die
ja eine geeignete ε-Umgebung enthält) ein N ∈ N derart, dass
(∀n ≥ N ) xn ∈ V.
Insbesondere ist xN ∈ V ∩ M , also V ∩ M 6= ∅ und somit x ∈ M (nach
Satz 2.2 (b)).
2
31
Beispiele 2.4 (a) Seien a < b in R. dann ist
[a, b[0 = ]a, b[
[a, b[ = [a, b]
∂[a, b[ = {a, b}.
(b) Sei (E, k.k) ein normierter Raum. Für Kugeln bzgl. k.k gilt dann
Br (0) = B r (0),
B r (0)0 = Br (0) und
∂Br (0) = ∂B r (0) = {x ∈ E : kxk = r}
(Vorlesung: Skizze für euklidische Norm auf R2 und für Maximumnorm auf
R2 ).
Beweis: Weil k.kE stetig ist und [0, r] ⊆ R abgeschlossen, ist B r (0) =
k.k−1 ([0, r]) abgeschlossen (wie jedes Urbild einer abgeschlossenen Menge
unter einer stetigen Funktion, siehe Analysis 1). Ist x ∈ B r (0), so ist kxk ≤ r,
somit (1− k1 )kxk < r, somit (1− k1 )x ∈ Br (0). Nun gilt aber (1− k1 , x) → (1, x)
in R × Rn (da dies komponentenweise gilt) und somit
1−
1
x → 1x = x
k
für k → ∞ wegen der Stetigkeit der Multiplikation R × e → E mit Skalaren.
Also ist x ∈ Br (0), somit Br (0) = Br (0). Die weiteren Aussagen werden in
der Übung nachgerechnet.
(c) Q = R, denn für jede reelle Zahl x existiert10 eine Folge (qn )n∈N
rationaler Zahlen mit qn → x.
Definition 2.5 Eine Teilmenge M eines topologischen Raums X heißt dicht
(in X), wenn M = X.
Beispiel 2.6 Q ist dicht in R, da Q = R.
Stetige Funktionen sind durch ihre Werte auf dichten Teilmengen festgelegt:
10
Z.B. die endlichen Dezimalbrüche qn der Darstellung von x als unendlicher Dezimalbruch, mit n Stellen hinter dem Komma.
32
Satz 2.7 Es seien f : X → Y und g : X → Y Funktionen zwischen metrischen
Räumen. Ist f |M = g|M für eine dichte Teilmenge M ⊆ X, so ist f = g.
Analoges gilt, wenn allgemeiner X ein topologischer Raum ist und Y ein
Hausdorffscher11 topologischer Raum.
Beweis. Seien zunächst X und Y metrische Räume. Für jedes x ∈ X = M
existiert eine Folge (xn )n∈N mit xn → x. Dann ist f (xn ) = g(xn ) für alle
n ∈ N. Da f und g stetig sind, folgt
f (x) = lim f (xn ) = lim g(xn ) = g(x).
n→∞
n→∞
Den allgemeinen Fall kann man durch einen Widerspruchsbeweis zeigen (den
wir in der Vorlesung überspringen). Angenommen, f (x) 6= g(x) für ein
x ∈ X. Weil f |M = g|M , folgt x 6∈ M . Also ist
x ∈ X \ M = M \ M ⊆ M \ M 0 = ∂M.
Da Y Hausdorffsch ist, gibt es offene Umgebungen V von f (x) und W von
g(x) mit
V ∩ W = ∅.
(8)
Dann ist f −1 (V ) ∩ g −1 (W ) eine offene Menge, die x enthält. Da x ∈ ∂M ,
existiert ein
y ∈ f −1 (V ) ∩ g −1 (W ),
(9)
das zudem in M ist. Da y ∈ M , ist f (y) = g(y). Nach (9) ist also
f (y) = g(y) ∈ V ∩ W.
2
Dies widerspricht (8).
Wir erwähnen eine typische Anwendung (die im Folgenden aber nicht weiter
benutzt wird):
Beispiel 2.8 Wir zeigen, dass jeder stetige Gruppen-Homomomorphismus
f : (Rn , +) → (Rm , +)
11
D.h. zu zwei verschiedenen Punkten y1 6= y2 in Y existieren stets disjunkte Umgebungen (siehe Analysis 1).
33
eine reell-lineare Abbildung ist. Dass f ein Gruppen-Homomorphismus ist,
bedeutet, dass
(∀x, y ∈ Rn ) f (x + y) = f (x) + f (y).
(10)
Zu zeigen ist, dass automatisch auch
(∀y ∈ Rn )(∀t ∈ R) f (ty) = tf (y).
(11)
Zunächst folgt aus (10), dass
f (kx) = kf (x)
(12)
für alle x ∈ Rn und k ∈ N bzw. k ∈ Z (die Rechnung kennt man aus Algebra,
Linearer Algebra, oder den ersten Wochen der Analysis 1). Ist y ∈ Rn und
k ∈ N, so liefert (12) mit x := k1 y:
1
f (y) = kf
y .
k
Multiplikation mit 1/k liefert
f
1
y
k
=
1
f (y).
k
(13)
Wir halten nun z ∈ Rn fest. Ist q ∈ Q, so schreiben wir q = m
mit m ∈ Z,
k
k ∈ N. Mit (12) und (13) erhalten wir
1
1
1
f (qz) = f
mz = f (mz) = mf (z) = qf (z).
k
k
k
Es ist also
(∀q ∈ Q)
f (qz) = qf (z).
(14)
Setzen wir
g(t) := f (tz) und h(t) := tf (z)
für t ∈ R, so erhalten wir stetige Funktionen g : R → Rm und h : R → Rm
(denn f und die Multiplikation in Rn bzw. Rm mit Skalaren ist stetig). Nach
(14) gilt g|Q = h|Q . Da g und h stetig sind und Q in R dicht ist, folgt mit
Satz 2.7, dass g = h. Also ist f (tz) = g(t) = h(t) = tf (z) für alle t ∈ R.
Bemerkung 2.9 Sei X ein topologischer Raum. Eine Teilmenge M ⊆ X
ist genau dann dicht in X, wenn V ∩ M 6= ∅ für jede offene, nicht-leere
Teilmenge V ⊆ X. (Beweis: Übung).
34
3
Kompaktheit und Anwendungen
In der Analysis 1 haben beschränkte, abgeschlossene Teilmengen K ⊆ R eine
besondere Rolle gespielt (insb. K = [a, b]). Zum Beispiel hatten wir gesehen,
dass jede stetige Funktion
f: K →R
auf solch einer Menge ein Maximum annimmt. Es wurde auch gezeigt: Ist
solch ein f stetig und injektiv, so ist die auf dem Bild f (K) ⊆ R definierte
Umkehrabbildung
f −1 : f (K) → K ⊆ R
automatisch stetig.
In diesem Kapitel verallgemeinern wir solche Ergebnisse weiter (insbesondere
auf Teilmengen des Rn ). Wir werden sehen, dass die sogenannte Kompaktheit
der obigen Mengen K hinter den beschriebenen Phänomenen steckt.
Bemerkung 3.1 Bevor ich die etwas gewöhnungsbedürftige Definition von
kompakten Mengen gebe, sage ich Ihnen schon einmal, welche Teilmengen
des Rn schließlich kompakt sein werden. Wir werden sehen:
Für eine Teilmenge K ⊆ Rn sind die folgenden drei Bedingungen äquivalent:
(a) K ist kompakt;
(b) K ist abgeschlossen in Rn und beschränkt;12
(c) Jede Folge (xm )m∈N in K hat eine Teilfolge, die gegen ein x ∈ K konvergiert.
Zum Beispiel sind abgeschlossene Kugeln bezüglich der Maximum-Norm,
B r (x) ⊆ Rn ,
stets abgeschlossen (wie schon gezeigt) und beschränkt,13 somit kompakt.
Als Hilfsmittel zur Definition kompakter Mengen benötigen wir sogenannte
offene Überdeckungen.
12
Eine Teilmenge M ⊆ Rn heißt beschränkt, wenn sup{kxk∞ : x ∈ M } < ∞.
Weil kyk∞ = kx + (y − x)k∞ ≤ kxk∞ + ky − xk∞ ≤ kxk∞ + r für alle y in B r (x), ist
das Supremum über alle y kleiner gleich kxk∞ + r < ∞.
13
35
Definition 3.2 Eine Familie (Vj )j∈J von Teilmengen eines topologischen
Raums X heißt offene Überdeckung von X, wenn jedes Vj eine offene Teilmenge von X ist und
[
X=
Vj .
(15)
j∈J
Beispiele 3.3 (a) Die Intervalle ]n − 1, n + 1[ bilden für n ∈ Z eine offene
Überdeckung von R.
(b) Auch die Intervalle ]−n, n[ bilden eine offene Überdeckung von R, für
n ∈ N.
In der folgenden Definition denken wir (wie immer) insbesondere an einen
metrischen Raum K oder eine Teilmenge K ⊆ Rn .
Definition 3.4 Ein Hausdorffscher topologischer Raum K heißt kompakt,
wenn jede offene Überdeckung von K eine endliche Teilüberdeckung besitzt.
Damit ist gemeint: Für jede offene Überdeckung (Vj )j∈J von K existiert eine
endliche Teilmenge F ⊆ J, so dass
[
Vj ,
K=
j∈F
also (Vj )j∈F eine offene Überdeckung von K ist.
Bemerkung 3.5 Verzichtet man auf die Hausdorffeigenschaft und verlangt
nur die endliche Überdeckungseigenschaft, so wird K quasikompakt genannt.
Wir gehen auf diesen allgemeineren Begriff nicht näher ein.
Beispiel 3.6 R ist nicht kompakt, denn die offenen Überdeckungen aus den
Beispielen 3.3 haben keine endlichen Teilüberdeckungen.
Beispiel 3.7 Es sei K = {x1 , . . . , xm } ein Hausdorffscher topologischer Raum,
der aus endlich vielen Elementen besteht. Dann ist K kompakt. Ist nämlich
(Vj )j∈J eine offene Überdeckung von K, so gibt es für jedes k ∈ {1, . . . , m}
ein jk ∈ J mit xk ∈ Vjk . Dann ist
K=
m
[
Vjk =
[
j∈F
k=1
mit F := {j1 , . . . , jm }.
36
Vj
Bemerkung 3.8 Zur Erinnerung: Jede Teilmenge K eines metrischen Raums
(X, d) ist ein metrischer Raum mit der induzierten Metrik
dK : K × K → [0, ∞[,
dK (x, y) := d(x, y) für x, y ∈ K.
Es sei O die durch die Metrik d auf X definierte Topologie (die Menge aller
offenen Mengen). Aus der Analysis 1 wissen wir: Die durch die Metrik dK
auf K definierte Topologie OK stimmt mit der von (X, O) auf K induzierten
Topologie überein, d.h.
OK = {K ∩ V : V ∈ O}
besteht genau aus den “relativ offenen” Mengen (den Durchschnitten von K
mit offenen Mengen in X).
Definition 3.9 Eine Teilmenge K von Rn wird kompakt genannt, wenn sie
mit der induzierten Topologie (die durch die induzierte Metrik beschrieben
wird) ein kompakter topologischer Raum ist. Entsprechend für Teilmengen
K eines Hausdorffschen topologischen Raums X.
Beispiel 3.10 Wir versehen [0, 1] ⊆ R mit der induzierten Metrik (und
Topologie). Für [0, 1] und n ∈ N bilden die relativ offenen Mengen
1
1
[0, 1] ∩ x − , x +
n
n
für x ∈ [0, 1] eine offene überdeckung von [0, 1]. Diese besitzt die endliche
Teilüberdeckung
k − 1 k + 1
,
[0, 1] ∩
n
n
mit k ∈ {0, . . . , n}.
Lemma 3.11 Ist X ein Hausdorffscher topologischer Raum und K ⊆ X
eine Teilmenge, so sind äquivalent:
(a) K ist kompakt als topologischer Raum (mit der induzierten Topologie),
d.h. ist (Vj )j∈J eine Familie von relativ offenen Mengen Vj in K mit
[
K=
Vj ,
j∈J
so gibt es eine endliche Teilmenge F ⊆ J mit K =
37
S
j∈F
Vj .
(b) Für jede Familie (Wj )j∈J von offenen Teilmengen Wj von X mit
[
K⊆
Wj
j∈J
so gibt es eine endliche Teilmenge F ⊆ J mit K ⊆
S
j∈F
Wj .
Abweichend von der obigen Terminologie werden auch solche Familien (Wj )j∈J
“offene Überdeckungen” genannt; aus dem Zusammenhang ist klar, was
gemeint ist.
Beweis.
S (a)⇒(b): Ist (Wj )j∈J eine Familie offener Teilmengen von X mit
K ⊆ j∈J Wj , so sind Vj := K ∩ Wj relativ offene Teilmengen von K mit
[
j∈J
Vj =
[
(K ∩ Wj ) = K ∩
j∈J
[
Wj = K.
j∈J
S
Per Voraussetzung gibt es eine endliche
Teilmenge F ⊆ J mit K = j∈F Vj .
S
Da Vj = K ∩ Wj ⊆ Wj , folgt K ⊆ j∈F Wj .
(b)⇒(a):
Ist (Vj )j∈J eine Familie relativ offener Teilmengen von K mit
S
K = j∈J Vj , so existieren offene Teilmengen Wj ⊆ X mit Vj = K ∩ Wj . Da
Vj ⊆ Wj , ist
[
K⊆
Wj
j∈J
und per Voraussetzung existiert eine endliche Teilmenge F ⊆ J derart, dass
[
Wj .
K⊆
j∈F
Somit ist
K=K∩
[
j∈F
Wj =
\
(K ∩ Wj ) =
j∈F
[
Vj
j∈F
2
und K als kompakt erkannt.
Beispiel 3.12 Es sei (xm )m∈N eine konvergente Folge in R (oder einem topologischen Raum X) mit Grenzwert x. Dann ist die Menge
K := {xm : m ∈ N} ∪ {x}
38
kompakt.
S
[Beweis: Sei (Vj )j∈J eine Familie offener Teilmengen von X mit K ⊆ j∈J Vj .
Dann existiert ein j0 ∈ J mit x ∈ Vj0 . Weil Vj0 eine Umgebung von x ist und
xm → x für m → ∞, existiert ein m0 ∈ N mit
(∀m ≥ m0 )
xm ∈ Vj0 .
Für jedes m ∈ {1, . . . , m0 − 1} finden wir ein jm ∈ J mit xm ∈ Vjm . Dann ist
K⊆
m[
0 −1
Vjm ,
j=0
denn x und die xm mit m ≥ m0 liegen in Vj0 , die verbleibenden x1 , . . . , xm0 −1
in Vj1 ∪ · · · ∪ Vjm0 −1 ].
Satz 3.13 Ist X ein Hausdorffscher topologischer Raum und K ⊆ X eine
kompakte Teilmenge, so ist K abgeschlossen in X. Insbesondere ist jede
kompakte Teilmenge von Rn abgeschlossen.
Beweis. K ist abgeschlossen, wenn K = K (d.h. die Menge K stimmt
mit ihrem Abschluss überein). Wäre letzteres falsch, so ist K eine echte
Teilmenge von K und somit existiert ein y ∈ K \ K. Da X Hausdorffsch ist,
existieren für jedes x ∈ K offene Umgebungen Px von x und Qx von y in X
mit
Px ∩ Qx = ∅.
S
Dann ist K ⊆ x∈K Px und somit existiert (nach Lemma 3.11 (b)) eine
endliche Teilmenge F ⊆ K mit
[
K⊆
Px .
x∈F
T
Die Menge Q := x∈F Qx ist eine offene Umgebung von y als Durchschnitt
endlich vieler offener Umgebungen. Nun gilt aber
[
[
[
[
Q∩K ⊆Q∩
Px =
(Q ∩ Px ) ⊆
(Qx ∩ Px ) =
∅ = ∅,
x∈F
x∈F
x∈F
x∈F
also Q ∩ K = ∅. Wegen Satz 2.2 (b) widerspricht dies der Voraussetzung
y ∈ K.
2
39
Satz 3.14 Ist K ein kompakter topologischer Raum, so ist eine Teilmenge
A ⊆ K genau dann kompakt, wenn A abgeschlossen ist.
Beweis. Als kompakter Raum ist K Hausdorffsch. Ist also A kompakt, so
ist A in K nach Satz 3.13 abgeschlossen. Ist umgekehrt A abgeschlossen und
ist (Wj )j∈J eine Familie von offenen Teilmengen von K mit
[
A⊆
Wj ,
j∈J
so ist K \ A offen in K (als Komplement einer abgeschlossenen Menge) und
[
K = (K \ A) ∪
Wj .
j∈J
Wegen der Kompaktheit von K existiert eine endliche Teilmenge F ⊆ J
derart, dass
[
K = (K \ A) ∪
Wj .
j∈F
Somit ist
A⊆
[
Wj
j∈F
2
und A als kompakt erkannt.
Satz 3.15 Ist K ein kompakter topologischer Raum und f : K → Y eine
stetige Abbildung in einen Hausdorffschen topologischen Raum Y , so ist f (K)
kompakt. Weiter ist f (A) kompakt (und somit in Y abgeschlossen) für jede
abgeschlossene Teilmenge A ⊆ K.
Beweis. Ist (Wj )j∈J eine Familie offener Teilmengen von Y mit
[
f (K) ⊆
Wj ,
j∈J
so sind die Urbilder f −1 (Wj ) offen in X (weil f stetig ist) und
!
[
[
K ⊆ f −1 (f (K)) ⊆ f −1
Wj =
f −1 (Wj ).
j∈J
40
j∈J
Da K kompakt ist, gibt es eine endliche Teilmenge F ⊆ J mit
[
K⊆
f −1 (Wj ).
j∈F
Es folgt
!
f (K) ⊆ f
[
f −1 (Wj )
=
j∈F
[
f (f −1 (Wj )) ⊆
j∈F
[
Wj .
j∈F
Also ist f (K) kompakt.
Ist A ⊆ K abgeschlossen, so ist A kompakt (nach Satz 3.14), somit f (A)
kompakt (nach dem bereits Gezeigten), somit f (A) in Y abgeschlossen (nach
Satz 3.13).
2
Satz 3.16 (Satz über die Umkehrfunktion) Ist K ein kompakter topologischer Raum, Y ein Hausdorffscher topologischer Raum und f : K → Y
eine bijektive stetige Abbildung, so ist f ein Homöomorphismus, d.h. auch
f −1 : Y → K
ist stetig.
Beweis. Wir haben zu zeigen, dass die Abbildung f −1 : Y → K stetig ist.
Aus der Analysis 1 wissen wir, dass dies genau dann der Fall ist, wenn das
Urbild
(f −1 )−1 (A)
in Y abgeschlossen ist für jede abgeschlossene Menge A ⊆ K. Nun gilt aber
(f −1 )−1 (A) = {y ∈ Y : f −1 (y) ∈ A} = f (A),
und all diese Bilder sind tatsächlich abgeschlossen, wie am Ende von Satz 3.15
festgestellt.
2
Folgerung 3.17 Ist K ein kompakter topologischer Raum und
f: K →Y
41
eine injektive stetige Abbildung in einen Hausdorffschen topologischen Raum
Y , so ist f eine topologische Einbettung,14 d.h. die Koeinschränkung
f |f (K) : K → f (K),
x 7→ f (x)
ist ein Homöomorphismus, wenn man f (K) mit der von Y induzierten Topologie versieht.
Beweis. Wir wenden den vorigen Satz auf die stetige bijektive Abbildung
f |f (K) : K → f (K) an.
2
Die folgende Beobachtung ist manchmal nützlich und ermöglicht hier eine
weitere Folgerung aus Satz 3.16.
Lemma 3.18 Es sei X eine Menge. Für Topologien O und O0 auf X sind
äquivalent:
(a) O = O0 ;
(b) Die Abbildung f : (X, O) → (X, O0 ), x 7→ x ist ein Homöomorphismus.
Beweis. (a)⇒(b): Ist O = O0 und V ∈ O0 , so ist f −1 (V ) = V ∈ O0 = O,
also f stetig. Ein analoges Argument zeigt, dass f −1 : (X, O0 ) → (X, O),
x 7→ x stetig ist.
(b)⇒(a): Ist f stetig und V ∈ O0 , so ist V = f −1 (V ) ∈ O, also O0 ⊆ O.
Ist auch f −1 stetig, so zeigt ein analoges Argument, dass O ⊆ O0 . Also ist
O = O0 .
2
Die Topologie auf einem kompakten topologischen Raum kann nicht echt
vergröbert werden, ohne die Hausdorffeigenschaft zu verlieren:
Folgerung 3.19 Es sei (K, O) ein topologischer Raum und O0 eine Hausdorffsche Topologie auf K, die gröber als O ist (d.h. O0 ⊆ O). Dann ist
O = O0 .
Beweis. Wir betrachten f : (K, O) → (K, O0 ), x 7→ x. Für alle V ∈ O0 ist
f −1 (V ) = V ∈ O0 ⊆ O, also f stetig. Da f bijektiv ist, (K, O) kompakt und
(K, O0 ) Hausdorffsch, ist der Satz über die Umkehrfunktion anwendbar: f
ist also ein Homöomorphismus und somit O = O0 nach Lemma 3.18.
2
14
Andere Bezeichnung: Ein Homöomorphismus aufs Bild.
42
Lemma 3.20 Ist (E, k.k) ein normierter Raum und K ⊆ E eine kompakte
Teilmenge, so ist diese beschränkt, d.h.
sup{kxk : x ∈ K} < ∞.
Beweis. Die Kugeln Br (0) bezüglich k.k sind offen und
[
K⊆E=
Br (0).
r>0
Wegen der Kompaktheit existieren also r1 , . . . , rm > 0 mit
K⊆
m
[
Brk (0).
k=1
Setzen wir r := max{r1 , . . . , rm }, so ist K ⊆
sup{kxk : x ∈ K} ≤ r.
Sm
k=1
Brk (0) = Br (0), also
2
Satz 3.21 (Satz vom Maximum) Es sei K ein nicht-leerer kompakter
topologischer Raum (z.B. eine kompakte Teilmenge K ⊆ Rn ) und f : K → R
eine stetige Funktion. Dann nimmt f ein Maximum und ein Minimum an,
d.h. es existieren Elemente x∗ , x∗ ∈ K derart, dass
f (x∗ ) = min{f (x) : x ∈ K}
und
f (x∗ ) = max{f (x) : x ∈ K}.
Beweis. Nach Satz 3.15 ist die Teilmenge f (K) ⊆ R kompakt, also abgeschlossen (nach Satz 3.13) und beschränkt (nach Lemma 3.20). Wie in der
Analysis 1 gezeigt, hat die Menge f (K) ⊆ R daher ein Maximum und ein
Minimum, was den Beweis beendet.15
2
Satz 3.22 (Satz von Bolzano-Weierstraß) Ein metrischer Raum (K, d)
ist genau dann kompakt, wenn jede Folge in K eine konvergente Teilfolge
hat.
Um den Satz zu beweisen, erinnern wir an ein Resultat aus der Analysis 1:
15
Sie können zB. meinen dortigen Satz vom Maximum auf die stetige Funktion
f (K) → R, t 7→ t anwenden.
43
Lemma 3.23 Es sei (X, d) ein metrischer Raum, x ∈ X und (xn )n∈N eine
Folge in X. Dann sind äquivalent:
(a) Es existiert eine Teilfolge (xnk )k∈N mit
lim xnk = x.
k→∞
(b) Für jedes ε > 0 und jedes N ∈ N existiert ein n ≥ N mit xn ∈ Bε (x). 2
Ist eine der äquivalenten Eigenschaften erfüllt, so haben wir x einen Häufungspunkt der Folge (xn )n∈N genannt.16
Beweis von Satz 3.22. Wir zeigen zunächst: Ist K kompakt, so hat
jede Folge in K eine konvergente Teilfolge. Und zwar per Kontraposition.
Angenommen also, es gibt eine Folge (xn )n∈N in K, die keine konvergente Teilfolge hat. Dann hat (xn )n∈N keinen Häufungspunkt, nach Lemma 3.23 (b)
existieren also zu jedem x ∈ K ein εx > 0 und Nx ∈ N derart, dass
(∀n ≥ Nx )
xn 6∈ Bεx (x).
S
S
Es ist K = x∈K Bεx (x). Wäre K kompakt, so müsste K = x∈F Bεx (x)
gelten mit einer endlichen Teilmenge F ⊆ K. Sei
N := max{Nx : x ∈ F } ∈ N.
Für alle S
n ≥ N gilt für jedes x ∈ F dann n ≥ Nx , somit xn 6∈ Bεx (x). Also
ist xn 6∈ x∈F Bεx (x) = K, Widerspruch. Somit ist K doch nicht kompakt.
Sei umgekehrt angenommen, dass jede Folge in K eine konvergente Teilfolge besitzt. Sei (Vj )j∈J eine offene Überdeckung von K. Wenn (Vj )j∈J
keine endliche Teilüberdeckung hätte, könnten wir wie folgt verfahren: Wir
wählen x1 ∈ K und m(1) ∈ N minimal derart, dass B1/m(1) (x1 ) ⊆ Vj(1)
für ein j(1) ∈ J. Sind x1 , . . . , xn−1 ∈ K, m(1), . . . , m(n − 1) ∈ N und
j(1), . . . , j(n − 1) ∈ J bereits gefunden, so sei
xn ∈ K \
n−1
[
Vj(i)
i=1
n−1
(wobei diese Menge nicht leer ist, weil sonst (Vj(i) )i=1
eine endliche Teilüberdeckung für K wäre) und wir wählen m(n) ∈ N minimal derart, dass
16
Im Lemma ist natürlich Bε (x) = {y ∈ X : d(x, y) < ε}.
44
B1/m(n) (xn ) ⊆ Vj(n) für ein j(n) ∈ J. Per Voraussetzung hat (xn )n∈N eine
konvergente Teilfolge (xnk )k∈N . Sei
x = lim xnk .
k→∞
Dann ist x ∈ Vj für ein j ∈ J und es existiert ein m ∈ N derart, dass
B1/m (x) ⊆ Vj . Da xnk → x, existiert ein N ∈ N derart, dass
(∀k ≥ N ) d(x, xnk ) <
1
.
4m
Für alle k ≥ N gilt nach der Dreiecksungleichung
B
1
2m
(xnk ) ⊆ B
1
1
+ 4m
2m
(x) ⊆ B 1 (x) ⊆ Vj .
m
Wegen der Minimalität von m(nk ) ist also
m(nk ) ≤ 2m
1
1
und somit m(n
≥ 2m
. Nun ist d(xnk , xnk+1 ) ≤ d(xnk , x) + d(x, xnk+1 ) ≤
k)
1
1
1
1
+ 4m = 2m ≤ m(nk ) , also xnk+1 ∈ B1/m(nk ) (xnk ) ⊆ Vj(nk ) . Per Konstruktion
4m
ist aber
nk+1 −1
[
xnk+1 6∈
Vj(i) ,
i=1
Widerspruch. Also muss (Vj )j∈J doch eine endliche Teilüberdeckung haben
und somit K kompakt sein.
2
Satz 3.24 (Satz von Heine-Borel) Eine Teilmenge K ⊆ Rn ist genau
dann kompakt, wenn sie beschränkt und abgeschlossen ist.
Beweis. Ist K kompakt, so ist K nach Satz 3.13 abgeschlossen und nach
Lemma 3.20 beschränkt.
Ist umgekehrt K abgeschlossen und beschränkt, so gibt es wegen der
Beschränktheit ein r > 0 mit
K ⊆ B r (0) = [−r, r] × · · · × [−r, r]
(wobei B r (0) die Kugel bezüglich der Maximums-Norm ist). Können wir
zeigen, dass
[−r, r]n = [−r, r] × · · · × [−r, r]
45
in der von Rn induzierten Topologie kompakt ist, so ist auch die abgeschlossene
Teilmenge K von [−r, r]n kompakt, nach Satz 3.14. Nach dem obigen Satz
von Bolzano-Weierstraß brauchen wir nur zu zeigen, dass jede Folge (xm )m∈N
in [−r, r]n (mit xm = (xm,1 , . . . , xm,n ) etwa) eine konvergente Teilfolge hat.
Nach der Fassung des Satzes von Bolzano-Weierstraß aus der Analysis 1 hat
jede Folge in [−r, r] eine konvergente Teilfolge, d.h. (xm,1 )m∈N hat eine konvergente Teilfolge (xmk ,1 )k∈N . Nach Ersetzen von (xm )m∈N durch (xmk )k∈N
dürfen wir annehmen, dass xm,1 konvergiert für m → ∞. Mit dem gleichen
Argument können wir (xm )m∈N nacheinander durch Teilfolgen ersetzen, für
welche die zweite, dritte und schließlich n-te Komponente konvergiert. Also
hat (xm )m∈N eine Teilfolge (xmk )k∈N derart, dass jede Komponente xmk ,j ∈ R
konvergiert für k → ∞, etwa gegen yj ∈ R. Setzen wir y = (y1 , . . . , yn ),
so gilt dann xmk → y für k → ∞ nach Satz 1.22, d.h. (xm )m∈N hat eine
konvergente Teilfolge. Also ist [−r, r]n kompakt und somit auch K.
2
Wie im vorigen Beweis sieht man, dass das Produkt K1 ×· · ·×Kn von endlich
vielen metrischen Räumen kompakt ist, denn für jede Folge (xm )m∈N ∈
K1 × · · · × Kn können wir nacheinander in den Komponenten zu Teilfolgen
übergehen und so nach n Schritten eine konvergente Teilfolge von (xm )m∈N
erhalten. Wir erwähnen, dass ein analoges Resultat für beliebige kompakte
topologische Räume gilt. Da uns im Moment vor allem metrische Räume
interessieren, überspringen wir den Beweis in der Vorlesung:
Satz 3.25 (Produkte kompakter Räume) Sind K1 , . . . , Kn kompakte
topologische Räume, so ist auch K1 × · · · × Kn kompakt.
Beweis. Sei zunächst n = 2. Ist (Vj )j∈J eine offene Überdeckung von
K1 × K2 , so existiert für jedes (x, y) ∈ K1 × K2 ein jx,y ∈ J mit (x, y) ∈ Vjx,y .
Die Definition der Produkttopologie liefert offene Mengen
Px,y ⊆ K1
und Qx,y ⊆ K2
mit (x, y) ∈ Px,y × Qx,y ⊆ Vjx,y . Für festes y ∈ K2 ist (Px,y )x∈K1 eine offene
Überdeckung von K1 . Da K1 kompakt ist, existiert eine endliche Teilmenge
Fy ⊆ K1 mit
[
K1 =
Px,y .
x∈Fy
Dann ist Qy :=
T
x∈Fy
Qx,y eine offene Umgebung von y derart, dass
Px,y × Qy ⊂ Px,y × Qx,y ⊆ Vjx,y
46
für alle x ∈ Fy . Da K2 kompakt ist und (Qy )y∈K2 eine offene Überdeckung
von K2 , existiert eine endliche Teilmenge F ⊆ K2 derart, dass
[
K2 =
Qy .
y∈F
Dann ist
K1 × K2 =
[
[ [
(K1 × Qy ) =
(Px,y × Qy ) ⊆
y∈Qy x∈Fy
y∈F
[ [
Vjx,y ,
y∈Qy x∈Fy
S
S
also K1 × K2 = y∈Qy x∈Fy Vjx,y , d.h. die Mengen Vjx,y mit y ∈ F und
x ∈ Fy bilden eine endliche Teilüberdeckung für K1 × K2 . Somit ist K1 × K2
kompakt.
Induktionsschritt n − 1 → n: Seien n ≥ 3 und K1 , . . . , Kn kompakt. Per
Induktionsvoraussetzung ist dann K := K1 × · · · Kn−1 kompakt und nach
dem Fall n = 2 ist folglich
K × Kn = (K1 × · · · × Kn−1 ) × Kn
kompakt. Nun ist K1 × · · · × Kn Hausdorffsch und die Abbildung
f : K × Kn → K1 × · · · × Kn ,
((x1 , . . . , xn−1 ), xn ) → (x1 , . . . , xn )
ist bijektiv und stetig, denn ihre j-te Komponente für j ∈ {1, . . . , n − 1} ist
πj ◦ pr1
mit den stetigen Projektionen πj : K → Kj und pr1 : K × Kn → K; die n-te
Komponente ist die stetige Projektion pr2 : K × Kn → Kn . Nach Satz 3.15
ist K1 × · · · × Kn = f (K × Kn ) kompakt.
2
Bemerkung 3.26 Der vorige Satz ist ein Spezialfall des sogenannten Satzes
von Tychonoff, der besagt, dass für eine geeignete Produkttopologie das Produkt
Y
Kj = {(xj )j∈J : (∀j ∈ J) xj ∈ Kj }
j∈J
einer beliebigen Familie (Kj )j∈J kompakter Räume stets kompakt ist (auch
für unendliche Indexmengen J).17 Dies ist ein mächtiger Satz mit vielen
Anwendungen in der Analysis, den Sie in meinen weiterführenden Veranstaltungen kennen lernen können.
17
Und allgemeiner Produkte von Familien quasikompakter Räume quasikompakt sind.
47
Die folgende Beobachtung wird gleich nützlich sein:
Lemma 3.27 Es seien (E, k.kE ) und (F, k.kF ) normierte Räume. Für eine
lineare Abbildung λ : E → F sind dann äquivalent:
(a) λ ist stetig;
(b) Es existiert ein a ∈ [0, ∞[ derart, dass
(∀x ∈ E)
kλ(x)kF ≤ akxkE .
(16)
In diesem Fall ist kλkop ≤ a.
Beweis. (a)⇒(b): Wir wissen bereits, dass aus (a) folgt, dass kλ(x)kF ≤
kλkop kxkE für alle x ∈ E. Also gilt (16) mit a := kλkop .
(b)⇒(a): Ist x ∈ E mit kxkE ≤ 1, so folgt aus (16), dass
kλ(x)kF ≤ akxkE ≤ a.
Bilden des Supremums über all diese x liefert kλkop ≤ a < ∞. Somit ist λ
eine beschränkte lineare Abbildung und somit stetig.
2
Definition 3.28 Zwei Normen k.k und k.k0 auf einem reellen Vektorraum E
werden äquivalent genannt, wenn es reelle Konstanten a, b > 0 gibt derart,
dass
(∀x ∈ E)
akxk0 ≤ kxk ≤ bkxk0 .
(17)
Lemma 3.29 Zwei Normen k.k und k.k0 auf einem reellen Vektorraum E
sind genau dann äquivalent, wenn sie die gleiche Topologie auf E definieren.
Beweis. Wir betrachten die identische Abbildung f : E → E, x 7→ x als
Abbildung von (E, k.k0 ) nach (E, k.k). Nach Lemma 3.18 sind die durch
k.k0 und k.k auf E definierten Topologien genau dann gleich, wenn f ein
Homöomorphismus ist, also die linearen Abbildungen
f : (E, k.k0 ) → (E, k.k),
x 7→ x
und
f −1 : (E, k.k) → (E, k.k0 ),
48
x 7→ x
stetig sind. Nach Lemma 3.27 gilt letzteres genau dann, wenn reelle Zahlen
b, c ≥ 0 existieren derart, dass
(∀x ∈ E) kxk = kf (x)k ≤ bkxk0
(18)
(∀x ∈ E) kxk0 = kf −1 (x)k0 ≤ ckxk.
(19)
und
Nach Vergrößern dürfen wir immer b, c > 0 annehmen; mit a =
(19) äquivalent zu
(∀x ∈ E) akxk0 ≤ kxk.
1
c
ist dann
(20)
Nun ist aber (19) zusammen mit (20) äquivalent ist zu (17) und somit zur
Äquivalenz der Normen k.k und k.k0 . Der Beweis ist beendet.
2
Satz 3.30 Alle Normen auf Rn sind zueinander äquivalent. Somit definiert
jede Norm auf Rn die gleiche Topologie auf Rn .
Beweis. Es ist klar, das Äquivalenz von Normen (oder alternativ: die gleiche
Topologie zu definieren) eine Äquivalenzrelation auf der Menge aller Normen
auf Rn ist. Wir brauchen daher nur zu zeigen, dass jede Norm k.k : Rn →
[0, ∞[ zur Maximum-Norm
k.k∞ : Rn → [0, ∞[,
kxk∞ := max{|x1 |, . . . , |xn |}
(für x = (x1 , . . . , xn ) ∈ Rn ) äquivalent ist. Mit den Standard-Einheitsvektoren
e1 = (1, 0, . . . , 0), . . ., en = (0, . . . , 0, 1) erhalten wir mit Subadditivität und
positiver Homogenität von k.k zunächst
n
n
n
n
X
X
X
X
|xk |·kek k ≤
max{|x1 |, . . . , |xn |}kek k = bkxk∞
kxk ek k =
kxk = xk e k ≤
k=1
k=1
k=1
k=1
für alle x = (x1 , . . . , xn ) ∈ Rn , mit
b :=
n
X
kek k.
k=1
Also gilt
(∀x ∈ Rn ) kxk ≤ bkxk∞ .
49
(21)
Nach Lemma 3.27 ist die lineare Abbildung
f : Rn → Rn ,
x 7→ x
also stetig als Abbildung von (Rn , k.k∞ ) nach (Rn , k.k). Nun ist die Menge
S := {x ∈ Rn : kxk∞ = 1} = k.k−1
∞ ({1})
in (Rn , k.k∞ ) abgeschlossen (da die Norm k.k∞ stetig ist und S das Urbild
der einpunktigen (also abgeschlossenen) Menge {1} ⊆ R unter der stetigen
Abbildung k.k∞ ist). Da S per Definition auch beschränkt ist, ist S kompakt.
Nach dem Satz vom Maximum nimmt somit die stetige Abbildung
k.k ◦ f |S : S → R,
x 7→ kf (x)k = kxk
ein Minimum auf S an. Sei
a := min{kxk : x ∈ S}.
Da x 6= 0 für alle x ∈ S (weil kxk∞ = 1), ist kxk > 0. Somit ist a > 0. Für
x = 0 ist kxk ≥ akxk∞ trivial. Weiter gilt für alle x ∈ Rn mit x 6= 0:
1
1
= kxk∞ x
x
kxk = kxk
∞
kxk∞ ≥ akxk∞ ,
kxk∞ weil kxk1 ∞ x∞ = kxk1 ∞ kxk∞ = 1 und somit kxk1 ∞ x ∈ S. Also gilt
(∀x ∈ Rn )
akxk∞ ≤ kxk.
Wegen (21) und (22) sind k.k und k.k∞ äquivalent.
(22)
2
Satz 3.31 (Lemma von Wallace) Es seien X1 und X2 Hausdorffsche topologische Räume, K1 ⊆ X1 und K2 ⊆ X2 kompakte Teilmengen und V ⊆
X1 × X2 eine offene Menge derart, dass
K1 × K2 ⊆ V.
Dann existieren offene Teilmengen V1 ⊆ X1 und V2 ⊆ X2 derart, dass
K1 × K2 ⊆ V1 × V2 ⊆ V.
50
Beweis. Für jedes x ∈ K1 und y ∈ K2 ist (x, y) ∈ V . Da V offen in der
Produkttopologie ist, gibt es also offene Mengen Px,y ⊆ X1 und Qx,y ⊆ X2
derart, dass
(x, y) ∈ Px,y × Qx,y ⊆ V.
Halte y ∈ K2 fest. Da K1 kompakt ist und
[
K1 ⊆
Px,y ,
x∈K1
gibt es eine endliche Teilmenge Fy ⊆ K1 derart, dass
[
K1 ⊆
Px,y =: Py .
x∈Fy
Als endlicher Durchschnitt offener Umgebungen ist dann
\
Qx,y
Qy :=
x∈Fy
eine offene Umgebung von y in X2 . Weiter gilt
[
[
(Px,y × Qx,y ) ⊆ V.
(Px,y × Qy ) ⊆
K1 × {y} ⊆ Py × Qy =
x∈Fy
x∈Fy
Da K2 kompakt ist und
[
K2 ⊆
Qy ,
y∈K2
gibt es eine endliche Teilmenge F ⊆ K2 derart, dass
[
K2 ⊆
Qy =: V2 .
y∈F
Die Menge V2 ⊆ X2 ist offen und enthält K2 . Weiter ist
\
V1 :=
Py
y∈F
eine offene Teilmenge von X1 , die K1 enthält, denn V1 ist der Durchschnitt
von endlich vielen Mengen mit diesen Eigenschaften. Wir schließen, dass
[
[
[
K1 × K2 ⊆ V1 × V2 = V1 ×
Qy =
(V1 × Qy ) ⊆
(Py × Qy ) ⊆ V.
y∈F
y∈F
51
y∈F
Also haben V1 und V2 die gewünschten Eigenschaften.
2
Als eine erste Anwendung des Wallaceschen Lemmas konstruieren wir sogenannte “gleichmäßige” Umgebungen um kompakte Teilmengen:
Folgerung 3.32 Es sei E ein normierter Raum, K ⊆ E kompakt und V ⊆
E eine offene Teilmenge mit K ⊆ V . Dann existiert ein ε > 0 derart, dass
[
K + Bε (0) =
Bε (x) ⊆ V.
x∈K
Beweis. Die Addition α : E × E → E, α(x, y) := x + y ist stetig und
α(K × {0}) = K + {0} = K ⊆ V , somit
K × {0} ⊆ α−1 (V ).
Hierbei ist α−1 (V ) offen in E × E als Urbild der offenen Menge V ⊆ E unter
der stetigen Abbildung α. Weiter sind K und {0} in E kompakt. Nach dem
Wallaceschen Lemma existieren also offene Mengen V1 , V2 ⊆ E derart, dass
K ⊆ V1 ,
{0} ⊆ V2
und V1 × V2 ⊆ α−1 (V ).
Da V2 ⊆ E eine offene Menge ist, die 0 enthält, gibt es ein ε > 0 mit
Bε (0) ⊆ V2 .
Dann ist
K × Bε (0) ⊆ V1 × V2 ⊆ α−1 (V )
und somit K S
+ Bε (0) = α(K × Bε (0)) ⊆ V . Da x + Bε (0) = Bε (x), ist
2
K + Bε (0) = x∈K Bε (x), was den Beweis beendet.
Bemerkung 3.33 Allgemeiner kann man ohne das Wallacesche Lemma, mit
einem direkten (etwas längeren) Argument zeigen:
Es sei (X, d) ein metrischer Raum, K ⊆ X kompakt und V ⊆ X eine offene
Teilmenge mit K ⊆ V . Dann existiert ein ε > 0 derart, dass
[
Bε (x) ⊆ V.
x∈K
52
Den Abstand zweier Teilmengen A, B ⊆ X definiert man als
dist(A, B) := inf{d(x, y) : x ∈ A, y ∈ B} ∈ [0, ∞].
In der obigen Situation ist stets
dist(K, ∂V ) > 0
(d.h. K hat positiven Abstand vom Rand von V ), denn für alle x ∈ K und
y ∈ ∂V ist y ∈ X \ V (da V = V 0 ), somit y 6∈ Bε (x) und somit d(x, y) ≥ ε.
Folglich dist(K, ∂V ) = inf{d(x, y) : x ∈ K, y ∈ ∂V } ≥ ε > 0.
Satz 3.34 (Stetigkeit parameter-abhängiger Integrale)
Es seien
a < b reelle Zahlen, X ein Hausdorffscher topologischer Raum (z.B. eine
Teilmenge X ⊆ Rn ) und
f : X × [a, b] → R
eine stetige Funktion. Dann ist auch die Funktion
Z b
g : X → R,
g(x) :=
f (x, t) dt
a
stetig.
Beweis. Um zu sehen, dass g an einerR gegebenen Stelle x ∈ X stetig ist, sei
b
W ⊆ R eine Umgebung von g(x) = a f (x, t) dt. Dann existiert ein ε > 0
ε
. Die Funktion
mit [g(x) − ε, g(x) + ε] ⊆ W . Wir setzen θ := b−a
h : X × [a, b] → R,
h(y, t) := f (y, t) − f (x, t)
ist stetig18 und es ist h(x, t) = 0 für alle t ∈ [a, b]. Somit ist
{x} × [a, b] ⊆ h−1 (0) ⊆ h−1 (]−θ, θ[),
wobei h−1 (]−θ, θ[) wegen der Stetigkeit von h offen ist. Nun ist die einpunktige Menge {x} ⊆ X kompakt (siehe Beispiel 3.7) und auch [a, b] ist kompakt. Nach dem Wallaceschen Lemma gibt es also offene Mengen V1 ⊆ X
und V2 ⊆ [a, b] mit
{x} × [a, b] ⊆ V1 × V2 ⊆ f −1 (]−θ, θ[).
18
Die Funktion X × [a, b] → R, (y, t) 7→ f (x, t) ist stetig, denn sie ist die Komposition
der Projektion π2 : X × [a, b] → [a, b], (y, t) 7→ t und der “partiellen Abbildung” [a, b] → R,
t 7→ f (x, t), die nach Beispiel 1.27 stetig ist.
53
Dann ist [a, b] ⊆ V2 ⊆ [a, b] und somit V2 = [a, b], also
V1 × [a, b] ⊆ h−1 (]−θ, θ[)
und daher h(y, t) ∈ ]−θ, θ[ für alle y ∈ V1 und t ∈ [a, b]. Also ist
(∀y ∈ V1 , t ∈ [a, b]) |f (y, t) − f (x, t)| = |h(y, t)| < θ.
Es folgt
|g(y) − g(x)| =
=
≤
≤
Z b
Z b
f (x, t) dt
f (y, t) dt −
a
Za b
(f (y, t) − f (x, t)) dt
a
Z b
|f (y, t) − f (x, t)| dt
a
Z b
θ dt = (b − a)θ = ε
a
für alle y ∈ V1 , somit g(y) ∈ [g(x) − ε, g(x) + ε] ⊆ W für alle y ∈ V1 . Also
ist g an der Stelle x stetig.
2
Anhang zu Kapitel 3: Weitere Folgerungen aus Kompaktheit
Die folgenden zwei Standard-Resultate werden in der Vorlesung zunächst
übersprungen. Sobald/falls wir sie benötigen, kommen wir darauf zurück.
Satz 3.35 (Lebesguesches Lemma) Es sei (K, d) ein kompakter metrischer
Raum und (Vj )j∈J eine offene Überdeckung von K. Dann existiert eine reelle
Zahl δ > 0 derart, dass
(∀x ∈ K)(∃j ∈ J)
Bδ (x) ⊆ Vj ,
wobei Bδ (x) := {y ∈ K : d(x, y) < δ}.
Ein δ > 0 mit der vorigen Eigenschaft wird auch ein Lebesguesches Delta
genannt.
Beweis. Für jedes x ∈ K existiert ein j(x) ∈ J derart, dass x ∈ Vj(x) . Da
die Menge Vj(x) offen ist, existiert ein ε(x) > 0 derart, dass
Bε(x) (x) ⊆ Vj(x) .
54
(23)
Weil (Bε(x)/2 (x))x∈K eine offene Überdeckung von K ist und K kompakt,
existiert eine endliche Teilmenge F ⊆ K derart, dass
[
K=
Bε(x)/2 (x).
(24)
x∈F
Wir setzen
δ := min{ε(x)/2 : x ∈ F }.
Für jedes y ∈ K existiert nach (24) ein x ∈ F derart, dass y ∈ Bε(x)/2 (x).
Da δ ≤ ε(x)/2, ist für alle z ∈ Bδ (y)
ε(x) ε(x)
ε(x)
+δ ≤
+
= ε,
2
2
2
und somit Bδ (y) ⊆ Vj(x) .
d(x, z) ≤ d(x, y) + d(y, z) <
also z ∈ Bε(x) (x) ⊆ Vj(x)
2
Satz 3.36 Es seien (K, dK ) und (Y, dY ) metrische Räume. Ist K kompakt,
so ist jede stetige Abbildung f : K → Y gleichmäßig stetig, d.h.
(∀ε > 0)(∃δ > 0)(∀y, z ∈ K) dK (y, z) < δ ⇒ dY (f (y), f (z)) < ε.
Beweis. Sei ε > 0. Da f stetig ist, ist f an jeder Stelle x ∈ K stetig und
somit hat x eine offene Umgebung Vx ⊆ K derart, dass
ε
(∀y ∈ Vx ) dY (f (y), f (x)) < .
2
Nach der Dreiecksungleichung gilt dann also
ε ε
(∀y, z ∈ Vx ) dY (f (y), f (z)) ≤ dY (f (y), f (x)) + dY (f (x), f (z)) < + = ε.
2 2
(25)
Nach dem Lebesgueschen Lemma existiert ein Lebesguesches Delta δ > 0 für
die offene Überdeckung (Vx )x∈K von K. Sind y, z ∈ K mit dK (y, z) < δ, so
ist
z ∈ Bδ (y).
(26)
Per Definition des Lebesgueschen Deltas existiert ein x ∈ K mit
Bδ (y) ⊆ Vx .
Nach (26) sind dann y, z ∈ Vx und somit gilt nach (25):
dY (f (y), f (z)) < ε,
was den Beweis der gleichmäßigen Stetigkeit beendet.
55
2
4
Weglänge und Wegintegrale
In diesem Kapitel betrachten wir Wege (Kurven) in Rn . Wir berechnen die
Weglänge von Kurven und lernen zwei wichtige Arten von Wegintegralen
kennen (die auch in physikalischen Anwendungen häufig gebraucht werden).
Definition 4.1 Ein Weg in Rn ist eine stetige Abbildung γ : [a, b] → Rn mit
a < b in R. Dann ist also
γ = (γ1 , . . . , γn )
mit den stetigen Komponenten γ1 , . . . , γn ) : [a, b] → R. Sind γ1 , . . . , γn sogar
C k für ein k ∈ N0 ∪ {∞}, so wird γ ein C k -Weg genannt. Ist γ stetig und
gibt es
a = t0 < t1 < · · · < tm = b
derart, dass γ|[tj−1 ,tj ] ein C k -Weg ist für alle j ∈ {1, . . . , m}, so wird γ
stückweise C k genannt.
Bemerkung 4.2 Man beachte, dass ein Weg γ = (γ1 , . . . , γn ) : [a, b] → Rn
genau dann an einer Stelle t ∈ [a, b] differenzierbar ist, also der Grenzwert
γ 0 (t) = lim
s→t
1
(γ(s) − γ(t))
s−t
(mit s ∈ [a, b]\{t}) existiert, wenn jede der Komponenten γ1 , . . . , γn : [a, b] →
R in t differenzierbar ist, und es gilt dann
γ 0 (t) = (γ10 (t), . . . , γn0 (t)).
Für jede Folge (sk )k∈N in [a, b] \ {t} existiert nämlich
1
(γ(sk ) − γ(t))
k→∞ sk − t
lim
nach Satz 1.22 genau dann, wenn all die Komponenten
1
(γj (sk ) − γj (t)),
k→∞ sk − t
lim
j ∈ {1, . . . , n}.
konvergieren, und hat als Komponenten dann die Grenzwerte γ10 (t), . . ., γn0 (t)
der Komponenten. Weiter ist γ 0 = (γ10 , . . . , γn0 ) genau dann stetig, wenn all
die Komponenten es sind. Wir können somit auch kürzer sagen: γ ist C 1 ,
wenn γ überall differenzierbar ist und γ 0 : [a, b] → Rn stetig ist.
56
Beispiele 4.3 (a) Für α > 0 hat die Abbildung
γ : [0, α] → R2 ,
γ(t) := (cos t, sin t)
beliebig oft differenzierbare Komponenten, ist also ein C ∞ -Weg in R2 (der
den Einheitskreis im Gegenuhrzeigersinn umläuft).
(b) Für a < b ist
γ : [0, α] → R3 ,
γ(t) := (cos t, sin t, t)
ein C ∞ -Weg in R3 , der ein Stück einer Schraubenlinie (Korkenzieher) durchläuft.
(c) Sind x0 , x1 , . . . , xm ∈ Rn und a = t0 < t1 < · · · < tm = b, so sei
γ : [a, b] → Rn der Weg, welcher auf dem Intervall [tj−1 , tj ] affin-linear von
xj−1 nach xj läuft, also
γ(t) := xj−1 +
t − tj−1
(xj − xj−1 )
tj − tj−1
für j ∈ {1, . . . , m}, t ∈ [tj−1 , tj ]. Dann ist γ : [a, b] → Rn ein Weg, welcher
stückweise C 1 ist. Der Weg verbindet geradlinig die gegebenen Punkte, es
handelt sich um einen sogenannten Polygonzug.
4.4 Es ist naheliegend, die Weglänge eines Polygonzugs (wie gerade betrachtet) als
m
X
kxj − xj−1 k2
j=1
zu definieren.
Definition 4.5 Ist γ : [a, b] → Rn ein Weg und
Z = {t0 , t1 , . . . , tm }
eine Zerlegung von [a, b] (also a = t0 < t1 < · · · < tm = b), so sei LZ (γ) die
Länge des Polygonzugs durch die Punkte γ(t0 ), . . . , γ(tm ), also
LZ (γ) :=
m
X
kγ(tj ) − γ(tj−1 )k2 .
j=1
Die Weglänge L(γ) von γ ist definiert als das Supremum
L(γ) := sup LZ (γ) ∈ [0, ∞],
Z
wobei Z alle Zerlegungen des Intervalls [a, b] durchläuft. Ist L(γ) < ∞, so
wird γ rektifizierbar genannt.
57
Wir werden bald sehen, dass jeder C 1 -Weg rektifizierbar ist und seine Weglänge
in Form eines geeigneten Integrals berechnet werden kann.
Lemma 4.6 Es sei γ : [a, b] → Rn ein Weg. Ist Z = {t0 , . . . , tm } eine Zerlegung von [a, b] und Z 0 eine Verfeinerung von Z, so ist
LZ (γ) ≤ LZ 0 (γ).
Beweis. Die Verfeinerung Z 0 geht aus Z hervor, indem wir endlich oft
je einen Zwischenpunkt hinzunehmen. Es genügt zu zeigen, dass sich die
Weglänge in jedem dieser Schritte nicht verkleinert. Wir dürfen daher ohne
Beschränkung der Allgemeinheit annehmen, dass
Z 0 = Z ∪ {s}
mit einem s ∈ [a, b] \ Z. Es gibt genau ein k ∈ {1, . . . , m} derart, dass
tk−1 < s < tk .
Nach der Dreieicksungleichung ist
kγ(tk ) − γ(tk−1 )k2 ≤ kγ(tk ) − γ(s)k2 + kγ(s) − γ(tk−1 )k2 ,
somit
LZ (γ) =
k−1
X
kγ(tj ) − γ(tj−1 )k2 + kγ(tk ) − γ(tk−1 )k2
j=1
m
X
+
kγ(tj ) − γ(tj−1 )k2
j=k+1
≤
k−1
X
kγ(tj ) − γ(tj−1 )k2 + kγ(tk ) − γ(s)k2
j=1
+kγ(s) − γ(tk−1 )k2 +
m
X
kγ(tj ) − γ(tj−1 )k2
j=k+1
= LZ 0 (γ).
2
58
Lemma 4.7 Sind a < b < c reelle Zahlen und γ : [a, c] → Rn ein Weg, so
ist
L(γ) = L(γ|[a,b] ) + L(γ|[b,c] ).
(27)
Insbesondere ist γ genau dann rektifizierbar, wenn beide Teilwege γ|[a,b] und
γ|[b,c] rektifizierbar sind.
Beweis. Wir stellen zunächst eine Vorüberlegung an. Ist Z = {t0 , . . . , tm }
eine Zerlegung von [a, c] derart, dass b = tk für ein k ∈ {1, . . . , m − 1}, so
ist Z 0 = {t0 , . . . , tk } eine Zerlegung von [a, b] und Z 00 = {tk , . . . , tm } eine
Zerlegung von [b, c]. Weiter gilt
LZ (γ) = LZ 0 (γ[a,b] ) + LZ 00 (γ|[b,c] ),
denn es ist
LZ (γ) =
m
X
kγ(tj ) − γ(tj−1 )k2
j=1
=
k
X
kγ(tj ) − γ(tj−1 )k2 +
j=1
m
X
kγ(tj ) − γ(tj−1 )k2
j=k+1
= LZ 0 (γ[a,b] ) + LZ 00 (γ|[b,c] ).
Seien nun (Zi )i∈N , (Zi0 )i∈N und (Zi00 )i∈N Folgen von Zerlegungen von [a, c],
[a, b] bzw. [b, c] derart, dass
LZi (γ) → L(γ),
LZi0 (γ) → L(γ|[a,b] ) und LZi00 (γ) → L(γ|[b,c] )
für i → ∞. Es ist Yj := Zj ∪ Zj0 ∪ Zj00 eine Verfeinerung von Zj . Weiter ist
Yj0 := Yj ∩[a, b] eine Verfeinerung von Zj0 und Yj00 := Yj ∩[b, c] eine Verfeinerung
von Zj00 . Somit ist LYj (γ) ≥ LZj (γ), folglich LYj (γ) dem Supremum L(γ)
näher. Also gilt erst recht
LYi (γ) → L(γ)
und ebenso LYi0 (γ) → L(γ|[a,b] ) und LYi00 (γ) → L(γ|[b,c] ). Da Yi = Yi0 ∪ Yi00 ,
ist jedoch nach der Vorüberlegung
LYi (γ) = LYi0 (γ|[a,b] ) + LYi00 (γ|[b,c] )
Durch Grenzübergang i → ∞ folgt nun (27) aus (28).
59
(28)
2
Bemerkung 4.8 Ist γ : [a, b] → Rn ein Polygonzug, so stimmt übrigens
die in Definition 4.5 als ein Supremum definierte Weglänge mit der in 4.4
betrachteten überein.19 Es genügt, dies für affin-lineare Wege γ zu beweisen,
da wir durch wiederholte Anwendung von Lemma 4.7 die Weglänge eines
Polygonzugs als Summe der Längen von affin-linearen Teilwegen schreiben
können. Sei etwa
γ(t) = x +
t−a
(y − x) für t ∈ [a, b]
b−a
mit x, y ∈ Rn und Z = {t0 , t1 , . . . , tm } eine Zerlegung von [a, b]. Dann ist
γ(tj ) − γ(tj−1 ) = x +
tj − a
tj−1 − a
tj − tj−1
(y − x) − x −
(y − x) =
(y − x)
b−a
b−a
b−a
für j ∈ {1, . . . , m}, somit
m
X
m X
tj − tj−1
LZ (γ) =
kγ(tj ) − γ(tj−1 )k2 =
b − a (y − x)
2
j=1
j=1
Pm
b−a
j=1 (tj − tj−1 )
= ky − xk2
= ky − xk2
= ky − xk2 .
b−a
b−a
Es ist also LZ (γ) = ky − xk2 für alle Zerlegungen Z und somit auch L(γ) =
supZ LZ (γ) = ky − xk2 .
Definition 4.9 Wir definieren das vektorwertige Integral einer vektorwertigen stetigen Funktion (also eines Weges) γ = (γ1 , . . . , γn ) : [a, b] → Rn als
Z b
Z b
Z b
γ(t) dt :=
γ1 (t) dt, . . . ,
γn (t) dt .
a
a
a
Es ist nützlich, dass auch hier eine Fassung des Hauptsatzes der Integralrechnung gilt:
Lemma 4.10 Für jeden C 1 -Weg γ : [a, b] → Rn gilt
Z
b
γ 0 (t) dt = γ(b) − γ(a).
a
19
In der Vorlesung überspringen wir den folgenden Beweis.
60
Beweis. In der Tat ist
Z b
Z b
Z b
Z b
0
0
0
0
γ (t) dt =
(γ1 (t), . . . , γn (t)) dt = (
γ1 (t) dt, . . . ,
γn0 (t) dt)
a
a
a
a
= (γ1 (b) − γ1 (a), . . . , γn (b) − γn (a)) = γ(b) − γ(a).
2
Die folgende Integralabschatzung ist oft nützlich.
Lemma 4.11 (Integralabschätzung) Für jeden Weg γ : [a, b] → Rn und
jede Norm k.k : Rn → [0, ∞[ gilt
Z b
Z b
γ(t) dt
kγ(t)k dt.
(29)
≤
a
a
Beweis. Wir betrachten zunächst nur die Maximum-Norm. In diesem Fall
ist in der Tat
Z b
Z b
Z b
γ
(t)
dt
γ(t)
dt
=
γ
(t)
dt,
.
.
.
,
n
1
a
a
a
∞
∞
Z b
= max γj (t) dt
j=1,...,n
a
Z b
Z b
≤ max
|γj (t)| dt ≤
kγ(t)k∞ dt.
j=1,...,n a | {z }
a
≤kγ(t)k∞
Um die UngleichungR auch für allgemeine Normen zu bekommen, approxb
imieren wir Integrale a γ(t) dt durch sogenannte Riemannsche Summen S(γ, Z).
Für eine Zerlegung Z = {t0 , t1 , . . . , tm } von [a, b] ist20
S(γ, Z) :=
m
X
(tj − tj−1 )γ(tj−1 ).
j=1
20
Wir werten hier γ jeweils am linken Intervallende
Pm tj−1 von [tj−1 , tj ] aus. Allgemeiner
werden in der Literatur Riemannsche Summen j=1 (tj − tj−1 )γ(bj ) mit einer “Belegung”
(b1 , . . . , bm ) von beliebig ausgewählten Zwischenstellen bj ∈ [tj−1 , tj ] betrachtet - was für
unsere Zwecke aber unnötig allgemein wäre.
61
Die Norm der vorigen Riemannschen Summe lässt sich wie folgt durch eine
Riemannsche Summe der Funktion21 kγk : [a, b] → [0, ∞[, t 7→ kγ(t)k abschätzen:
m
m
X
X
|tj − tj−1 | ·kγ(tj−1 )k = S(kγk, Z).
kS(γ, Z)k = (tj − tj−1 )γ(tj−1 ) ≤
| {z }
j=1
j=1
=tj −tj−1
(30)
Hierbei wurden die Subadditivität und positive Homogenität der Norm benutzt. Wir definieren die Maschenweite ∆(Z) (oder Feinheit) der Zerlegung
Z als das Maximum der Längen der Teilintervalle,
max (tj − tj−1 ).
∆(Z) :=
j∈{1,...,m}
Dann gilt
Z
b
γ(t) dt für k → ∞,
S(γ, Zk ) →
(31)
a
für jede Folge (Zk )k∈N von Zerlegungen Zk von [a, b] mit Maschenweite ∆(Zk ) →
0. Als stetige Funktion auf einem kompakten Intervall ist γ automatisch gleichmäßig stetig (siehe Analysis 1 oder der obige Satz 3.36). Also existiert zu
ε > 0 ein δ > 0 derart, dass
(∀s, t ∈ [a, b]) |s − t| ≤ δ ⇒ kγ(s) − γ(t)k∞ ≤ ε.
Sei nun k so groß, dass ∆(Zk ) ≤ δ. Schreibe Zk = {t0 , t1 , . . . , tm }. Sind
s, t ∈ [tj−1 , tj ] für ein j, so ist dann |s − t| ≤ ∆(Zk ) ≤ δ und somit kγ(s) −
γ(t)k∞ ≤ ε. Insbesondere ist
(∀j ∈ {1, . . . , m})(∀t ∈ [tj−1 , tj ]) kγ(t) − γ(tj−1 )k∞ ≤ ε.
21
k.k ◦ γ wäre eine korrektere, aber längliche Notation.
62
(32)
Wir erhalten
Z b
γ(t)
dt
−
S(γ,
Z
)
k
a
=
∞
=
≤
≤
m Z
m
X tj
X
γ(t) dt −
(tj − tj−1 )γ(tj−1 )
|
{z
}
j=1
j=1 tj−1
Rt
= t j γ(tj−1 ) dt j−1
∞
m Z tj
X
(γ(t) − γ(tj−1 ) dt
j=1 tj−1
∞
m Z tj
X
(γ(t) − γ(tj−1 ) dt
tj−1
j=1
∞
m Z tj
X
kγ(t) − γ(tj−1 )k∞ dt
{z
}
tj−1 |
j=1
≤
≤ε
m Z
X
j=1
tj
ε dt =
tj−1
m
X
(tj − tj−1 )ε = (b − a)ε,
j=1
wobei die Subadditivität der Norm benutzt wurde, dann die gerade bewiesene
Integralabschätzung und schließlich (32). Somit ist (31) gezeigt.
Ist nun k.k eine beliebige Norm auf Rn , so haben wir nach (30)
kS(γ, Zk )k ≤ S(kγk, Zk ).
Da S(γ, Zk ) →
Rb
a
(33)
γ(t) dt nach dem Vorigen und k.k stetig ist, gilt
Z b
kS(kγk, Zk )k → γ(t) dt
a
für k → ∞. Weiter gilt S(kγk, Zk ) →
Grenzübergang k → ∞ aus (33).
Rb
a
kγ(t)k dt. Also folgt (29) durch
2
Lemma 4.12 Ist k.k : Rn → [0, ∞[ eine Norm, γ : [a, b] → Rn ein Weg und
θ ≥ 0 derart, dass
kγ 0 (t) − γ 0 (a)k ≤ θ
so ist
für alle t ∈ [a, b],
Z b
0
kγ(b) − γ(a)k −
≤ 2(b − a)θ.
kγ
(t)k
dt
a
63
(34)
Rb
γ 0 (t) dt und
Z b
Z b
0
0
kγ 0 (a)k dt,
γ (a) dt
kγ (a)(b − a)k = =
Beweis. Da γ(b) − γ(a) =
a
a
a
ist
Z b
0
kγ(b) − γ(a)k −
kγ (t)k dt
Z b a
Z b
Z b
Z b
0
0
0
0
γ (t) dt − γ (a) dt +
kγ (a)k dt −
kγ (t)k dt
= a
a
a
Za b
Z b
γ 0 (t) dt − γ 0 (a) dt
(35)
≤ a
a
Z b
Z b
0
0
+
kγ (a)k dt −
kγ (t)k dt.
(36)
a
a
Weil Normen nach Beispiel 1.14 stets Lipschitzstetig sind mit Konstante 1,
also
kyk − kxk ≤ ky − xk,
können wir den Summanden in (35) nach oben abschätzen durch
Z b
Z b
Z b
0
0
γ (t) dt −
γ (a) dt = (γ 0 (t) − γ 0 (a)) dt
a
a
a
Z b
kγ 0 (t) − γ 0 (a)k dt ≤ (b − a)θ (37)
≤
|
{z
}
a
≤θ
(wobei das erste Ungleichungszeichen auf der üblichen Integralabschätzung
beruht). Im Summanden in (36) fassen wir die Integranden zusammen, wenden die übliche Integralabschätzung an und benutzen die Lipschitzstetigkeit
der Norm:
Z b
Z b
0
0
0
kγ (a)k − kγ 0 (t)k dt
kγ (a)k − kγ (t)k dt ≤
a
a
Z b
≤
kγ 0 (a) − γ 0 (t)k dt ≤ (b − a)θ. (38)
a
Setzen wir die Abschätzungen (37) und (38) in (35) bzw. (36) ein, so ergibt
sich (34).
2
64
Satz 4.13 Jeder C 1 -Weg γ : [a, b] → Rn ist rektifizierbar, mit Weglänge
b
Z
kγ 0 (t)k2 dt.
L(γ) =
(39)
a
Gleiches gilt für stückweise C 1 -Wege, wenn man
Z
b
0
kγ (t)k2 dt :=
a
m Z
X
j=1
tj
kγ 0 (t)k2 dt
tj−1
definiert mit einer Zerlegung Z = {t0 , t1 , . . . , tm } von [a, b] derart, dass
γ|[tj−1 ,tj ] ein C 1 -Weg ist für alle j ∈ {1, . . . , m}.
Beweis. Wegen Lemma 4.7 genügt es, die Aussage für C 1 -Wege zu beweisen.
Da die stetige Funktion γ 0 : [a, b] → Rn , t 7→ γ 0 (t) wegen der Kompaktheit
von [a, b] gleichmäßig stetig ist, gibt es für jedes k ∈ N ein δk > 0 derart,
dass
1
(∀s, t ∈ [a, b]) |s − t| ≤ δk ⇒ kγ 0 (s) − γ 0 (t)k2 ≤ .
k
Wir wählen nun eine Folge (Zk )k∈N von Zerlegungen Zk von [a, b] derart, dass
LZk (γ) → L(γ)
für k → ∞. Indem wir Zk notfalls verfeinern (z.B. mit einer genügend engen
äquidistanten Zerlegung vereinigen), dürfen wir annehmen, dass
∆(Zk ) ≤ δk
(40)
für alle k. Für festes k schreiben wir Zk = {t0 , t1 , . . . , tm }. Für jedes j ∈
{1, . . . , m} und t ∈ [tj−1 , tj ] gilt |t − tj−1 | ≤ tj − tj−1 ≤ ∆(Zk ) ≤ δk , somit
kγ 0 (t) − γ 0 (tj−1 )k2 ≤
65
1
.
k
Dies ermöglicht uns, Lemma 4.12 auf γ|[tj−1 ,tj ] anzuwenden, mit θ = k1 . Somit
gilt
Z b
m Z tj
m
X
X
0
0
kγ (t)k2 dt −
kγ(tj ) − γ(tj−1 )k2 kγ (t)k2 dt − LZk (γ) = a
j=1 tj−1
j=1
m Z tj
X
0
≤
kγ (t)k2 dt − kγ(tj ) − γ(tj−1 )k2 tj−1
j=1
m
X
m
1
2X
≤
2(tj − tj−1 ) =
2(tj − tj−1 )
k
k j=1
j=1
=
2
2(b − a)
(tm − t0 ) =
→0
k
k
für k → ∞. Also gilt sowohl LZk (γ) → L(γ) also auch LZk (γ) →
für k → ∞, und somit folgt (39).
Rb
a
kγ 0 (t)k2 dt
2
Beispiel 4.14 Wir betrachten (wie in Beispiel 4.3 (a)) für α > 0 den C ∞ Weg
γ : [0, α] → R2 , γ(t) := (cos t, sin t),
der den Kreisbogen von γ(0) = (1, 0) bis γ(α) = (cos α, sin α) im Gegenuhrzeigersinn
durchläuft. Nach Satz 4.13 hat γ die Weglänge
Z α
Z α
Z αp
0
(− sin t)2 + (cos t)2 dt
L(γ) =
kγ (t)k2 dt =
k(− sin t, cos t)k2 dt =
{z
}
0
0
0 |
=1
Z α
=
1 dt = α.
0
Mit anderen Worten, wir können die Zahl α wirklich als eine Bogenlänge
interpretieren, nämlich als die Länge des durch den Weg γ parametrisierten
Kreisbogens von (1, 0) bis (cos α, sin α).
Beim Umparametrisieren ändert sich die Länge von Wegen nicht:
Satz 4.15 Ist γ : [a, b] → Rn ein Weg und φ : [c, d] → [a, b] ein Homöomorphismus,
so ist
L(γ) = L(γ ◦ φ).
66
Beweis. Wir wissen aus der Analysis 1, dass die bijektive stetige Abbildung
φ : [c, d] → [a, b] entweder streng monoton wachsend oder streng monoton
fallend ist. Ist Z = {t0 , t1 , . . . , tm } eine Zerlegung von [c, d] so ist
φ(Z) = {φ(t0 ), φ(t1 ), . . . , φ(tm )}
eine Zerlegung von [a, b]. Ist Φ streng monoton wachsend, so ist a = φ(t0 ) <
φ(t1 ) < · · · < φ(tm ) = b und
Lφ(Z) (γ) =
m
X
kγ(φ(tj )) − γ(φ(tj−1 ))k2 = LZ (γ ◦ φ).
j=1
Ist φ streng monoton fallend, so ist b = φ(t0 ) > φ(t1 ) > · · · > φ(tm ) = a,
also a = φ(tm ) < φ(tm−1 ) < · · · < φ(t0 ) = b die aufsteigende Anordnung der
Punkte der Zerlegung φ(Z), somit ebenfalls
Lφ(Z) (γ) =
m
X
kγ(φ(tj ))−γ(φ(tj−1 ))k2 =
j=1
m
X
kγ(φ(tj−1 ))−γ(φ(tj ))k2 = LZ (γ◦φ).
j=1
Sei nun Z die Menge aller Zerlegungen von [a, b] und Z 0 die Menge aller
Zerlegungen von [c, d]. Dann ist
Z 0 → Z,
Z 7→ φ(Z)
eine bijektive Abbildung (mit Umkehrabbildung Z 7→ φ−1 (Z)), insbesondere
also surjektiv. Es folgt
L(γ) = sup LZ (γ) = sup Lφ(Z) (γ) = sup LZ (γ ◦ φ) = L(γ ◦ φ).
Z∈Z
Z∈Z 0
Z∈Z 0
2
Die Existenz einer schönen Umparametrisierung (wie im vorigen Satz) ist
häufig automatisch:
Satz 4.16 Sind γ : [a, b] → Rn und η : [c, d] → Rn injektive Wege22 mit
gleichem Bild, also
γ([a, b]) = η([c, d]),
so gibt es einen Homöomorphismus φ : [c, d] → [a, b] derart, dass
η = γ ◦ φ.
22
Injektive Wege nennt man traditionell auch “doppelpunktfreie Wege.”
67
Insbesondere gilt L(γ) = L(η), d.h. die Bogenlänge
L(Γ) := L(γ)
der Menge (“Kurve”) Γ := γ([a, b]) ist wohldefiniert, unabhängig von der
gewählten Parametrisierung γ.
Beweis. Sei Γ := γ([a, b]) = η([c, d]). Da [c, d] kompakt ist und
η|Γ : [c, d] → Γ,
t 7→ η(t)
stetig und bijektiv, ist η|Γ nach Satz dem Satz über die Umkehrfunktion (Satz
3.16) ein Homöomorphismus. Ebenso ist γ|Γ : [a, b] → Γ ein Homöomorphismus.
Also ist auch (γ|Γ )−1 : Γ → [a, b] ein Homöomorphismus und somit auch die
Komposition
φ := (γ|Γ )−1 ◦ η|Γ : [c, d] → [a, b].
Sei ι : Γ → Rn die Inklusion. Per Konstruktion ist γ ◦ φ = ι ◦ γ|Γ ◦ φ =
ι ◦ γ|Γ ◦ (γ|Γ )−1 ◦ η|Γ = ι ◦ η|Γ = η. Die übrigen Aussagen folgen nun aus Satz
4.15.
2
Beispiel 4.17 Gegeben α ∈ ]0, 2π[ ist der Weg
γ : [0, α] → R2 ,
γ(t) := (cos t, sin t)
injektiv. Somit können wir dem Kreisbogen Γ := γ([0, α]) die Bogenlänge
L(Γ) := L(γ) = α zuordnen und wissen, dass wir für jede andere injektive
Parametrisierung η des Kreisbogens23 die gleiche Bogenlänge erhalten. Diese
ist eine Eigenschaft von Γ allein, unabhängig von der Parametrisierung.
Definition 4.18 [Wegintegrale erster Art] Ist ein Weg γ : [a, b] → Rn stückweise
C 1 und
f : γ([a, b]) → R
stetig, so definieren
Z
Z
f :=
γ
23
Z.B. η(t) = (1 − t,
Z
b
f ds :=
γ
f (γ(t))kγ 0 (t)k2 dt.
a
p
1 − (1 − t)2 ) falls α ≤ π.
68
Ist γ nicht C 1 , so ist hierbei
Z b
m Z
X
0
f (γ(t))kγ (t)k2 dt :=
a
tj
f (γ(t))kγ 0 (t)k2 dt,
tj−1
j=1
wobei Z = {t0 , t1 , . . . , tm } eine Zerlegung von [a, b] ist derart, dass γ|[tj−1 ,tj ]
ein C 1 -Weg ist für alle j ∈ {1, . . . , m}.
Beispiel 4.19 Die Kurve
γ = (γ1 , γ2 , γ3 ) : [a, b] → R3
beschreibe einen Draht im Raum, welcher an der Stelle γ(t) = x die Massendichte
ρ(x) besitzt (im Sinne von Masse pro Weglänge).24 Dann ist
Z
m= ρ
γ
die Masse des Drahts. Sein Schwerpunkt ist
x = (x1 , x2 , x3 )
mit
1
xk =
m
Z
1
prk ·ρ =
m
γ
Z
γk (t)ρ(γ(t))kγ 0 (t)k2 dt
[a,b]
für k ∈ {1, 2, 3}. Ist ρ konstant, so ist m = ρ · L(γ) und
Z
1
xk =
γk (t)kγ 0 (t)k2 dt.
L(γ) [a,b]
Definition 4.20 [Wegintegrale zweiter Art] Ist ein Weg γ : [a, b] → Rn stückweise
C 1 und
F : γ([a, b]) → Rn
stetig,25 so definieren wir
Z
Z
Z b
hF, d~si := F · d~s :=
hF (γ(t)), γ 0 (t)i dt
γ
γ
a
24
Ist der Draht an verschiedenen Stellen unterschiedlich gezogen worden oder verrostet,
braucht ρ nicht konstant sein.
25
Wir benutzen die selbe Notation auch, wenn F auf einer größeren Teilmenge von Rn
(z.B. auf ganz Rn ) definiert ist.
69
mit dem Skalarprodukt
hx, yi := x · y :=
n
X
xk yk
k=1
für x = (x1 . . . . , xn ) und y = (y1 , . . . , yn ) in Rn . Ist γ nicht C 1 , so ist hierbei
Z b
m Z tj
X
0
hF (γ(t)), γ (t)i dt :=
hF (γ(t)), γ 0 (t)i dt
a
tj−1
j=1
wobei Z = {t0 , t1 , . . . , tm } eine Zerlegung von [a, b] ist derart, dass γ|[tj−1 ,tj ]
ein C 1 -Weg ist für alle j ∈ {1, . . . , m}.
Beispiel 4.21 Es sei F : R3 → R3 ein stetiges Kraftfeld, also F (x) ∈ R3 ein
Kraftvektor, der an der Stelle x ∈ R3 auf ein Teilchen wirkt. Sei γ(t) ∈ R3
die Position des Teilchens zur Zeit t. Die bei der Bewegung des Teilchens
längs einer C 1 -Kurve γ : [a, b] → R3 aufgewandte Energie (geleistete Arbeit)
ist dann
Z
E = − F · d~s.
γ
n
Satz 4.22 Es sei γ : [a, b] → R ein C 1 -Weg und φ : [c, d] → [a, b] eine
bijektive C 1 -Funktion. Für alle stetigen Funktionen f : γ([a, b]) → R und
F : γ([a, b]) → Rn gilt dann
Z
Z
f
f=
γ◦φ
γ
und
Z
Z
hF, d~si,
hF, d~si = ±
γ◦φ
γ
wobei das positive Vorzeichen zu wählen ist, wenn φ streng monoton wachsend ist; ist φ streng monoton fallend, so tritt das Minuszeichen auf.
Beweis. Ist φ streng monoton wachsend, so ist überall φ0 (t) ≥ 0. Weiter ist
φ(c) = a, φ(d) = b und die Substitution u = φ(t) liefert
Z
Z d
Z d
0
f (γ(φ(t)))|φ0 (t)| kγ 0 (φ(t))k2 dt
f =
f (γ(φ(t)))k(γ ◦ φ) (t)k2 dt =
γ◦φ
c
c
Z
d
0
=
Z
0
φ(d)
f (γ(φ(t)))φ (t)kγ (φ(t))k2 dt =
c
Z
=
a
φ(c)
b
f (γ(u))kγ 0 (u)k2 du =
Z
f.
γ
70
f (γ(u))kγ 0 (u)k2 du
Ebenso ist dann
Z
Z
d
hF (γ(φ(t))), γ 0 (φ(t))φ0 (t)i dt
hF, d~si =
c
γ◦φ
Z
d
hF (γ(φ(t))), γ 0 (φ(t))iφ0 (t) dt
=
c
Z
=
b
hF (γ(u)), γ 0 (u)iφ0 (t) du
Za
hF, d~si.
=
γ
Ist γ streng monoton fallend, so ist überall γ(t) ≤ 0, weiter γ(c) = b und
γ(d) = a. Wir erhalten
Z
Z d
Z d
0
f =
f (γ(φ(t)))k(γ ◦ φ) (t)k2 dt =
f (γ(φ(t)))|φ0 (t)| kγ 0 (φ(t))k2 dt
γ◦φ
c
c
Z
d
0
Z
0
φ(d)
f (γ(u))kγ 0 (u)k2 du
f (γ(φ(t)))φ (t)kγ (φ(t))k2 dt = −
= −
φ(c)
c
Z
= −
a
Z
0
0
a
Z
Z
f (γ(u))kγ (u)k2 du =
f (γ(u))kγ (u)k2 du =
b
und
Z
b
f
γ
d
hF (γ(φ(t))), γ 0 (φ(t))φ0 (t)i dt
hF, d~si =
c
γ◦φ
Z
d
hF (γ(φ(t))), γ 0 (φ(t))iφ0 (t) dt
=
c
Z
a
0
0
hF (γ(u)), γ (u)iφ (t) du = −
bZ
= − hF, d~si.
=
Z
b
hF (γ(u)), γ 0 (u)iφ0 (t) du
a
γ
2
5
Partielle Differenzierbarkeit
∂f
einer Funktion f in
In diesem Abschnitt lernen wir partielle Ableitungen ∂x
i
mehreren Variablen kennen, d.h. Ableitungen nach einer der Variablen (hier
71
der i-ten) bei festgehaltenen übrigen Variablen. Dies führt uns weiter zu
stetig partiell differenzierbaren Funktionen und k mal stetig partiell differenzierbaren Funktionen.
Im Folgenden bezeichnen e1 = (1, 0, . . . , 0), . . ., em = (0, 0, . . . , 1) die StandardBasisvektoren von Rm .
Definition 5.1 Es sei U ⊆ Rm offen. Ist f : Rm → Rn eine Funktion,
i ∈ {1, . . . , m} und x ∈ U , so nennen wir
Di f (x) :=
∂f (x)
1
∂f
(x) :=
:= lim (f (x + tei ) − f (x))
t→0 t
∂xi
∂xi
die partielle Ableitung von f nach der i-ten Variablen an der Stelle x, wenn
der Grenzwert existiert.
Bemerkung 5.2 (a) Eine weitere Schreibweise für die partielle Ableitung
(die ich nicht benutze) ist fxi .
(b) Im Falle einer Funktion (x, y) 7→ f (x, y) schreibt man auch ∂f
und
∂x
∂f
statt D1 f und D2 f . Entsprechend bei anderen Buchstaben für die
∂y
Komponenten.
∂f
Bemerkung 5.3 Wollen wir (zum Beispiel) ∂x
(x) in einem festen Punkt
1
m
x = (x1 , . . . , xm ) ∈ R berechnen, so können wir die folgende Funktion einer
Variablen betrachten,
γ : V → Rn ,
γ(t) := f (t, x2 , . . . , xm ),
die auf der Menge
V := {t ∈ R : (t, x2 , . . . , xm ) ∈ U }
definiert ist. Die Menge V enthält t = x1 und ist offen in R (denn U ist offen
und V
= h−1 (U ) mit der stetigen Abbildung h : R → Rm ,
t 7→ (t, x2 , . . . , xm )). Dann ist
1
1
∂f
dγ
(x1 ) = lim (γ(x1 + t) − γ(x1 )) = lim (f (x + te1 ) − f (x)) =
(x),
t→0 t
t→0 t
dt
∂x1
wann immer der Grenzwert existiert. Also:
72
∂f
(x), indem wir alle Variablen außer
Wir erhalten die partielle Ableitung ∂x
1
der ersten konstant halten und die so erhaltene Funktion der einen Variablen
x1 nach x1 ableiten.
Letztere Ableitung kann komponentenweise berechnet werden (vgl. die Diskussion von Wegen und ihren Ableitungen im vorigen Kapitel), d.h. ist f =
(f1 , . . . , fn ), so ist
∂f
∂fn ∂f
1
(x) =
(x), . . . ,
(x) .
∂xi
∂xi
∂xi
Beispiele 5.4 (a) Für f : R2 → R, f (x, y) := x + y 2 + 1 erhalten wir die
partielle Ableitung nach x, indem wir bei festem y wie in Analysis 1 nach x
ableiten
∂f
∂
(x, y) =
(x + y 2 + 1) = 1.
∂x
∂x
Die partielle Ableitung nach y erhalten wir, indem wir x festhalten und nach
y ableiten:
∂
∂f
(x, y) (x + y 2 + 1) = 2y.
∂y
∂y
(b) f : R2 → R3 , f (x, y) = (x + y, xy, 1 + xey ) hat die partiellen Ableitungen
∂f
(x, y) = (1, y, ey )
∂x
∂f
(x, y) = (1, x, xey ).
∂y
(c) Jede konstante Funktion U → Rn , x 7→ c auf einer offenen Menge U ⊆ Rm
∂c
ist überall partiell differenzierbar, mit ∂x
(x) = 0.
i
(d) Die partiellen Ableitungen der Funktion pri : R → R, (x1 , . . . , xm ) 7→ xi
sind
∂ pri
∂xi
1 wenn i = j;
(x) =
(x) =
0 wenn i 6= j.
∂xj
∂xj
Es ist also
∂ pri
(x)
∂xj
= δi,j durch das sogenannte “Kroneckersche delta” gegeben.
Definition 5.5 Eine Abbildung f : U → Rn auf einer offenen Menge U ⊆
Rm heißt stetig partiell differenzierbar (kurz partiell C 1 ), wenn f stetig ist,
73
für alle i ∈ {1, . . . , m} die partielle Ableitung
existiert und die Abbildung
∂F
: U → Rn ,
∂xi
x 7→
∂F
(x)
∂xi
an jeder Stelle x ∈ U
∂F
(x)
∂xi
stetig ist.
Beispiele 5.6 All die Beispiele aus 5.4 sind partiell C 1 , denn sie sind stetig,
all ihre partiellen Ableitungen existieren und die obigen Formeln zeigen, dass
diese auch stetig sind.
Bemerkung 5.7 Ist U ⊆ Rm offen, f : U → Rn überall nach der ersten
∂f
Variablen partiell differenzierbar und ∂x
: U → Rn stetig, so ist für festes
1
x = (x1 , . . . , xm ) ∈ U die Funktion
γ : V → Rn ,
γ(t) := f (t, x2 , . . . , xn )
von t ∈ V ⊆ R (wie in der vorigen Bemerkung) überall differenzierbar und
γ 0 (t) =
∂f
(t, x2 , . . . , xm )
∂x1
(41)
stetig in t. Für alle s, t ∈ V , deren Verbindungsstrecke ganz in V liegt, ist
nach dem Hauptsatz der Integral- und Differentialrechnung also
Z s
Z 1
0
γ(s) − γ(t) =
γ (r) dr =
γ 0 (t + u(s − t))(s − t) du,
t
0
wobei noch r = t + u(s − t) mit u ∈ [0, 1] und dr = (s − t)du substituiert
wurde. Setzen wir (41) und die Definition von γ in die vorige Gleichung ein,
so erhalten wir
f (s, x2 , . . . , xm ) − f (t, x2 , . . . , xm )
Z s
∂f
=
(r, x2 , . . . , xm ) dr
t ∂x1
Z 1
∂f
= (s − t)
(t + u(s − t), x2 , . . . , xm ) du.
0 ∂x1
(42)
Ableitungen nach Parametern und Integration können vertauscht werden,
man kann “unter dem Integralzeichen ableiten”:
74
Satz 5.8 (Differenzierbarkeit parameterabhängiger Integrale) Es seien
I ⊆ R offen, a < b reelle Zahlen und
f : I × [a, b] → Rn ,
eine stetige Funktion derart, dass
Dann ist
(s, t) 7→ f (s, t)
∂f
∂s
g : I → Rn ,
: I × [a, b] → R existiert und stetig ist.
Z b
g(s) :=
f (s, t) dt
a
1
eine C -Funktion und
dg
(s) =
ds
Also
d
ds
Rb
a
f (s, t) dt =
b
Z
a
∂f
(s, t) dt.
∂s
(43)
Rb
∂f
(s, t) dt.
a ∂s
Beweis. Wir dürfen annehmen, dass I ein Intervall ist. Durch Betrachtung
der einzelnen Komponenten dürfen wir außerdem annehmen, dass n = 1 ist,
somit f und g reellwertige Funktionen sind. Gegeben r, s ∈ I mit r 6= s ist
Z b
Z b
g(r) − g(s)
1
f (s, t) dt
f (r, t) dt −
=
r−s
r−s
a
a
Z b
f (r, t) − f (s, t)
=
dt
r−s
a
Z b Z 1
∂f
(s + σ(r − s), t) dσ dt,
(44)
=
a
0 ∂s
wobei Bemerkung 5.7 auf die letzte Gleichheit führt. Da die Funktion
I × [a, b] × [0, 1] → R,
(r, t, σ) 7→
∂f
(s + σ(r − s), t)
∂s
stetig ist, ist nach Satz 3.34 (über die Stetigkeit parameterabhängiger Integrale) die Funktion
Z 1
∂f
h : I × [a, b] → R, h(r, t) :=
(s + σ(r − s), t) dσ
0 ∂s
stetig. Diese erfüllt
Z 1
Z 1
∂f
∂f
∂f
h(s, t) =
(s + σ(s − s), t) dσ =
(s, t) dσ =
(s, t).
| {z }
∂s
0 ∂s
0 ∂s
=0
75
(45)
Nochmalige Anwendung des Satzes liefert die Stetigkeit der Abbildung
Z b
Z b Z 1
∂f
(s + σ(r − s), t) dσ dt.
∆ : I → R, ∆(r) :=
h(r, t) dt =
a
a
0 ∂s
Diese erfüllt wegen (45)
Z
b
Z
h(s, t) dt =
∆(s) =
a
a
b
∂f
(s, t) dt.
∂s
(46)
Nun gilt nach (44) für r ∈ I \ {s}
Z b
g(r) − g(s)
∂f
= ∆(r) → ∆(s) =
(s, t) dt
r−s
a ∂s
für r → s, wobei die Stetigkeit von ∆ benutzt wurde und dann (46). Also
gilt (43).
2
Analoges gilt, wenn I ein (nicht notwendig offenes) nicht-entartetes Intervall ist.
Beispiel 5.9 Wir wollen das Integral
Z 1
xex dx
0
berechnen,
ohne partielle Integration zu benutzen. Hierzu beachten wir, dass
∂ x
xe = ∂t etx . Die Funktion
t=1
f (tx) = etx
f : ]0, ∞[ ×[0, 1] → R,
erfüllt
Z
1
Z
f (t, x) dx =
0
0
1
1
e dx = etx
t
tx
∂f
(t, x)
∂t
1
=
0
et − 1
,
t
∂ tx
ist stetig und hat die partielle Ableitung
= ∂t
e = xetx , welche stetig
in (t, x) ist. Nach Satz 5.8 gilt also
Z 1 Z 1
∂
x
xe dx =
etx dx
0
0 ∂t t=1
Z 1
d =
etx dx
dt t=1 0
d et − 1
=
dt t=1 t et et − 1 −
=
= e − (e − 1) = 1.
t
t2
t=1
76
Definition 5.10 Sei U ⊆ Rm offen und 2 ≤ k ∈ N. Rekursiv definieren wir:
Eine Funktion f : U → R heißt kmal stetig partiell differenzierbar (kurz:
partiell C k ), wenn f partiell C 1 und für alle i ∈ {1, . . . , m} die partielle
Ableitung
∂f
:U →R
∂xi
partiell C k−1 ist.
Bemerkung 5.11 (a) Also ist f genau dann partiell C k , wenn f stetig
ist, für alle j ∈ N mit j ≤ k und i1 , . . . , ij ∈ {1, . . . , m} die partielle
Ableitung
∂
∂
∂j f
(x) :=
f (x)
···
∂xij · · · ∂xi1
∂xij
∂xi1
für alle x ∈ U existiert und
∂j f
: U → Rm
∂xij · · · ∂xi1
stetig ist.
(b) Da wir partielle Ableitungen komponentenweise ausrechnen können, ist
f = (f1 , . . . , fn ) genau dann partiell C k , wenn jede der Komponenten
f1 , . . . , fn : U → R partiell C k ist. Weiter ist
∂ j f1
∂ j fn
∂j f
=
,...
∂xij · · · ∂xi1
∂xij · · · ∂xi1
∂xij · · · ∂xi1
2
f
(c) Statt ∂x∂i ∂x
schreibt man
i
holungen).
(d) Für
∂j f
∂xij ···∂xi1
∂2f
∂x2i
(und entsprechend bei mehrfachen Wieder-
gibt es auch die Notation fxi1 xi2 ···xij (die ich aber nicht be-
nutzen werde).
Beispiel 5.12 Die Funktion f : R2 → R, f (x, y) := x2 y 3 ist partiell C 2 ,
denn f ist stetig und hat die partiellen Ableitungen
∂f
(x, y) = 2xy 3
∂x
und
77
∂f
(x, y) = 3x2 y 2
∂y
erster Ordnung und die partiellen Ableitungen
∂ 2f
(x, y) = 2y 3 ,
2
∂x
∂ 2f
(x, y) = 6x2 y,
2
∂y
∂ 2f
(x, y) = 6xy 2 und
∂y∂x
zweiter Ordnung, die alle stetig sind.
∂ 2f
(x, y) = 6xy 2
∂x∂y
Wir beobachten, dass
∂ 2f
∂ 2f
(x, y) = 6xy 2 =
(x, y)
∂y∂x
∂x∂y
im vorigen Beispiel. Das ist kein Zufall: Bei der Bildung höherer partieller
Ableitungen kommt es auf die Reihenfolge nicht an (wie jetzt gezeigt wird).
Satz 5.13 Ist U ⊆ Rm offen und f : U → R partiell C 2 , so gilt für alle
i, j ∈ {1, . . . , m}
(∀x ∈ U )
∂ 2f
∂ 2f
(x) =
(x).
∂xi xj
∂xj xi
Beweis. Der Fall i = j ist trivial. Wir dürfen also annehmen, dass i 6= j und
(notfalls nach Umbenennen) das i < j. Da U offen ist, gibt es zu y ∈ U ein
k.k
k.k
r > 0 derart, dass B2r ∞ (y) ⊆ U . Wir dürfen annehmen, dass U = B2r ∞ (y).
Da wir zur Berechnung der partiellen Ableitung alle Variablen außer der iten
und jten sowieso festhalten, dürfen wir annehmen, dass m = 2 ist, i = 1 und
j = 2. Nach 5.7 haben wir
Z 1
1
∂f
(x1 + ut, x2 ) du
(f (x1 + t, x2 ) − f (x1 , x2 )) =
t
0 ∂x1
k.k∞
für (x1 , x2 ) ∈ Br
Funktion
(y) und t ∈ ]−r, r[ \{0}. Für festes t und x1 ist die
h : ]y2 − r, y2 + r[×[0, 1] → Rn ,
h(x2 , u) :=
∂f
(x1 + ut, x2 )
∂x1
stetig und besitzt die partielle Ableitung
∂h
∂ 2f
(x2 , u) =
(x1 + ut, x2 ).
∂x2
∂x2 ∂x1
78
Mit Satz 5.8 folgt
1
t
∂f
∂f
(x1 + t, x2 ) −
(x1 , x2 )
∂x2
∂x2
Z 1
∂f
∂
(x1 + ut, x2 ) du
=
∂x2 0 ∂x1
Z 1
∂ 2f
=
(x1 + ut, x2 ) du
0 ∂x2 ∂x1
Wir betrachten nun die stetige Funktion
g : ]−r, r[ ×[0, 1] → Rn ,
Dann ist
g(0, u) =
unabhängig von u, also
Z 1
Z
g(0, u) du =
0
0
1
g(t, u) :=
∂ 2f
(x1 + ut, x2 ).
∂x2 ∂x1
∂ 2f
(x1 , x2 )
∂x2 ∂x1
∂ 2f
∂ 2f
(x1 , x2 ) du =
(x1 , x2 ).
∂x2 ∂x1
∂x2 ∂x1
Nach dem Vorigen gilt für t ∈ ]−r, r[ \{0}:
1 ∂f
∂f
(x1 + t, x2 ) −
(x1 , x2 )
t ∂x2
∂x2
Z 1
Z 1
=
g(t, u) du →
g(0, u) du
0
(47)
0
∂ 2f
=
(x1 , x2 )
∂x2 ∂x1
nach dem Satz über die Stetigkeit Parameter-abhängiger Integrale. Nun
konvergieren die Differenzenquotienten in (47) für t → 0 aber auch gegen
∂2f
(x1 , x2 ). Die zwei Grenzwerte sind gleich und somit ist
∂x1 ∂x2
∂ 2f
∂ 2f
(x1 , x2 ) =
(x1 , x2 )
∂x2 ∂x1
∂x1 ∂x2
2
bewiesen.
79
Definition 5.14 Gegeben m ∈ N nennen wir ein m-Tupel α = (α1 , . . . , αm ) ∈
(N0 )m von Zahlen α1 , . . . , αm ∈ N0 einen Multiindex. Die Länge (oder Ordnung) eines Multiindex α ist
|α| := α1 + · · · + αm .
Ist U ⊆ Rm offen und f : U → Rn partiell C k , so definieren wir
∂ αf
∂ αm
∂ α1
·
·
·
:=
f.
∂xα
∂xα1 1
∂xαmm
Für x = (x1 , . . . , xm ) ∈ Rm definieren wir
xα := xα1 1 xα2 2 · · · xαmm
als das gezeigte Produkt von Potenzen der Komponenten (Monom). Eine
beliebige Polynomfunktion f : Rm → R lässt sich dann also schreiben in der
Form
X
f (x) =
aα x α
|α|≤`
mit einem ` ∈ N0 und Koeffizienten aα ∈ R. Die Summation ist über alle
Multiindizes α ∈ Nm
0 mit |α| ≤ `. Sind α = (α, . . . , αm ) und β = (β1 , . . . , βm )
m
Multiindizes in N0 , so schreiben wir
β ≤ α,
wenn βj ≤ αj für alle j ∈ {1, . . . , m}. Wir definieren
α! := α1 ! · · · αm !.
Ist β ≤ α, so schreiben wir zudem
α
α1
αm
:=
···
.
β
β1
βm
Bemerkung 5.15 Für U wie oben und r ∈ N0 schreiben wir C r (U, Rn ) für
den Vektorraum alle Funktionen f : U → Rm , die partiell C r sind.26 Für
r ∈ N und i ∈ {1, . . . , m} können wir die Abbildung
∂
: C r (U, Rn ) → C r−1 (U, Rn ),
∂xi
26
f 7→
∂f
∂xi
Mit C 0 -Funktionen meinen wir stetige Funktionen, und setzen
80
∂0f
∂x0
:= f .
betrachten. Dies ist ein Beispiel eines sogenannten Differentialoperators,
der einer Funktion (in diesem Fall) eine ihrer partiellen Ableitungen zuordnet. Die Notation ist nützlich im folgenden Beweis (der in der Vorlesung
übersprungen und Ihnen als Übung anvertraut wurde).
Folgerung 5.16 Es sei U ⊆ Rm offen und f : U → Rm partiell C k . Ist
` ∈ N mit ` ≤ k und sind i1 , . . . , i` ∈ {1, . . . , m}, so gilt
∂ `f
∂ `f
=
∂xi1 · · · ∂xi`
∂xiσ(1) · · · ∂xiσ(`)
für jede Permutation σ : {1, . . . , `} → {1, . . . , `}.
Beweis. Für j ∈ {1, . . . , m} sei αj die Anzahl der a ∈ {1, . . . , `} mit ia = j.
Wir setzen α = (α1 , . . . , αm ). Dann ist αj auch gleich der Zahl der a ∈
{1, . . . , `} mit iσ(a) = j. Es genügt daher zu zeigen, dass
∂
∂ αf
∂
···
f=
.
∂xi1
∂xi`
∂xα
(48)
Wir zeigen (48) per Induktion nach |α| = `. Für ` = 1 ist nichts zu zeigen
(es gibt dann nur die identische Abbildung als Permutation). Wir setzen
β := (β1 , . . . , βm ), wobei βj die Zahl der a ≥ 2 mit ia = j ist. Da |β| = ` − 1,
gilt per Induktion dann
∂
∂
∂β f
.
···
f=
∂xi2
∂xi`
∂xβ
Nach dem Satz von Schwarz können wir
∂
∂x1
∂
∂
∂xi1
von links nach rechts nacheinan-
der mit
(β1 mal), . . ., ∂xi −1 (βi1 −1 mal) vertauschen, ohne die partielle
1
Ableitung zu ändern, und erhalten
∂ ∂
∂
∂ ∂β f
···
f =
∂x1 ∂xi2
∂xi`
∂x1 ∂xβ
∂ ∂ β1
∂ βi1 −1 ∂ βi1
∂ βm
=
·
·
·
f
·
·
·
β
β
∂xi1 ∂xβ1 1
∂xβmm
∂x i1 −1 ∂x i1
i1 −1
=
∂1β
∂xβ1 1
α
···
∂ f
=
,
∂xα
81
i1
βi1 −1
βi 1
i1 −1
i1
∂ ∂
∂ βm
·
·
·
f
β
β
∂xβmm
∂x i1 −1 ∂xi1 ∂x i1
∂
2
da α = β + ei1 .
Satz 5.17 Es seien U ⊆ Rm offen und f : U → R, g, h : U → Rn partiell C k
und λ, µ ∈ R. Dann gilt:
(a) Die Linearkombination λg + µh ist partiell C k , mit
∂α
∂ αg
∂ αh
(λg + µh) = λ α = µ α
∂xα
∂x
∂x
(49)
für alle α ∈ Nm
0 mit |α| ≤ k.
(b) Das Produkt f g : U → Rn , x 7→ f (x)g(x) ist partiell C k und
∂ α (f g) X α ∂ β f ∂ α−β g
=
β
∂xα
∂xβ ∂xα−β
β≤α
(50)
m
für alle α ∈ Nm
0 mit |α| ≤ k, wobei die Summation über alle β ∈ N0
mit β ≤ α erfolgt.
So sieht also die Leibnizregel aus im Falle von Funktionen mehrerer Variablen.
Beweis. (a) Für Funktionen einer Variablen kennen wie dies aus Analysis 1.
Sind g und h partiell C 1 , so existiert nach Bemerkung 5.3 jede partielle
Ableitung von λg + µh erster Ordnung und es ist
∂g
∂h
∂
(λg + µh) = λ
=µ
.
∂xi
∂xi
∂xi
(51)
Als Linearkombination stetiger Funktionen ist ∂x∂ i (λg + µh) stetig. Also
ist λg + µh partiell C 1 . Für einen Induktionsbeweis nehmen wir an, dass
k ≥ 2 und die Aussage bereits für k − 1 statt k gilt. Per Induktionsannahme
ist ∂x∂ i (λg + µh) wegen der Summengestalt aus (51) partiell C k−1 , somit
λg + µh partiell C k . Per Induktionsannahme gilt weiter (49) für alle α =
(α1 , . . . , αm ) ∈ Nm
0 mit |α| ≤ k − 1. Ist |α| = k, so gibt es ein i ∈ {1, . . . , m}
mit αi > 0 (und wir wählen i kleinstmöglich). Somit ist auch β := α − ei ∈
Nm
0 . Per Induktionannahme gilt bereits
∂β
∂β g
∂β h
(λg
+
µh)
=
λ
=
µ
.
∂xβ
∂xβ
∂xβ
82
Leiten wir beide Seiten nochmals partiell nach xi ab, so ergibt sich (49) für α.
(b) Da sich partielle Ableitungen komponentenweise berechnen lassen,
dürfen wir n = 1 annehmen, d.h. f und g sind reellwertige Funktionen.
Sei α = (α1 , . . . , αm ) ∈ Nm
0 . Da sich partielle Ableitungen nach xm als
gewöhnliche Ableitungen bei festgehaltenen übrigen Variablen interpretieren
lassen (siehe Bemerkung 5.3), liefert die gewöhnliche Leibnizregel der Analysis 1:
αm X
∂ αm
αm ∂ βm f ∂ αm −βm g
.
(52)
(f g) =
βm
∂xαmm
∂xβmm ∂xαmm −βm
βm =0
Wir zeigen nun nacheinander für j = m, j = m − 1, . . ., j = 1, dass
αj
αm X
X
∂ αj
∂ αm
αj
αm
(f g) =
···
···
α ···
βj
βm
∂xαmm
∂xj j
βj =0
βm =0
!
!
∂ βm
∂ αm −βm
∂ βj
∂ αj −βj
· · · βm f
· · · αm −βm g . (53)
·
β
α −β
∂xm
∂xm
∂xj j
∂xj j j
Gelingt dies, so haben wir insbesondere für j = 1
α1
αm X
X
∂ αm
∂ α1
α1
αm
· · · αm (f g) =
···
···
β1
βm
∂xα1 1
∂xm
β1 =0
βm =0
α1 −β1
β1
∂
∂
∂ βm
∂ αm −βm
·
· · · βm f
· · · αm −βm g .
∂xβ1 1
∂xm
∂xα1 1 −β1
∂xm
Dies ist genau (50). Da alle partiellen Ableitungen bis zur Ordnung k existieren und durch (50) gegeben (und somit stetig) sind, ist f g eine C k Funktion und der Beweis beendet. lediglich (53) ist noch zu begründen. Für
j = m wurde die Formel in (52) bereits gezeigt. Gilt die Formel für j +1 statt
j, so können wir wie beim Beweis von (52) alle Variablen außer xj festhalten
in
αj+1
αm X
X
∂ αm
∂ αj+1
αj+1
αm
(f g) =
···
···
αj+1 · · ·
βj+1
βm
∂xαmm
∂xj+1
βj+1 =0
βm =0
!
!
βj+1
βm
αj+1 −βj+1
αm −βm
∂
∂
∂
∂
· · · βm f
· · · αm −βm g
·
βj+1
αj+1 −βj+1
∂xm
∂xm
∂xj+1
∂xj+1
83
und αj mal nach xj ableiten. Mit der Leibnizregel für Funktionen einer
Variablen erhalten wir daraus (53) für das gegebene j.
2
P
α
Beispiel 5.18 Polynomfunktionen p : Rm → R, p(x) =
|α|≤` aα x sind
partiell C k für alle k ∈ N (also partiell C ∞ ). Zum Beweis beobachten wir
∂c
zunächst, dass die partiellen Ableitungen ∂x
= 0 einer konstanten Funktion
i
k−1
wieder konstant sind, also partiell C
per Induktion, somit die konstante
∂ prj
k
Funktion x 7→ c partiell C . Da ∂xi = δi,j konstant und somit C k−1 ist,
ist weiter prj : Rm → R, x 7→ xj partiell C k und somit auch jedes Monom
q : x 7→ xα nach Satz 5.17 (b), weil ja q = prα1 1 · . . . · prαmm . Nun ist aber
eine allgemeine Polynomfunktion p eine Linearkombination von Monomen
xα , somit partiell C k nach Satz 5.17 (a).
Der folgende Satz wir im nächsten Kapitel bewiesen. Mit unseren momentanen Begriffen wäre das sehr mühsam. Einfacher ist es, dort mit einem Begriff
von totalen (statt nur partiellen) Ableitungen zu arbeiten.
Satz 5.19 Es seien U ⊆ Rm und V ⊆ Rn offen und f : V → R` sowie
g = (g1 , . . . , gn ) : U → Rn stetig partiell differenzierbare Funktionen derart,
dass g(U ) ⊆ V . Dann ist auch die Komposition
f ◦ g : U → R` ,
x 7→ f (g(x))
stetig partiell differenzierbar, und für alle i ∈ {1, . . . , m und x ∈ U gilt
n
X ∂f
∂g
∂(f ◦ g)
(x) =
(g(x))
(x)
∂xi
∂xj
∂xj
j=1
(wobei wir uns der schöneren Schreibweise wegen erlauben, Vektoren von
rechts mit Skalaren zu multiplizieren).
Folgerung 5.20 Sind f und g partiell C k in der Situation von Satz 5.19, so
ist auch f ◦ g partiell C k .
Beweis. Wir beweisen die Aussage per Induktion nach k ∈ N. Für k = 1
gilt sie nach Satz 5.19. Ist k ≥ 2 und gilt die Aussage für k − 1 statt k, so
ist f ◦ g nach Satz 5.19 partiell C 1 und
n
∂g
∂(f ◦ g) X ∂f
=
◦g
∂xi
∂xj
∂xj
j=1
84
(54)
für alle i ∈ {1, . . . , m}. Da g und
∂f
∂xj
partiell C k−1 sind, ist
∂f
◦g
∂xj
nach Induktionsannahme
partiell C k−1 . Nach Satz 5.17 (b) ist nun auch
∂g
∂f
k−1
◦ g ∂xj partiell C
und also auch die Summe (54), nach Satz 5.17 (a).
∂xj
2
Beispiel 5.21 Jede rationale Funktion in mehreren Variablen ist partiell
C ∞ . Seien nämlich p, q : Rn → R Polynomfunktionen mit q 6= 0. Dann ist
U := {x ∈ Rn : q(x) 6= 0} = q −1 (R \ {0})
eine offene Teilmenge von Rn . Da die Funktion
ι : R \ {0} → R,
y 7→
1
y
C ∞ ist (wie wir aus der Analysis 1 wissen) und somit (was bei Funktionen
einer Variablen das gleiche ist) partiell C ∞ , ist nach der Kettenregel die
Funktion
1
ι ◦ q|U : U → R, x 7→
q(x)
partiell C ∞ . Also ist auch das Produkt
U → R,
x 7→
p(x)
1
= p(x)
q(x)
q(x)
partiell C ∞ , nach Satz 5.17.
Beispiel 5.22 Den Raum Mn (R) = Rn×m der reellen (n × n)-Matrizen
können wir mit Rnm identifizieren, indem wir die Matrixeinträge in einer
festen Reihenfolge auflisten. Mit dieser Identifizierung gilt:
Die Menge GLn (R) aller invertierbaren (n × n)-Matrizen ist offen in Mn (R)
und die Abbildung
η : GLn (R) → Mn (R),
A 7→ A−1 ,
die einer invertierbaren Matrix ihre Inverse zuordnet, ist partiell C ∞ .
85
Die Determinante det : Mn (R) → R ist nämlich ein Polynom in den Matrixeinträgen, somit stetig und folglich ist
GLn (R) = {A ∈ Mn (R) : det(A) 6= 0} = det−1 (R \ {0})
offen in Mn (R). Die Abbildung η ist partiell C ∞ , wenn jede ihrer Komponenten es ist. Nun kann jedoch ein gegebener Matrixeintrag der inversen Matrix
A−1 nach der Cramerschen Regel ausgedrückt werden als Quotient zweier
Determinanten von Matrizen gebildet aus Einträgen von A (und Einsen und
Nullen und Vorzeichen); er ist somit eine rationale Funktion in A und somit
partiell C ∞ nach dem vorigen Beispiel.
Es ist nicht sehr natürlich, lediglich (für partielle Ableitungen) in Richtung der Koordinatenachsen abzuleiten. Allgemeiner kann man auch Richtungsableitungen in anderen Richtungen betrachten.
Definition 5.23 Es sei U ⊆ Rm offen und f : U → Rm eine Funktion. Sei
x ∈ U und y ∈ Rm . Wir definieren die Richtungsableitung (Dy f )(x) von f
an der Stelle x in Richtung y als
1
(Dy f )(x) := lim (f (x + ty) − f (x)) ∈ Rn
t→0 t
(mit t 6= 0), wann immer der Grenzwert existiert.
Analog kann man (Dy f )(x) ∈ F definieren, wenn Rm und Rn durch normierte
Räume (E, k.kE ) und (F, k.kF ) ersetzt werden.
Die folgende Beobachtung erleichtert uns spter einmal einen Beweis.
Bemerkung 5.24 In der Definition 5.5 stetig partiell differenzierbarer Abbildungen hätten wir die Stetigkeit von f nicht verlangen müssen, diese folgt
aus den anderen Annahmen. Genauer:
Ist U ⊆ Rm offen und f : U → Rn eine Abbildung derart, dass die partiellen
∂f
: U → Rn für alle i ∈ {1, . . . , m} existieren und stetig sind,
Ableitungen ∂x
i
so ist auch f stetig und somit f partiell C 1 .
Wir könnten dies jetzt per Hand nachrechnen, jedoch folgt die Aussage
auch aus späteren Resultaten (und dann können Sie hierher noch einmal
zurückkehren). Aus den Voraussetzungen folgt nämlich, dass f an jeder
Stelle total differenzierbar ist (für diesen Beweisteil von Satz 6.12 wird die
Stetigkeit von f nicht benutzt) und somit stetig, nach Bemerkung 6.2 (c).
86
6
Differenzierbarkeit
In diesem Kapitel lernen wir einen sehr natürlichen, Koordinaten-unabhängigen
Ableitungsbegriff (der totalen Ableitung) kennen. Die Kettenregel ist für
diesen einfach zu beweisen. Jenseits von Funktionen mehrerer reeller Variablen können sogar Abbildungen zwischen offenen Teilmengen von normierten
Räumen behandelt werden. Im endlich-dimensionalen Fall stellen wir die
Verbindung zu partiellen Ableitungen her.
Eine zentrale Grundidee der Differentialrechung für Funktionen einer Variablen war, eine Funktion f um eine Stelle x durch eine affin-lineare Funktion
(die Tangente an den Graphen von f ) zu approximieren. Wir haben gesehen, dass die Differenzierbarkeit von f in x äquivalent ist zur Existenz einer
affin-linearen Approximation von f um x. Im Falle von Funktionen mehrerer
Variablen benutzen wir letztere als Definition von Differenzierbarkeit:
Definition 6.1 Es seien (E, k.kE ) und (F.k.kF ) normierte Räume,27 U ⊆ E
eine offene Menge, f : U → F eine Abbildung und x ∈ U . Ist A : E → F
eine stetige lineare Abbildung (also A ∈ L(E, F )), so gilt
(∀y ∈ U )
f (y) = f (x) + A(y − x) + R(y)
(55)
mit R(y) := f (y) − f (x) − A(y − x). Dann ist also R(x) = 0. Kann A ∈
L(E, F ) so gewählt werden, dass28
R(y)
= 0 in F ,
y→x ky − xkE
lim
(56)
so nennen wir f (total) differenzierbar an der Stelle x.
Bemerkung 6.2 (a) Die Bedingung (56) bedeutet, dass
lim
y→x
kR(y)kF
= 0.
ky − xkE
(57)
In der Literatur gibt es hierfür auch die Kurzschreibweise R(y) = o(ky − xk)
(Landausches klein-o-Symbol).
27
28
Zum Beispiel E = Rm und F = Rn .
Für y 6= x.
87
(b) Ist f an der Stelle x differenzierbar, so ist A ∈ L(E, F ) durch (55) und
(56) eindeutig festgelegt, denn wir zeigen, dass für alle u ∈ E
1
A(u) = lim (f (x + tu) − f (x)) = (Du f )(x)
t→0 t
(58)
gleich der Richtungsableitung von f in x in der Richtung u ist. Dies ist klar,
wenn u = 0 (dann ist A(u) = 0 = (D0 f )(x)). Ist u 6= 0, so gilt
R(tu) 1
kR(x + tu)kF
(f (x + tu) − f (x)) − A(u) = t = kukE
t
ktukE
F
F
kR(x + tu)kF
= kukE
→0
k(x + tu) − xkE
für t → 0 (nach (a)), somit (wie benötigt) 1t (f (x + tu) − f (x)) → A(u).
Fortan – nachdem die Eindeutigkeit geklärt ist – schreiben wir f 0 (x) := A.
Dann ist also f 0 (x) die eindeutige stetige lineare Abbildung E → F mit
f (y) = f (x) + f 0 (x)(y − x) + R(y)
(59)
und (56). Wir nennen die lineare Abbildung f 0 (x) : E → F die (totale)
Ableitung von f an der Stelle x. Weiter nennen wir die Funktion
E → F,
y 7→ f (x) + f 0 (x)(y − x)
die affin-lineare Approximation von f um die Stelle x. Aus (58) wird die
wichtige und nützliche Formel
(∀u ∈ E)
f 0 (x)(u) = (Du f )(x).
(60)
(c) Ist f an der Stelle x total differenzierbar, so ist f an der Stelle x stetig.
Denn für y → x mit y 6= x gilt
kf (y) − f (x)kF = kf 0 (x)(y − x) + R(y)kF ≤ kf 0 (x)(y − x)kF + kR(y)kF
kR(y)kF
→0
≤ kf 0 (x)kop ky − xkE + ky − xkE
ky − xkE
(da alle drei Bestandteile gegen 0 gehen, siehe (a)).
88
(d) Ist E = Rm und F = Rn , so ist f = (f1 , . . . , fn ) und wir erhalten wir
nach (60) für den Standard-Einheitsvektor ej von Rm
 ∂f1

(x)
∂xj
∂f


..
f 0 (x)(ej ) = (Dej f )(x) =
(x) = 
.
.
∂xj
∂fn
(x)
∂xj
Die lineare Abbildung f 0 (x) : Rm → Rn entspricht bezüglich den StandardBasen also der (n × m)-Matrix
 ∂f1

∂f1
∂f1
(x) ∂x
(x) · · · ∂x
(x)
∂x1
m
2
 ∂f2 (x) ∂f2 (x) · · · ∂f2 (x) 


∂x2
∂xm
Jf (x) :=  ∂x1.
,
..
..
..


.
.
∂fn
(x)
∂x1
∂fn
(x)
∂x2
···
∂fn
(x)
∂xm
der sogenannten Jacobi-Matrix. Schreibt man Vektoren aus Rm und Rn als
Spaltenvektoren, so wird aus (59)
f (y) = f (x) + Jf (x)(y − x) + R(y),
wobei die Matrix und der Spaltenvektor in der üblichen Art und Weise multipliziert werden.
(e) Ist f : U → F an jeder Stelle x ∈ U differenzierbar und die Abbildung
f 0 : U → (L(E, F ), k.kop ),
x 7→ f 0 (x)
stetig, so nennen wir f stetig differenzierbar oder (kurz) eine C 1 -Funktion.
Beispiele 6.3 (a) Jede konstante Funktion f : E → F zwischen normierten
Räumen ist an jeder Stelle x ∈ E differenzierbar mit f 0 (x) = 0, denn es ist
f (y) = c = f (x) = f (x) + 0(y − x) + R(y)
mit R(y) = 0. Da die konstante Funktion f 0 : E → L(E, F ),
ist, ist f stetig differenzierbar.
x 7→ 0 stetig
(b) Jede stetige lineare Abbildung λ : E → F zwischen normierten Räumen
ist an jeder Stelle x ∈ E differenzierbar mit λ0 (x) = λ, denn wegen der
Linearität ist
λ(y) = λ(x) + λ(y − x) = λ(x) + λ(y − x) + R(y)
89
mit R(y) = 0. Da die konstante Funktion λ0 : E → L(E, F ), x 7→ λ stetig
ist, ist λ stetig differenzierbar.
(c) Seien (E1 , k.k1 ), (E2 , k.k2 ) und (F, k.kF ) normierte Räume und
β : E1 × E2 → F,
(x1 , x2 ) 7→ β(x1 , x2 )
eine stetige bilineare Abbildung. Dann ist β an jeder Stelle x = (x1 , x2 )
differenzierbar, denn für alle y = (y1 , y2 ) ∈ E1 × E2 gilt
β(y) = β(y1 , y2 ) = β(x1 + (y1 − x1 ), x2 + (y2 − x2 ))
= β(x1 , x2 ) + β(x1 , y2 − y1 ) + β(y1 − x1 , x2 ) + β(y1 − x1 , y2 − x2 )
= β(x) + A(y − x) + R(y)
mit der linearen Abbildung
A : E1 × E2 → F,
z = (z1 , z2 ) → β(x1 , z2 ) + β(z1 , x2 )
und R(y) := β(y1 − x1 , y2 − x1 ). Die lineare Abbildung A ist stetig, da
kA(z)kF ≤ kβ(x1 , z2 )kF + kβ(z1 , x2 )kF
≤ kβkop kx1 k1 kz2 k2 + kβkop kz1 k1 kx2 k2
≤ kβkop (kx1 k1 + kx2 k2 ) max{kz1 k1 , kz2 k2 } = Ckzk
(61)
mit C := kβkop (kx1 k1 + kx2 k2 ) und kzk := max{kz1 k1 , kz2 k2 }. Weiter gilt
kR(y)kF
ky − xk
kβkop ky1 − x1 k1 ky2 − x2 k2
ky − xk
kβkop ky − xk2
≤
= kβkop ky − xk → 0
ky − xk
≤
für y → x. Also ist β an der Stelle x differenzierbar mit β 0 (x) = A, d.h. es
ist
β 0 (x)(z) = β(x1 , z1 ) + β(z1 , x2 ).
Da β bilinear ist, ist β 0 (x)(z) linear in x (wie die vorige Formel zeigt), also
β 0 : E1 × E2 → L(E1 , ×E2 , F ), x 7→ β 0 (x) eine lineare Abbildung. Diese ist
stetig, denn nach (61) ist
kβ 0 (x)kop ≤ kβkop (kx1 k1 + kx2 k2 ) ≤ 2kβkop kxk
und somit kβ 0 kop ≤ 2kβkop . Also ist β stetig differenzierbar.
90
Bemerkung 6.4 Ist eine reellwertige Funtion f : U → R an der Stelle x ∈
∂f
∂f
(x) . . . ∂x
(x)) eine (1×n)-Matrix,
U ⊆ Rn differenzierbar, so ist Jf (x) = ( ∂x
n
1
die wir mit dem sogenannten Gradienten
(grad f )(x) := (∇f )(x) :=
∂f
∂x1
(x), . . . ,
∂f
(x) ∈ Rn
∂xn
identifizieren können.29
Der Gradient zeigt in die Richtung des steilsten Anstiegs.
Satz 6.5 Es sei U ⊆ Rn offen und f : U → R eine Funktion, die an der
Stelle x ∈ U differenzierbar ist, mit ∇f (x) 6= 0. Die Richtungsableitung
Du f (x)
in Richtung eines auf kuk2 = 1 normierten Vektors ist genau dann maximal,
wenn
1
u=
∇f (x).
k∇f (x)k2
In Gegenrichtung wird die Richtungsableitung minimal.
Beweis. Die Richtungsableitung ist
Du f (x) = f 0 (x)(u) = Jf (x)u = h∇f (x), ui.
Nach der Cauchy-Schwarzschen Ungleichung ist
|Du f (x)| = |h∇f (x), ui| ≤ k∇f (x)k2 kuk2 = k∇f (x)k2
wobei Gleichheit genau dann gilt, wenn u und ∇f (x) kollinear sind. Ist
u = k∇f (x)k−1
2 ∇f (x), so ist
∇f (x), ui = k∇f (x)k2
der maximale Wert und für u = −k∇f (x)k−1
2 ∇f (x) erhalten wir das Minimum h∇f (x), ui = −k∇f (x)k2 .
2
29
Das Symbol ∇ wird ”Nabla” ausgesprochen.
91
Satz 6.6 Es seien (X, k.kX ), (Y, k.kY ) und (Z, k.kZ ) normierte Räume, U ⊆
X und V ⊆ Y offene Mengen und x ∈ U . Ist g : U → Y eine an der Stelle
x differenzierbare Funktion mit g(U ) ⊆ V und f : V → Z, y 7→ f (y) an der
Stelle g(x) differenzierbar, so ist
f ◦ g : U → Z,
y 7→ f (g(y))
an der Stelle x differenzierbar und
(f ◦ g)0 (x) = f 0 (g(x)) ◦ g 0 (x).
(62)
Beweis. Wir können den Beweis der Kettenregel aus Analysis 1 wörtlich
wiederholen, es ist lediglich überall der Betrag |.| durch die entsprechende
Norm k.kX , k.kY bzw. k.kZ zu ersetzen. Sollten Sie nicht in meiner Analysis 1
gewesen sein, so können Sie den Beweis zum Beispiel in Otto Forsters Buch
“Analysis 2” nachlesen.
2
Beispiel 6.7 Wenn X = Rn , Y = Rm , Z = R` , so entspricht g 0 (x) der
Matrix Jg (x) und f 0 (g(x)) der Matrix Jf (g(x)). Aus der linearen Algebra
wissen wir, dass die Komposition linearer Abbildungen dem Matrixprodukt
entspricht. Aus (62) ergibt sich also die Formel
Jf ◦g (x) = Jg(x) (f )Jf (x)
für die Jacobimatrizen, wobei auf der rechten Seite das Matrixprodukt verwendet wird.
Bemerkung 6.8 Ist X = Rm in der Situation von Satz 6.6, so erhalten mit
Bemerkung 6.2 (d) und Satz 6.6
∂g
∂(f ◦ g)
(x) = (f ◦ g)0 (x)(ei ) = f 0 (g(x))(g 0 (x)(ei )) = f 0 (g(x))
(x)
∂xi
∂xi
mit den Standard-Basivektoren e1 , . . . , em für Rm , also
∂g
∂(f ◦ g)
(x) = f 0 (g(x))
(x) .
∂xi
∂xi
(63)
P
Ist zudem Y = Rn , so schreiben wir g = (g1 , . . . , gn ), also g(x) = nj=1 gj (x)ej
(wobei jetzt e1 , . . . , en die Standard-Basisvektoren für Rn sind). Dann ist
n
∂g
∂g
∂gn X ∂gj
1
(x) =
(x), . . . ,
(x) =
(x)ej
∂xi
∂xi
∂xi
∂xi
j=1
92
und wir erhalten durch Einsetzen in (63)
n
∂g
X
∂(f ◦ g)
∂gj
0
0
(x) = f (g(x))
(x) = f (g(x))
(x)ej
∂xi
∂xi
∂xi
j=1
=
n
X
∂gj
j=1
∂xi
(x) f 0 (g(x))(ej ) .
|
{z
}
∂f
(g(x))
= ∂y
j
Also gilt
n
n
X ∂gj
X ∂f
∂(f ◦ g)
∂f
∂gj
(x) =
(x)
(g(x)) =
(g(x))
(x)
∂xi
∂xi
∂yj
∂yj
∂xi
j=1
j=1
(64)
(wobei wir uns für die Endformel gestatten, Vektoren von Rechts mit Skalaren
zu multiplizieren).
Definition 6.9 Es seien (E, k.kE ) und (F, k.kF ) normierte Räume und U ⊆
E eine offene Menge. Eine Abbildung
f: U →F
wird stetig differenzierbar (oder kurz: C 1 ) genannt, wenn f an jeder Stelle
x ∈ U differenzierbar (somit insbesondere f stetig) ist und die Abbildung
f 0 : U → (L(E, F ), k.kop ),
x 7→ f 0 (x)
stetig ist. Ist f stetig, so nennen wir f eine C 0 -Abbildung. Rekursiv nennen
wir f eine C k -Abbildung (für eine natürliche Zahl k ≥ 2) wenn f eine C 1 Funktion und f 0 : U → (L(E, F ).k.kop ) eine C k−1 -Funktion ist. Wir nennen
f eine C ∞ -Funktion oder glatt, wenn f eine C k -Funktion ist für alle k ∈ N0 .
Beispiele 6.10 (a) Jede konstante Abbildung f : E → F zwischen normierten
Räumen ist glatt, denn f ist C k für alle k ∈ N0 per Induktion:
k = 0: Als konstante Funktion ist f stetig, also C 0 .
Sei nun k ≥ 1. Nach Beispiel (6.3) (a) ist f an jeder Stelle x differenzierbar, mit f 0 (x) = 0. Als konstante Funktion ist f 0 stetig, somit f eine
C 1 -Funktion. Per Induktionsvoraussetzung ist die konstante Funktion f 0
eine C k−1 -Funktion, somit f eine C k -Funktion.
93
(b) Jede stetige lineare Abbildung λ : E → F zwischen normierten Räumen
ist glatt. Nach Beispiel 6.3) (b) ist λ an jeder Stelle x ∈ E differenzierbar, mit
λ0 (x) = λ. Als konstante Funktion ist λ0 stetig, somit λ eine C 1 -Funktion.
Da nach (a) die konstante Funktion λ0 glatt ist und somit C k für alle k ∈ N0 ,
ist λ eine C k+1 -Funktion für alle k ∈ N0 und somit glatt.
(c) Jede stetige bilineare Abbildung β : E1 ×E2 → F zwischen normierten
Räumen ist glatt. Wir haben in Beispiel 6.3 (c) nämlich schon gesehen, dass
β an jeder Stelle differenzierbar und β 0 eine stetige lineare Abbildung ist und
somit glatt nach (b). Wie in (b) schließen wir, dass β glatt ist.
Lemma 6.11 Es seien E, F1 und F2 normierte Räume, U ⊆ E offen,
k ∈ N0 und λ : F1 → F2 eine bijektive stetige lineare Abbildung mit stetiger
Umkehrfunktion. Dann gilt: Eine Abbildung f : U → F1 ist genau dann C k ,
wenn λ ◦ f eine C k -Abbildung ist.
Beweis. Da wir λ◦f und λ−1 die Rollen von f und λ spielen können, genügt
es zu zeigen: Ist f eine C k -Abbildung, so ist auch λ ◦ f eine C k -Abbildung.
Für k = 0 ist dies klar, denn ist f stetig, so auch λ ◦ f . Ist nun k ≥ 1
und gilt die Aussage für k − 1 statt k, so sei f eine C k -Funktion. Da λ eine
C 1 -Funktion mit λ0 (y) = λ (für alle y ∈ E1 ) ist, ist nach der Kettenregel
λ ◦ f an jeder Stelle x ∈ U differenzierbar mit
(λ ◦ f )0 (x) = λ0 (f (x)) ◦ f 0 (x) = λ ◦ f 0 (x) = λ∗ (f 0 (x)) = (λ∗ ◦ f 0 )(x)
mit der Abbildung
λ∗ : L(E, F1 ) → L(E, F2 ) A 7→ λ ◦ A.
Man beachte, dass λ∗ linear ist. Weiter ist
kλ∗ (A)kop = kλ ◦ Akop ≤ kλkop kAkop ≤ kλkop
für alle A ∈ L(E, F1 ) with kAkop ≤ 1, somit
kλ∗ kop ≤ kλkop < ∞
und somit die lineare Abbildung λ∗ stetig. Da f 0 eine C k−1 -Abbildung und
λ∗ stetig linear ist, ist per Induktionsvoraussetzung
(λ ◦ f )0 = λ∗ ◦ f 0
94
eine C k−1 -Abbildung (also insbesondere stetig). Somit ist λ ◦ f eine C 1 Funktion und (λ ◦ f )0 eine C k−1 -Funktion, folglich λ ◦ f eine C k -Funktion.
2
Satz 6.12 Es sei U ⊆ Rm offen, k ∈ N0 und f = (F1 , . . . , fn ) : U → Rn eine
Abbildung. Dann sind äquivalent:
(a) f ist C k ;
(b) f ist partiell C k .
Beweis. Der Beweis ist per Induktion nach k ∈ N0 . Für k = 0 bedeutet C 0
und partiell C 0 beides das gleiche, nämlich Stetigkeit von f . Sei nun k ≥ 1
und gelte die Aussage für k − 1 an Stelle von k. Ist f eine C k -Abbildung,
so ist insbesondere f eine C 1 -Abbildung und somit existieren die partiellen
∂fi
(x) für alle i ∈ {1, . . . , n}, j ∈ {1, . . . , m} und x ∈ U (siehe
Ableitungen ∂x
j
obige Diskussion der Jacobi-Matrix). Wir können mittels der Standardbasen
L(Rm , Rn ) mit Rn×m identifizieren und somit (indem wir die Matrixeinträge
in einer festen Reihenfolge auflisten) mit Rnm . Sei
λ : L(Rm , Rn ) → Rnm
der so erhaltene Isomorphismus von Vektorräumen. Da alle Normen auf
endlich-dimensionalen Vetorräumen äquivalent sind, sind λ und λ−1 stetig.30
Da nun f 0 eine C k−1 -Abbildung ist, ist λ ◦ f 0 eine C k−1 -Abbildung (nach dem
vorigen Lemma), also partiell C k−1 (per Induktionsannahme) und somit sind
alle Komponenten von λ ◦ f 0 partiell C k−1 . Dies sind genau die Funktionen
∂fi
. Insbesondere sind diese stetig, also ist f partiell C 1 und alle partiellen
∂xj
Ableitungen sind partiell C k−1 , womit f partiell C k ist.
Ist umgekehrt f partiell C k mit k ≥ 1 und x = (x1 , . . . , xm ) ∈ U , so gibt
es (da U offen ist und alle partiellen Ableitungen stetig) zu ε > 0 ein δ > 0
derart, dass die Kugel Bδ (x) := {y ∈ Rm : ky − xk∞ < δ} in U enthalten ist
und
∂f
∂f
(y) −
(x) < ε
∂xj
∂xj
∞
30
x 7→ kλ−1 (x)kop ist äquivalent zu k.k∞ auf Rnm . Also gibt es C1 , C2 > 0 mit
C1 kλ−1 (x)kop ≤ kxk∞ ≤ C2 kλ−1 (x)kop . Daraus folgt kλ−1 kop ≤ C1−1 < ∞ und (indem wir x = λ(y) einsetzen) kλ(y)k∞ ≤ C2 kykop und somit kλkop ≤ C2 < ∞.
95
für alle y ∈ Bδ (x) und j ∈ {1, . . . , m}. Für alle y = (y1 , . . . , ym ) ∈ Bδ (x)
haben wir
f (y) = f (x) +
= f (x) +
m
X
j=1
m
X
(f (y1 , . . . , yk , xj+1 , . . . , xm ) − f (y1 , . . . , yj−1 , xj , . . . , xm ))
Z
(yj − xj )
0
j=1
1
∂f
(y1 , . . . , yj−1 , xj + t(yj − xj ), xj+1 , . . . , xm ) dt,
∂xj
wobei Bemerkung 5.7 benutzt wurde. Sei nun A : Rm → Rn die lineare
Abbildung


u1
m
X
∂f
 .. 
u =  .  7→
uj
(x).
∂xj
j=1
um
Für y wie zuvor ist dann
f (y) = f (x) + A(y − x) + R(y)
mit
R(y) := f (y) − f (x) − A(y − x)
Z 1
m
X
∂f
=
(yj − xj )
(y1 , . . . , yj−1 , xj + t(yj − xj ), xj+1 , . . . , xm ) dt
∂x
j
0
j=1
−
m
X
(yj − xj )
j=1
∂f
(x),
∂xj
was sich zusammenfassen lässt in der Form
Z 1
m
X
∂f
∂f
(yj −xj )
(y1 , . . . , yj−1 , xj + t(yj − xj ), xj+1 , . . . , xm ) −
(x) dt.
∂xj
∂xj
0
j=1
Somit ist
Z 1
m
X
∂f
kR(y)k∞
|yj − xj |
∂f
≤
(y1 , . . . , yj−1 , xj + t(yj − xj ), xj+1 , . . . , xm ) −
(x)
dt
ky − xk∞
ky
−
xk
∂x
∂x
∞
j
j
0
∞
j=1 |
{z }
|
{z
}
≤1
≤ε
≤ mε.
96
Wir haben gezeigt, dass
R(y)
= 0.
y→x ky − xk∞
lim
Also ist f an der Stelle x total differenzierbar mit f 0 (x) = A. Da (λ ◦ f 0 )(x)
i
die Komponenten ∂f
(x) hat und diese partiell C k−1 sind, ist λ ◦ f 0 partiell
xj
C k−1 , also C k−1 per Induktionsvoraussetzung. Nach Lemma 6.11 ist dann
auch f 0 eine C k−1 -Abbildung, insbesondere also stetig. Somit ist f eine
C 1 -Abbildung derart, dass f 0 eine C k−1 -Abbildung ist und somit ist f eine
C k -Abbildung.
2
Beweis der Kettenregel aus dem vorigen Kapitel (Satz 5.19). Sind f
und g partiell C 1 , so sind sie nach Satz 6.12 auch C 1 . Nach der Kettenregel
ist f ◦ g somit C 1 und nach Satz 6.12 folglich partiell C 1 . Schließlich gilt
nach (64) die gewünschte Formel für die partiellen Ableitungen von f ◦ g. 2
Bemerkung 6.13 Solange wir nur im Endlich-Dimensionalen arbeiten (also
Abbildungen zwischen offenen Mengen in Rm und Rn betrachten) werden wir
im folgenden meist nicht mehr zwischen C k -Funktionen unterscheiden und
Funktionen, die partiell C k sind (da beide Eigenschaften äquivalent sind,
nach Satz 6.12).
Bemerkung 6.14 Sind U ⊆ R und V ⊆ Rn offen,
γ = (γ1 , . . . , γn ) : U → Rn ,
t 7→ γ(t)
stetig differenzierbar mit γ(U ) ⊆ V und ist f : V → Z, y 7→ f (y) eine stetig
differenzierbare Funktion in einen normierten Raum Z, so ist γ eine Funktion
einer rellen Variablen t = x1 und aus (64) wird
n
X ∂f
γj
d(f ◦ γ)
(t) =
(γ(t)) (t).
dt
∂yj
dt
j=1
(65)
Diese Formel gilt auch dann, wenn U ⊆ R ein nicht offenes nicht entartetes
Intervall und γ ein C 1 -Weg ist. Wir machen uns dies klar, wenn U = [a, b].
Wir finden ein ε > 0 derart, dass
γ(b) + s
dγ
(b) ∈ V
dt
97
für alle s ∈ [0, ε[, denn diese Funktion ist stetig in s und V offen in Rn . Nach
(a) ∈ V für alle s ∈ ]−ε, 0]. Dann
Verkleinern von ε > 0 gilt zudem γ(a) + s dγ
dt
ist η : ]a − ε, b + ε[ → Rn ,

dγ
 γ(a) + (t − a) dt (a) wenn t ≤ a
γ(t)
wenn t ∈ [a, b]
η(t) :=

dγ
γ(b) + (t − b) dt (b) wenn t ≥ b
ein C 1 -Weg (wobei benutzt wird, dass an den Schnittstellen a und b die
rechts- und linksseitige Ableitung gleich, somit Differenzierbarkeit gegeben
ist). Die Kettenregel lässt sich auf f ◦ η anwenden und wir erhalten für alle
t ∈ ]a − ε, b + ε[ nach (65)
n
X ∂f
dηj
d(f ◦ η)
(t) =
(η(t))
(t).
dt
∂y
dt
j
j=1
Ist t ∈ [a, b], so ist η(t) = γ(t) und
wird also (65) für f ◦ γ.
dηj
(t)
dt
=
dγj
(t);
dt
aus der vorigen Formel
Bemerkung 6.15 Ist U ⊆ R ein offenes Intervall und γ : U → Rn ein C 1 Weg, so habe wir zwei Bedeutungen für γ 0 (t): Zunächst haben wir wie im
Kapitel über Wege den Tangentenvektor
γ 0 (t) =
1
dγ
(t) = lim
(γ(s) − γ(t)) ∈ Rn
s→t
dt
s−t
(mit s 6= t), für den wir im weiteren Verlauf der Bemerkung zur besseren
Unterscheidung dγ
(t) schreiben. Zum anderen haben wir die totale Ableitung
dt
γ 0 (t) ∈ L(R, Rn ),
die also eine lineare Abbildung γ 0 : R → Rn ist. Was haben die beiden
miteinander zu tun? Nun, nach Bemerkung 6.2 (d) gilt für die Funktion γ
der einen Variablen x1 = t:
∂γ
dγ
(t) =
(t) = γ 0 (t)(e1 ) = γ 0 (t)(1)
dt
∂x1
mit dem Standard-Baisvektor e1 = 1 für R = R1 . Es ist also
dγ
dγ
(t) = γ 0 (t)(1) und γ 0 (t)(s) = s (t),
dt
dt
98
weil aufgrund der Linearität γ 0 (t)(s) = γ 0 (t)(s · 1) = sγ 0 (t)(1) = s dγ
(t).
dt
n
n
Identifiziert man L(R, R ) mit R via
A 7→ A(1),
so wird also γ 0 (t) mit dγ
(t) identifiziert. Es wird stets aus dem Zusammendt
hang klar sein, welche der zwei Bedeutungen von γ 0 (t) gemeint ist.
7
Taylorentwicklung und lokale Extrema
... für Funktionen mehrerer Variablen. Das Skript-Kapitel wird später
ergänzt. Das Thema wird natürlich in jedem Analysis-Buch behandelt. Das
Nötigste finden Sie zB in O. Forsters Analysis 2.
8
Vektorfelder und Potentialfunktionen
Der Gradient ∇φ einer C 1 -Funktion φ : U → R auf einer offenen Menge
U ⊆ Rn ist ein Vektorfeld auf U , d.h. jedem x ∈ U wird ein Vektor in Rn
zugeordnet, nämlich ∇φ(x) ∈ Rn . In diesem Kapitel beschftigen wir uns
mit der fr Anwendungen wichtigen Frage, welche Vektorfelder F : U → Rn
Gradientenvektorfelder sind, d.h. wann wie oben eine C 1 -Funktion φ : U → R
existiert (eine sogenannte Potentialfunktion) mit F = ∇φ.
Definition 8.1 Sei U ⊆ Rn offen. Ein stetiges Vektorfeld auf U ist eine
stetige Funktion F = (F1 , . . . , Fn ) : U → Rn stetig. Jedem Punkt x ∈ U
wird also ein Vektor F (x) = (F1 (x), . . . , Fn (x)) ∈ Rn zugeordnet, der stetig
von x abhängt. Ist F wie zuvor eine C k -Funktion, so nennt man F ein C k Vektorfeld auf U . Die Komponenten F1 , . . . , Fn : U → R sind dann also C k .
Beispiele 8.2 F (x) := x definiert ein Vektorfeld auf Rn , das C ∞ (also glatt)
1
x wird ein glattes Vektorfeld auf Rn \ {0} definiert.
ist. Durch F (x) := kxk
2
Wegintegrale über Gradientenvektorfelder sind sehr leicht berechenbar:
Lemma 8.3 Es sei U ⊆ Rn offen, φ : U → R eine C 1 -Funktion und γ : [a, b] →
U ein Weg, der stückweise C 1 ist. Dann ist
Z
h∇φ, dsi = φ(b) − φ(a).
(66)
γ
99
Beweis. Es sei a = t0 < t1 < · · · < tm = b eine Zerlegung von [a, b] derart,
dass γ|[tj−1 ,tj ] ein C 1 -Weg ist für alle j ∈ {1, . . . , m}. Dann gilt
Z
n
X
dγk
∂φ
(γ(t))
(t)
dt
tj−1 k=1 ∂xk
Z tj
d
=
(φ ◦ γ)(t) dt
tj−a dt
tj
dγ
h∇φ(γ(t)), (t)i dt =
dt
tj−1
Z
tj
t
= [φ ◦ γ]tjj−1
= φ(γ(tj )) − φ(γ(tj−1 )),
wobei das zweite Gleichheitszeichen auf Bemerkung 6.14 beruht und dann das
Integral mit dem Hauptsatz der Differential- und Integralrechnung berechnet
wurde (beachte φ ◦ γ ist Stammfunktion für dtd (φ ◦ γ)). Wir schließen, dass
Z
m Z tj
X
dγ
h∇φ(γ(t)), (t)i dt
h∇φ, dsi =
dt
γ
j=1 tj−1
=
m
X
φ(γ(tj )) − φ(γ(tj−1 ))
j=1
= φ(γ(b)) − φ(γ(a)),
2
wie benötigt.
Eine Teilmenge U ⊆ Rn heißt sternförmig, wenn es einen Punkt z ∈ U gibt,
dessen Verbindungsstrecke mit jedem Punkt x ∈ U in U liegt, d.h.
(∀x ∈ U ) (∀t ∈ [0, 1]) z + t(x − z) ∈ U.
Zum Beispiel ist jede konvexe Menge (also insb. jede Kugel, jeder Quader
und ganz Rn ) sternförmig. Die Menge
R2 \ {(x, 0) : x ≤ 0}
(skizzieren!) ist sternförmig (mit z = (1, 0)), aber nicht konvex.
Der folgende Satz ist das Hauptziel dieses Kapitels.
Satz 8.4 Für ein stetiges Vektorfeld F = (F1 , . . . , Fn ) : U → Rn auf einer
offenen, nicht-leeren Menge U ⊆ Rn sind die folgenden drei Bedingungen
äquivalent:
100
(a) F ist ein Gradientenvektorfeld, d.h. es gibt eine C 1 -Funktion φ : U → R
mit F = ∇φ.
(b) Alle Wegintegrale über F längs geschlossenen Wegen verschwinden.
Genauer: Für jeden Weg γ : [a, b] → U , der geschlossen31 und stückweise
C 1 ist, gilt
Z
hF, dsi = 0.
γ
(c) Wegintegrale über F hängen nur vom Anfangs- und Endpunkt ab. Genauer:
Sind γ : [a, b] → U and η : [c, d] → U stückweise C 1 -Wege mit γ(a) =
η(c) und γ(b) = η(d), so ist
Z
Z
hF, dsi = hF, dsi.
γ
η
Ist F ein C 1 -Vektorfeld, so folgt aus (a) die folgende Integrabilitätsbedingung:
(d)
∂Fi
∂xj
=
∂Fj
∂xi
für alle i, j ∈ {1, . . . , n}.
Ist U sternförmig, so sind (a) und (d) äquivalent.
Beweis. (a)⇒(b): Ist F = ∇φ und γ : [a, b] → U ein geschlossener Weg, der
stückweise C 1 ist, so gilt nach dem vorigen Lemma
Z
hF, dsi = φ(γ(b)) − φ(γ(a)) = 0
γ
(weil γ(a) = γ(b)).
(b)⇒(c) Sind γ und η wie im Satz beschrieben, so erhalten wir einen
geschlossenen stückweise stetig differenzierbaren Weg θ, indem wir zuerst
γ durchlaufen und dann η rückwärts. In Formeln definieren wir den Weg
θ : [a, b + d − c] → U via
γ(t)
wenn t ∈ [a, b];
θ(t) :=
η(d − (t − b)) wenn t ∈ [b, b + (d − c)].
Dann gilt
Z
Z
0 = hF, dsi =
θ
31
θ|[a,b]
Z
Z
hF, dsi +
hF, dsi =
θ|[b,b+(d−c)]
also γ(a) = γ(b)
101
Z
hF, dsi −
γ
hF, dsi,
η
wobei für die letzte Gleichheit Satz 4.22 benutzt wurde. Die zwei fraglichen
Wegintegrale sind also gleich.
(c)⇒(a) Wir werden im Anschluss
an den Beweis zeigen, dass sich U
S
stets als eine Vereinigung U = j∈J Uj offener Mengen Uj ⊆ Rn schreiben
lässt, die paarweise disjunkt sind (also Ui ∩ Uj = ∅ für i 6= j in J) und
derart, dass zu allen x, y ∈ Uj eine stückweise stetig differenzierbarer Weg
γ : [a, b] → Uj von x nach y existiert (also mit γ(a) = x und γ(b) = y). Es
genügt, zu zeigen, dass auf jeder der Mengen Uj eine Potentialfunktion φj
existiert; dann ist φ : U → R, φ(x) := φj (x) für x ∈ Uj eine C 1 -Funktion mit
∇φ = F . Nach Ersetzen von U durch Uj dürfen wir also annehmen, dass
sich alle x, y ∈ U durch einen stückweise C 1 -Weg in U verbinden lassen. Wir
halten einen Punkt z ∈ U fest und definieren
Z
hF, dsi,
φ(x) :=
γx
∂φ
für
wobei γx ein Weg von z nach x in U ist. Wir zeigen nun, dass ∂x
i
alle i ∈ {1, . . . , n} existiert und mit Fi übereinstimmt (insb. also stetig ist).
Nach Bemerkung 5.24 ist dann φ eine C 1 -Funktion, und nach dem Vorigen
ist ∇φ = F . Gegeben i wie zuvor und x ∈ U existiert ein ε > 0 derart, dass
k.k∞
⊆ U . Wir setzen y := x − εei (mit dem i-ten Standard-Einheitsvektor
B2ε(x)
ei ) und wählen einen stückweise C 1 -Weg
γy : [a, b] → U
von z nach y. Für s ∈ ]0, 2ε[ ist dann ηs : [a, b + s] → U ,
γy (t)
wenn t ∈ [a, b]
ηs (t) :=
y + (t − b)ei wenn t ∈ [b, b + s]
ein stückweise C 1 -Weg von z nach y + sei , also nach x + (s − ε)ei (was gleich
x ist an der Stelle s = ε). Also ist
Z
φ(x + (s − ε)ei ) = φ(y + sei ) =
hF, dsi
Z
Z
ηs
b+s
hF, dsi +
=
γy
hF (y + (t − b)ei ), ei i dt
b
Z
b+s
Fi (y + (t − b)ei ).
= φ(y) +
b
102
Die rechte Seite kann nach s abgeleitet werden und liefert (nach dem Hauptsatz der Integral- und Differentialrechnung) den Integranden an der Stelle
b + s, es ist also
∂φ
(x + (s − ε)ei ) = Fi (y + (b + s − b)ei ) = Fi (y + sei ) = Fi (x + (s − ε)ei ).
∂xi
∂φ
Für s := b + ε erhalten wir ∂x
(x) = Fi (x).
i
1
(a)⇒(d): Ist F ein C -Vektorfeld und F = ∇φ mit einer C 1 -Funktion
∂φ
= Fi eine C 1 -Funktion für alle i ∈ {1, . . . , n} und somit φ eine
φ, so ist ∂x
i
C 2 -Funktion. Nach dem Satz von Schwarz ist somit
∂Fj
∂ 2φ
∂ 2φ
∂Fi
=
=
=
.
∂xi
∂xi ∂xj
∂xj ∂xi
∂xj
(d)⇒(a), wenn U sternförmig ist: Es sei z ∈ U ein Punkt derart, dass
γx (t) := z + t(x − z) ∈ U für alle x ∈ U und alle t ∈ [0, 1]. dann ist γx ein
C 1 -Weg von z nach x in U , mit γx0 (t) = x − z. Wir definieren mit selbigem
Z
Z 1
Z 1X
n
φ(x) :=
hF, dsi =
hF (z+t(x−z), x−zi dt =
Fj (z+t(x−z))(xj −zj ).
γx
0
0
j=1
Da der Integrand eine C 1 -Funktion von (z, t) ist, ist φ (als Konsequenz aus
dem Satz über parameterabhängige Integrale, Satz 5.8) stetig differenzierbar
und wir können die partiellen Ableitungen ins Integral ziehen. Dies ergibt
Z 1X
n
∂φ
∂
(x) =
Fj (z + t(x − z))(xj − zj )
∂xi
0 j=1 ∂xi
Z 1X
n
∂(xj − zj ) =
t(Di Fj )(z + t(x − z))(xj − zj ) + Fj (z + t(x − z))
dt
∂xi
0 j=1
| {z }
=δij
Z
1
Fi (z + t(x − z)) + t
=
0
n
X
(Dj Fi )(z + t(x − z))(xj − zj ) dt
j=1
{z
|
}
∂
= ∂t
tFi (z+t(x−z))
= [tFi (z + t(x − z))]t=1
t=0 = Fi (x),
wie benötigt. Beachten Sie, das für das dritte Gleichheitszeichen die Integrabilitätsbedingung Di Fj = Dj Fi benutzt wurde.
2
103
Bemerkung 8.5 Die Rotation (engl.: curl) eines C 1 -Vektorfelds
F = (F1 , F2 , F3 ) : U → R3
auf einer offenen Menge U ⊆ R3 ist das durch
 ∂F3
rot F (x) := (∇ × F )(x) := 
(x) −
−
−
∂x2
∂F1
(x)
∂x3
∂F2
(x)
∂x1
∂F2
(x)
∂x3
∂F3
(x)
∂x1
∂F1
(x)
∂x2


für x ∈ U definierte Vektorfeld rot F : U → R3 . Die Integrabilitätsbedingung
aus Satz 8.4 (d) ist zu
rot F = 0
äquivalent. Ist also U sternförmig, so ist ein C 1 -Vektorfeld F : U → R3 genau
dann ein Gradientenvektorfeld, wenn rot F = 0.
Für ebensolches F definiert man weiter seine Divergenz als die durch
(div F )(x) := (∇ · F )(x) :=
∂F2
∂F3
∂F1
(x) +
(x) +
(x)
∂x1
∂x2
∂x3
gegebene Funktion div F : U → R. Für jede C 2 -Funktion φ : U → R auf der
offenen Menge U ⊆ R3 ist nach der Integrabilitätsbedigung
rot(grad φ) = ∇ × (∇φ) = 0.
Man kann auch
∆φ := div(grad φ) = ∇ · (∇φ) =
∂ 2φ ∂ 2φ ∂ 2φ
+
+
∂x21 ∂x22 ∂x23
bilden. Die Abbildung ∆ : φ 7→ ∆φ wird Laplace-Operator genannt.
Um die im Beweis des Satzes gemachten Behauptungen zu begrnden, beschftigen wir uns kurz mit Wegkomponenten und Wegzusammenhang. Das Thema
wird in der Vorlesung Funktionentheorie weiter vertieft und dort sehr oft eine
Rolle spielen.
Definition 8.6 Ein topologischer Raum X heißt wegzusammenhängend, wenn
sich alle x, y ∈ X in X durch einen Weg verbinden lassen. d.h. es existiert
ein Weg γ : [a, b] → X mit Anfangspunkt γ(a) = x und Endpunkt γ(b) = y.
104
Jede konvexe MengeX ⊆ Rn ist wegzusammenhängend, denn man kann den
geradlinigen Weg [0, 1] → X, t 7→ x + t(y − x) benutzen. Auch sternförmige
Mengen X ⊆ Rn (in denen sich ein z mit allen Punkten geradlinig verbinden
lässt) sind wegzusammenhängend, den wir können x, y ∈ X durch den Polygonzug verbinden, der zuerst geradlinig von x nach z läuft, dann geradlinig
von z nach y.
Im vorigen Beweis wurden die folgenden zwei Lemmata benutzt.
Lemma 8.7 Ist U ⊆ Rn eine offene, wegzusammenhängende Menge,32 so
gibt es für alle x, y ∈ U einen Weg γ : [a, b] → U von x nach y, der stückweise
C 1 ist.
Beweis. Seien x, y ∈ U . Da U wegzusammenhängend ist, gibt es einen Weg
η : [a, b] → U mit η(a) = x und η(b) = y. Dann ist η([a, b]) kompakt als Bild
einer kompakten Menge unter einer stetigen Abbildung. Da U offen ist und
η([a, b]) ⊆ U , gibt es nach dem Satz über gleichmäßige Umgebungen also ein
ε > 0 derart, dass
(∀t ∈ [a, b]) Bε (η(t)) ⊆ U
(wobei Kugeln bzgl. k.k∞ gemeint sind). Da η nach Satz 3.36 gleichmäßig
stetig ist, gibt es ein δ > 0 derart, dass
(∀s, t ∈ [a, b]) |t − s| < ε ⇒ kη(t) − η(s)k∞ < ε.
(67)
Wir wählen eine Zerlegung a = t0 < t1 < · · · < tm = b von [a, b] derart, dass
tj − tj−1 < δ für alle j ∈ {1, . . . , m}. Nach (67) ist kη(tj ) − η(tj−1 )k∞ < ε,
also
k(s(η(tj ) − η(tj−1 ))k∞ = skη(tj ) − η(tj−1 )k∞ < ε
für alle s ∈ [0, 1] und somit
η(tj−1 ) + s(η(tj ) − η(tj−1 )) ∈ Bε (η(tj−1 )) ⊆ U.
Setzen wir
γ(t) := η(tj−1 ) +
32
t − tj−1
(η(tj ) − η(tj−1 ))
tj − tj−1
Es soll U also mit der induzierten Topologie wegzusammenhängend sein.
105
für j ∈ {1, . . . , m} und t ∈ [tj−1 , tj ], so ist also γ(t) ∈ U für alle t ∈ [a, b] und
somit ist der Polygonzug γ : [a, b] → U ein stückweiser C 1 -Weg mit γ(a) = x
und γ(b) = y.
2
Leider sind viele sehr natürliche offene Mengen U ⊆ Rn nicht wegzusammenhängend. Beispielsweise ist R \ {0} ⊆ R nicht wegzusammenhängend,33
denn es gibt keinen Weg γ in R \ {0 von −1 nach 1. Jedoch ist R \ {0}
immerhin die disjunkte Vereinigung zweier offener wegzusammenhängender
Mengen, nämlich
R \ {0} = ]−∞, 0[ ∪ ]0, ∞[.
Wir zeigen nun, dass Entsprechendes bei allen offenen Mengen U ⊆ Rn
möglich ist. Als Hilfmittel definieren wir:
Definition 8.8 Es sei X ein topologischer Raum. Wir nennen x, y ∈ X
verbindbar und schreiben x ∼ y, wenn sich x und y in X durch einen stetigen
Weg verbinden lassen, d.h. es existiert ein Weg γ : [a, b] → X mit γ(a) = x
und γ(b) = y.
Dann gilt:
Lemma 8.9 Für jeden topologischen Raum X gilt:
(a) Die Verbindbarkeitsrelation ∼ ist eine Äquivalenzrelation auf X.
(b) Die Äquivalenzklassen [x] := {y ∈ X : y ∼ x} sind wegzusammenhn̈gend.
Man nennt diese die Wegkomponenten von X.
(c) Die Wegkomponenten bilden eine Partition von X, d.h. X ist die Vereinigung der Wegkomponenten, diese sind nicht leer und für alle x, z ∈
X gilt:
[x] = [z]
oder
[x] ∩ [z] = ∅.
(d) Ist X eine offene Teilmenge von Rn , so sind auch alle Wegkomponenten
von X offen in Rn . Bezeichnet X/ ∼ die Menge aller Wegkomponenten,
so ist also X die disjunkte Vereinigung
[
X=
C
C∈X/∼
33
Ist γ : [a, b] → R stetig mit γ(a) = −1 und γ(b) = 1, so gibt es nach dem Zwischenwertsatz der Analysis 1 ein t ∈ [a, b] mit γ(t) = 0. Also ist γ kein Weg in R \ {0}.
106
von offenen, wegzusammenhängenden Mengen C (wobei C = [x] für
ein x ∈ X).
Beweis. (a) Reflexivität: Für jedes x ∈ X ist der konstante Weg [0, 1] → X,
t 7→ x ein Weg von x nach x, somit x ∼ x.
Transitivität: Gilt x ∼ y und y ∼ z, so gibt es einen Weg γ : [a, b]toX
von x nach y und einen Weg η : [c, d] → X von y nach z. Dann ist ζ : [a, b +
(d − c)] → X,
γ(t)
wenn t ∈ [a, b],
ζ(t) :=
η(c + (t − b)) wenn t ∈ [b, b + (d − c)]
ein Weg von x nach z, somit x ∼ z.
Symmetrie: Ist x ∼ y, so gibt es einen Weg γ : [a, b] → X von x nach y.
Dann ist η : [a, b] → X, η(t) := γ(b − (t − a)) ein Weg von y nach x, also
y ∼ x.
(b) Sind y, z ∈ [x], so gilt y ∼ x und z ∼ x, somit y ∼ z (nach (a)) und
folglich gibt es einen Weg γ : [a, b] → X von y nach z. Für jedes s ∈ ]a, b]
ist γ|[a,s] ein Weg von y nach γ(s) in X, somit γ(s) ∈ [y] = [x]. Also ist
γ([a, b]) ⊆ [x] und wir können γ als einen Weg von y nach z in [x] betrachten.
Somit ist [x] wegzusammenhängend.
(c) Dies gilt für jede Äquivalenzrelation und sollte Ihnen bekannt sein.
(d) Sei x ∈ X. Ist y ∈ [x], so gibt es (weil X ⊆ Rn offen ist) ein ε > 0 mit
Bε (y) ⊆ X (wobei die Kugel bezüglich k.k∞ in Rn gemeint ist). Die Kugel
Bε (y) ist konvex, also jedes z ∈ Bε (y) innerhalb Bε (y) (und somit innerhalb
X) mit y durch einen Weg verbindbar. Es ist also Bε (y) ⊆ [y] = [x] und
somit ist [x] offen. Alles andere wurde bereits gezeigt.
2
9
Die Sätze über die Umkehrfunktion und
implizite Funktionen
Das Kapitel wird später ergänzt. Das Nötigste dazu finden Sie in allen
Analysis-Büchern, zB in O. Forsters ”Analysis 2”.
107

Vorlesungsskript zum 2. Teil der Analysis 2

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können