Analysis III SS 2006 Prof. Dr. Bernd Dreseler

Werbung
Analysis III
SS 2006
Prof. Dr. Bernd Dreseler
Inhaltsverzeichnis
1 Gleichmäßige Konvergenz
1.1 Lokal gleichmäßige Konvergenz . . . . . . . . . . . . . . . . . . . . . . . .
1
5
2 Metrische Räume
2.1 Topologische Räume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
11
3 Stetigkeit
3.1 Kompaktheit . . . . . . . . . . . . . . . . .
3.2 Zusammenhang . . . . . . . . . . . . . . . .
3.3 Kurven im Euklidischen Raum . . . . . . . .
3.4 Differenzierbare Abbildungen . . . . . . . .
3.5 Richtungsableitungen, partielle Ableitungen
3.6 Mittelwert- und Schrankensätze . . . . . . .
3.7 Höhere Ableitungen . . . . . . . . . . . . . .
3.8 Das Taylorpolynom . . . . . . . . . . . . . .
3.9 Lokales Verhalten einer Funktion . . . . . .
3.10 Differentation parameterabhängiger Integrale
3.11 Reihen von Abbildungen . . . . . . . . . . .
3.12 Der Fixpunktsatz . . . . . . . . . . . . . . .
3.13 Der Umkehrsatz . . . . . . . . . . . . . . . .
3.14 Über das Lösen von Gleichungen . . . . . .
3.15 Extrema unter Nebenbedingungen . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
14
17
21
24
26
29
30
31
33
35
38
39
41
41
43
46
4 Differentialgleichungen (gewöhnliche)
4.1 Lineare Differentialgleichungen erster Ordnung . . . . . . . . . . . . . . . .
47
51
5 Untermannigfaltigkeiten
5.1 Tangentialraum . . . . . . . . . . . . . . . . . . .
5.2 Normalraum und Multiplikatorregel von Lagrange
5.3 Krümmung von Kurven . . . . . . . . . . . . . .
5.4 Ein Beispiel aus der Variationsrechnung . . . . . .
56
59
62
63
64
I
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
Gleichmäßige Konvergenz
Sei fn : D → C, n ∈ IN, eine Folge von Funktionen. Dann konvergiert (fn ) punktweise
gegen die Grenzfunktion f : D → C, falls für alle x ∈ D limn→∞ fn (x) = f (x). Frage:
Welche Eigenschaften hat die Grenzfunktion, welche Eigenschaften erbt die Grenzfunktion?
Sei z.B. x0 ∈ D und fn stetig in x0 für alle n ∈ IN. Stetigkeit von f im Punkte x0 ∈ D
bedeutet dann (wenn die fn punktweise gegen f konvergieren)
f
stetig
lim f (x) = f (x0 ) = n→∞
lim fn (x0 )
lim lim fn (x) = x→x
x→x0 n→∞
fn
stetig
=
0
lim lim fn (x).
n→∞ x→x0
Die Stetigkeit in x0 vererbt sich also, wenn die Limites links und rechts vertauscht werden
können.
Beispiele:
1. Die fn : [0, 1] → IR, fn (x) = xn , sind stetig und
( konvergieren punktweise gegen die
0
0≤x<1
nicht stetige Funktion f : [0, 1] → IR, f (x) =
.
1
x=1
1
0.8
0.6
0.4
0.2
00
0.2
0.4
0.6
0.8
1
√
2. fn : [0, 1] → IR, fn (x) = n1 n x + n−n , ist differenzierbar, n ≥ 1. Für festes n ist fn monoton wachsend. Also 0 ≤ fn (x) ≤ fn (1) ≤ n2 , also konvergiert fn (punktweise) gegen
die Funktion 0. Die Funktion 0 ist differenzierbar mit Ableitung 0. Die Ableitung von
1−n
1−n
1
fn ist ( n1 (x + n−n ) n )0 = n12 (x + n−n ) n , also fn0 (0) = n12 (n−n ) n = n12 nn−1 = nn−3
und damit fn0 (0) → ∞ für n → ∞. Die Grenzfunktion f ist zwar differenzierbar, aber
f 0 ist nicht (punktweise) Grenzwert der fn0 .
2
n
fn (x) =
√
x + n−n
1n
n
1
3. fn : [0, 1] → IR sei wie im Bild erklärt (stückweise linear).
1
n
1
2
Dann gilt fn (x) → 0 ∀x ∈ [0, 1], aber
−
R1
0
1
n
1
2
1
2
+
1
n
fn (x) dx = 1, also
1
R1
0
fn (x) dx −→
/
R1
0
0 dx = 0.
Definition: Sei fn : D → C, n ∈ IN, eine Folge von Funktionen. Dann konvergiert (fn )
gleichmäßig gegen die Grenzfunktion f : D → C, wenn es zu jedem ε > 0 ein N gibt
mit |fn (x) − f (x)| < ε für alle x ∈ D und alle n ≥ N.
ε
ε
f
x
Bemerkungen:
1. Gleichmäßige Konvergenz ⇒ punktweise Konvergenz.
2. fn konvergiert gleichmäßig gegen f ⇔ zu jedem ε > 0 gibt es ein N mit kfn −f kD < ε
für alle n ≥ N.
3. f : [a, b] → C ist Regelfunktion ⇔ es gibt eine Folge von Treppenfunktionen ϕn :
[a, b] → C die gleichmäßig gegen f konvergiert.
Satz 1: Die Folge fn : D → C konvergiere gleichmäßig gegen f : D → C. Falls die fn
stetig in x0 ∈ D sind, so ist auch f stetig in x0 .
Beweis: Sei ε > 0 vorgegeben. Dann gibt es ein N, so daß |fn (x) − f (x)| < 3ε für alle
x ∈ D und alle n ≥ N. Nun ist fN stetig in x0 . Zu dem gegebenen ε gibt es also ein
δ > 0 mit |fn (x) − fn (x0 )| < 3ε für alle x ∈ D mit |x − x0 | < δ. Für diese x folgt:
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| < ε. Also ist f stetig
in x0 . qed.
Satz 2: Die Folge fn : [a, b] → C konvergiere gleichmäßig gegen f : [a, b] → C. Falls die
fn Regelfunktionen sind, so ist f Regelfunktion und
Z b
a
f (x) dx = n→∞
lim
2
Z b
a
fn (x) dx.
Beweis: Da der Definitionsbereich ein kompaktes Intervall [a, b] ist, sind Regelfunktionen
als gleichmäßige Grenzwerte von Treppenfunktionen charakterisiert. Insbesondere gibt es
zu fn eine Treppenfunktion ϕn : [a, b] → C mit kfn − ϕn k < n1 Dann konvergiert ϕn
gleichmäßig gegen f : sei ε > 0 vorgegeben. Dann gibt es ein N ∈ IN mit kfn − f k < 2ε und
1
< 2ε für alle n ≥ N. Insgesamt folgt für n ≥ N:
n
kϕn − f k ≤ kϕn − fn k + kfn − f k <
1 ε
+ < ε.
n 2
Also ist f Regelfunktion. Nun gilt
also
Rb
a
fn (x) dx →
Rb
a
¯Z
¯ b
¯
¯ (fn
¯ a
¯
¯
− f )(x) dx¯¯¯
≤ |b − a| · kfn − f k,
f (x) dx. qed.
Satz 3: Sei I ein Intervall und fn : I → C eine Folge stetig differenzierbarer Funktionen
mit folgenden Eigenschaften:
1. fn konvergiert punktweise gegen f : I → C;
2. fn0 konvergiert gleichmäßig.
Dann ist f stetig differenzierbar und f 0 (x) = limn→∞ fn0 (x) für alle x ∈ I.
Beweis: Sei f ∗ : I → C die Grenzfunktion der fn0 . Nach Satz 1 ist f ∗ stetig auf I. Sei nun
a ∈ I fest gewählt. Für alle x ∈ I gilt dann
fn (x) =
Z x
a
fn0 (u) du + fn (a).
Nach Satz 2 folgt:
(1)
lim fn (x) = f (a) +
f (x) = n→∞
0
∗
Z x
f ∗ (u) du,
a
also ist f differenzierbar mit f = f . qed.
Cauchy-Kriterium: Sei fn : D → C eine Folge von Funktionen. Dann konvergiert (fn )
gleichmäßig genau dann, wenn zu jedem ε > 0 ein N existiert mit kfn − fm k < ε für alle
n, m ≥ N.
Beweis: Für alle x ∈ D gilt |fn (x)−fm (x)| ≤ kfn −fm k, also ist (fn (x)) eine Cauchy-Folge
für alle x ∈ D. Also existiert f (x) := limn→∞ fn (x). Falls nun ε vorgegeben ist und N wie
oben bestimmt ist, so gilt für alle x ∈ D und n ≥ N
lim fm (x) − fn (x)| = m→∞
lim |fm (x) − fn (x)| ≤ ε.
|f (x) − fn (x)| = | m→∞
Also konvergiert fn gleichmäßig gegen f . qed.
3
P
Definition: Eine Reihe ∞
fk : D → C konvergiert gleichmäßig,
k=1 fk von Funktionen
Pn
wenn die Folge der Partialsummen sn = k=1 fk gleichmäßig konvergiert. Im KonverP
genzfall bezeichnen wir die Grenzfunktion ebenfalls mit ∞
k=1 fk .
Das Cauchy-Kriterium liefert
P
Korollar 1: Die Reihe ∞
k=1 fk von Funktionen fk : D → C konvergiert genau dann
gleichmäßig, wenn zu jedem ε > 0 ein N existiert, so daß
° n
°
°X °
°
°
fk °°°
°
k=m
für alle n ≥ m ≥ N.
<ε
D
Daraus folgern wir
Korollar 2: Normale Konvergenz ⇒ gleichmäßige Konvergenz.
Das Korollar folgt aus der Dreiecksungleichung:
° n
°
°X °
°
°
fk °°°
°
k=m
D
≤
n
X
k=m
kfk kD .
Leibniz-Kriterium: Sei fk : D → IR, k ∈ IN, eine Folge von Funktionen , so daß gilt:
1. für jedes x ∈ D ist fk (x) monoton fallend,
2. (fk ) konvergiert auf D gleichmäßig gegen 0.
P
k
Dann konvergiert ∞
k=1 (−1) fk gleichmäßig auf D und für die Grenzfunktion f : D → IR
Pn
gilt kf − k=1 (−1)k fk kD ≤ kfn+1 kD
Beweis: Nach dem Leibniz-Kriterium für Reihen reeller Zahlen wissen wir, daß
Pn
k
k=1 (−1) fk (x) fürPalle x ∈ D konvergiert. Wir erhalten damit eine Grenzfunktion
k
f : D → IR, f (x) = ∞
k=1 (−1) fk (x). Wir müssen zeigen, daß die Folge der Partialsummen
gleichmäßig gegen f konvergiert. Dies folgt aus der behaupteten Abschätzung, die wir jetzt
beweisen.
P
k
Sei dazu n ∈ IN. Setze sm = m
k=n+1 (−1) fk , m ≥ n + 1.
1. n ungerade: Dann (für m ≥ n + 1)
sm (x) = fn+1 (x) − fn+2 (x) + fn+3 (x) − + . . . + (−1)m fm (x), also
sn+1 (x) = fn+1 (x) ≥ sn+3 (x) ≥ sn+5 (x) . . . → f (x) −
0 ≤ sn+2 (x) ≤ sn+4 (x) . . . → f (x) −
daher 0 ≤ f (x) −
Pn
k
k=1 (−1) fk (x)
n
X
(−1)k fk (x) und
k=1
(−1)k fk (x),
k=1
≤ fn+1 (x) für alle x ∈ D.
4
n
X
2. n gerade: Man erhält mit einem analogen Argument: −fn+1 (x) ≤ f (x)−
0 für alle x ∈ D.
Insgesamt erhalten wir für n ∈ N beliebig
qed.
¯
¯
n
¯
¯
X
¯
¯
¯f (x) −
f
k (x)¯
¯
¯
1.1
Lokal gleichmäßige Konvergenz
k=1
≤ |fn+1 (x)| ∀x ∈ D, also
°
°
°
°f
°
−
n
X
k
(−1)
k=1
°
°
fk °°°
D
Pn
k=1
fk (x) ≤
≤ kfn+1 kD .
Stetigkeit und Differenzierbarkeit sind lokale Eigenschaften, man kann daher die gleichmäßige Konvergenz ersetzen durch einen schwächeren Begriff:
Definition: Eine Folge von Funktionen fn : D → C, n ∈ IN, konvergiert lokal
gleichmäßig gegen die Grenzfunktion f : D → C, wenn es zu jedem x0 ∈ D eine
Umgebung U von x0 in D gibt, so daß (fn |U ) gleichmäßig gegen f |U konvergiert.
Bemerkungen:
1. gleichmäßige Konvergenz ⇒ lokal gleichmäßige Konvergenz ⇒ punktweise Konvergenz.
2. Seien U1 , . . . , Uk Teilmengen von D, so daß (fn |Ui ) gleichmäßig konvergiert für
1 ≤ i ≤ k. Dann konvergiert (fn |Sk Ui ) gleichmäßig.
i=1
3. Falls (fn ) lokal gleichmäßig gegen f : D → C konvergiert und die fn in x0 ∈ D stetig
sind, so ist f stetig in x0 .
Begründung: zu x0 gibt es eine Umgebung U von x0 ∈ D, so daß fn : U → C
gleichmäßig gegen f : U → C konvergiert. Sei nun ε > 0 vorgegeben. Dann gibt es
ein N ∈ IN, so daß |f (x) − fn (x)| < 3ε für alle x ∈ U und n ≥ N. Nun ist fN stetig in
x0 . Es gibt also eine Umgebung V von x0 in D, so daß |fN (x) − fN (x0 )| < 3ε für alle
x ∈ V . Nun ist W := U ∩ V eine Umgebung von x0 in D und für alle x ∈ W gilt
|f (x) − f (x0 )| ≤ |f (x) − fN (x)| + |fN (x) − fN (x0 )| + |fN (x0 ) − f (x0 )| <
ε ε ε
+ + = ε.
3 3 3
Daher ist f stetig in x0 .
In Satz 2 können wir statt [a, b] ein beliebiges Intervall I nehmen und gleichmäßig durch
lokal gleichmäßig ersetzen, um die erste Behauptung zu erhalten. Für a < b in I folgt die
zweite Behauptung in Satz 2 mit Argumenten weiter unten (Heine-Borel und Bemerkung
2 oben).
In Satz 3 können wir gleichmäßig durch lokal gleichmäßig ersetzen.
5
Definition:
1. Eine offene Überdeckung von X ⊂ IR ist eine Familie von offenen Intervallen (Iα )α∈A
S
mit X ⊂ α∈A Iα .
2. X ⊂ IR hat die Heine-Borelsche Überdeckungseigenschaft (HBÜ), wenn aus
jeder offenen Überdeckung (Iα )α∈A von X endlich viele Intervalle Iα1 , . . . , Iαm ausgewählt werden können mit X ⊂ Iα1 ∪ . . . ∪ Iαm .
Beispiele:
1. { n1 | n ∈ IN} hat nicht die HBÜ.
2. { n1 | n ∈ IN} ∪ {0} hat die HBÜ.
Satz: (Heine-Borel). Für X ⊂ IR sind äquivalent:
1. X ist kompakt.
2. X hat die HBÜ.
Beweis: (1) ⇒ (2): X kompakt, also beschränkt. Sei nun (Iα )α∈A eine offene Überdeckung
von X, die keine endliche Teilüberdeckung hat. Weil X beschränkt ist, gibt es ein Intervall
[a1 , b1 ] mit X ⊂ [a1 , b1 ]. Durch fortgesetztes Halbieren erhalten wir eine Intervallschachtelung [an , bn ], so daß [an , bn ] ∩ X nicht durch endlich viele der Iα überdeckt wird. Sei nun
T
xn ∈ [an , bn ] ∩ X und sei x der wohlbestimmte Punkt in n≥1 [an , bn ]. Dann folgt xn → x
für n → ∞. Also ist x ∈ X, denn X ist kompakt. Daher gibt es ein α mit x ∈ Iα . Nun ist
Iα ein offenes Intervall, es gibt also ein ε > 0 mit [x − ε, x + ε] ⊂ Iα , also ist [an , bn ] ⊂ Iα
für alle n genügend groß. Widerspruch.
(2) ⇒ (1): Sei (xn ) eine Folge in X ohne Häufungswert in X. Zu x ∈ X gibt es dann ein
offenes Intervall Ix mit x ∈ Ix , so daß zu Ix nur endlich viele n existieren mit xn ∈ Ix . Dann
ist (Ix )x∈X eine offene Überdeckung von X. Es gibt daher eine endliche Teilüberdeckung.
Widerspruch, denn IN ist nicht endlich. qed.
Korollar 1: Sei I ⊂ IR ein Intervall und fn : I → C, n ∈ IN, sei lokal gleichmäßig konvergent. Dann ist (fn |K ) gleichmäßig konvergent für jedes kompakte K ⊂ I.
Korollar 2: Sei I ⊂ IR ein kompaktes Intervall und fn : I → C, n ∈ IN, eine Folge von
Funktionen. Dann ist (fn ) gleichmäßig konvergent genau dann, wenn (fn ) lokal gleichmäßig
konvergent ist.
Zum Beweis von Korollar 1 und 2 benützt man, daß kompakte Intervalle die HBÜ besitzen.
Bemerkung 2 oben liefert dann die Behauptungen.
6
2
Metrische Räume
Sei X eine Menge. Eine Metrik auf X ist eine Abbildung d : X × X → [0, ∞], so daß
M1. d(x, y) ≥ 0 für alle x, y ∈ X und = 0 genau dann, wenn x = y;
M2. d(x, y) = d(y, x) für alle x, y ∈ X (Symmetrie);
M3. d(x, z) ≤ d(x, y) + d(y, z) für alle x, y, z ∈ X (Dreiecksungleichung).
Ein metrischer Raum ist eine Menge X zusammen mit einer Metrik d. Wir nennen d(x, y)
den Abstand oder die Distanz von x zu y. Oft sagen wir ”sei X ein metrischer Raum”
und meinen damit, daß auf der Menge X eine Metrik fest vorgegeben ist.
Beispiele:
1. X = IR oder X = C zusammen mit d(x, y) = |x − y|.
2. Sei X = IRn oder X = Cn und sei p ≥ 1. Setze dann
d(x, y)
v
u n
X
u
p
|x
=t
i
i=1
− yi |p ,
x = (x1 , . . . , xn ),
y = (y1 , . . . , yn ).
Trivialerweise sind M1 und M2 erfüllt. M3 ist die Minkowski-Ungleichung. Der wichtigste Fall ist p = 2; die entsprechende Metrik heißt Euklidische Metrik. Wenn
nichts anderes spezifiziert wird, denken wir uns IRn bzw. Cn mit der Euklidischen
Metrik versehen.
3. Sei F (D) = {f : D → C}. Für f, g ∈ F (D) setze d(f, g) = kf − gkD .
2
4. French Railway Metrik: X = IR und d(x, y) =
(
0
kxk + kyk
5. Diskrete Metrik: sei X eine Menge. Setze d(x, y) =
(
0
1
falls x = y
.
sonst
falls x = y
sonst
Beispiele 1 und 2 haben eines gemeinsam: Die Distanzfunktion rührt von einer Norm auf
dem zugrundeliegenden Vektorraum her.
Sei IK = IR oder IK = C und V ein Vektorraum über IK. Eine Norm auf V ist eine
Abbildung k k : V → IR, so daß
N1. kxk ≥ 0 für alle x ∈ V und kxk = 0 genau dann, wenn x = 0;
N2. kαxk = |α|kxk für alle x ∈ V , α ∈ IK (Homogenität);
N3. kx + yk ≤ kxk + kyk für alle x, y ∈ V (Dreiecksungleichung).
Falls V ein IK-Vektorraum mit Norm k k, dann ist d(x, y) = kx − yk eine Metrik auf V .
7
Definition: Sei (X, d) ein metrischer Raum.
1. Für x ∈ X, r > 0 heißt Kr (x) = {y ∈ X | d(x, y) < r} die offene Kugel um x
mit Radius r. Für r ≥ 0 heißt Kr (x) = {y ∈ X | d(x, y) ≤ r} die abgeschlossene
Kugel um x mit Radius r.
2. Eine Teilmenge U ⊂ X heißt Umgebung von x ∈ X, wenn es ein ε > 0 gibt mit
Kε (x) ⊂ U ; wir nennen Kε (x) auch die ε-Umgebung von x.
3. Eine Teilmenge U ⊂ X heißt offen, wenn U Umgebung ist von allen x ∈ U . Anders
gesagt: U ist offen, wenn es zu jedem x ∈ U ein ε > 0 gibt mit Kε (x) ⊂ U.
4. Eine Teilmenge A ⊂ X heißt abgeschlossen, wenn X − A offen ist.
Einige elementare Eigenschaften: Sei (X, d) ein metrischer Raum
1. ∅ und X sind offen, also auch abgeschlossen. Für x ∈ X und r > 0 ist Kr (x) offen
(d(x, y) < r, wähle ε > 0 mit d(x, y) + ε < r, die Dreiecksungleichung impliziert
Kε (y) ⊂ Kr (x)). Analog zeigt man: Kr (x) ist abgeschlossen.
2. Sei x ∈ X und U eine Umgebung von x. Dann ist x ∈ U und jede Obermenge von U
ist ebenfalls Umgebung von x. Die beliebige Vereinigung offener Mengen ist offen.
3. Seien U1 , . . . , Uk Umgebungen von x ∈ X. Dann ist U1 ∩ . . . ∩ Uk ebenfalls Umgebung
von x. Entsprechend gilt: der Durchschnitt endlich vieler offener Mengen ist offen.
4. Die endliche Vereinigung abgeschlossener Mengen ist abgeschlossen. Ein beliebiger
Durchschnitt abgeschlossener Mengen ist abgeschlossen.
5. Endliche Teilmengen von X sind abgeschlossen.
6. Zu x 6= y ∈ X gibt es Umgebungen U von x und V von y mit U ∩ V = ∅ (Hausdorff’sche Trennungseigenschaft).
Definition: Sei (xk ) eine Folge im metrischen Raum X. Dann konvergiert (xk ) gegen
a ∈ X, wenn es zu jeder Umgebung U von a ein N gibt mit xk ∈ U für alle k ≥ N. Anders
gesagt: zu ε > 0 gibt es N mit d(xk , a) < ε für alle k > N. Gegebenenfalls schreiben wir
limk→∞ xk = a oder xk → a für k → ∞ und nennen a den Grenzwert von (xk ).
Bemerkungen:
1. Eine Folge (xk ) in X hat höchstens einen Grenzwert. Denn seien a, b Grenzwerte
von (xk ) und sei ε > 0. Dann gibt es ein N, so daß d(xk , a) < ε ∀k > N und
d(xk , b) < ε ∀k > N. Damit d(a, b) ≤ d(a, xk ) + d(xk , b) < 2ε (k > N). Also a = b.
8
2. A ⊂ X ist abgeschlossen genau dann, wenn der Grenzwert jeder konvergenten Folge
(xk ) in X mit xk ∈ A ∀k ∈ IN ebenfalls in A liegt.
Beweis: Sei A abgeschlossen und (xk ) eine konvergente Folge mit xk ∈ A ∀k ∈ IN.
Sei a = lim xk . Nun ist X − A offen. Zu x ∈ X − A gibt es daher ein ε > 0 mit
Kε (x) ⊂ X − A, also xk ∈
/Kε (x) ∀k ∈ IN. Damit x 6= a, daher a ∈ A. Umgekehrt
sei nun der Grenzwert jeder in X konvergenten Folge (xk ) mit xk ∈ A ∀k ∈ IN in A
enthalten. Wenn A nicht abgeschlossen ist, dann ist X − A nicht offen. Dann gibt es
x ∈ X − A, so daß Kε (x) ⊂
/ X − A für alle ε > 0; also Kε (x) ∩ A 6= ∅ für alle ε > 0.
Daher gibt es zu k ∈ IN ein xk ∈ K 1 (x) ∩ A. Nach Konstruktion gilt xk ∈ A ∀k ∈ IN
k
und lim xk = x. Widerspruch. Also ist A abgeschlossen. qed.
Lemma 1: Eine Folge (xk ) in IRn konvergiert genau dann gegen a ∈ IRn , wenn
lim xki = ai ,
k→∞
1 ≤ i ≤ n (xk = (xk1 , . . . , xkn ), a = (a1 , . . . , an ).)
Beweis: Die Behauptung folgt sofort aus
|xki − ai | ≤ kxk − ak = d(xk , a) ≤
n
X
j=1
|xkj − aj |,
1 ≤ i ≤ n.
qed.
Definition: Eine Folge (xk ) in einem metrischen Raum X heißt beschränkt, wenn es
einen Punkt x ∈ X und ein r > 0, r < ∞ gibt mit d(x, xk ) ≤ r ∀k ∈ IN. Wenn (xk )
beschränkt ist, dann gibt es zu jedem x ∈ X ein r ∈ (0, ∞) mit d(xk , x) < r ∀k ∈ IN.
Satz 1: (Bolzano-Weierstraß). Eine beschränkte Folge in IRn besitzt eine konvergente
Teilfolge.
Beweis: Es gibt r > 0 mit kxk k ≤ r ∀k ∈ IN. Also ist |xki | ≤ r ∀k ∈ IN, 1 ≤ i ≤ n. Induktiv erhalten wir eine Teilfolge, so daß die entsprechenden Folgen der Komponenten einen
Grenzwert haben, vgl. das Argument für den Satz von Bolzano-Weierstraß für beschränkte
Folgen komplexer Zahlen. qed.
Definition: Eine Folge (xk ) in einem metrischen Raum heißt Cauchy-Folge , wenn zu
jedem ε > 0 ein N existiert mit d(xk , xl ) ≤ ε für alle k, l ≥ N. X heißt vollständig,
wenn jede Cauchy-Folge in X konvergent ist.
Bemerkung: Eine Norm k k auf einem IK−Vektorraum V induziert eine Metrik, d(x, y) :=
kx−yk. Wir nennen den normierten Vektorraum V einen Banachraum, wenn V bezüglich
dieser Metrik vollständig ist.
Satz 2: Der euklidische Raum IRn ist vollständig.
9
Beweis: Eine Cauchy-Folge (xk ) in IRn ist beschränkt, denn zu ε = 1 gibt es ein N mit
kxk − xl k2 ≤ 1 für alle k, l ≥ N. Dann folgt
kxk k2 ≤ max{kx1 k2 , . . . , kxN k2 } + 1
für alle k. Also ist (xk ) beschränkt und hat damit nach Bolzano-Weierstraß eine konvergente
Teilfolge xki → a für i → ∞. Weil (xk ) eine Cauchy-Folge ist, folgt xk → a für k → ∞. Sei
dazu ε > 0 vorgegeben. Dann gibt es N1 , N2 mit kxki − ak ≤ 2ε für i ≥ N1 ; kxk − xl k2 ≤ 2ε
für k, l ≥ N2 . Setze N = max{kN1 , N2 }. Für k ≥ N gilt dann
kxk − ak2 ≤ kxk − xkj k2 + kxkj − ak2 ,
wobei j ≥ N so gewählt ist, daß kj ≥ N ist. Dann
kxj − xkj k2 + kxkj − ak2 <
ε ε
+ = ε.
2 2
qed.
Definition: Zwei Normen k k und k k∗ auf einem IK−Vektorraum V heißen äquivalent,
wenn es Konstanten c1 , c2 > 0 gibt, so daß
c1 kxk ≤ kxk∗ ≤ c2 kxk ∀x ∈ V.
Bemerkung: Wegen der Homogenität reicht es, zu verlangen c1 ≤ kxk∗ ≤ c2 ∀x ∈ V, kxk =
1.
Lemma 2: Zwei Normen k k und k k∗ sind äquivalent genau dann, wenn für jede Menge
M ⊂ V gilt: M ist offen bezüglich k k genau dann, wenn M offen ist bezüglich k k∗ .
Beweis: Mit Kr (a) bezeichnen wir die Kugel um a mit Radius r bezüglich k k,
Kr (a) = {x ∈ V | kx − ak < r}; entsprechend Kr∗ (a) = {x ∈ V | kx − ak∗ < r}.
Falls nun k k und k k∗ äquivalent sind und c1 , c2 > 0 Konstanten wie in der Definition,
dann gilt
Kc∗1 r (a) ⊂ Kr (a) ⊂ Kc∗2 r (a) ∀a ∈ V, r > 0.
Eine Menge M ist also offen bezüglich k k genau dann, wenn M offen ist bezüglich k k∗ .
Seien nun die offenen Mengen beider Normen gleich. Nun ist K1 (0) offen bezüglich k k, also
auch bezüglich k k∗ (wegen unserer Annahme). Also gibt es ein ε > 0 mit Kε∗ (0) ⊂ K1 (0).
Für alle x ∈ V, x 6= 0 gilt damit
°
°
° εx °
°
°
°
°≤1
° 2kxk∗ °
und daher 2ε kxk ≤ kxk∗ für alle x ∈ V . Analog erhält man c2 . qed.
10
Satz 3: Sei V ein endlichdimensionaler IK−Vektorraum. Dann sind je zwei Normen auf
V äquivalent.
Beweis: Wir betrachten zunächst den Fall V = IRn , K = IR. Es genügt, die Äquivalenz
einer gegebenen Norm k k zur euklidischen Norm k k2 zu zeigen. Sei dazu e1 , . . . , en die
P
Standardbasis des IRn . Dann gilt für x = ni=1 xi ei ,
kxk ≤
qP
n
X
i=1
|xi |kei k ≤
v
v
u n
u n
uX
uX
2
t
|x | t ke k2
i
i=1
i
i=1
=
v
u n
uX
t
ke k2
i
i=1
· kxk2 = c2 kxk2 ,
n
2
c2 =
i=1 kei k . Sei nun S = {x ∈ V | kxk2 = 1} und c1 = inf{kxk | x ∈ S} ≥ 0. Dann
ist c1 > 0, sonst gibt es eine Folge (xk ) in S mit kxk k → 0 für k → ∞. Nun ist (xk ) in S,
also eine beschränkte Folge im eukidischen IRn . Nach Bolzano-Weierstraß können wir nach
Übergang zu einer Teilfolge annehmen xk → a für k → ∞, a = (a1 , . . . , an ). Nach Lemma
P
P
1 gilt limk→∞ xki = ai , 1 ≤ i ≤ n, also 1 = limk→∞ kxk k22 = limk→∞ ni=1 x2ki = ni=1 a2i und
damit a ∈ S. Andererseits gilt für alle k,
kak ≤ ka − xk k + kxk k ≤ c2 kxk − ak2 + kxk k → 0
x
k ≥ c1 ,
für k → ∞, also a = 0. Widerspruch. Also c1 > 0. Für alle x 6= 0 gilt daher k kxk
2
und damit c1 kxk2 ≤ kxk für alle x ∈ V . Allgemeiner Fall: Sei V ein endlichdimensionaler
IK−Vektorraum und seien k k, k k∗ zwei Normen auf V . Dann ist V IR−isomorph zu IRn
für ein geeignetes n. Wähle einen IR−Isomorphismus F : V → IRn . Definiere Normen auf
IRn durch
kxkF := kF −1 (x)k, kxk∗F = kF −1 (x)k∗ .
Dann sind k kF , k k∗F äquivalent, es gibt daher Konstanten c1 , c2 > 0 mit c1 kxkF ≤ kxk∗F ≤
c2 kxkF ∀x ∈ IRn , also c1 kvk ≤ kvk∗ ≤ c2 kvk ∀v ∈ V . qed.
Konsequenz: Für je zwei Normen auf endlichdimensionalem V stimmen die entsprechenden Systeme von offenen Mengen überein. Dieses System ist also kanonisch zu V assoziiert
und heißt die kanonische Topologie von V . Begriffe wie Konvergenz von Folgen etc. sind
unabhängig von der gewählten Norm.
2.1
Topologische Räume
Sei X eine Menge. Eine Topologie auf X ist eine Menge O von Teilmengen von X ,
genannt offen, so daß gilt
O1. Der Durchschnitt endlich vieler offener Mengen ist offen.
O2. Die Vereinigung (beliebig vieler) offener Mengen ist offen.
11
O3. ∅ und X sind offen.
Ein topologischer Raum ist eine Menge X zusammen mit einer Topologie.
Beispiele:
1. Sei X ein metrischer Raum mit Metrik d. Nenne U ⊂ X offen, wenn es zu jedem
x ∈ U ein ε > 0 gibt mit Kε (x) ⊂ U. Die Menge der offenen Mengen ist dann eine
Topologie von X, die von d induzierte Topologie.
2. Diskrete Topologie auf X: alle Teilmengen von X sind offen bezüglich der diskreten
Topologie.
3. Triviale Topologie auf X: O := {∅, X}.
Definitionen und Bemerkungen: Sei X ein topologischer Raum.
1. U ⊂ X heißt Umgebung von x ∈ X, wenn eine offene Teilmenge V von X existiert
mit x ∈ V ⊂ U . Es gilt:
(a) Der endliche Durchschnitt von Umgebungen von x ist eine Umgebung von x.
(b) Jede Umgebung von x enthält x und jede Obermenge einer Umgebung von x ist
eine Umgebung von x.
(c) Eine Teilmenge von X ist offen genau dann, wenn sie Umgebung jedes ihrer
Punkte ist.
(d) X ist Umgebung von jedem x ∈ X.
2. Eine Teilmenge A ⊂ X heißt abgeschlossen, wenn X − A offen ist. ∅ und X sind
abgeschlossen.
3. Sei M ⊂ X. Dann heißt x ∈ X
(a) innerer Punkt von M, wenn es eine Umgebung U von x gibt mit U ⊂ M. Die
Menge M ◦ aller inneren Punkte heißt Inneres oder offener Kern zu M. M ◦
ist die größte in M enthaltene offene Teilmenge von X.
(b) Berührungspunkt von M, wenn jede Umgebung von x einen Punkt von M
enthält. Punkte aus M sind Berührungspunkte. Die Menge M aller Berührungspunkte heißt Abschluß oder abgeschlossene Hülle von M. M ist die kleinste
abgeschlossene Teilmenge von X, die M enthält.
(c) Randpunkt von M, wenn jede Umgebung von x Punkte aus M und X −
M enthält. Randpunkte sind Berührungspunkte von M. Die Menge ∂M aller
Randpunkte von M erfüllt M = M ∪ ∂M, M ◦ = M − ∂M.
(d) Häufungspunkt von M, wenn jede Umgebung von x einen von x verschiedenen
Punkt aus M enthält.
12
(e) isolierter Punkt von M, wenn x ∈ M und es eine Umgebung U von x gibt
mit U ∩ M = {x}.
4. Sind O1 und O2 Topologien auf X mit O1 ⊂ O2 , so heißt O1 gröber als O2 und O2
feiner als O1 . Die feinste Topologie auf X ist die diskrete Topologie, die gröbste ist
die triviale Topologie.
5. Für eine Topologie O auf X nennen wir B ⊂ O Basis von O, wenn jedes U ∈ O
Vereinigung von Elementen aus B ist.
Beispiel: X metrisch, B = {Kε (x) | x ∈ X, ε > 0}.
Definition: Sei X topologischer Raum und (xk ) eine Folge in X. Dann heißt (xk ) konvergent gegen x ∈ X, wenn es zu jeder Umgebung U von x ein N gibt mit xk ∈ U für
alle k ≥ N.
Definition: Sei X ein topologischer Raum. Dann heißt X Hausdorff-Raum, wenn es zu
je zwei Punkten x, y ∈ X, x 6= y, Umgebungen U von x und V von y gibt mit U ∩ V = ∅.
(Haussdorffsches Trennungsaxiom).
Metrische Räume erfüllen das Hausdorffsche Trennungsaxiom.
Satz: Sei X ein Hausdorff-Raum. Dann hat eine Folge in X höchstens einen Grenzwert.
Gegebenenfalls schreiben wir limk→∞ xk = x.
Beweis: ist klar.
Zwei natürliche Verfahren , Topologien zu bestimmen:
1. Teilraumtopologie (Relativtopologie): Sei X ein topologischer Raum und M ⊂
X. Dann nennen wir U ⊂ X offen in M (oder offen relativ M), wenn es eine offene
Teilmenge V von X gibt mit U = M ∩ V (U ist i.a. nicht offen in X). Dies erklärt
eine Topologie auf M. Sei x ∈ M. Dann ist U Umgebung von x in M, wenn es eine
Umgebung V von x in X gibt mit U = M ∩ V .
2. Produkttopologie: Seien X1 , . . . , Xn topologische Räume. Auf X = X1 × . . . × Xn
erklären wir eine Topologie wie folgt: U ⊂ X nennen wir offen, wenn es zu jedem
x = (x1 , . . . , xn ) ∈ U (mit xi ∈ Xi , 1 ≤ i ≤ n) Umgebungen Ui von xi in Xi gibt mit
U1 × . . . × Un ⊂ U.
Bemerkung: Die kanonische Topologie auf IKn ist gleich der Produkttopologie (IKn =
IK × . . . × IK). Denn für x ∈ IKn gilt
Kε (x) = Kε (x1 ) × . . . × Kε (xn ),
wobei links die ε-Kugel von x bezüglich der k k∞ -Norm steht und rechts die ε-Kugeln um
xi bezüglich | |.
13
3
Stetigkeit
Definition: Seien X, Y topologische Räume und f : X → Y eine Abbildung. Dann heißt
f stetig in a ∈ X, wenn es zu jeder Umgebung V von f (a) in Y eine Umgebung U
von a in X gibt mit f (U) ⊂ V . Anders ausgedrückt: f ist stetig in a ∈ X, wenn für
jede Umgebung V von f (a) in Y die Menge f −1 (V ) eine Umgebung von a in X ist. Wir
nennen f stetig, wenn f in jedem Punkt a ∈ X stetig ist.
ε-δ-Kriterium: Seien X, Y metrische Räume und f : X → Y eine Abbildung. Dann
ist f stetig in a ∈ X genau dann, wenn es zu jedem ε > 0 ein δ > 0 gibt, so daß
dY (f (x), f (a)) < ε für alle x ∈ X mit dX (x, a) < δ.
Beweis: Sei f stetig in a und sei ε > 0. Nun ist U = KεY (f (a)) eine Umgebung von f (a)
in Y . Also gibt es eine Umgebung U von a in X mit f (U) ⊂ V . Nach Definition gibt es
dann ein δ > 0 mit KδX (a) ⊂ U. Also gibt es zu ε > 0 ein δ > 0 mit dY (f (a), f (x)) < ε
für alle x ∈ X mit dX (a, x) < δ. Umgekehrt gelte das ε-δ-Kriterium für a ∈ X. Sei V eine
Umgebung von f (a) in Y . Dann gibt es ein ε > 0, so daß KεY (f (a)) ⊂ V . Zu ε > 0 gibt es
δ > 0 mit f (KδX (a)) ⊂ KεY (f (a)). Wähle U = KδX (a). qed.
Folgenkriterium: Sei X metrisch, Y topologisch, f : X → Y eine Abbildung. Dann ist
f stetig in a ∈ X genau dann, wenn für jede Folge (xk ) in X mit limk→∞ xk = a gilt, daß
(f (xk )) gegen f (a) konvergiert.
Beweis: Sei f stetig in a und (xk ) eine Folge in X mit limk→∞ xk = a. Sei V eine Umgebung
von f (a). Dann gibt es eine Umgebung U von x mit f (U) ⊂ V . Zu U gibt es ein N mit
xk ∈ U ∀k ≥ N. Also f (xk ) ∈ V ∀k ≥ N. Umgekehrt gelte das Folgenkriterium in a.
Wenn f nicht stetig in a ist, dann gibt es eine Umgebung V von f (a) in Y , so daß in jeder
Umgebung U von a in X ein x existiert mit f (x)∈
/V . Nun ist X metrisch. Zu k ∈ IN gibt es
daher einen Punkt xk ∈ K 1 (a) mit f (xk )∈
/V . Nach Konstruktion gilt xk → a für k → ∞,
k
aber f (xk ) →
/ f (a) (denn f (xk )∈
/V ∀k ∈ IN). qed.
Beispiele:
1. Seien V , W normierte IK-Vektorräume und f : V → W linear. Falls V endlichdimensional ist, dann ist f stetig.
Beweis: Sei b1 , . . . , bn eine Basis von V . O.B.d.A können wir auf V folgende Norm
Pn
wählen: kxkV = max{|xi | | 1 ≤ i ≤ n} für x =
i=1 xi bi . Dann gilt
Pn
Pn
kf (x) − f (y)kW = k i=1 (xi − yi )f (bi )kW ≤ i=1 |(xi − yi )|kf (bi )k ≤ max{kf (bi )kW |
1 ≤ i ≤ n} · n · max{|xi − yi | | 1 ≤ i ≤ n} = Lkx − ykV . Dies ist eine LipschitzBedingung. Also ist f stetig (zu ε > 0 wähle δ = Lε > 0).
2. Sei V ein normierter IK-Vektorraum. Dann ist k k : V → IR stetig.
Beweis: ∀x, y ∈ V gilt
|kxk − kyk| ≤ kx − yk.
14
3. Sei X ein metrischer Raum, M ⊂ X. Definiere dM : X → [0, ∞] durch dM (x) =
inf y∈M d(x, y). Dann gilt ∀x, z ∈ X, y ∈ M:
d(x, y) ≤ d(x, z) + d(z, y)
und damit
dM (x) ≤ d(x, z) + dM (z).
Wir nehmen nun an, d(x, y) < ∞ ∀x, y ∈ X. Dann erhalten wir (Vertausche Rollen
von x und z): |dM (x) − dM (z)| ≤ d(x, z). Also ist dM stetig.
4. Sei X ein topologischer Raum. Dann ist die identische Abbildung idX : X → X
stetig.
5. Seien X, Y topologische Räume, f : X → Y stetig. Für M ⊂ X ist dann f |M : M →
Y stetig bezüglich der Relativtopologie auf M.
Definition: Seien X, X 0 metrische Räume mit Metriken d bzw. d0 und f : X → X 0 eine
Abbildung. Wir sagen, daß f eine Lipschitz-Abbildung ist, wenn es eine Konstante
L ≥ 0 gibt mit d0 (f (x), f (y)) ≤ Ld(x, y) für alle x, y ∈ X.
Bemerkung: Lipschitz-Abbildung sind stetig.
Regel 1: Seien X, X1 , . . . , Xn topologische Räume und f : X → X1 × . . . × Xn eine
Abbildung. Wir versehen X1 × . . . × Xn mit der Produkttopologie. Ferner schreiben wir
f = (f1 , . . . , fn ), also f (x) = (f1 (x), . . . , fn (x)) ∀x ∈ X mit fi (x) ∈ Xi , 1 ≤ i ≤ n. Dann
ist f stetig in a ∈ X genau dann, wenn die fi stetig in a ∈ X sind.
Beweis: Sei f stetig in a ∈ X. Sei V eine Umgebung von fi (a) in Xi . Dann gilt fi−1 (V ) =
{x ∈ X | fi (x) ∈ V } = {x ∈ X | f (x) ∈ W } = f −1 (W ) mit W = {(x1 , . . . , xn ) ∈
X1 × . . . × Xn | xi ∈ V }, W = X1 × . . . × Xi−1 × V × Xi+1 × . . . × Xn . Nach Definition
der Produkttopologie ist W Umgebung von f (a) (denn fi (a) ∈ V ). Weil f stetig ist, ist
f −1 (W ) eine Umgebung von a. Falls also f stetig ist in a, dann ist fi stetig in a, 1 ≤ i ≤ n.
Seien nun umgekehrt f1 , . . . , fn stetig in a. Sei W eine Umgebung von f (a) in X1 × . . . ×
Xn . Nach Definition der Produkttopologie gibt es Umgebungen Vi von fi (a) in Xi mit
V1 × . . . × Vn ⊂ W . Nun ist Ui = {x ∈ X | fi (x) ∈ Vi } eine Umgebung von a in X (denn
fi ist stetig). Also ist U1 ∩ . . . ∩ Un = U eine Umgebung von a in X. Für alle x ∈ U gilt
f (x) ∈ V1 × . . . × Vn . Also ist f stetig in a. qed.
Seien pi : Xi × . . . × Xn → Xi die Projektionen, 1 ≤ i ≤ n, pi (x) = xi für x = (x1 , . . . , xn ).
Dann sind die pi stetig.
Korollar 1: Sei X topologischer Raum, f : X → IKn eine Abbildung. Dann ist f stetig in
a ∈ X genau dann, wenn die fi = pi ◦ f stetig in a sind.
Bemerkung: Es stimmt nicht, daß eine Abbildung f : IKn → X stetig ist, wenn sie jeweils
stetig in xi ist, 1 ≤ i ≤ n. Standardbeispiel: f : IR2 → IR, f (x, y) = x22xy
für (x, y) 6= (0, 0),
+y2
15
f (0, 0) = 0. Für festes x (bzw. festes y) ist f (x, ·) : IR → IR, y 7→ f (x, y) (bzw. f (·, y))
stetig. Aber f ist nicht stetig in (0, 0). Sei dazu x = r cos ϕ, y = r sin ϕ mit r ≥ 0, dann
gilt für (x, y) 6= (0, 0): f (x, y) = 2 cos ϕ sin ϕ = sin 2ϕ. Für x = y 6= 0 gilt f (x, y) = 1.
Regel 2: Sei X ein topologischer Raum, f, g : X → IK Funktionen. Falls f, g stetig in
a ∈ X sind, so auch f + g und f · g. Falls g(x) 6= 0 ist, so ist auch fg stetig in a.
Beweis: Wir diskutieren den Fall f + g. Sei ε > 0 vorgegeben. Dann gibt es Umgebungen U, V von a ∈ X, so daß |f (x) − f (a)| < 2ε ∀x ∈ U und |g(x) − g(a)| < 2ε ∀x ∈ V .
Für alle x in der Umgebung W = U ∩ V von a gilt dann: |(f + g)(x) − (f + g)(a)| ≤
|f (x) − f (a)| + |g(x) − g(a)| < ε. qed.
Korollar 2: Polynome IKn → IK sind stetig. Rationale Funktionen sind auf ihrem natürlichen Definitionsbereich stetig. Ein Polynom ist eine Funktion IKn → IK der Form
P
p(x1 , . . . , xn ) = 0≤ij ≤m λi1 ,...,in xi1 · . . . · xinn . Rationale Funktionen sind Quotienten von
1≤j≤n
Polynomen.
Korollar 3: f : X → IKn g : X → IK seien stetig in a ∈ X. Dann ist g · f stetig in a, wobei
g · f erklärt ist durch gf (x) = (g(x)f1 (x), . . . , g(x)fn (x)).
f
g
Regel 3: Seien X, Y, Z topologische Räume, X → Y → Z. Falls f stetig in a, g stetig
in f (a), so ist g ◦ f stetig in a.
Beweis: Sei W Umgebung von g(f (a)). Dann ist V = g−1 (W ) Umgebung von f (a) in Y ,
denn g ist stetig in f (a). Also ist U = f −1 (V ) Umgebung von a in X, denn f ist stetig in
a. Nun ist U = f −1 (g −1 (W )) = (g ◦ f )−1 (W ). qed.
Satz 1: Seien X, Y topologische Räume, f : X → Y Abbildungen. Dann sind äquivalent:
1. f ist stetig,
2. das Urbild offener Mengen in Y ist offen in X,
3. das Urbild abgeschlossener Mengen ist abgeschlossen.
Beweis: (2) ⇔ (3) ist klar, denn abgeschlossene Mengen sind die Komplemente offener
Mengen.
(1) ⇒ (2): Sei V ⊂ Y offen, a ∈ f −1 (V ). Nun ist V Umgebung von f (a), denn V ist
offen. Also ist f −1 (V ) Umgebung von a, denn f ist stetig in a. Also ist f −1 (V ) offen, denn
a ∈ f −1 (V ) war beliebig.
(2) ⇒ (1): Sei a ∈ X und W eine Umgebung von f (a). Dann gibt es eine offene Menge V in
Y mit a ∈ V ⊂ W . Nun ist U = f −1 (V ) offen in X mit a ∈ U . Also ist U eine Umgebung
von a mit f (U) = V ⊂ W . Also ist f stetig in a. Weil a ∈ X beliebig war, folgt: f ist
16
stetig. qed.
Korollar 4: Sei f : X → IR stetig, c ∈ IR. Dann sind {x ∈ X | f (x) < c}, {x ∈ X |
f (x) > c}, {x ∈ X | f (x) 6= c} offen und {x ∈ X | f (x) ≤ c}, {x ∈ X | f (x) ≥ c},
{x ∈ X | f (x) = c} abgeschlossen.
Definition: Seien X, Y topologische Räume. Eine Abbildung f : X → Y heißt
Homöomorphismus, wenn f bijektiv ist und f und f −1 stetig sind.
Beispiele:
1. tan : (− π2 , π2 ) → IR
2. ln : (0, ∞) → IR
3. f : (0, ∞) → (0, 1), f (x) =
x
1+x
Sei X topologischer Raum, Y metrischer Raum und fn : X → Y , n ∈ IN, eine Folge von
Abbildungen. Dann konvergiert (fn ) gleichmäßig gegen f : X → Y , wenn es zu jedem
ε > 0 ein N gibt mit d(fn (x), f (x)) < ε ∀n ≥ N, x ∈ X.
Satz: Falls die Folge der fn : X → Y , n ∈ IN, gleichmäßig gegen f konvergiert und die
fn stetig sind, so ist f stetig.
Beweis: Das 3ε -Argument wie im ersten Kapitel.
3.1
Kompaktheit
Definition: Sei X ein topologischer Raum. Dann heißt X kompakt, wenn X die HeineBorel-Eigenschaft hat: Zu jeder offenen Überdeckung (Uα )α∈A von X gibt es endlich viele
Indizes α1 , . . . , αn mit Uα1 ∪ . . . ∪ Uαn = X. Kurz: jede offene Überdeckung von X enthält
eine endliche Teilüberdeckung. Sei X topologischer Raum und K ⊂ X. Dann nennen wir
K kompakt, wenn K mit der Relativtopologie ein kompakter topologischer Raum ist.
Definition: Sei X ein topologischer Raum. Dann heißt X folgenkompakt, wenn X die
Bolzano-Weierstraß-Eigenschaft hat: Jede Folge in X hat eine konvergente Teilfolge. Sei
X ein topologischer Raum und K ⊂ X. Dann heißt K folgenkompakt, wenn jede Folge
(xk ) in X mit xk ∈ K für alle k eine Teilfolge enthält, die gegen einen Punkt aus K
konvergiert.
Bemerkungen:
1. kompakt ⇒ folgenkompakt.
Sei nämlich X kompakter Raum und (xk ) eine Folge in X ohne Häufungswert. Zu
jedem x ∈ X gibt es dann eine offene Umgebung Ux von x, die nur endlich viele
Folgenglieder enthält. Dann ist (Ux )x∈X eine offene Überdeckung von X. Daher gibt
es x1 , . . . , xn ∈ X mit Ux1 ∪ . . . ∪ Uxn = X. Widerspruch, denn IN ist nicht endlich.
17
2. Sei X metrisch mit d(x, y) < ∞ ∀x, y ∈ X, K ⊂ X folgenkompakt ⇒ K ist beschränkt und abgeschlossen.
Falls K nicht beschränkt ist, dann gibt es xk ∈ K mit d(xk , x) > k ∀k ∈ IN und
x ∈ X fest gewählt. Nun hat die Folge (xk ) keine konvergente Teilfolge. Widerspruch.
Wenn K nicht abgeschlossen ist, dann gibt es einen Berührungspunkt x von K mit
x∈
/K. Wähle xk ∈ K 1 (x) ∩ K, k ∈ IN, dann ist (xk ) eine Folge in K mit xk → x∈
/K.
k
Widerspruch.
Satz 1: Sei X ein vollständiger metrischer Raum mit d(x, y) < ∞ ∀x, y ∈ K. Für K ⊂ X
sind folgende Aussagen äquivalent:
1. K ist kompakt.
2. K ist folgenkompakt.
3. K ist abgeschlossen, und zu jedem ε > 0 gibt es eine endliche Zahl von ε-Kugeln,
die K überdecken.
Beweis: (1) ⇒ (2) siehe oben, (2) ⇒ (3): Nach Bemerkung 2 ist K abgeschlossen. Wir
nehmen an, daß es ein ε > 0 gibt, so daß K nicht von endlich vielen ε-Kugeln überdeckt
wird. Wähle x1 ∈ K, x2 ∈ K − Kε (x1 ), x3 ∈ K − (Kε (x1 ) ∪ Kε (x2 )),. . ., und rekursiv
xk ∈ K − (Kε (x1 ) ∪ . . . ∪ Kε (xk−1 )), k ≥ 4. Dann gilt d(xi , xj ) > ε für alle i 6= j, also hat
(xk ) keine konvergente Teilfolge. Widerspruch.
(3) ⇒ (1): Wir nehmen an, daß (Uα )α∈A eine offene Überdeckung von K ist, die keine
endliche Teilüberdeckung enthält. Nun wird K von endlich vielen Kugeln mit Radius 12
überdeckt. Es gibt also eine Kugel K̃ mit Radius 12 , so daß K1 = K̃ ∩ K nicht von endlich
vielen der Uα überdeckt wird. Wähle x1 ∈ K1 . Rekursiv nehmen wir an, daß wir K1 ⊃
K2 ⊃ . . . ⊃ Kn erhalten haben mit Ki ⊂ Kugel vom Radius 2−i , so daß Ki nicht von
endlich vielen der Uα überdeckt wird und xi ∈ Ki . Weil Kn ⊂ K, kann Kn mit endlich
vielen Kugeln vom Radius 2−n−1 überdeckt werden. Es gibt also eine solche, K 0 , so daß
K 0 ∩ Kn nicht von endlich vielen der Uα überdeckt wird. Setze Kn+1 = K 0 ∩ Kn und wähle
xn+1 ∈ Kn+1 . Dann ist (xk ) eine Cauchy-Folge. Weil X vollständig ist, folgt xk → x ∈ X
für k → ∞. Weil K abgeschlossen ist, gilt x ∈ K (denn xk ∈ K ∀k ∈ IN). Also gibt es ein α
mit x ∈ Uα . Nun ist Kn enthalten in einer Kugel vom Radius 2−n . Für n groß genug folgt
Kn ⊂ Uα . Widerspruch. qed.
Satz 2: Für K ⊂ IRn sind folgende Aussagen äquivalent:
1. K ist kompakt.
2. K ist folgenkompakt.
3. K ist beschränkt und abgeschlossen.
18
Beweis: (3) ist offensichtlich äquivalent zu (3) in Satz 1. qed.
Satz 3: X kompakt, f : X → Y stetig ⇒ f (X) kompakt.
Beweis: Sei Uα eine offene Überdeckung von f (X). Dann ist Vα = f −1 (Uα ), α ∈ A,
eine offene Überdeckung von X. Also gibt es α1 , . . . , αn mit X = Vα1 ∪ . . . ∪ Vαn , also
f (X) = Vα1 ∪ . . . ∪ Vαn . qed.
Satz 4: X kompakt, f : X → IR stetig. Dann hat f ein Maximum und ein Minimum.
Beweis: f (X) ⊂ IR ist kompakt, also beschränkt und abgeschlossen. Also ist c = sup{y ∈
IR | y ∈ f (X)} ∈ f (X). Daher gibt es ein x ∈ X mit f (x) = c. In X hat f daher ein
Maximum. qed.
Definition: X, Y metrisch. Dann heißt f : X → Y gleichmäßig stetig, wenn es zu
jedem ε > 0 ein δ > 0 gibt mit dY (f (x), f (x0 )) < ε für alle x, x0 ∈ X mit dX (x, x0 ) < δ.
Satz 5: X, Y metrisch mit X kompakt, f : X → Y stetig. Dann ist f gleichmäßig stetig.
Tubenlemma: Seien X, Y topologische Räume mit Y kompakt. Sei W ⊂ X × Y offen
und enthalte {x0 } × Y . Dann gibt es eine Umgebung U von x0 in X mit U × Y ⊂ W . Wir
nennen {x0 } × Y die Faser über x0 und U × Y eine Tubenumgebung der Faser.
x0
{x0 } × Y
Y
X ×Y
W
X
Beweis: Zu y ∈ Y gibt es Umgebungen Uy von x0 in X und Vy von y in Y mit Uy ×Vy ⊂ W .
Die (Vy )y∈Y bilden eine offene Überdeckung von Y . Es gibt daher endlich viele y1 , . . . , ym
mit Vy1 ∪ . . . ∪ Vym = Y . Setze U = ∩m
i=1 Uyi . Dann ist U × Vyi ⊂ W, 1 ≤ i ≤ m, und daher
U × Y ⊂ W . qed.
Als erste Anwendung erhalten wir
Satz 6: Sei X, Y kompakt. Dann ist X × Y kompakt.
Als zweite Anwendung diskutieren
wir parameterabhängige Integrale: Beispiel: Die
R
Gammafunktion Γ(s) = 0∞ e−t ts−1 dt, s > 0. Hier ist s der Parameter; für jedes s ist Γ(s)
ein uneigentliches Integral. Wir diskutieren zwar nur den Fall bestimmter Integrale, die
Erweiterung auf den Fall uneigentlicher Integrale ist aber unter geeigneten Voraussetzungen
möglich.
Satz 7: Sei f : X × [a, b] → C stetig. Dann ist F : X → C, F (x) =
19
Rb
a
f (x, y) dy, stetig.
Beweis: Seien x0 ∈ X und ε > 0 vorgegeben. Die Funktion ϕ : X × [a, b] → C, ϕ(x, y) =
f (x, y) − f (x0 , y), ist stetig auf X × [a, b]. Also ist W = {(x, y) | |ϕ(x, y)| < ε} offen mit
{x0 } × [a, b] ⊂ W . Daher gibt es eine Umgebung U von x0 mit U × [a, b] ⊂ W . Für x ∈ U
gilt daher
|F (x) − F (x0 )| =
¯Z
¯ b
¯
¯ f (x, y) dy
¯ a
−
¯
¯
f (x0 , y) dy ¯¯¯
a
Z b
=
¯Z
¯
¯ b
¯
¯
¯
¯ ϕ(x, y) dy ¯
¯ a
¯
≤
Z b
a
|ϕ(x, y)| dy < ε|b − a|.
qed.
Dies können wir nun auf iterierte Integrale anwenden: X = [c, d], f : [c, d] × [a, b] → C
stetig, F wie oben.
Z Z
Z
d
b
d
f (x, y) dy dx =
c
a
F (x) dx
c
Seien c = x0 < x1 < . . . < xm = d und a = y0 < y1 < . . . < yn = b Zerlegungen und
P
zij ∈ [xi , xi+1 ] × [yj , yj+1 ], dann heißt i,j f (zij )∆xi ∆yj Riemannsche Summe (bez. der
gegebenen Daten), ∆xi = xi − xi−1 , ∆yj = yj − yj−1 .
Satz 8: Zu ε > 0 gibt es ein δ > 0, so daß
¯
¯
¯Z dZ b
¯
X
¯
¯
¯
f (x, y) dy dx −
f (zij )∆xi ∆yj ¯¯
¯
¯ c a
¯
i,j
< ε,
wenn die Feinheiten der Zerlegungen < δ sind.
Beweis: f ist gleichmäßig stetig auf [c, d] × [a, b], also gibt es ein δ > 0 mit |f (x, y) −
f (x0 , y 0 )| < ε, falls k(x, y) − (x0 , y 0 )k∞ < δ. Falls die Zerlegungen wie oben feiner sind als δ,
so gilt:
¯
¯
¯Z d Z b
¯
X
¯
¯
¯
¯
f
(x,
y)
dy
dx
−
f
(z
)∆x
∆y
ij
i
j¯
¯
¯ c a
¯
i,j
¯
¯
¯X Z x Z y
¯
X
i
j
¯
¯
¯
¯
f
(x,
y)
dy
dx
−
f
(z
)∆x
∆y
ij
i
j¯
¯
¯ i,j xi−1 yj−1
¯
i,j
X
i,j
=
<
ε∆xi ∆yj = ε|c − d||b − a|
qed.
Die Riemannsche Summe einer
stetigen Funktion d : [c, d] × [a, b] → C ist beliebig nahe
RbRd
an dem iterierten Integral a c f (x, y) dy dx für genügend feine Zerlegungen. Die Daten
einer Riemannschen Summe: Zerlegungen von [c, d] × [a, b] : c = x0 < . . . < xm = d,
a = y0 < . . . < yn = b und Vektoren zij ∈ [xi−1 , xi ] × [yj−1 , yj ]; dann ist die Riemannsche
P
Summe IZ,(zij ) (f ) = i,j f (zij )∆xi ∆yj . Die (nun nicht notwendigerweise stetige) Funktion
20
f : [c, d] × [a, b] → C heißt Riemann-integrierbar, wenn es eine Zahl I ∈ C gibt mit der
folgenden Eigenschaft: zu jedem ε > 0 gibt es ein δ > 0, so daß
|I − IZ,(zij ) (f )| < ε,
und ∆yj sind < δ). Gegebenenfalls
wenn nur die Feinheit von Z kleiner als δ ist (d.h. die ∆x
R i
heißt I das Riemann-Integral von f und wird mit [a,b]×[c,d] f (x, y) dy dx bezeichnet. Wir
R
R R
haben oben gesehen: wenn f stetig, dann [a,b]×[c,d] f (x, y) dy dx = ab cd f (x, y) dx dy. Im
Riemann-Integral spielt die Reihenfolge der Variablen keine Rolle. Für f stetig wie oben
folgt daher:
Z Z
Z Z
b
d
d
b
f (x, y) dx dy =
a
c
f (x, y) dy dx.
c
a
Beispiele:
1. Sei 0 < a < b: f : [0, 1] × [a, b] → IR, f (x, y) = xy .
R1 Rb y
x dy dx
0
a
=
R 1 xb −xa
0
ln x
dx.
2
RbR1 y
x dx dy
a
0
=
R b dy
a y+1
b+1
= ln a+1
=
2
−x
2. f : [0, 1] × [0, 1] → IR, f (x, y) = (xy2 +y
2 )2 für (x, y) 6= 0, 0 für (x, y) = 0. Dann ist f
nicht stetig in 0. Beim iterierten Integral darf man die Reihenfolge nicht vertauschen,
es gilt nämlich:
(a)
(b)
3.2
R1
0
π
.
4
R1
0
f (x, y) dx =
x
|1
x2 +y2 0
f (x, y) dy =
−1
,
x2 +1
=
also
1
,
1+y 2
R1 R1
0
0
also
R1 R1
0
0
f (x, y) dx dy =
f (x, y) dy dx = −
R 1 dx
0 x2 +1
R 1 dy
0 1+y 2
= arctan y|10 =
= − arctan x|10 = − π4 .
Zusammenhang
Ein topologischer Raum X heißt zusammenhängend, wenn es keine Zerlegung X = U ∪V
in disjunkte offene, nicht leere Teilmengen U und V gibt. Eine Teilmenge M ⊂ X heißt
zusammenhängend, wenn M mit der Relativtopologie zusammenhängend ist.
Satz 1: M ⊂ IR ist zusammenhängend ⇔ M ist Intervall.
Beweis: Falls M kein Intervall ist, dann gibt es Punkte x, y ∈ M und einen Punkt z
zwischen x und y mit z∈
/M. Sei O.B.d.A x < y. Sei U = {u ∈ M | u < z} 3 x, V = {v ∈
M | v > z} 3 y. Dann sind U, V offen, nicht leer, disjunkt und U ∪ V = M, weil z∈
/M.
Daher ist M nicht zusammenhängend.
Sei M ein Intervall und O.B.d.A enthalte M mindestens zwei Punkte. Sei M = U ∪ V eine
Zerlegung wie oben, x ∈ U , y ∈ V , wobei wir x < y annehmen. Dann ist [x, y] ⊂ M, denn
M ist ein Intervall. Sei z = sup[x, y] ∩ U. Nun ist V offen in M, also V ∩ [x, y] offen in
[x, y], also U ∩ [x, y] abgesclossen in [x, y]. Also z ∈ U ∩ [x, y]. Weil y ∈ V ist z < y. Nun
ist U ∩ [x, y] offen in [x, y], denn U ist offen in M. Wegen z < y gibt es daher ein ε > 0 mit
[z, z + ε) ⊂ U ∩ [x, y]. Widerspruch zur Definition von z. qed.
21
Satz 2: Sei f : X → Y stetig, M ⊂ X zusammenhängend ⇒ f (M) zusammenhängend.
Beweis: Seien U, V offen in Y mit U ∩ f (M), V ∩ f (M) disjunkt und nicht leer mit
f (M) ⊂ U ∪ V . Dann sind f −1 (U) und f −1 (V ) offen und f −1 (U ) ∩ M, f −1 (V ) ∩ M sind
disjunkt und nicht leer mit M ⊂ f −1 (U) ∪ f −1 (V ). Widerspruch. qed.
Satz 3: (Zwischenwertsatz) Sei f : X → IR stetig,X zusammenhängend, x, y ∈ X. Dann
gibt es zu allen c zwischen f (x) und f (y) ein z ∈ X mit f (z) = c.
Beweis: Sonst wäre U = {u ∈ X | f (u) < c}, V = {v ∈ X | f (v) > c} eine Zerlegung wie
oben. Widerspruch. qed.
Definition: Sei X ein topologischer Raum. Ein Weg oder eine Kurve in X ist eine
stetige Abbildung c : I → X, I ein Intervall.
Definition: Sei X topologischer Raum. Dann heißt X wegzusammenhängend, wenn
es zu allen x, y ∈ X einen Weg c : [a, b] → X gibt mit c(a) = x und c(b) = y.
Beispiele:
1. Konvexe Teilmengen des IRn sind wegzusammenhängend. Ist nämlich X ⊂ IRn konvex
und sind x, y ∈ X, so ist c : [0, 1] → X ⊂ IRn , c(t) = (1 − t)x + ty, definitionsgemäß
eine Kurve in X von x nach y.
2. Für n ≥ 2 ist IRn − {0} wegzusammenhängend.
Ein Weg c : [a, b] → IRn heißt Streckenzug, wenn es eine Zerlegung a = t0 < . . . < tn = b
gibt, so daß für ti−1 ≤ t ≤ ti gilt
c(t) =
ti − t
t − ti−1
c(ti−1 ) +
c(ti ).
ti − ti−1
ti − ti−1
Bemerkung: Wegzusammenhang ⇒ Zusammenhang.
Beweis: Wir nehmen an, daß X wegzusammenhängend, aber nicht zusammenhängend ist.
Falls U, V offen, disjunkt und nicht leer sind mit U ∪ V = X, so gibt es zu x ∈ U, y ∈ V
einen Weg c : [a, b] → X mit c(a) = x, c(b) = y. Dann sind c−1 (U ), c−1 (V ) offen, disjunkt,
nicht leer (a ∈ c−1 (U ), b ∈ c−1 (V )) mit c−1 (U) ∪ c−1 (V ) = [a, b]. Widerspruch zu Satz 1.
Satz 4: Sei U ⊂ IRn offen und zusammenhängend ⇒ U ist wegzusammenhängend.
Genauer: zu je zwei Punkten x, y aus U gibt es einen Streckenzug in U von x nach y.
Definition: Offene zusammenhängende Mengen des IRn heißen Gebiete.
Beweis: Sei x ∈ U fest gewählt. Sei V = {y ∈ U | ∃ Streckenzug in U von x nach y}.
Dann ist V 6= ∅, denn x ∈ V .
22
1. V ist offen. Sei nämlich y ∈ V . Weil U offen ist, gibt es ein ε > 0, so daß Kε (y) ⊂ U.
Sei z ∈ Kε (y), dann ist z ∈ V , denn die Strecke von y nach z liegt in Kε (y) ⊂ U (wir
können einen Streckenzug von x nach y um diese Strecke verlängern und erhalten
einen Streckenzug von x nach z). Also Kε (y) ⊂ V , also ist V offen.
2. W = U − V ist offen: Sei y ∈ W . Dann gibt es ein ε > 0 mit Kε (y) ⊂ U. Sei
z ∈ Kε (y). Wenn z ∈ V ist, dann gibt es einen Streckenzug von x nach z. Erweitert
um die Strecke von z nach y, die ganz in Kε (y) ⊂ U verläuft, erhalten wir einen
Streckenzug von x nach y, der ganz in U liegt. Widerspruch, also ist W offen.
Nun ist U zusammenhängend und V 6= ∅, also W = ∅. Daher U = V . qed.
Satz 5: Für n > 1 ist IRn nicht homöomorph zu IR.
Beweis: Sei h : IRn → IR ein Homöomorphismus, c = h(0). Dann ist h : IRn − {0} →
IR − {c} ebenfalls ein Homöomorphismus. Daher sind U = {x ∈ IRn − {0} | h(x) < c},
V = {x ∈ IRn − {0} | h(x) > c} disjunkte, nicht leere Teilmengen mit U ∪ V = IRn − {0}.
Aber IRn − {0} ist wegzusammenhängend, also zusammenhängend. Widerspruch.
Allgemeiner gilt: seien m 6= n und U ⊂ IRm , V ⊂ IRn offen. Dann sind U und V nicht
homöomorph (Brouwer).
Peanokurven: Beispiel: surjektive stetige Abbildungen c : [0, 1] → [0, 1] × [0, 1].
c2
c1
1
R
I
2
µ
6
7
R
5
ª
ª
µ
3
R
RµRµRµRµR
ªIªIªIªIª
RµRµRµRµR
ªIªIªIªIª
RµRµRµRµR
ªIªIªIªIª
RµRµRµRµR
ªIªIª IªIª
RµRµRµRµR
4
8
9
R
Hierbei ist c1 : [0, 1] → [0, 1] × [0, 1] der Streckenzug wie im Bild, bestehend aus 9 Strecken,
so daß c1 |[ i−1 , i ] genau die i-te Strecke ist, 1 ≤ i ≤ 9. Man erhält c2 aus c1 , indem man
9 9
die i-te Strecke zu c1 durch einen zu c1 ähnlichen Streckenzug ersetzt, 1 ≤ i ≤ 9, jeweils
parametrisiert auf [ i−1
, 9i ]. Sukzessive erhalten wir eine Folge von Kurven cn : [0, 1] →
9
[0, 1] × [0, 1] mit kcm − cn k∞ ≤ 3−m , m ≤ n, wenn wir in IR2 die Norm k(x, y)k∞ =
max{|x|, |y|} wählen. Also ist (cm ) eine Cauchyfolge, daher gibt es einen Grenzwert c :
[0, 1] → [0, 1] × [0, 1], und c ist stetig. Nun gilt cn (l/9m ) = cm (l/9m ) für alle n ≥ m mit
0 ≤ l ≤ 9m . Die Unterteilungen (Kästchen) werden immer feiner, zu x ∈ [0, 1] × [0, 1] und
ε > 0 gibt es daher m ∈ IN und 0 ≤ l ≤ 9m mit kcm (l/9m ) − xk∞ < ε. Aus dem eben
gesagten folgt cm (l/9m ) = c(l/9m ). Es folgt, daß jede Umgebung von x einen Punkt aus
Im(c) enthält. Nun ist Im(c) kompakt, daher Im(c) = [0, 1] × [0, 1]. Mit anderen Worten: c
ist surjektiv!
23
Satz: (Jordanscher Kurvensatz) Sei c : [a, b] → IRn stetig, a < b. Ferner sei c(x) 6= c(y)
für alle x 6= y in [a, b], außer c(a) = c(b). Dann besteht IR2 − Im (c) aus genau zwei
Zusammenhangskomponenten, genau eine davon ist beschränkt. Diese nennt man das
innere Gebiet, die andere das äußere Gebiet zu c.
3.3
Kurven im Euklidischen Raum
Sei I ein Intervall. Eine Abbildung c : I → IRn ist genau dann stetig, wenn die Komponentenfunktionen ci : I → IR stetig sind, c = (c1 , . . . , cn ). Eine Kurve in IRn ist eine
stetige Abbildung c : I → IRn . Wir nennen c differenzierbar, bzw. stetig differenzierbar,
bzw. integrierbar etc., wenn die Komponentenfunktionen diese Eigenschaft haben. Das Bild
von c nennen wir auch die Spur von c. Den Parameter von c fassen wir auch häufig als
Zeitparameter auf. Wenn c differenzierbar ist, so heißt ċ(t) = (c˙1 (t), . . . , c˙n (t)) der Geschwindigkeitsvektor oder die Ableitung oder der Tangentialvektor von c in t. Die
Geschwindigkeit in t ist kċ(t)k. Wir nennen c regulär in t, wenn ċ(t) 6= 0 ist. Falls
I = [a, b], so nennen wir c(a) den Anfangspunkt von c und c(b) den Endpunkt von c.
Wir sagen, c verbindet c(a) mit c(b). Wir nennen c stückweise stetig differenzierbar,
wenn es eine Unterteilung a = t0 < . . . < tm = b gibt, so daß c|[ti−1 ,ti ] stetig differenzierbar
ist. Beispiel: Streckenzüge.
Beispiele:
1. c : IR → IR2 , c(t) = p + r(cos t, sin t), wobei p ∈ IR2 , r > 0 fest gewählt sind. Für alle
t gilt kc(t) − pk = r (Kreis mit Radius r um p).
2. Ellipse: c(t) = (a cos t, b sin t), t ∈ IR.
3. Neilsche Parabel: c(t) = (t2 , t3 ) ist stetig differenzierbar, aber die Spur von c hat eine
Spitze in t = 0. Die Punkte auf der Spur von c erfüllen die Gleichung x3 = y 2 . Es gilt
ċ(0) = 0 (allgemein ċ(t) = (2t, 3t2 )).
4. Schraubenlinie: c : IR → IR3 , c(t) = (cos t, sin t, ht), wobei h > 0 fest gewählt ist.
24
5. parametrisierte Graphen: f : I → IR sei eine Funktion, setze dann c(t) = (t, f (t)),
t ∈ I.
Sei c : I → IRn eine Kurve, Z = {t0 , . . . , tm } ⊂ I mit t0 < . . . < tm . Wir erhalten ein
P
∗
Sehnenpolygon der Länge LZ (c) = m
i=1 kc(ti ) − c(ti−1 )k. Wenn Z durch Hinzunahme
weiterer Punkte aus Z entsteht, dann gilt LZ ∗ (c) ≥ LZ (c) (Dreiecksungleichung). Wir
nennen c rektifizierbar, wenn L(c) := supZ LZ (c) nicht ∞ ist. Wir nennen L(c) die
Länge von c.
Satz 1: Sei c : [a, b] → IRn stetig differenzierbar. Dann gilt
L(c) =
Z b
a
kċ(t)k dt.
Genauer gilt: zu ε > 0 gibt es ein δ > 0 mit
¯
¯
Z b
¯
¯
¯
¯
¯LZ (c) −
¯
k
ċ(t)k
dt
¯
¯
a
<ε
wenn die Feinheit der Zerlegung < δ ist.
Beweis: Wir schreiben um:
LZ (c) =
m
X
i=1
=
kc(ti ) − c(ti−1 )k =
v
m uX
X
u n
t (cj (ti ) − cj (ti−1 ))2
i=1
j=1
v
u
Ã
!2
m uX
n
X
cj (ti ) − cj (ti−1 )
u
t
∆ti
i=1
j=1
ti − ti−1
Weil die cj : [a, b] → IR differenzierbar sind, gibt es nach dem Mittelwertsatz ξij ∈ [ti−1 , ti ]
j (ti−1 )
= c˙j (ξij ). Die c˙j sind stetig auf [a, b], also gleichmäßig stetig. Zu ε > 0 gibt
mit cj (tit)−c
i −ti−1
ε
es daher ein δ > 0 mit |cj (s) − cj (t)| < √n(b−a)
falls nur |s − t| < δ ist. Für eine Unterteilung
Z wie oben mit Feinheit < δ folgt
¯Z
¯
¯ b
¯
¯
¯
¯
¯
k
ċ(t)k
dt
−
L
(c)
Z
¯ a
¯
=
=
≤
≤
¯
¯
v
¯Z b
¯
m uX
X
¯
¯
u n
2
¯
¯
t
k
ċ(t)k
dt
−
c
˙
(ξ
)∆t
j
ij
i¯
¯
¯ a
¯
i=1
j=1
¯

 ¯
v
¯X
¯
uX
Z ti
¯m
¯
u n ˙2
¯
kċ(t)k − t

cj (ξij ) dt¯¯
¯
¯ i=1 ti−1
¯
j=1
Z
m
¯
X ti ¯¯
¯
¯kċ(t)k − k(c˙1 (ξi1 ), . . . , c˙n (ξin ))k¯
i=1 ti−1
m Z ti
X
i=1 ti−1
kċ(t) − (c˙1 (ξi1 ), . . . , c˙n (ξin ))k dt
25
dt
=
v
m Z ti uX
X
u n
t (c˙j (t) − c˙j (ξij ))2 dt
i=1 ti−1
j=1
≤
m Z ti
X
i=1 ti−1
ε
dt = ε
b−a
qed.
Sei c : I → IRn eine stetig differenzierbare Kurve und ϕ : J → I eine bijektive stetig
differenzierbare Funktion mit ϕ̇(τ ) 6= 0 für alle τ ∈ J. Dann ist ϕ−1 : I → J ebenfalls stetig
differenzierbar. In diesem Fall nennen wir c̃ = c ◦ ϕ eine Umparametrisierung von c.
Satz 2: Sei c : [a, b] → IRn stetig differenzierbar und c̃ = c ◦ ϕ eine Umparametrisierung
von c. Dann gilt L(c) = L(c̃).
Beweis: Wir betrachten zunächst den Fall ϕ̇(t) > 0 ∀t. Nun ist ϕ auf einem kompakten
Intervall J = [α, β] erklärt, denn J ist das Bild von [a, b] unter der stetigen Abbildung ϕ−1 .
Weil ϕ streng monoton wachsend und bijektiv ist, folgt ϕ(α) = a und ϕ(β) = b. Damit
L(c) =
Z b
a
kċ(t)k dt =
Z β
α
kċ(ϕ(τ ))kϕ̇(τ ) dτ =
Z β
α
˙ )k dτ.
kc̃(τ
Den Fall ϕ̇(τ ) < 0 beweist man analog. qed.
R
Sei c : [a, b] → IRn stetig differenzierbar. Dann heißt l(s) = as kċ(t)k dt, s ∈ [a, b], die
Bogenlänge von c. Wir nennen c nach der Bogenlänge parametrisiert, wenn kċ(t)k = 1
bzw. wenn l(s) = s − a für alle s ∈ [a, b]. Sei nun c : [a, b] → IRn stetig differenzierbar und
regulär, also ċ(t) 6= 0 für alle t ∈ [a, b]. Dann gibt es eine Umparametrisierung c̃ :R[0, L(c)] →
IRn von c, so daß c̃ nach der Bogenlänge parametrisiert ist. Sei nämlich l(s) = as kċ(t)k dt,
˙
l : [a, b] → [0, L(c)]. Dann ist l(s)
= kċ(s)k > 0 für alle s ∈ [a, b]. Daher ist l bijektiv
1
und die Umkehrfunktion ϕ : [0, L(c)] → [a, b] ist stetig differenzierbar mit ϕ̇(τ ) = kċ(ϕ(τ
.
))k
˙
Damit folgt für c̃ = c ◦ ϕ, kc̃(τ )k = kċ(ϕ(τ ))ϕ̇(τ )k = |ϕ̇(τ )|kċ(ϕ(τ ))k = 1.
Satz 3: Sei c : [a, b] → IRn stetig mit c(a) = x, c(b) = y. Dann gilt L(c) ≥ kx − yk, also
die gerade Strecke ist kürzeste Verbindung von x nach y.
Beweis: Für jedes c eingeschriebene Sehnenpolygon bezüglich einer Unterteilung Z von
[a, b] gilt LZ (c) ≥ kx − yk nach der Dreiecksungleichung. Also gilt L(c) = supZ LZ (c) ≥
kx − yk. qed.
3.4
Differenzierbare Abbildungen
Im folgenden betrachten wir Abbildungen f : U → IRm , wobei U ⊂ Rn offen ist. Wie im
Falle m = n = 1 definieren wir Differenzierbarkeit in a ∈ U als ”gute Approximierbarkeit”
von f durch eine lineare Abbildung L wie in der folgenden Definition.
26
Definition: Sei U ⊂ Rn offen und f : U → IRm eine Abbildung. Dann heißt f differenzierbar im Punkte a ∈ U, wenn es eine lineare Abbildung L ∈ Hom(IRn , IRm ) gibt
mit
f (a + h) = f (a) + L · h + ϕ(h),
wobei der Rest ϕ die Eigenschaft
lim
h→0
ϕ(h)
=0
khk
hat. Falls es eine solche lineare Abbildung L gibt, dann ist sie eindeutig bestimmt und
heißt das Differential oder die Ableitung von f in a. Notation: L = df (a) = f 0 (a).
Wir sagen, f ist differenzierbar, wenn f in jedem a ∈ U differenzierbar ist.
Bemerkungen:
1. Die Abbildung ϕ hat Werte im IRm und ist erklärt für alle h ∈ IRn mit h + a ∈ U.
Wichtig ist alleine das Verhalten von ϕ in der Nähe von 0; Notation: ϕ = o(khk),
= 0.
d.h., limh→0 ϕ(h)
khk
2. f differenzierbar in a ⇒ f stetig in a.
Beweis: Seien L, ϕ wie in der Definition. Als lineare Abbildung ist L stetig auf
IRn , insbesondere in h = 0. Ferner ist ϕ stetig in h = 0, denn ϕ = o(khk). Also
limh→0 f (a + h) = limh→0 (f (a) + Lh + ϕ(h)) = f (a). qed.
3. Eindeutigkeit von L: Seien L, M ∈ Hom(Rm , Rn ) mit f (a + h) = f (a) + Lh + ϕ(h) =
f (a) + Mh + ψ(h), wobei ϕ = o(khk), ψ = o(khk). Sei h ∈ Rn ein Vektor mit
Lh 6= Mh. Dann gilt: 0 6= (L − M)h = ψ(h) − ϕ(h). Für t > 0 folgt damit 0 6=
(L−M)(th)
= limt&0 (L−M)(th)
= limt&0 ψ(th)−ϕ(th)
= 0, Widerspruch. Also gilt L = M.
t
t
t
4. Wir stellen uns lineare Abbildungen IRn → IRm gegeben durch Matrizen vor (bezüglich
der Standardbasen). Entsprechend Hom(IRn , IRm ) ∼
= Mat(n, m, IR) ∼
= IRmn .
5. f ist differenzierbar in a ∈ U genau dann, wenn es eine Abbildung Λ : U →
Hom(IRn , IRm ) ∼
= IRmn gibt, die in a stetig ist, so daß
f (a + h) = f (a) + Λ(a + h)h ∀h ∈ Rn mit a + h ∈ U.
Beweis: Gibt es eine solche Abbildung Λ, so setze L = Λ(a), ϕ(h) = Λ(a+h)h−Λ(a)h.
= limh→0 (Λ(a+h)−Λ(a))h
=
Dann gilt f (a+h) = f (a)+Lh+ϕ(h) und ferner limh→0 ϕ(h)
khk
khk
h
h
limh→0 (Λ(a + h) − Λ(a)) khk = 0, denn limh→0 Λ(a + h) = Λ(a) und khk ist ein Einheitsvektor, hat also Komponenten vom Betrag ≤ 1. Falls umgekehrt L und ϕ wie
in der Definition sind, so definieren wir Λ(a + h) = L für h = 0 und Λ(a + h)v =
ϕ(h)
Lv + khk
2 hh, vi, h 6= 0. Dann gilt f (a + h) = f (a) + Λ(a + h)h. Stetigkeit von Λ in a:
für alle v ∈ IRn gilt limh→0
ϕ(h)
hh, vi
khk2
= limh→0
27
ϕ(h) h
h , vi
khk khk
h
= 0, denn |h khk
, vi| ≤ kvk.
6. Sei f in a differenzierbar, L = df (a). Dann gilt für x ∈ U :
f (x) = f (a) + L(x − a) + ϕ(x − a),
= 0. Der Graph der affinen Abbildung IRn → IRm , x 7→ f (a)+L(x−
und limx→a ϕ(x−a)
kx−ak
a) ist ein n-dimensionaler affiner Unterraum von IRn ×IRm und heißt Tangentialraum
an den Graphen von f im Punkte (a, f (a)).
Regel 1: Seien f : U → IRm , g : U → IRk Abbildungen, U ⊂ IRn offen. Dann ist die
Abbildung (f, g) : U → IRm × IRk , x 7→ (f (x), g(x)) genau dann in a ∈ U differenzierbar,
wenn f und g in a differenzierbar sind, und es gilt d(f, g)(a) = (df (a), dg(a)).
Beweis: Seien f, g in a differenzierbar und L = df (a), M = dg(a), f (a + h) = f (a) + Lh +
ϕ(h), g(a + h) = g(a) + Mh + ψ(h). Dann ist (L, M) : IRn → IRm × IRk , h 7→ (Lh, Mh),
= 0. Nun
linear. Ferner gilt k(ϕ(h), ψ(h))k2 = kϕ(h)k2 + kψ(h)k2 , also limh→0 (ϕ(h),ψ(h))
khk
(f (a + h), g(a + h)) = (f (a), g(a)) + (Lh, Mh) + (ϕ(h), ψ(h)). Also ist (f, g) in a differenzierbar mit d(f, g)(a) = (df (a), dg(a)). Die Umkehrung ist analog. qed.
Korollar: f : U → IRm ist differenzierbar in a genau dann, wenn die Komponentenfunktionen f1 , . . . , fm in a differenzierbar sind.
Regel 2: Seien f, g : U → IRm differenzierbar in a ∈ U und seien α, β ∈ IR. Dann ist
αf + βg differenzierbar in a mit
d(αf + βg)(a) = αdf (a) + βdg(a).
Beweis: Seien L = df (a), M = dg(a). Dann gilt (αf +βg)(a+h) = αf (a+h)+βg(a+h) =
αf (a)+αLh+αϕ(h)+βg(a)+βMh+βψ(h) = (αf +βg)(a)+(αL+βM)h+(αϕ+βψ)(h).
= α limh→0 ϕ(h)
+ β limh→0 ψ(h)
= 0. qed.
Nun gilt limh→0 αϕ(h)+βψ(h)
khk
khk
khk
Regel 3: (Kettenregel) Seien U ⊂ IRn , V ⊂ IRm offen, f : U → IRm und g : V → IRl
Abbildungen mit f (U) ⊂ V . Sei f differenzierbar in a ∈ U und g in b = f (a) ∈ V . Dann
ist g ◦ f differenzierbar in a mit
d(g ◦ f )(a) = dg(b)df (a).
Beweis: Wie in Bemerkung 5 schreiben wir f (a + h) = f (a) + Λ(a + h)h, g(b + k) =
g(b) + M(b + k)k, wobei Λ stetig in a, M stetig in b mit Λ(a) = df (a), M(b) = dg(b). Dann
g ◦ f (a + h) = g(f (a) + Λ(a + h)h) = g(b) + M(b + Λ(a + h)h)Λ(a + h)h. Zu überprüfen:
Stetigkeit von h 7→ M(b + Λ(a + h)h)Λ(a + h) in h = 0 und Wert in h = 0: Nun sind M
und Λ stetig in b bzw. a, also limh→0 M(b + Λ(a + h)h)Λ(a + h) = M(b)Λ(a) = dg(b)df (a).
qed.
28
3.5
Richtungsableitungen, partielle Ableitungen
Sei f : U → Rm wie oben in a differenzierbar. Wir wollen df (a)v berechnen, v ∈ IRn . Für
t ∈ IR hinreichend klein ist dann a + tv ∈ U und
f (a + tv) = f (a) + df (a)(tv) + ϕ(tv).
Für t 6= 0, v 6= 0 folgt daher df (a)v =
f (a+tv)−f (a)
t
±
ϕ(tv)
kvk,
ktvk
also
f (a + tv) − f (a)
.
t→0
t
df (a)v = lim
Definition: Sei f : U → IRm eine Abbildung, nicht notwendigerweise differenzierbar in
a ∈ U. Sei v ∈ IRn . Falls existent, so heißt
f (a + tv) − f (a)
t→0
t
∂v f (a) = lim
die Ableitung von f in Richtung v. Falls v der i-te Einheitsvektor ei ist, so nennen
∂f
wir ∂ei f auch die i-te partielle Ableitung von f , ∂ei f (a) = ∂x
(a). Die Matrix mit
i
m,n
∂fi
Einträgen ( ∂xj (a))i,j=1 heißt Jacobi-Matrix von f in a.
Beispiel: f : IR2 → IR, f (x, y) = x2 ey . ∂f
(x, y) = 2xey , ∂f
(x, y) = x2 ey .
∂x
∂y
Wir haben schon gesehen, wenn die Ableitung von f in a existiert, so existieren auch die
Richtungsableitungen, und es gilt: df (a)v = ∂v f (a). Insbesondere existieren die partiellen
Ableitungen df (a)ei = ∂i f (a), 1 ≤ i ≤ n. Also:
Satz 1: Sei U ⊂ IRn offen und f : U → IRm in a ∈ U differenzierbar. Dann ist die Matrix
von df (a) bezüglich der Standardbasen in IRn , IRm gerade die Jacobi-Matrix.
Im Fall m = 1 nennen wir (∂1 f (a), . . . , ∂n f (a)) auch den Gradienten von f in a, Bezeichnung: gradf (a) ∈ IRn . Bezüglich des Euklidischen Skalarproduktes gilt also (wenn f
in a differenzierbar ist): df (a)v = hgradf (a), vi = kvkkgradf (a)k cos ϕ, wobei ϕ der Winkel
zwischen v und gradf (a) ist. Es folgt: der Gradient zeigt in die Richtung des stärksten
Wachstums von f .
Beispiel: Partielle Differenzierbarkeit impliziert nicht Differenzierbarkeit. Sei nämlich f :
IR2 → IR definiert durch
f (x, y) =
(
0
xy
x2 +y 2
(x, y) = (0, 0)
.
sonst
Dann existieren die partiellen Ableitungen von f in (0, 0), ∂x (0, 0) = 0 = ∂y (0, 0). Aber f
ist nicht differenzierbar in (0, 0), denn f ist nicht stetig in (0, 0).
29
Satz 2: Sei U ⊂ IRn offen, f : U → IRm und a ∈ U . Falls die partiellen Ableitungen von f
in einer Umgebung von a ∈ U existieren und in a stetig sind, so ist f in a differenzierbar.
Beweis: Nach Regel 1 können wir m = 1 annehmen. Wir schreiben h ∈ IRn als h =
Pn
Pn
i=1 hi ei , h = (h1 , . . . , hn ). Dann gilt f (a + h) − f (a) =
k=1 [f (a + h1 e1 + . . . + hk ek ) −
f (a + h1 e1 + . . . + hk−1 ek−1 )]. Nach dem Mittelwertsatz, angewendet auf die Funktion
t 7→ f (a + h1 e1 + . . . + hk−1 ek−1 + tek ), gibt es θk ∈ (0, 1) mit f (a + h1 e1 + . . . + hk ek ) −
f (a + h1 e1 + . . . + hk−1 ek−1 ) = hk ∂k f (a + h1 e1 + . . . + hk−1 ek−1 + θk hk ek ). Nach Bemerkung
5 im vorherigen Kapitel ist dies aber genau die Behauptung, denn limh→0 ∂k f (a + h1 e1 +
. . . + hk−1 ek−1 + θk hk ek ) = ∂k f (a). qed.
Beispiele:
1. f : IR2 → IR, f (x) = 12 kxk2 = 12 (x21 +x22 ). Die partiellen Ableitungen sind ∂1 f (x1 , x2 ) =
x1 , ∂2 f (x1 , x2 ) = x2 . Die partiellen Ableitungen sind stetig auf IR2 , daher ist f in allen
x ∈ IR2 differenzierbar und gradf (x) = x.
2. f : IR2 → IR2 , f (x, y) = (cos x sin y, xy 2 ). Partielle Ableitungen: Komponentenfunktionen sind f1 (x, y) = cos x sin y, f2 (x, y) = xy 2 . Dann ∂x f1 (x, y) = − sin x sin y,
∂y f1 (x, y) = cos x cos y, ∂x f2 (x, y) = y 2 , ∂y f2 (x, y) = 2xy. Die partiellen Ableitungen
sind stetig, also ist f differenzierbar und df (x, y) hat die Matrix
Ã
− sin x sin y cos x cos y
y2
2xy
!
(df ist eine Abbildung IR2 → Hom(IR2 , IR2 )).
Seien V, W endlichdimensionale Vektorräume über IR, U ⊂ V offen. Dann heißt f : U → W
differenzierbar in a ∈ U, wenn es eine lineare Abbildung L ∈ Hom(V, W ) gibt mit f (a+h) =
= 0. Dies ist unabhängig von der gewählten Norm. Falls
f (a)+Lh+ϕ(h), wobei limh→0 ϕ(h)
khk
die Norm auf V von einem Skalarprodukt h , i herkommt und f : U → IR differenzierbar
ist in a ∈ U, so gibt es genau einen Vektor w ∈ V mit df (a)v = hv, wi. Diesen Vektor w
nennen wir gradf (a). Der entsprechende Vektor im Dualraum ist df (a) ∈ V ∗ .
3.6
Mittelwert- und Schrankensätze
Sei U ⊂ IRn offen.
Mittelwertsatz 1: Sei f : U → IR differenzierbar. Es seien x, y ∈ U Punkte mit
[x, y] = {z ∈ IRn | ∃t ∈ [0, 1] : z = (1 − t)x + ty} ⊂ U. Dann gibt es z ∈ [x, y] mit
f (y) − f (x) = df (z)(y − x).
Mittelwertsatz 1’: Sei f : U → IR differenzierbar und c : [a, b] → U differenzierbar mit
c(a) = x, c(b) = y. Dann gibt es t ∈ (a, b) mit f (y) − f (x) = df (c(t))ċ(t)(b − a).
Beweis: Definiere g : [0, 1] → IR durch g(t) = f ((1 − t)x + ty). Dann ist g nach der Kettenregel differenzierbar mit g 0 (t) = df ((1 − t)x + ty)(y − x). Nach dem Mittelwertsatz gibt es
30
t ∈ (0, 1) mit f (y)−f (x) = g(1)−g(0) = g0 (t) = df (z)(y−x), wobei z = (1−t)x+ty ∈ [x, y].
Betrachte g : [a, b] → IR, g(t) = f (c(t)). Dann ist g differenzierbar, nach dem alten Mittelwertsatz gibt es daher ein t ∈ (a, b) mit g(b) − g(a) = g 0 (t)(b − a). qed.
Mittelwertsatz 2: Sei f : U → IRm stetig differenzierbar, d.h., die partiellen Ableitun∂fi
gen ∂x
: U → IR sind stetig. Seien x, y ∈ U Punkte mit [x, y] ⊂ U. Dann gilt
j
f (y) − f (x) =
µZ 1
0
¶
df ((1 − t)x + ty) dt (y − x).
Mittelwertsatz 2’: Seien f : U → IRm , c : [a, b] → IR stetig differenzierbar mit c(a) = x,
c(b) = y. Dann gilt
f (y) − f (x) =
Beweis: Es gilt
d
f ((1
dt
Z b
df (c(t))ċ(t) dt.
a
− t)x + ty) = df ((1 − t)x + ty)(y − x), also
fj (y) − fj (x) =
Z 1
=
Z 1
d
fj ((1 − t)x + ty) dt
0 dt
Ã
!
Z 1 X
n
∂fj
((1 − t)x + ty)(yi − xi ) dt
=
0
i=1 ∂xi
n Z 1
X
∂fj
((1 − t)x + ty) dt · (yi − xi )
=
i=1 0 ∂xi
0
Es gilt
d
(f
dt
dfj ((1 − t)x + ty) dt · (y − x)
◦ c)(t) = df (c(t))ċ(t) und f (c(b)) − f (c(a)) =
Rb d
(f
a dt
◦ c)(t) dt. qed.
Schrankensatz: Sei f : U → IRm stetig differenzierbar und K ⊂ U konvex und kompakt.
Dann ist f auf K Lipschitz-stetig. Genauer gilt: Wenn kdf (x)k∞ ≤ L ist für alle x ∈ K,
so ist L eine Lipschitz-Konstante für f auf K. Hierbei ist kdf (x)k∞ := max{kdf (x)vk |
v ∈ IRn ∧ kvk = 1}.
R
Beweis:
Seien x, y ∈ K. kf (y)
− f (x)k = k 01 df ((1 − t)x + ty)(y − x) dtk ≤
R1
R1
0 kdf (1 − t)x + ty)(y − x)k dt ≤ 0 Lky − xk dt = Lky − xk. qed.
3.7
Höhere Ableitungen
Satz (H.A. Schwarz): Sei U ⊆ IRn offen und f : U → IR besitze die partiellen Ableitungen
∂i f , ∂j f , ∂i (∂j f ) =: ∂ij f . Weiterhin sei ∂ij f in a ∈ U stetig. Dann existiert in a auch
∂j (∂i f ), und es gilt:
∂ji f (a) = ∂ij f (a).
31
Beweis: Setze ϕ(s, t) = f (a + sei + tej ). ϕ ist in einer Umgebung von 0 ∈ IR2 definiert,
∂s ϕ, ∂t ϕ, ∂st ϕ existieren, ∂st ϕ ist stetig in 0. Betrachte für s, t 6= 0:
D(s, t) :=
1 (ϕ(s, t) − ϕ(0, t)) − (ϕ(s, 0) − ϕ(0, 0))
.
s
t
Für festes s ist der Ausdruck (ϕ(s,t)−ϕ(0,t))−(ϕ(s,0)−ϕ(0,0))
Differenzenquotient zur Funktion
t
t 7→ ϕ(s, t) − ϕ(0, t). Nach dem Mittelwertsatz gibt es θ ∈ (0, 1) mit
(ϕ(s, t) − ϕ(0, t)) − (ϕ(s, 0) − ϕ(0, 0))
= ∂t ϕ(s, θt) − ∂t ϕ(0, θt).
t
Nun ist D(s, t) = 1s (∂t ϕ(s, θt) − ∂t ϕ(0, θt) Differenzenquotient bezüglich s, also gibt es
η ∈ (0, 1) mit D(s, t) = ∂st ϕ(ηs, θt) (Beachte: η, θ sind von s und t abhängig.). Weil ∂st ϕ
stetig in (0, 0) ist, gibt es zu jedem ε > 0 ein δ > 0 mit
|D(s, t) − ∂st ϕ(0, 0)| < ε für |s|, |t| < δ.
Außerdem gilt lims→0 D(s, t) = 1t (∂s ϕ(0, t) − ∂s ϕ(0, 0)). Es folgt
Also existiert
¯
¯ ∂ ϕ(0, t) − ∂ ϕ(0, 0)
s
¯ s
¯
¯
t
¯
¯
− ∂st ϕ(0, 0)¯¯¯
≤ ε für |t| < δ.
∂s ϕ(0, t) − ∂s ϕ(0, 0)
t→0
t
∂ts ϕ(0, 0) = lim
und ist gleich ∂st ϕ(0, 0). qed.
Beispiel: Sei V : IR2 → IR2 , V (x, y) = (−y, x). Frage: Gibt es f : IR2 → IR mit gradf = V ?
Für ein solches f wäre ∂x f (x, y) = −y, ∂y f (x, y) = x, also ∂yx f (x, y) = −1, ∂xy f (x, y) = 1
(stetig!). Widerspruch zum Satz, also gibt es kein solches f .
Definition: f : U → IRm heißt p-mal stetig differenzierbar, wenn alle p-ten partiellen
Ableitungen ∂i1 ...ip f , i1 , . . . , ip ∈ {1, . . . , n}, existieren und stetig sind.
C p (U, IRm ) := {f : U → IRm | f p-mal stetig differenzierbar},
∞
m
C (U, IR ) :=
∞
\
C p (U, IRm ),
C p (U ) := C p (U, IR)
C ∞ (U) := C ∞ (U, IR)
p=1
Korollar aus dem Satz von Schwarz: Für f ∈ C p (U, IRm ) spielt in ∂i1 ...ip f die Reihenfolge
der partiellen Ableitungen keine Rolle.
32
3.8
Das Taylorpolynom
Sei U ⊆ IRn offen, f ∈ C p (U, IRm ). Für y ∈ U, h ∈ IRn , 1 ≤ k ≤ p setzen wir
dk f (y)hk :=
n
X
...
i1 =1
n
X
ik =1
∂i1 ...ik f (y)hi1 · . . . · hik ∈ IRm
und d0 f (y)h0 := f (y) ∈ IRm .
Bemerkung: Seien x0 , x ∈ U mit [x0 , x] ⊂ U , h := x − x0 . Definiere g : [0, 1] → IRm durch
g(t) := f ((1 − t)x0 + tx) = f (x0 + th). Dann ist g p-mal stetig differenzierbar:
g 0 (t) =
g 00 (t) =
(p)
g (t) =
n
X
∂i f (x0
i=1
n X
n
X
+ th)hi = df (x0 + th)h,
∂ij f (x0 + th)hj hi = d2 f (x0 + th)h2 , . . .
j=1 i=1
n
X
...
i1 =1
n
X
∂i1 ...ip hi1 . . . hip = dp f (x0 + th)hp .
ip =1
Beachte f (x) = g(1) = g(0) + g0 (0)(1 − 0) + 12 g00 (0)(1 − 0)2 + . . . + p!1 g (p) (0)(1 − 0)p + Rp =
1 k
k
k=0 k! d f (x0 )(x − x0 ) + Rp . Dadurch motiviert definieren wir
Pp
Txp0 f (x) :=
p
X
1 k
d f (x0 )(x − x0 )k .
k!
k=0
Txp0 f heißt das Taylorpolynom vom Grad p mit Entwicklungspunkt x0 .
Taylorformel 1: (Integralrestglied) Sei U ⊆ IRn offen, f ∈ C p+1 (U, IRm ), x0 , x ∈ U mit
[x0 , x] ⊂ U, h := x − x0 . Dann gilt
f (x) = Txp0 f (x) +
1Z1
(1 − t)p dp+1 f (x0 + th)hp+1 dt.
p! 0
Beweis: Für j = 1, . . . , m setze gj (t) := fj (x0 + th), gj : [0, 1] → IR. Wende die alte
Taylorformel mit Integralrestglied an auf gj :
1 (k)
1Z1
k
gj (1) =
(1 − t)p g (p+1) (t) dt, also
g (0)(1 − 0) +
k!
p!
0
k=0
p
X
fj (x) = Txp0 fj (x) +
1Z1
(1 − t)p dp+1 f (x0 + th)hp+1 dt.
p! 0
qed.
33
Taylorformel 2: (Lagrange-Restglied) Sei f ∈ C p+1 (U), x, x0 ∈ U mit [x0 , x] ⊂ U,
h := x − x0 . Dann gibt es ξ ∈ [x0 , x] mit
f (x) = Txp0 f (x) +
1
dp+1 f (ξ)hp+1 .
(p + 1)!
Beweis: g(t) := f (x0 + th). Die alte Taylorformel mit Lagrange-Restglied ergibt:
g(1) =
p
X
1 (k)
1
g (0)(1 − 0)k +
g (p+1) (θ)(1 − 0)p+1
k!
(p
+
1)!
k=0
für ein θ ∈ (0, 1), also
f (x) = Txp0 f (x) +
1
dp+1 f (x
+ θh)hp+1 .
| 0 {z }
(p + 1)!
=:ξ
qed.
Qualitative Taylorformel: Sei f ∈ C p (U, IRm ), x0 ∈ U. Dann gilt:
f (x) − Txp0 f (x)
→ 0 für x → x0 ,
kx − x0 kp
also f (x) = Txp0 f (x) + o(kx − x0 kp ) für x → x0 .
Beweis: Sei zunächst m = 1. Taylorformel 2 für p − 1 statt p ergibt
f (x) +
f (x) = Txp−1
0
1 p
1
d f (ξ)(x − x0 )p = Txp0 f (x) + (dp f (ξ) − dp f (x0 ))(x − x0 )p
p!
p!
für ein ξ ∈ [x0 , x]. Es folgt
|f (x) − Txp0 f (x)| ≤
n
1 X
|∂i1 ...ip f (ξ) − ∂i1 ...ip f (x0 )| kx − x0 kp∞ ,
{z
}
p! i1 ,...,ip =1 |
→0
|f (x)−T p f (x)|
für
x→x0
also kx−xx00kp∞ → 0 für x → x0 . Die Behauptung folgt für m = 1, da k k∞ und k k
äquivalent sind. Für allgemeines m folgt die Behauptung aus
m
kf (x) − Txp0 f (x)k1 X
|fi (x) − Txp0 fi (x)|
=
→0
kx − x0 kp
kx − x0 kp
i=1
und der Äquivalenz von k k1 und k k. qed.
Beispiel: Sei f : IR × (IR − {0}) → IR, f (x, y) = xy .
34
∂x f (x, y) = y1 , ∂y f (x, y) = − yx2 , ∂xx f (x, y) = 0, ∂xy f (x, y) = − y12 = ∂yx f (x, y), ∂yy f (x, y) =
2x
. Das Taylorpolynom zweiten Grades mit Entwicklungspunkt (x0 , y0 ) lautet also:
y3
2
f (x, y) =
T(x
0 ,y0 )
x0 1
x0
1
1
x0
+ (x−x0 )− 2 (y−y0 )− 2 (x−x0 )(y−y0 )− 2 (y−y0 )(x−x0 )+ 3 (y−y0 )2 ,
y0 y0
y0
2y0
2y0
y0
2
f (x, y) = 1 + (x − 1) − (y − 1) − (x − 1)(y − 1) + (y − 1)2 . Bemerkung:
zum Beispiel T(1,1)
1
x−1
f (x, y) = xy = 1+(y−1)
+ 1+(y−1)
= 1 − (y − 1) + (y − 1)2 + (x − 1) − (x − 1)(y − 1)+ Terme
höherer Ordnung.
3.9
Lokales Verhalten einer Funktion
Sei X ⊂ IRn und f : X → IR eine Funktion. Dann heißt a ∈ X ein (lokales) Maximum
von f , wenn f (x) ≤ f (a) für alle x ∈ X (bzw. für alle x in einer Umgebung von a in X).
Analog definiert man (lokale) Minima. Wir nennen a ein (lokales) Extremum, wenn a
ein (lokales) Minimum oder Maximum ist.
Satz 1: Sei a ∈ X ein innerer Punkt von X. Falls a ∈ X ein lokales Extremum von f ist
und die partiellen Ableitungen von f in a existieren, so gilt ∂1 f (a) = . . . = ∂n f (a) = 0.
Beweis: O.B.d.A sei a ein lokales Maximum. Wähle ε > 0 mit Kε (a) ⊂ X. Dann ist
die Funktion (−ε, ε) → IR, t 7→ f (a1 , . . . , ai + t, . . . , an ) = f (a + tei ) definiert und in
t = 0 differenzierbar. Weil diese Funktion dort ein lokales Maximum hat, gilt ∂i f (a) =
d
f (a + tei )|t=0 = 0. qed.
dt
Sei nun U ⊂ IRn und f ∈ C 1 (U ). Wir nennen a ∈ U einen kritischen Punkt von f ,
wenn df (a) = 0 ist. Dann heißt f (a) auch kritischer Wert von f . Wir haben in Satz 1
festgestellt, daß lokale Extrema von f kritische Punkt von f sind.
Beispiele:
1. f : IR2 → IR, f (x, y) = x2 + y 2 . Dann df (x, y) = (2x, 2y). Einziger kritischer Punkt:
(x, y) = (0, 0). Dieser ist globales Minimum von f .
2. f : IR2 → IR, f (x, y) = x2 − y 2 . Dann df (x, y) = (2x, −2y). Einziger kritischer Punkt:
(x, y) = (0, 0). Dieser ist kein lokales Extremum. (0, 0) ist ein Sattelpunkt.
Wir nehmen nun an, daß f ∈ C 2 (U). Dann heißt
IRn 3 x 7→ d2 f (a)h2 =
n
X
i,j=1
∂ij f (a)hi hj ∈ IR
die Hesse-Form von f in a ∈ U. Die Hesse-Form ist eine quadratische Form, und ihre
Matrix bezüglich der Standardbasis ist die Hesse-Matrix


∂11 f (a) . . . ∂1n f (a)


..
..

.
Hf (a) = 
.
.

∂n1 f (a) . . . ∂nn f (a)
35
Es gilt d2 f (a)h2 = ht Hf (a)h. Das Taylor-Polynom 2. Ordnung von f in a ist dann
Ta2 f (x) = f (a) + df (a)(x − a) + (x − a)t Hf (a)(x − a).
Bemerkung: Wir können d2 f (a) auch als symmetrische Bilinearform auffassen:
2
d f (a)(v, w) =
n
X
∂ij f (a)vi wj .
i,j=1
Sei allgemein Q : IRn → IR eine quadratische Form mit (symmetrischer) Matrix A. Dann
heißt Q
• positiv definit, falls Q(x) > 0 für alle x ∈ IRn , x 6= 0, Notation: Q > 0;
• negativ definit, falls Q(x) < 0 für alle x ∈ IRn , x 6= 0, Notation: Q < 0;
• positiv semidefinit, falls Q(x) ≥ 0 für alle x ∈ IRn , x 6= 0, Notation: Q ≥ 0;
• negativ semidefinit, falls Q(x) ≤ 0 für alle x ∈ IRn , x 6= 0, Notation: Q ≤ 0;
• indefinit, falls es x, y ∈ IRn gibt mit Q(x) > 0 und Q(y) < 0;
• nicht ausgeartet, falls det A 6= 0.
Satz 2: Sei f ∈ C 2 (U ), a ∈ U mit df (a) = 0. Dann ist
1. a ein isoliertes lokales Minimum, falls d2 f (a) > 0;
2. a ein isoliertes lokales Maximum, falls d2 f (a) < 0;
3. a kein lokales Extremum, wenn d2 f (a) indefinit ist.
Beweis: Sei d2 f (a) > 0. Weil df (a) = 0, gilt
1
f (a + h) = f (a) + ht Hf (a)h + R(h),
2
mit R(h)/khk2 → 0 für h → 0. Die stetige Funktion h → ht Hf (a)h hat auf S n−1 = {h ∈
IRn | khk = 1} ein positives Minimum, m. Damit ht Hf (a)h ≥ mkhk2 ∀h ∈ IRn . Es gibt
ein ε > 0 mit R(h) < m4 khk2 für alle h ∈ IRn mit khk < ε. Für diese h folgt f (a + h) ≥
f (a)+ m2 khk2 +R(h) ≥ f (a)+ m4 khk2 . Damit (1); (2) ist analog. Im Fall (3) gibt es v, w ∈ IRn
mit d2 f (a)v2 > 0, d2 f (a)w2 < 0. Ferner gilt für die Funktionen t 7→ Fv (t) := f (a + tv),
die auf (−ε, ε) definiert ist für ε > 0 genügend klein, Fv0 (0) = ∂v f (a) = df (a)v = 0 und
Fv00 (a) = v t Hf (a)v > 0. Also hat Fv in t = 0 ein isoliertes lokales Minimum. Entsprechend
hat Fw (t) = f (a + tw), −ε < t < ε, ein isoliertes lokales Maximum in t = 0. qed.
Bemerkungen:
36
1. Es gibt eine orthogonale Zerlegung
IRn = V ⊕ W ⊕ N,
wobei d2 f (a) auf V positiv definit, auf W negativ definit und N der Nullraum von
d2 f (a) ist. Entsprechend gilt (siehe obigen Beweis), falls df (a) = 0: f |({a}+V )∩U hat in
a ein lokales Minimum, f |({a}+W )∩U hat in a ein lokales Maximum, über f |({a}+N)∩U
läßt sich allgemein nichts sagen, außer, daß a ein kritischer Punkt ist.
2. Im Fall n = 2 und mit Q, A wie oben gilt Q > 0 ⇔ det A > 0 und a11 > 0,
Q < 0 ⇔ det A > 0 und a11 < 0, Q indefinit ⇔ det A < 0.
2
2
Beispiele: f (x, y) = x + y , a = (0, 0), Hf (a) =
Ã
!
Ã
2 0
0 2
!
> 0.
2 0
indefinit.
0 −2
f (x, y) =Ã x2 + y!3 , df (x, y) = (2x, 3y 2 ), einziger kritischer Punkt ist a = (0, 0). Es gilt
2 0
Hf (a) =
≥ 0. Aber a ist kein lokales Extremum.
0 0
f (x, y) = x4 + y 4 , df (x, y) = (4x3 , 4y 3 ),Ãeinziger!kritischer Punkt ist a = (0, 0). Dieser ist
0 0
ein globales Minimum, aber Hf (0, 0) =
.
0 0
√
f : IR2 → IR, f (x, y) = x2 + y 2 hat ein globales Minimum in a = (0, 0), aber f ist nicht
differenzierbar in (0, 0). Unsere Methoden können daher nicht angewendet werden.
f (x, y) = x2 − y 2 , a = (0, 0), Hf (0) =
Betrachte jetzt die Menge Q = {(x, y) ∈ IR2 | 0 ≤ x, y ≤ π2 }. Q ist beschränkt und
abgeschlossen ⊂ IR2 . Definiere f : Q → IR durch f (x, y) = sin x + sin y + sin(x + y).
◦
◦
Wir betrachten zunächst f auf Q. Nun ist f ∈ C 2 (Q) und ∂f
(x, y) = cos x + cos(x + y),
∂x
∂f
(x, y) = cos y + cos(x + y). Falls
∂y
◦
(x, y) kritischer Punkt ist in Q, so gilt
cos x = − cos(x + y) = cos y. Wegen
3
0 < x, y < π2 also x = y. Ferner
2
cos x = − cos(x + y) = − cos(2x) =
1
0
1 − 2 cos2 x, also cos x = 12 und damit
1.5
hat f ein
x = y = π3 . Im Punkte ( π3 , π3 ) √
0
1
0.5
3
0.5
lokales Maximum mit Wert 2 3 (man
1
0
1.5
sieht sofort d2 f ( π3 , π3 ) < 0). Hat f andere (lokale) Extrema auf Q? Diese liegen
dann
auf
∂Q
und
sind
natürlich
lokale Extrema für f |∂Q . Offensichtlich hat f in (0, 0) ein globales Minimum. Betrachte jetzt ϕ1 (x) = f (x, 0) = 2 sin x, 0 ≤ x ≤ π2 . ϕ1 wächst streng monoton von 0 auf 2,
37
ϕ4 (y) = f (0, y) = 2 sin y, 0 ≤ y ≤ π2 analog. Daher hat f keine lokalen Extrema auf
{(x, 0) | 0 < x < π2 } bzw. {(0, y) | 0√< y < π2 }. ϕ2 (y) = f ( π2 , y) = 1 + sin y + cos y
wächst streng monoton von 2 auf 1 + 2 auf [0, π4 ] und fällt dann streng monoton auf 2.
ϕ3 (x) = f (x, π2 ) = 1 + sin x + cos x analog. Die einzigen Kanidaten für weitere Extrema
sind daher ( π2 , π4 ), ( π4 , π2 ) als lokales Maximum und ( π2 , π2 ) als lokales Minimum. Nun bemerken wir: es gibt eine Funktion F : IR2 → IR mit F ∈ C 1 (IR2 ) und F |Q = f , nämlich
( π , π ) < 0, ∂F
( π , π ) < 0. Daher hat f keine
F (x, y) = sin x + sin y + sin(x + y). Nun gilt ∂F
∂x 2 4
∂y 4 2
lokalen Extrema in ( π2 , π4 ) und ( π4 , π2 ). Ferner gilt ∂F
( π , π ) = ∂F
( π , π ) = −1. Aus Stetig∂x 2 2
∂y 2 2
(x, y), ∂F
(x, y) < 0 ∀(x, y) ∈ Q nahe genug an ( π2 , π2 ). Nach dem
keitsgründen ist daher ∂F
∂x
∂y
ersten Mittelwertsatz gilt daher f ( π2 , π2 ) − f (x, y) = df (ξ, η)( π2 − x, π2 − y) für ein geeigetes
(ξ, η) zwischen (x, y), ( π2 , π2 ). Nun ist π2 − x ≥ 0, π2 − y ≥ 0, also f (x, y) > f ( π2 , π2 ) für (x, y)
genügend nahe an ( π2 , π2 ). Daher hat f : Q → IR in (0, 0) ein globales Minimum, in ( π3 , π3 )
ein globales Maximum und in ( π2 , π2 ) ein lokales Minimum.
3.10
Differentation parameterabhängiger Integrale
Satz: Sei U ⊂ IRn offen, f : U × [a, b] → C stetig und F : U → C definiert durch
F (x) =
Z b
f (x, t) dt.
a
Falls die partielle Ableitung ∂i f : U × [a, b] → C existiert und stetig ist, so existiert ∂i F
und ist stetig,
Z
b
∂i F (z) =
a
∂i f (z, t) dt.
Beweis: Sei z ∈ U und ε > 0 vorgegeben. Setze
ψ(x, t) = ∂i f (x, t) − ∂i f (z, t).
Dann ist ψ stetig auf U × [a, b] und verschwindet auf {z} × [a, b]. Also ist
W = {(x, t) ∈ U × [a, b] | |ψ(x, t)| < ε}
eine offene Umgebung von {z} × [a, b] in U × [a, b]. Nach dem Tubenlemma gibt es deshalb
eine offene Umgebung V von z in IRn (bzw. U ), so daß V × [a, b] ⊂ W . Weil V offen
ist, gibt es ein δ > 0 mit z + sei ∈ V falls |s| < δ. Wir betrachten nun die Funktionen
s 7→ F (z + sei ) bzw. s 7→ f (z + sei , t). Weil ∂i f existiert und stetig ist, ist die zweite
Funktion nach Definition stetig differenzierbar. Nach dem (alten) Mittelwertsatz gibt es zu
s, t ein θ(s, t) ∈ (0, 1) mit f (z + sei , t) − f (z, t) = ∂i f (z + (θs)ei , t)s. Sei nun |s| < δ, also
z + (θs)ei ∈ V , daher (z + (θs)ei , t) ∈ W . Also
|∂i f (z + (θs)ei , t) − ∂i f (z, t)| < ε.
38
Damit folgt
¯
¯ F (z
¯
¯
¯
¯
¯
+ sei ) − F (z) Z b
∂i f (z, t) dt¯¯¯ =
−
s
a
¯Z
¯
¯ b 1
¯
¯
¯
¯ ( (f (z + sei , t) − f (z, t)) − ∂i f (z, t)) dt¯
¯ a s
¯
¯
Z b¯
¯1
¯
¯ (f (z + sei , t) − f (z, t)) − ∂i f (z, t)¯ dt
¯
¯
a
s
≤
< ε|b − a|
R
Daher ∂i F (z) = ab ∂i f (z, t) dt. Die Stetigkeit von ∂i F : U → C folgt mit dem entsprechenden Ergebnis aus Abschnitt 3.1. qed.
3.11
Reihen von Abbildungen
Satz: Sei U ⊂ IRn offen und fk : U → IRm eine Folge von C 1 -Abbildungen mit
1.
P∞
k=1
fk konvergiert punktweise;
2. für jede kompakte Teilmenge K ⊂ U konvergiert
Dann ist f =
P∞
k=1
P∞
k=1
kdfk kK .
fk : U → IRm stetig differenzierbar und df (x) =
P∞
k=1
P∞
dfk (x), x ∈ U .
Beweis: Es genügt, den Fall m = 1 zu betrachten. Wegen (2) ist L = k=1 dfk (x) ∈ (Rn )∗
wohldefiniert. Wir wollen zeigen, daß L das Differential von f in x ist. Dazu wählen wir
zunächst ein r > 0, so daß K = Kr (x) ⊂ U. Sei nun ε > 0 vorgegeben. Dann gibt es ein N
P
mit k≥N kdfk kK < ε. Für h ∈ IRn mit khk ≤ r gilt
kf (x + h) − f (x) −
X
k≥1
dfk (x)hk ≤
N
X
kfk (x + h) − fk (x) − dfk (x)hk +
k=1
∞
X
k=N+1
kfk (x + h) − fk (x)k +
∞
X
k=N+1
kdfk (x)hk.
Der dritte Term ist nach Wahl von N kleiner als εkhk. Der zweite Term läßt sich nach
P
dem Schrankensatz abschätzen durch ∞
k=N+1 kdfk kK · khk ≤ εkhk. Nun sind die fk stetig
differenzierbar, 1 ≤ k ≤ N. Daher kann man ein δ > 0 finden mit δ ≤ r, so daß
kfk (x + h) − fk (x) − dfk (x)hk ≤
ε
khk,
N
1 ≤ k ≤ N. Damit ist auch der erste Term ≤ εkhk, falls khk ≤ δ ist. Insgesamt ist die
P
rechte Seite ≤ 3εkhk. Also df (x) = k≥1 dfk (x). Die Stetigkeit der Abbildung x 7→ df (x)
P
folgt, weil die Reihe von Abbildungen k≥1 dfk nach (2) auf kompakten Teilmengen von U
gleichmäßig konvergiert. qed.
39
2
Beispiel: Sei Mat(n) der Raum der n × n-Matrizen mit reellen Einträgen (∼
= IRn ) und
F : Mat(n) → Mat(n),
F (X) = X m .
Dann gilt dF (X)H = HX m−1 + XHX m−2 + . . . + X m−1 H. Zum Beispiel gilt für m = 2:
F (X + H) = (X + H)(X + H) = X 2 + XH + HX + HH = F (X) + LH + ϕ(H),
wobei L : Mat(n) → Mat(n) gegeben ist als LH = HX+XH (L ist linear) und ϕ(H) = H 2 ,
kH 2 k
kHk2
=
≤
= kHk → 0 für H → 0. Für m ∈ IN beliebig gilt
also kϕ(H)k
kHk
kHk
kHk
F (X + H) = (X + H)m = (X + H) · . . . · (X + H)
= X m + HX m−1 + XHX m−2 + . . . + X m−1 H
+H 2 X m−2 + HXHX m−3 + . . . + X m−2 H 2
+H 3 X m−3 + H 2 XHX m−4 + . . . + X m−3 H 3 + . . .
= X m + HX m−1 + . . . + X m−1 H + ϕ(H)
µ
¶
µ
¶
m
m
mit ϕ(H) Summe von
+...+
Termen ist, die jeweils Produkte von k Faktoren
2
m
H und m − k Faktoren X sind mit k ≥ 2. Ein solcher Term hat Norm ≤ kXkm−k kHkk .
Für µkHk¶≤ 1 ist damit
jeder dieser Terme ≤ max{kXkm−2 , kXkm−3 , . . . , 1}kHk2 . Sei jetzt
µ ¶
m
m
c=
+ ... +
. Dann ist
2
m
ϕ(H) ≤ c max{kXkm−2 , . . .}kHk2 .
Damit folgt die Behauptung.
Als Beispiel zu dem Satz oben betrachten wir die geometrische Reihe: sei dazu U = {X ∈
P
Mat(n) | kXk < 1} und F (X) = k≥0 X k . Falls K ⊂ U kompakt ist, so gibt es ein ε > 0
P
P
P
mit kXk < 1 − ε für alle X ∈ K. Dann ist k pk=m X k k ≤ pk=m kX k k ≤ pk=m kXkk ≤
Pp
k
k=m (1 − ε) . Also konvergiert obige Reihe auf K gleichmäßig. Für die Ableitung von
k
Fk (X) = X gilt kdFk (X)Hk = kHX k−1 +. . .+X k−1 Hk ≤ kkXkk−1 kHk, also kdFk (X)k ≤
P
kkXkk−1 ≤ k(1−ε)k−1 für X ∈ K. Also konvergiert kdFk kK (weil kdFk kK ≤ k(1−ε)k−1 ).
P
k
Damit ist F : Mat(n) → Mat(n), F (X) = ∞
k=0 X stetig differenzierbar.
−1
Es folgt nun leicht: F (X) = (1 − X) , X ∈ U . Denn (En + X + X 2 + . . . + X m )(1 − X) =
En − X m+1 . Nun kXkm+1 → 0 für m → ∞.
Sei nun GL(n, IR) ⊂ Mat(n) die Menge der invertierbaren Matrizen. Dann ist GL(n, IR)
offen. Sei A ∈ GL(n, IR) und ϕ : Mat(n) → Mat(n) die affine Abbildung X 7→ En − A−1 X,
ψ : Mat(n) → Mat(n) die lineare Abbildung X 7→ XA−1 . Sei V die offene Menge aller
X ∈ GL(n, IR) mit kA−1 Xk < 1, also A−1 X ∈ U. Die Abbildung Inv : GL(n, IR) →
GL(n, IR), Inv(X) = X −1 , ist auf V die Komposition ψ ◦ F ◦ ϕ, F geometrische Reihe:
ϕ(X) = En − A−1 X, F (ϕ(X)) = (En − ϕ(X))−1 = X −1 A, ψ(F (ϕ(X)) = X −1 , daher ist
Inv stetig differenzierbar. Zur Berechnung des Differentials benutzen wir Id(X)Inv(X) =
XX −1 = En , X ∈ GL(n, IR). Mit der Produktregel folgt 0 = d(IdInv)X H = dIdX H InvX+
Id(X)d InvX H = HX −1 + Xd InvX H, damit d InvX H = −X −1 HX −1
40
3.12
Der Fixpunktsatz
Eine Abbildung f : X → X, X metrischer Raum, heißt Kontraktion, wenn es eine
Konstante 0 ≤ λ < 1 gibt mit d(f (x), f (y)) ≤ λd(x, y) ∀x, y ∈ X.
Fixpunktsatz: Sei X vollständiger metrischer Raum und f : X → X eine Kontraktion.
Dann gibt es genau einen Punkt y ∈ X mit f (y) = y (einen Fixpunkt). Für jedes x ∈ X
konvergiert die Folge (xn ), rekursiv definiert durch x0 = x, xn = f (xn−1 ), n ≥ 1, gegen
den Fixpunkt y.
Beweis: Sei (xn ) wie oben und n ≥ 1. Dann gilt
d(xn , xn+1 ) = d(f (xn−1 ), f (xn )) ≤ λd(xn−1 , xn ).
Per Induktion folgt
d(xn , xn+1 ) ≤ λn d(x0 , x1 ) = λn d(x, f (x)).
P
Nun ist λ ∈ [0, 1), also konvergiert n≥0 λn . Nun ist d(xn , xm ) ≤ (λn +. . .+λm−1 )d(x, f (x)),
m ≥ n, also ist (xn ) eine Cauchy-Folge. Weil X vollständig ist, existiert limn→∞ xn =: y.
Weil f stetig ist, folgt f (y) = f (limn→∞ xn ) = limn→∞ f (xn ) = limn→∞ xn+1 = y, also ist y ein Fixpunkt. Sei z ein weiterer Fixpunkt. Dann gilt für y wie oben: d(y, z) =
d(f (y), f (z)) ≤ λd(y, z). Nun ist λ < 1, also d(y, z) = 0, also y = z. qed.
3.13
Der Umkehrsatz
Es sei U ⊂ IRn offen und f : U → IRn eine C k -Abbildung, k ≥ 1.
Umkehrsatz: Sei a ∈ U und df (a) : IRn → IRn ein Isomorphismus. Dann gibt es eine
offene Umgebung V von a in U und eine offene Umgebung W von f (a) in IRn , so daß
f : V → W ein C k -Diffeomorphismus ist, d.h. es gibt eine C k -Abbildung g : W → V
mit f ◦ g = IdW , g ◦ f = IdV .
Beweis: Nach Übergang zu der Abbildung x 7→ f (a + x) − f (a) können wir annehmen
a = 0, f (a) = 0. Sei L = df (0)−1 . Nach Übergang zu L◦f können wir annehmen df (0) = Id.
Schritt 1: Wir wollen die Gleichung y = f (x) für ein gegebenes y lösen, zumindest für y
genügend klein. Dazu betrachten wir die Abbildung ϕy , definiert durch
ϕy (x) = y + x − f (x).
Fixpunkte von ϕy sind Lösungen der obigen Gleichung. Wähle nun r > 0, so daß kId −
df (x)k ≤ 12 für alle x ∈ K2r (0). Nun ist dϕy (x) = Id − df (x). Mit dem Schrankensatz gilt
daher für x1 , x2 ∈ K2r (0):
(∗)
1
kϕy (x1 ) − ϕy (x2 )k ≤ kx1 − x2 k.
2
41
Für kyk < r und kxk ≤ 2r gilt daher
(†)
kϕy (x)k ≤ kϕy (x) − ϕy (0)k + kϕy (0)k = kϕy (x) − ϕy (0)k + kyk < 2r.
Daher bildet ϕy die Kugel K2r (0) in sich ab und ist nach (∗) eine Kontraktion. Nun ist
K2r (0) abgeschlossen, also vollständig. Nach dem Fixpunktsatz hat ϕy genau einen Fixpunkt in K2r (0), nach (†) liegt dieser in K2r (0). Zu jedem y ∈ Kr (0) gibt es also genau ein x =: g(y) ∈ K2r (0) mit ϕy (x) = x, also mit f (x) = y. Setze W = Kr (0)
und V = f −1 (W ) ∩ K2r (0). Nach Konstruktion ist g : W → V die Umkehrabbildung
zu f : V → W .
Schritt 2: Seien y1 , y2 ∈ W und xi = g(yi ). Dann gilt
x2 − x1 = ϕ0 (x2 ) − ϕ0 (x1 ) + f (x2 ) − f (x1 ),
also
1
kx2 − x1 k + kf (x2 ) − f (x1 )k
2
1
=
kx2 − x1 k + ky2 − y1 k.
2
kx2 − x1 k ≤
Nun ist xi = g(yi ), also
kg(y2 ) − g(y1 )k ≤ 2ky2 − y1 k.
Also ist g stetig (sogar Lipschitz-stetig mit Konstante 2).
Schritt 3: Wegen kId − df (x)k ≤ 12 auf K2r (0) gilt kv − df (x)vk ≤ 12 kvk ∀x ∈ V, v ∈ IRn . Für
diese x, v gilt also kdf (x)vk ≥ 12 kvk, und daher ist df (x)v 6= 0 für v 6= 0. Für alle x ∈ V ist
daher df (x) invertierbar.
Schritt 4: Seien y, y 0 ∈ W , x = g(y), x0 = g(y 0 ). Dann mit f (x0 ) = f (x) + df (x)(x0 − x) +
ψ(x0 − x):
kg(y 0 ) − g(y) − df (x)−1 (y 0 − y)k = kx0 − x − df (x)−1 (f (x0 ) − f (x))k
= kx0 − x − df (x)−1 (df (x)(x0 − x) + ψ(x0 − x))k
= kdf (x)−1 (ψ(x0 − x))k ≤ kdf (x)−1 kkψ(x0 − x)k.
Nun gilt kx0 − xk < 2ky 0 − yk, also (x, y fest)
kdf (x)−1 kkψ(x0 − x)k
kψ(g(y 0 ) − g(y))k
−1
≤
2kdf
(x)
= 0.
k
lim
y →y
y0 →y kg(y 0 ) − g(y)k
ky 0 − yk
lim
0
Daher dg(y) = df (x)−1 , also dg = Inv ◦ df ◦ g. Die letzte Gleichung impliziert: g ist C k
(boot strap). qed.
Bemerkungen und Beispiele:
1. Für x ∈ V gilt dg(f (x)) = df (x)−1 .
42
2. Seien P ⊂ IRn , Q ⊂ IRm offen und f : P → Q ein C k -Diffeomorphismus mit k ≥ 1.
Dann folgt n = m. Denn sei g = f −1 , f ◦ g = Id, also d(f ◦ g)(y) = df (g(y))dg(y)
nach der Kettenregel. Ebenso d(g ◦ f )(x) = dg(f (x))df (x), also dg(f (x)) = df (x)−1 .
Die lineare Abbildung df (x) : IRn → IRm ist daher invertierbar. Daher n = m.
3. Im Beweis des Umkehrsatzes erhalten wir eine ”explizite” Beschreibung von W , W =
Kr (0) (unter den gegebenen Normalisierungen f (0) = 0 und df (0) = Id) und V ⊂
K2r (0).
4. Polarkoordinaten: x = r cos ϕ, y = r sin ϕ. Setze f (r, ϕ) = (r cos ϕ, r sin ϕ), definiert auf (0, ∞) × IR. Dann
df (r, ϕ) =
Ã
cos ϕ −r sin ϕ
sin ϕ r cos ϕ
!
,
also det df (r, ϕ) = r 6= 0. Für alle (r, ϕ) ist daher df (r, ϕ) invertierbar. Zum Beispiel
ist f : V → W ein C ∞ -Diffeomorphismus für V =µ(0, ∞) × (−π, π) → IR2 − {(x, y) ¶|
√ 2
x ≤ 0∧y = 0}. Die Umkehrabbildung ist g(x, y) =
x + y 2 , sign(y)arccos( √ x2 2 ) .
x +y
3.14
Über das Lösen von Gleichungen
Sei U ⊂ IRn+k = IRn × IRk = {(x, y) | x ∈ IRn , y ∈ IRk } offen, f : U → IRn eine C m -Abbildung. Für h ∈ IRn setzen wir dx f (x, y)h := df (x, y)(h, 0) und für h0 ∈ IRk
dy f (x, y)h0 := df (x, y)(0, h0 ). Also df (x, y) = (dx f (x, y), dy f (x, y)).
Satz über die impliziten Funktionen: Sei (x0 , y0 ) ∈ U, z0 = f (x0 , y0 ). Sei dx f (x0 , y0 )
invertierbar. Dann gibt es eine Umgebung U 0 × U 00 von (x0 , y0 ) in U und eine C m Abbildung g : U 00 → U 0 mit g(y0 ) = x0 , so daß die Lösungen von f (x, y) = z0 mit
(x, y) ∈ U 0 × U 00 genau die Punkte (g(y), y) sind.
Beweis: Die Abbildung ϕ : U → IRn+k , ϕ(x, y) = (f (x, y), y) ist Cm und hat das Differential
Ã
!
dx f (x, y) dy f (x, y)
,
dϕ(x, y) =
0
IdIRk
also ist dϕ(x0 , y0 ) invertierbar. Es gibt daher eine offene Umgebung Ũ von (x0 , y0 ) in U,
W von (z0 , y0 ) in IRn+k , so daß ϕ : Ũ → W ein C m -Diffeomorphismus ist. Wegen der
besonderen Gestalt von ϕ hat die Umkehrabbildung ϕ−1 die Form ϕ−1 (z, y) = (h(z, y), y),
wobei h : W → IRn eine C m -Abbildung ist mit h(z0 , y0 ) = x0 . Für (z, y) ∈ W ist also
(h(z, y), y) die einzige Lösung von f (x, y) = z mit IRk -Koordinate y und (x, y) ∈ Ũ. Sei
nun U 0 eine offene Umgebung von x0 , U000 eine offene Umgebung von y0 mit U 0 ×U000 ⊂ Ũ und
{z0 } × U000 ⊂ W . Weil h stetig ist mit h(z0 , y0 ) = x0 gibt es eine offene Umgebung U 00 ⊂ U000
von y0 mit h({z0 } × U 00 ) ⊂ U 0 . Setze nun g = h(z0 , ·) : U 00 → U 0 . Dann ist f (g(y), y) = z0 ,
und in U 0 × U 00 sind alle Lösungen von dieser Form. qed.
43
Bemerkungen: 1. Im letzten Schritt hätten wir noch ein besseres Resultat erzielen können:
Es gibt offene Umgebungen V von z0 in IRn , U 00 von y0 mit h(V × U 00 ) ⊂ U 0 . Dann ist
f (h(z, y), y) = z und in U 0 × U 00 sind alle Lösungen von dieser Form. Damit beschreibt h
in U 0 × U 00 alle Lösungen der Gleichung f (x, y) = z mit z ∈ V .
2. f (g(y), y) = z0 ∀y ∈ U 00 . Ableiten nach der Kettenregel ergibt dann
0 = ∂x f (x0 , y0 )dg(y0 ) + ∂y f (x0 , y0 )
und damit:
dg(y0 ) = −(∂x f (x0 , y0 ))−1 ∂y f (x0 , y0 ).
6
y0
3. Sei c : I → U eine differenzierbare Kurve mit
f ◦ c = const., f : U → IR differenzierbar. Dann ist
gradf (c(t)) ⊥ ċ(t), denn 0 = dtd (f ◦ c)(t) = df (c(t))ċ(t) =
hgradf (c(t)), ċ(t)i.
4. Bild zum Satz über die impliziten Funktionen: ∂x f (x0 , y0 ) 6=
0, x = g(y), Lösungen f (g(y), y) = z0 existieren im
Kästchen.
U 00
U0
-
x0
Beispiele: Wir diskutieren zunächst den Fall n = 1 (in der Formulierung des Satzes
über die impliziten Funktionen), also den Fall einer Funktion f : IR1+k → IR (x ∈ IR, y ∈
IRk , z ∈ IR). Dann dx f (x, y) = ∂x f (x, y), die partielle Ableitung nach x.
1. f : IR2 → IR, f (x, y) = ex + ey . Wir betrachten die Gleichung f (x, y) = 0. Nun ist
∂x f (x, y) 6= 0, ∂y f (x, y) 6= 0, aber die Gleichung hat keine Lösung!
2. f : IR2 → IR, f (x, y) = x2 + y 2 . Dann ist ∂x (x, y) = 2x, ∂y f (x, y) = 2y; gradf (x, y) =
2(x, y). In (x, y) = (0, 0) kann man den Satz über die impliziten Funktionen nicht
anwenden. Wir betrachten die Gleichung f (x, y) = 1. 2y = ∂y f (x, y) 6= 0 für y 6= 0.
Ist (x0 , y0 ) eine Lösung mit y0 6= 0, dann gibt es also ε > 0, δ > 0 und eine C ∞ Funktion g : (x0 − ε,√
x0 + ε) → (y0 − δ, y0 + δ) mit x2 + g(x)2 = 1 und g(x0 ) = y0 .
Klar: g(x) = sign(y0 ) 1 − x2 .
3. f : IR2 → IR, f (x, y) = x2 − y 2 . Wir betrachten die Gleichung f (x, y) = 0. ∂x f (x, y) =
2x, ∂y f (x, y) = −2y. gradf (x, y) = 0 nur in (0, 0). In der Nähe jeder Lösung (x0 , y0 ) 6=
44
(0, 0) können wir die Gleichung also nach x = g(y) bzw. y = g(x) auflösen. In der
6
f =0
-
Nähe von (0, 0) ist das nicht möglich.
4. Die Menge aller Punkte der (x, y)-Ebene, für die das Produkt der Entfernungen zu
(1, 0) und (−1, 0) gleich 1 ist, nennt man die Lemniskate. Die Gleichung lautet
((x − 1)2 + y 2 )((x + 1)2 + y 2 ) = 1 bzw. (x2 + y 2 )2 − 2(x2 − y 2 ) = 0. Wir betrachten
daher die Funktion f : IR2 → IR, f (x, y) = (x2 + y 2 )2 − 2(x2 − y 2 ) und die Gleichung
f (x, y) = 0. Sei (x0 , y0 ) eine Lösung mit y0 6= 0. Dann ist ∂y f (x0 , y0 ) = 4(x20 +
y02 + 1)y
können wir lokal nach y auflösen, y = g(x) (Es gilt übrigens
q 0 6= 0. Also √
y = ± −(x2 + 1) + 4x2 + 1.) Nun berechnen wir dg(x) wie folgt: 0 = f (x, g(x)) =
dg
d
f (x, g(x)) = ∂f
(x, g(x)) + ∂f
(x, g(x)) dx
(x),
(x2 + g(x)2 )2 − 2(x2 − g(x)2 ), also 0 = dx
∂x
∂y
∂f
dg
∂f
∂f
−1
wegen ∂y (x, g(x)) 6= 0 folgt dx (x) = − ∂x (x, g(x))( ∂y (x, g(x))) . In unserem Beispiel
liefert Ableiten nach x nach Division durch 4:
(∗)
(x2 + g(x)2 )(x + g(x)g 0 (x)) − (x − g(x)g0 (x)) = 0.
Kritische Punkte von g (g 0 (x) = 0) lösen daher (x2 + g(x)2 − 1)x = 0. Wegen x 6= 0
(da y 6=
0) erhalten wir x2 + g(x)2 = 1. Es folgt nun leicht aus der Definition von f :
√
x = ± 23 . Weiteres√Ableiten von (∗) ergibt eine Gleichung für g00 , und man sieht, daß
in den Punkten ± 23 Maxima oder Minima vorliegen.
1
0.5
0
-0.5
-1
-2
-1
0
1
2
5. esin(x+y) + 3x2 − cos y = 0. Für die entsprechende Funktion f gilt in der Lösung (0, 0):
f (0, 0) = 0,
∂f
(0, 0) = (cos(x + y)esin(x+y) + sin y)| x=0 = 1 6= 0.
y=0
∂y
45
Nach dem Satz über die impliziten Funktionen gibt es ε > 0, δ > 0 und eine stetige
Funktion g : (−δ, δ) → (−ε, ε), so daß die Lösungen in (−δ, δ) × (−ε, ε) gegeben sind
durch {(x, g(x)) | x ∈ (−δ, δ)}.
6. f (x, y, z) = x4 + 2x cos y + sin z. Betrachte f = 0. Nun ist (0, 0, 0) eine Lösung,
∂f
(0, 0, 0) = cos 0 6= 0. Also gibt es eine offene Umgebung V von (0, 0) in IR2 und eine
∂z
C ∞ -Funktion g : V → IR, so daß die Lösungen von f = 0 lokal um (0, 0, 0) gegeben
sind als {(x, y, g(x, y)) | (x, y) ∈ V }.
Ã
!
Ã
µ ¶
x2 + y 2 − z 2
2y −2z
0
=
in (0, 1, 1). Nun ist ∂(y,z) F (x, y, z) =
7. F (x, y, z) =
x2 + y 2 + z 2
2y 2z
2
invertierbar falls yz 6= 0. Man kann daher lokal um (0, 1, 1) differenzierbar
auflösen:
µ ¶
0
y = f (x), z = g(x), so daß die Lösungen von F (x, y, z) =
lokal um (0, 1, 1)
2
gegeben sind als (x, f (x), g(x)).
3.15
Extrema unter Nebenbedingungen
Problem: U ⊂ IRn , f : U → IR eine Funktion; ϕ1 , . . . , ϕk : U → IR Funktionen und
M = {x ∈ U | ϕi (x) = 0, 1 ≤ i ≤ k}. Wir suchen Punkte x0 ∈ M mit f (x) ≤ f (x0 )
(bzw. f (x) ≥ f (x0 )) ∀x ∈ M. Solche Punkte heißen Maxima oder Minima von f unter der
Nebenbedingung ϕ = 0, ϕ = (ϕ1 , . . . , ϕk ).
Multiplikatorregel von Lagrange: Sei U offen, f differenzierbar und ϕi ∈ C 1 (U ).
Falls a ∈ U ein Extremum unter der Nebenbedingung ϕ = 0 ist und die Gradienten
gradϕ1 (a), . . . , gradϕk (a) linear unabhängig sind, so gibt es λ1 , . . . , λk ∈ IR mit
gradf (a) =
k
X
λi gradϕi (a).
i=1
Die Zahlen λ1 , . . . , λk heißen Lagrange-Multiplikatoren.
Beweis: Die lineare Abbildung dϕ(a) hat Rang k. Nach eventueller Umnumerierung der
Koordinaten können wir deshalb annehmen, daß dx ϕ(x0 , y0 ) 6= 0 invertierbar ist, wobei wir
Vektoren des IRn schreiben als (x, y), x ∈ IRk , y ∈ IRn−k und a = (x0 , y0 ). Es gibt also offene
Umgebungen U 0 von x0 in IRk , U 00 von y0 in IRn−k und eine C 1 -Funktion g : U 00 → U 0 ,
g(y0 ) = x0 , so daß
M ∩ (U 0 × U 00 ) = {(g(y), y) | y ∈ U 00 }.
Nach Annahme hat die Funktion h : U 00 → IR, h(y) = f (g(y), y) in y = y0 ein Extremum.
Daher:
(∗)
0 = dh(y0 ) = dx f (x0 , y0 )dg(y0 ) + dy f (x0 , y0 )
= −dx f (x0 , y0 )dx ϕ(x0 , y0 )−1 dy ϕ(x0 , y0 ) + dy f (x0 , y0 ).
46
!
Setze nun L = dx f (x0 , y0 )dx ϕ(x0 , y0 )−1 : IRk → IR mit Matrix (λ1 , . . . , λk ). Per Definition
gilt
Ldx ϕ(x0 , y0 ) = dx f (x0 , y0 )
und nach (∗):
Ldy ϕ(x0 , y0 ) = dy f (x0 , y0 ).
qed.
Beispiele:
!
1. Betrachte die Ebene z = x + y, also ϕ(x, y, z) = x + y − z = 0, und den Punkt
P = (1, 0, 0). Zu minimieren unter der Nebenbedingung ϕ = 0 sei
f (x, y, z) =
°
°
°
°
°
°
°
°2

°
x
°

y  − P °° = (x − 1)2 + y 2 + z 2 .
°
°
z
Es gilt gradf (x, y, z) = (2(x − 1), 2y, 2z), gradϕ(x, y, z) = (1, 1, −1). Wir müssen
lösen 2(x − 1) = λ ∧ 2y = λ ∧ 2z = −λ ∧ x + y − z = 0. Es folgt y − z = λ, also x = −λ
und daher 2(−λ − 1) = λ, also λ = − 23 , damit (x, y, z) = ( 23 , − 13 , 13 ). Dieser Punkt ist
also das Minimum unter der Nebenbedingung, falls es überhaupt ein Minimum gibt,
was man sich aber leicht überlegen kann.
2. Sei A : IRn → IR linear und symmetrisch, d.h. hAx, yi = hx, Ayi ∀x, y ∈ IRn ,
Q(x) := hAx, xi die zugehörige quadratische Form. Wir wollen Q auf S n−1 maximieren, d.h. die Nebenbedingung lautet ϕ(x) := kxk2 − 1 = 0. Es gilt gradQ(x) = 2Ax,
gradϕ(x) = 2x. Also gilt in jedem Maximum x1 von Q auf S n−1 : Ax1 = λx1 für ein
λ ∈ IR, d.h. x1 ist ein Eigenvektor von A. Da orthogonale Komplemente A-invarianter
Unterräume wieder A-invariant sind, folgt induktiv: Es gibt eine Orthonormalbasis
aus Eigenvektoren.
4
Differentialgleichungen (gewöhnliche)
Sei U ⊆ IRn offen. Ein Vektorfeld ist eine Abbildung f : U → IRn . Veranschaulichung:
An jedes x ∈ U den Vektor f (x) dranhängen. Eine Integral- oder Lösungskurve zu f
ist eine differenzierbare Abbildung c : RI → U mit ċ(t) = f (c(t)) ∀t ∈ I. Falls f stetig,
so ist dies äquivalent zu c(t) = c(0) + 0t f (c(τ )) dτ ∀t ∈ I. Speziell interessieren wir uns
für Lösungskurven mit einer Anfangsbedingung c(0) = x0 (d.h. 0 ∈ I, x0 ∈ U), und
allgemeiner für einen ”lokalen Fluß” ϕ : I × V → U, wobei I ⊆ IR offen mit 0 ∈ I und
V ⊆ U offen mit x0 ∈ V , so daß für jedes x ∈ V die Kurve ϕ(·, x) Lösungskurve zu f mit
Anfangsbedingung ϕ(0, x) = x ist.
47
Definition: f heißt lokal Lipschitz-stetig, wenn es zu jedem x0 ∈ U eine Kugel Kr (x0 )
und eine Zahl L > 0 gibt, so daß
kf (y) − f (z)k ≤ Lky − zk ∀z, y ∈ Kr (x0 ).
Bemerkung: Falls f ∈ C 1 (U, IRn ), so ist f lokal Lipschitz-stetig (Schrankensatz).
Satz 1: f sei lokal Lipschitz-stetig, x0 ∈ U . Sei r > 0 so, daß f |K2r (x0 ) Lipschitz-stetig
ist. Sei L Lipschitz-Konstante für f |K2r (x0 ) auf dieser Kugel, und sei M := kf |K2r (x0 ) ksup .
Wähle ε < min{ L1 , Mr }. Dann gibt es einen eindeutigen lokalen Fluß
ϕ : (−ε, ε) × Kr (x0 ) → K2r (x0 ).
Außerdem gilt
kϕ(t, x) − ϕ(t, y)k ≤ eL|t| kx − yk
für alle x, y ∈ Kr (x0 ).
Beweis: Sei x ∈ Kr (x0 ) fest. Setze E := {c : [−ε, ε] → K2r (x0 ) | c stetig, c(0) = x}.
E ist eine abgeschlossene Teilmenge des vollständigen metrischen Raumes C 0 ([−ε, ε], IRn ),
versehen mit der Supremumsnorm. Damit ist E selbst ein vollständiger metrischer Raum.
Definiere S : E → E durch
(Sc)(t) = x +
Z t
f (c(τ )) dτ.
0
R
Sc ∈ E, denn Sc ist stetig, (Sc)(0) = x, und k(Sc)(t) − xk ≤ 0t kf (c(τ ))k dτ ≤ εM < r,
also (Sc)(t) ∈ Kr (x) ⊆ K2r (x0 ). Außerdem ist S kontrahierend mit Kontraktionskonstante
εL < 1: Es gilt
k(Sc)(t) − (Sc̃)(t)k ≤
Z t
0
kf (c(τ )) − f (c̃(τ ))k dτ ≤ εLkc − c̃ksup ,
|
{z
≤Lkc(τ )−c̃(τ )k
}
also kSc − Sc̃ksup ≤ εLkc − c̃ksup . Nach dem Banachschen Fixpunktsatz
gibt es genau
R
eine Kurve c : [−ε, ε] → K2r (x0 ) mit Sc = c, d.h. c(t) = x + 0t f (c(τ )) dτ , also ist c
Lösungskurve mit Anfangsbedingung c(0) = x. Setze ϕ(t, x) = c(t). Seien x, y ∈ Kr (x0 ).
2
0
Definiere
q
qv(t) := kϕ(t, x) − ϕ(t, y)k . v (t) = 2hϕ(t, x) − ϕ(t, y), f (ϕ(t, x)) − f (ϕ(t, y))i ≤
2 v(t)L v(t) = 2Lv(t). Sei u(t) = e−2Lt v(t). Dann u0 (t) ≤ −2Lu(t) + 2Lu(t) ≤ 0, also für
t ≥ 0: u(t) ≤ u(0) = kx − yk2 , also kϕ(t, x) − ϕ(t, y)k ≤ eLt kx − yk. Für t ≤ 0 analog mit
u(t) = e−2|t| v(t). qed.
Bemerkung: Der in Satz 1 konstruierte lokale Fluß ϕ : (−ε, ε) × Kr (x0 ) → K2r (x0 ) ist
selbst wieder Lipschitz-stetig, denn
kϕ(t, x) − ϕ(s, y)k ≤ kϕ(t, x) − ϕ(t, y)k + kϕ(t, y) − ϕ(s, y)k ≤ eL|t| kx − yk + |t − s|M
≤ Ck(x, t) − (y, t)k
48
für ein C > 0.
Satz 2: Sei f lokal Lipschitz-stetig, c : I → U, c̃ : J → U zwei Lösungskurven zu f , und
es gebe t0 ∈ I ∩J mit c(t0 ) = c̃(t0 ). Dann gilt c(t) = c̃(t) für alle t ∈ I ∩J. Lösungskurven
sind also eindeutig, solange sie existieren.
Beweis: Betrachte die Menge I ∗ ⊆ I ∩ J derjenigen t mit c(t) = c̃(t). Dann ist I ∗ 6= ∅ und
abgeschlossen in I ∩J, I ∩J ist zusammenhängend, d.h. I ∗ = I ∩J folgt, wenn I ∗ auch offen
in I ∩J ist. Sei dazu t1 ∈ I ∗ beliebig mit c(t1 ) = c̃(t1 ) =: x0 . Wende Satz 1 an auf eine kleine
Kugel um x0 , dann gibt es ein ε > 0, so daß c(t) = c̃(t) für alle t ∈ (t1 − ε, t1 + ε) ∩ I ∩ J.
Damit ist I ∗ offen. qed.
Definition: Sei f : U → IRn lokal Lipschitz-stetig und G := {(t, x) | die Lösungskurve
cx zur Anfangsbedingung cx (0) = x existiert auf [0, t] (bzw. [t, 0])}.
Φ : G → U,
(t, x) 7→ cx (t)
heißt der globale Fluß zu f .
Bemerkung: Wenn f ∈ C k , k ≥ 1, ist, so ist G offen und Φ ∈ C k (ohne Beweis).
Beispiel, wo die Lösungskurve nicht für alle Zeiten existiert: U = IR, x0 = 0. f (x) = 1+x2 .
Dann gilt für c mit c(0) = 0; ċ(t) = 1 + c(t)2 , also c(t) = tan t, definiert auf (− π2 , π2 ).
Beispiel dafür, daß die Eindeutigkeit
q der Lösungskurve verloren geht, wenn f nicht lokal
Lipschitz-stetig ist: U = IR, f (x) = 2 |x|. f ist in keiner Umgebung von 0 Lipschitz-stetig.
In der Tat gibt es zu jedem ε > 0 unendlich
viele Lösungskurven c : (−ε, ε) → IR mit
(
0
t≤s
,s ≥ 0.
ċ(t) = f (c(t)), c(0) = 0, nämlich cs (t) :=
(t − s)2 t ≥ s
Zeitabhängige Vektorfelder: f : I × U → IRn , Lösungskurven ċ(t) = f (t, c(t)).
Parameterabhängige Vektorfelder: f : P × U → IRn , P ⊆ IRk , Lösungskurven cp (t) mit
c˙p (t) = f (p, c(t)).
Satz 3 (Zeit- und parameterabhängige Differentialgleichungen): Sei f ∈ C m (P ×
I ×U, IRn ), wobei I ⊆ IR offen, 0 ∈ I, P ⊆ IRk offen, U ⊆ IRn offen. Dann gibt es zu jedem
(p0 , x0 ) ∈ P × U eine Umgebung P 0 × U 0 ⊆ P × U und ε > 0, so daß für jedes (p, x) ∈
P 0 ×U 0 genau eine Lösungskurve cp,x : (−ε, ε) → U existiert mit ċp,x (t) = f (p, t, c(t)) und
cp,x (0) = x. Die Lösungskurven sind auf ihren maximalen Definitionsintervallen eindeutig,
und der der globale Fluß Φ : (p, t, x) 7→ cp,x (t) ist auf seinem Definitionsbereich vom Typ
C m.
Beweis: Betrachte Ũ := P × I × U, f˜ ∈ C m (Ũ , IRk × IR × IRn ), f˜(p, t, x) = (0, 1, f (t, p, x)).
Sei (p0 , 0, x0 ) ∈ Ũ. Satz 1, angewendet auf f˜, garantiert die Existenz einer Umgebung
P 0 × U 0 von (p0 , x0 ) und einer Zahl ε > 0, so daß für jedes (p, x) ∈ P 0 × U 0 genau eine
Kurve c̃p,x : (−ε, ε) → IRk × IR × IRn existiert mit c̃˙ p,x (t) = f˜(c̃p,x (t)) = (0, 1, f (c̃p,x (t)) und
c̃p,x (0) = (p, 0, x). Daher (c̃p,x (t))1 = p, (c̃p,x (t))2 = t, (c̃˙ p,x (t))3 = f (p, t, (c̃p,x (t))3 ). Setze
49
also cp,x (t) := (c̃p,x (t))3 . qed.
Bemerkung:
1. f : U → IRm , U ⊂ IRn offen. Falls f stetig differenzierbar ist, so ist f lokal Lipschitzstetig.
Beweis: Sei a ∈ U und r > 0 mit Kr (a) ⊂ U. Nun ist f stetig differenzierbar, also
gibt es eine Konstante c mit kdf (x)k ≤ c für alle x ∈ Kr (a). Also ist f auf Kr (a)
nach dem Schrankensatz Lipschitz-stetig mit Lipschitz-Konstante c.
2. Im Beweis des Existenz-und Eindeutigkeitssatzes (Satz
1) wurde benutzt, daß c : I →
Rt
U eine Lösung ist genau dann, wenn c(t) = c(t0 ) + t0 f (s, c(s)) ds ist. Zur Lösung des
Anfangswertproblems c(t0 ) = y0 ∈ U betrachtet man die ”Picard-Lindelöf”-Iteration
c0 (t) ≡ y0
cm+1 (t) = y0 +
Z t
t0
f (s, cm (s)) ds
Unter geeigneten Voraussetzungen an f (siehe Satz 1) konvergiert dann (cm ) gleichmäßig
gegen die Lösung des Anfangswertproblems.
Beispiel eines zeitabhängigen Vektorfeldes (Im Falle n = 1): betrachte die Differentialgleichung mit getrennten Variablen,
(∗)
y 0 = f (x)g(y).
Hier ist x als Zeit zu interpretieren, und das Vektorfeld F ist gegeben durch F (x, y) =
f (x)g(y) (definiert auf dem Produkt der Definitionsbereiche von f und g). Die Differentialgleichung (∗) kennen wir schon aus dem Wintersemester. Man kann sie (häufig) explizit
lösen; zur Erinnerung: das Anfangswertproblem y(x0 ) = y0 wird wie folgt gelöst: falls
g(y0 ) = 0 ist, so ist y(x) ≡ y0 eine Lösung; falls g(y0 ) 6= 0 und G eine Stammfunktion zu
1/g in einer Umgebung von y0 ist, so erhält man eine Lösung des Anfangswertproblems
durch
Z x
G(y) =
f (ξ) dξ + G(y0 ).
x0
Nun muß man noch nach y auflösen.
Wir betrachten nun Differentialgleichungen höherer (k-ter) Ordnung:
(∗) c(k) = f (c, c0 , . . . , c(k−1) ).
Satz 4: Sei U ⊂ IRkn offen und f : U → IRn eine C m -Abbildung, m ≥ 1. Dann gibt es
(k−1)
zu (y0 , y01 , y02 , . . . , y0
) eine offene Umgebung V in U und ein ε > 0 , so daß für jedes
(y, y 1 , . . . , y (k−1) ) eine eindeutige Lösungskurve c = Φ(·, y, y 1 , . . . , y (k−1) ) : (−ε, ε) → U
von (∗) mit c(0) = y, c0 (0) = y 1 , . . . , c(k−1) (0) = y (k−1) existiert, und Φ ist von der Klasse
C m.
50
Beweis: Wir betrachten das System
ċ = c1
ċ1 = c2
..
.
ċ(k−1) = f (c, c1 , . . . , c(k−1) ).
Dies ist eine Differentialgleichung erster Ordnung für c̃ = (c, c1 , . . . , c(k−1) ), gegeben auf U k
durch F : U k → IRkn mit
F (y, y 1 , . . . , y (k−1) ) = (y 1 , . . . , y (k−1) , f (y, y 1 , . . . , y (k−1) ).
Dann ist F ∈ C m (U k , IRkn ). Falls c̃ eine Lösung ist von c̃˙ = F (c̃), c̃ = (c, c1 , . . . , c(k−1) ), so
ist c eine Lösung von (∗). qed.
4.1
Lineare Differentialgleichungen erster Ordnung
Wir betrachten Differentialgleichungen der Form
(1)
y 0 = A(t)y + a(t),
wobei A : I → Mat(n, IK), a : I → IKn stetige Abbildungen sind; I offenes Intervall und
IK = IR oder IK = C. Wenn a ≡ 0 ist, so nennt man (∗) eine homogene lineare Differentialgleichung erster Ordnung, sonst eine inhomogene lineare Differentialgleichung
erster Ordnung.
Satz 1: Das Anfangswertproblem y(t0 ) = y0 mit t0 ∈ I, y0 ∈ IRn ist eindeutig lösbar,
und die Lösung existiert auf ganz I.
Beweis: Sei J ⊂ I ein kompaktes Intervall. Dann gibt es eine Konstante M mit kA(t)k ≤
M für alle t ∈ J. Die rechte Seite in (1) erfüllt daher auf J × IRn folgende LipschitzBedingung:
kf (t, y1 ) − f (t, y2 )k ≤ Mky1 − y2 k,
f (t, y) = A(t)y + a(t). Der Beweis von Satz 1 im vorherigen Abschnitt zeigt, daß die
Picard-Lindelöf-Iteration
yk+1 (t) = y0 +
Z t
t0
f (s, yk (s)) ds, y0 (t) ≡ y0
auf ganz J erklärt ist (sogar auf ganz I) und zu Lösungen des Anfangswertproblems führt.
In unserem Fall
Z t
yk+1 (t) = y0 + (A(s)yk (s) + a(s)) ds.
t0
51
Es gilt
ky1 (t) − y0 k = k
Z t
t0
(A(s)y0 + a(s)) dsk ≤
≤ (Mky0 k + a0 )|t − t0 |,
Z t
t0
kA(s)y0 + a(s)k ds
wobei ka(s)k ≤ a0 auf J. Insgesamt:
ky1 (t) − y0 k ≤ b0 |t − t0 |
mit b0 = Mky0 k + a0 . Induktiv nehmen wir an
kyk (t) − yk−1 (t)k ≤
b0 M k−1 |t − t0 |k
.
k!
Nach Wahl von b0 ist dies richtig für k = 1.
kyk+1 (t) − yk (t)k = k
≤
Z t
Z t
t0
Z t
t0
A(s)(yk (s) − yk−1 (s)) dsk
kA(s)(yk (s) − yk−1 (s))k ds
|s − t0 |k
ds
k!
t0
Z t
k+1
|s − t0 |k
k
k |t − t0 |
ds = b0 M
= b0 M
k!
(k + 1)!
t0
≤
Mb0 M k−1
P
cm+1
0
Also gilt die Ungleichung für alle k ≥ 1 und daher ist die Reihe M m b0 (m+1)!
, c0 =
P∞
max{|t − t0 | | t ∈ J}, eine Majorante der Reihe y0 + k=0 (yk+1 (s) − yk (s)), s ∈ J, deren
Partialsummen gerade die ym , m ≥ 1, sind. Diese Reihe konvergiert also normal auf J. Für
den Grenzwert y : J → IRn gilt daher
Z t
t0
(A(s)y(s) + a(s)) ds = m→∞
lim
Z t
t0
(A(s)ym (s) + a(s)) ds = m→∞
lim ym+1 (t) = y(t).
Also ist y eine Lösung des Anfangswertproblems.
Zur Eindeutigkeit: seien y1 , y2 Lösungen von (1) mit y1 (t0 ) = y2 (t0 ). Dann ist y1 − y2 eine
Lösung von y 0 = A(s)y mit y(t0 ) = 0. Zu zeigen ist y ≡ 0. Nun gilt
|hy, yi0 | = |hy 0 , yi + hy, y 0 i|
≤ |hA(s)y, yi| + |hy, A(s)yi|
≤ 2Mhy, yi, s ∈ J
Die Funktion h : J → IR, h = hy, yi ist ≥ 0 und erfüllt |h0 | ≤ 2Mh. Daher ist f (t) = he−2Mt
monoton fallend, ≥ 0 mit f (t0 ) = 0. Also h(t) = 0 für t ≥ t0 und daher y(t) = 0 für t ≥ t0 .
Entsprechend behandelt man t ≤ t0 mit f (t) = he2Mt . Damit haben wir gezeigt: auf J gibt
es eine eindeutige Lösung des Anfangswertproblems. Nun können wir I ausschöpfen durch
kompakte Teilintervalle. qed.
52
Satz 2: Sei y eine Lösung von (1). Dann ist z eine Lösung des zugehörigen homogenen
Systems
(2)
z 0 = A(t)z
genau dann, wenn y + z eine Lösung von (1) ist.
Satz 3: Die Menge der Lösungen von (2) ist ein n-dimensionaler Vektorraum über IK
(vermöge punktweiser Addition und Multiplikation mit Skalaren).
Beweis: Sei t0 ∈ I und sei b1 , . . . , bn Basis des IRn . Sei zi die Lösung von (2) mit zi (t0 ) = bi .
P
P
Sei nun z eine beliebige Lösung von (2). Dann z(t0 ) = αi bi = αi zi (t0 ). Wegen der EinP
deutigkeit der Lösungen von (2) folgt z = αi zi . Nun sind die zi linear unabhängig, denn
die zi (t0 ) sind schon linear unabhängig. Also ist z1 , . . . , zn eine Basis des Lösungsraums von
(2). qed.
Bemerkung: Eine solche Basis z1 , . . . , zn des Lösungsraums nennt man auch ein Fundamentalsystem von Lösungen von (2).
Wir betrachten nun den Fall A(t) ≡ A ∈ Mat(n, C). Sei B ∈ Mat(n, C) invertierbar. Sei y
eine Lösung von (1). Dann ist x = By eine Lösung von
x0 = (By)0 = By 0 = B(Ay + a(t)) = BAB −1 (By) + Ba(t) = (BAB −1 )x + b(t)
mit b = Ba. Nun gibt es eine invertierbare Matrix B, so daß BAB −1 in Jordanscher
Normalform ist, d.h. BAB −1 ist eine Matrix aus Kästchen der Form

Ã
λn
 ..
 .
 .
 .
 .
0

1 ... 0
. . . . . . .. 
. 
,
.. . .
. 1 

.
. . . . . . λn
!

 .
 ..
BAB −1 = 

..
.
...
..
.
0
..
.
...





A1 0
Falls BAB =
mit A1 ∈ Mat(k, C), A2 ∈ Mat(n−k, C), dann sind (x1 , . . . , xk )
0 A2
und (xk+1 , . . . , xn ) entkoppelt: BAB −1 = ((αij ))
−1
ẋ1 = α11 x1 + . . . + α1k xk + b1 (t)
ẋ1 = α21 x1 + . . . + α2k xk + b2 (t)
.. .. ..
. . .
ẋk = αk1 x1 + . . . + αkk xk + bk (t)
ẋk+1 = αk+1,k+1 xk+1 + . . . + αk+1,n xn + bk+1 (t)
.. .. ..
. . .
ẋn = αn,k+1 xk+1 + . . . + αn,n xn + bn (t)
53


λ 1 ... 0
 ... . . . . . . ... 

 ..
 führt zu einer Gleichung der Form
Ein Kästchen der Form 
.. . .
.
.
.
1
0 ... ... λ
ẋ1 = λx1 + x2 + b1 (t)
ẋ2 = λx2 + x3 + b2 (t)
.. .. ..
. . .
ẋk = λxk + bk (t)
Seien A : I → Mat(n, IK) und a : I → IKn stetig. Es liegt nahe, den Lösungsansatz, den wir
im Wintersemester im Falle n = 1 diskutiert haben, auch hier zu testen. Sei dazu zunächst
n = 1 und B : I → IK eine Stammfunktion zu A. Dann ist eB : I → IK eine Lösung von
(2):
(eB )0 (x) = B 0 (x)eB(x) = A(x)eB(x) .
Die allgemeine Lösung von (2) ist y = ceB , c ∈ IK.
Im allgemeinen Fall n ≥ 1 sei nun B : I → Mat(n, IK) ebenfalls eine Stammfunktion zu A.
Wegen
kB(x)k k ≤ kB(x)kk
und weil kB(x)k auf kompakten Teilintervallen von I beschränkt ist, konvergiert
eB(x) =
X
1
B(x)k
k!
k≥0
auf kompakten Teilintervallen von I gleichmäßig. Daher ist eB : I → Mat(n, IK), x 7→ eB(x) ,
eine C 1 -Funktion. Ferner gilt
(B(x)k )0 = B 0 (x)B(x)k−1 + B(x)B 0 (x)B(x)k−2 + . . . + B(x)k−1 B 0 (x).
Damit wir dies wie im Falle n = 1 schreiben können als kB 0 (x)B(x)k−1 , brauchen wir
B 0 (x)B(x) = B(x)B 0 (x),
x ∈ I.
Falls dies gilt, so ist
(eB )0 (x) =
X
X 1
k 0
B (x)B(x)k−1 = B 0 (x)
B(x)k = B 0 (x)eB(x) .
k≥1 k!
k≥0 k!
Satz 4: Sei B eine Stammfunktion zu A auf I mit A(x)B(x) = B(x)A(x) für alle x ∈ I.
Dann ist die allgemeine Lösung von (2) gegeben durch
y = eB v,
v ∈ IRn .
Falls v1 , . . . , vn eine Basis von IKn ist, so ist y1 , . . . , yn mit yi (x) = eB(x) vi , 1 ≤ i ≤ n, ein
Fundamentalsystem von Lösungen von (2).
54
Beweis: In einer Übungsaufgabe ist bewiesen worden: für C ∈ Mat(n, IK) ist eC invertierbar mit inverser Matrix e−C . Sei nun y eine Lösung von (2) und sei y(x0 ) = y0 . Dann
gibt es ein v0 ∈ IKn mit eB(x0 ) v0 = y0 . Wegen der Eindeutigkeit der Lösbarkeit des Anfangswertproblems folgt y = eB v0 (d.h. y(x) = eB(x) v0 für alle x ∈ I). Analog folgt, daß
y1 (x0 ), . . . , yn (x0 ) eine Basis des IKn ist für alle x ∈ I. qed.
Beispiel: Wenn A(x) ≡ A0 ∈ Mat(n, IK), so ist B : I → Mat(n, IK), B(x) = (x − x0 )A0 ,
x ∈ I, eine Stammfunktion der konstanten Abbildung A ≡ A0 , und offensichtlich gilt
B(x)A(x) = (x − x0 )A0 A0 = A0 (x − x0 )A0 = A(x)B(x) für alle x ∈ I.
Bemerkung: Sei y1 , . . . , yn : I → IKn ein Fundamentalsystem von Lösungen von (2). Dann
ist y1 (x), . . . , yn (x), x ∈ I, eine Basis von IKn : sei nämlich y0 ∈ IKn und sei y die Lösung
P
von (1) mit y(x) = y0 . Dann gibt es nach Definition c1 , . . . , cn ∈ IK mit y = ci yi , also
P
y0 = y(x) = ci yi (x).
Wir setzen nun Y (x) = (y1 (x), . . . , yn (x)) ∈ Mat(n, IK), x ∈ I. Nach dem eben Gesagten ist
Y (x) invertierbar für alle x ∈ I. Ferner Y 0 = AY . Um eine partikuläre Lösung y : I → IKn
von (1) zu bestimmen, machen wir den Ansatz (Variation der Konstanten):
v : I → IKn differenzierbar.
y(x) = Y (x)v(x),
Es gilt dann
!
y 0 (x) = Y 0 (x)v(x) + Y (x)v 0 (x) = A(x)y + a(x).
Nun ist y = Y v, Y 0 = AY , also Y 0 v = AY v = Ay. Wir erhalten Y (x)v0 (x) = a(x) und
damit v 0 (x) = Y (x)−1 a(x), x ∈ I.
Satz 5: Sei Y = (y1 , . . . , yn ) ein Fundamentalsystem von Lösungen zu (2). Dann sind
die Lösungen von (1) gegeben durch
y(x) = Y (x)
µZ x
x0
¶
Y (ξ)−1 a(ξ)dξ + Y −1 (x0 )y0 .
In der angegebenen Form löst Y das Anfangswertproblem y(x0 ) = y0 .
Zurück zum Fall A(x) ≡ A0 ∈ Mat(n, IK) ⊂ Mat(n, C). Es gibt dann eine Matrix B ∈
Mat(n, C), so daß BA0 B −1 eine obere Dreiecksmatrix ist. Mit z = By transformiert sich
die homogene Gleichung (2) zu z 0 = (BA0 B −1 )z. Sei
BA0 B
−1
=






γ11
γ12
0
..
.
γ22
...
0
...
...
...
...
0

γ1n
.. 
. 


γn−1,n 
γnn
Damit schreibt sich z 0 = (BA0 B −1 )z als
z10 = γ1n zn + . . . + γ12 z2 + γ11 z1
55
z20 = γ2n zn + . . . + γ22 z2
..
.
0
= γn−1,n zn + γn−1,n−1 zn−1
zn−1
0
zn = γnn zn
Dies sind n gewöhnliche und untereinander gekoppelte Differentialgleichungen, die letzte ist
entkoppelt von den übrigen. Die Lösung der letzten Gleichung ist zn (x) = cn eγnn x , x ∈ IR.
Die vorletzte Gleichung wird damit zu
0
= γn−1,n−1 zn−1 + γn−1,n cn eγnn x .
zn−1
Die Lösung zn−1 hiervon ist
zn−1 (x) = eγn−1,n−1 x
µZ x
x0
¶
e−γn−1,n−1 ξ γn−1,n cn eγnn ξ dξ + cn−1 .
Induktiv bestimmen wir zn , zn−1 , . . . , z1 . Die Lösungen des ursprünglichen Systems erhalten
wir durch y = B −1 z. Sie sind reell, falls A0 ∈ Mat(n, IR) ist und die Anfangsbedingung
reell ist (wegen Satz 1).
5
Untermannigfaltigkeiten
Für 0 < d < n setzen wir
IRd0 = {x ∈ IRn | xd+1 = . . . = xn = 0}.
Definition: Eine nichtleere Menge M ⊂ IRn heißt d-dimensionale C k Untermannigfaltigkeit von IRn , wenn es zu jedem a ∈ M eine offene Umgebung
U in IRn und einen C k -Diffeomorphismus ϕ : U → V , V ⊂ IRn offen, gibt mit
ϕ(M ∩ U ) = IRd0 ∩ V . Ein solches ϕ heißt auch Karte der Untermannigfaltigkeit M.
ϕ
M ∩U
Beispiele:
56
q
IRd0 ∩ V
0. lineare Unterräume: sei M ⊂ IRn ein linearer Unterraum der Dimension d. Wähle eine
Basis b1 , . . . , bd von M und ergänze mit bd+1 , . . . , bn zu einer Basis von IRn . Wähle
P
U = IRn = V und ϕ : IRn → IRn die Abbildung mit ϕ(x) = y, wobei x = yi bi .
Dann ist ϕ eine invertierbare lineare Abbildung, also ein C ∞ -Diffeomorphismus mit
ϕ(M) = IRd0 .
1. Sei U ⊂ IRd offen und f : U → IRm eine C k -Abbildung. Dann ist Graph(f ) ⊂
IRd × IRm = IRd+m eine C k -Untermannigfaltigkeit.
Beweis: Setze W = U × IRm ; W ⊂ IRd+m ist offen und enthält Graph(f ). Erkläre
ϕ : W → W durch ϕ(x, y) = (x, y − f (x)). Dann ist ϕ ein C k -Diffeomorphismus mit
ϕ(Graph(f )) = W ∩ IRd0 = U .
2. S n = {x ∈ IRn+1 | kxk = 1}, die Einheitssphäre ist C ∞ -Untermannigfaltigkeit.
Beweis: Sei a ∈ S n . Dann gibt es ein i mit ai 6= 0. Bis auf Umnumerierung und Vorzeichenwechsel nehmen wir an i = n + 1 und an+1 > 0. Seien U = {xq∈ IRn+1 | x21 + . . . +
x2n < 1, xn+1 > 0}, V = {x ∈ IRn+1 | x21 + . . . + x2n < 1, xn+1 > − 1 − x21 − . . . − x2n }
q
und ϕ : U → V die Abbildung ϕ(x1 , . . . , xn+1 ) = (x1 , . . . , xn , xn+1 − 1 − x21 − . . . − x2n ).
Dann sind U und V offen und ϕ ist ein C ∞ -Diffeomorphismus mit ϕ(U ∩S n ) = V ∩IRn0 .
Satz 1: Sei U ⊂ IRn offen und f : U → IRm eine C k -Abbildung, k ≥ 1. Sei c ∈ Im(f )
und df (x) surjektiv für alle x ∈ f −1 (c) =: M. Dann ist M eine C k -Untermannigfaltigkeit
von IRn mit Dimension n − m.
Beispiel: S n = M = f −1 (1) mit f : IRn+1 → IR, f (x) = kxk2 . Für x ∈ S n gilt gradf (x) =
2x 6= 0 (denn kxk = 1).
Beweis: Sei a ∈ M. Bis auf Umnumerierung der Koordinaten können wir annehmen:
d(x1 ,...,xm ) f (a) ist invertierbar. Nach dem Satz über die impliziten Funktionen gibt es eine
offene Umgebung U 0 von (a1 , . . . , am ) in IRm , eine offene Umgebung U 00 von (am+1 , . . . , an )
in IRn−m und eine C k -Abbildung g : U 00 → U 0 , so daß M ∩ (U 0 × U 00 ) = {(g(y), y) | y ∈ U 00 };
U 0 × U 00 ist eine offene Umgebung von a in IRn . Erkläre nun einen C k -Diffeomorphismus
ϕ : IRm × U 00 → IRm × U 00 durch ϕ(η, y) = (η − g(y), y). Die Umkehrabbildung ist ψ :
IRm × U 00 → IRm × U 00 , ψ(ζ, y) = (ζ + g(y), y). Also ist V = ψ−1 (U 0 × U 00 ) offen in IRm × U 00
und damit offen in IRn . Ferner ist ϕ : U 0 × U 00 → V ein C k -Diffeomorphismus. Nach
Definition von ϕ gilt ϕ((U 0 × U 00 ) ∩ M) = {0} × U 00 . Also ist M eine (n − m)-dimensionale
Untermannigfaltigkeit. qed.
Beispiele:
1. O(n) = {A ∈ Mat(n, IR) | At A = I}, die orthogonale Gruppe, ist eine Untermann(n+1)
nigfaltigkeit. Betrachte dazu S(n) = {X ∈ Mat(n, IR) | X t = X} ∼
= IR 2 und die
C ∞ -Abbildung f : Mat(n, IR) → S(n), f (X) = X t X. Es gilt O(n) = f −1 (I). Nun gilt
df (A)H = At H + H t A. Sei nun A ∈ O(n), Y ∈ S(n). Dann ist H = 12 AY eine Lösung
von df (A)H = Y , denn At ( 12 AY ) + ( 12 AY )t A = 12 A−1 AY + 12 Y t (A−1 A) = Y , denn
57
A−1 = At und Y t = Y . Also ist O(n) eine C ∞ -Untermannigfaltigkeit von Mat(n, IR)
= n(n−1)
.
mit Dimension n2 − n(n+1)
2
2
2. SL(n, IR) = {A ∈ Mat(n, IR) | det A = 1}, die spezielle lineare Gruppe, ist eine
Untermannigfaltigkeit von Mat(n, IR) mit Dimension n2 − 1.
Beweis: Betrachte f := det : Mat(n, IR) → IR. Eine Matrix in Mat(n, IR) ist das


x1j
. 
n-Tupel ihrer n Spaltenvektoren, X = (x1 , . . . , xn ), wobei xj = 
 .. , also det :
xnj
IRn × . . . × IRn → IR. Dann ist det multilinear und alternierend. Nun gilt für festes
X ∈ Mat(n, IR) und H ∈ Mat(n, IR):
f (X + H) = f (x1 + h1 , . . . , xn + hn )
= f (x1 , . . . , xn ) + f (h1 , x2 , . . . , xn ) + . . . + f (x1 , . . . , xn−1 , hn ) +
f (h1 , h2 , x3 , . . . , xn ) + weitere Terme, die mind. 2 der hj enthalten
Behauptung: d det(X)H = det(h1 , x2 , . . . , xn ) + . . . + det(x1 , . . . , xn−1 , hn ). Dazu ist
zu zeigen: f (h1 , h2 , x3 , . . . , xn ) + . . . = o(kHk). Nun gilt z.B.:
| det(h1 , h2 , x3 , . . . , xn )| =
≤
¯
¯X
¯
¯
sign(σ)hσ(1),1 hσ(2),2 xσ(3),3
¯
¯σ∈Sn
X
σ∈Sn
¯
¯
¯
· . . . · xσ(n),n ¯¯
¯
|hσ(1),1 hσ(2),2 xσ(3),3 · . . . · xσ(n),n |
≤ |Sn | max |hij |2 max |xij |n−2 .
i,j
i,j
Insgesamt ist daher für kXk := maxi,j |xij | und kHk = maxi,j |hij | ≤ 1, der Rest
≤ (Anzahl der Terme) · |Sn |kHk2 max{kXkk | 0 ≤ k ≤ n − 2} ≤ CkHk2 , wobei C
eine geeignete Konstante ist. Deshalb ist d det(X) wie behauptet, also
d det(X)H = det(h1 , x2 , . . . , xn ) + . . . + det(x1 , . . . , xn−1 , hn ).
Insbesondere: d det(I)H = tr(H) und
d det(A)(AY ) = det(y11 a1 + . . . yn1 an , a2 , . . . , an ) +
det(a1 , y12 a1 + . . . + yn2 an , a3 , . . . , an ) + . . .
= y11 det(a1 , . . . , an ) + y22 det(a1 , . . . , an ) + . . . + ynn det(a1 , . . . , an )
= tr(Y ) det(A)
Für A ∈ SL(n, IR) folgt d det(A)(AY ) = tr(Y ). Daher ist d det(A) 6= 0, A ∈ SL(n, IR).
Allgemeiner folgt d det(A) 6= 0 ⇔ det A 6= 0 ⇔ A ∈ GL(n, IR). Damit ist SL(n, IR)
C ∞ -Untermannigfaltigkeit von Mat(n, IR) mit Dimension n2 − 1.
Sprechweisen: Sei f : U → IRm , U ⊂ IRn offen, eine C k -Abbildung. Dann heißt x ∈ U
regulär, falls df (x) maximalen Rang min(n, m) hat. Ansonsten heißt x singulär. y ∈ IRm
heißt regulär, wenn alle x ∈ f −1 (y) regulär sind, ansonsten singulär.
58
Satz 1’: Sei n ≥ m, U ⊂ IRn offen, f : U → IRm eine C k -Abbildung. Falls c ∈ Im(f )
regulärer Wert ist, so ist M = f −1 (c) eine (n−m)-dimensionale C k -Untermannigfaltigkeit
in IRn .
Satz 2: M ⊂ IRn ist genau dann eine d-dimensionale C k -Untermannigfaltigkeit, wenn es
zu jedem a ∈ M eine offene Umgebung U von a in IRn und C k -Funktionen
ϕ1 , . . . , ϕm : U → IR,
m = n − d,
gibt mit
1. M ∩ U = {x ∈ U | ϕ1 (x) = . . . = ϕm (x) = 0},
2. gradϕ1 (x), . . . , gradϕm (x) sind linear unabhängig für alle x ∈ U.
ψ
Beweis: Sei U → V eine Karte für M um a wie in der Definition. Dann sind die ϕi = ψd+i ,
1 ≤ i ≤ n − d = m, Funktionen wie gewünscht: (1) nach Definition der Karte, (2) weil ψ
ein C k -Diffeomorphismus ist, also sogar gradψ1 (x), . . . , gradψn (x) linear unabhängig sind
für alle x ∈ U. Seien umgekehrt ϕ1 , . . . , ϕm : U → IR Funktionen, die (1) und (2) erfüllen,
m = n − d. Betrachte f = (ϕ1 , . . . , ϕm ) : U → IRm . Wegen (1) gilt M ∩ U = f −1 (0)
und wegen (2) hat df (x) Rang m für alle x ∈ U . Also ist M ∩ U nach Satz 1 eine C k Untermannigfaltigkeit, damit auch M. qed.
5.1
Tangentialraum
Definition: Sei M ⊂ IRn nicht leer. Dann heißt v ∈ IRn Tangentialvektor an M in
a ∈ M, wenn es eine C 1 -Kurve c : (−ε, ε) → M gibt mit c(0) = a und ċ(0) = v. Die
Menge der Tangentialvektoren an M in a heißt Tangentialkegel von M in a, Ta M. Falls
Ta M ein Unterraum von IRn ist, so heißt Ta M auch Tangentialraum an M in a.
Satz: Sei M ⊂ IRn eine d-dimensionale Untermannigfaltigkeit, a ∈ M. Dann gilt
1. Ta M ist ein d-dimensionaler Unterraum von IRn ;
2. falls M Niveaumenge eines regulären Wertes einer Abbildung f : U → IRm ist, so
ist Ta M = ker df (a).
Beweis:
1. Sei a ∈ M und ϕ : U → V eine Karte um a für M, also a ∈ U, ϕ(U ∩M) = IRd0 ∩V . Sei
nun c : (−ε, ε) → M eine C 1 -Kurve mit c(0) = a. Durch Verkleinern von ε können wir
59
annehmen c(t) ∈ U für alle t ∈ (−ε, ε). Dann gilt (ϕ ◦ c)(t) ∈ IRd0 für alle t ∈ (−ε, ε),
also dtd (ϕ ◦ c)(0) ∈ IRd0 . Daher ist Ta M ⊂ L = {w ∈ IRn | ∃v ∈ IRd0 : w = (dϕ(a))−1 v},
denn dtd (ϕ ◦ c)(0) = dϕ(a)ċ(0). Sei andererseits v ∈ IRd0 , und ε > 0 so gewählt, daß
ϕ(a) + tv ∈ V für −ε < t < ε. Setze c̃(t) = ϕ(a) + tv. Dann ist c = ϕ−1 ◦ c̃ eine
˙
C 1 -Kurve in M mit c(0) = a, also ist ċ(0) = dϕ−1 (ϕ(a))c̃(0)
= (dϕ(a))−1 v ∈ Ta M.
Also folgt Ta M = L.
2. Sei c : (−ε, ε) → M eine C 1 -Kurve mit c(0) = a. Dann ist f ◦ c = const. Also
df (a)ċ(0) = dtd (f ◦ c)(0) = 0, daher Ta M ⊂ ker df (a). Nun gilt dim Ta M = d =
dim ker df (a), also Ta M = ker df (a). qed.
Beispiele:
1. S n : sei a ∈ S n . Dann ist Ta S n = {v ∈ IRn+1 | ha, vi = 0}. Für f (x) = kxk2 = hx, xi
gilt nämlich df (a)v = 2ha, vi.
2. O(n): sei f (X) = X t X wie oben. Sei A ∈ O(n). Dann ist X ∈ ker df (A) genau
dann, wenn es eine schiefsymmetrische Matrix Y gibt mit X = AY ; falls dies gilt,
ist df (A)(AY ) = (AY )t A + At (AY ) = Y t + Y = 0. Andererseits hat der Raum der
. Nun gilt dim TA O(n) =
schiefsymmetrischen n × n-Matrizen die Dimension n(n−1)
2
n(n−1)
, also folgt die Behauptung: TA O(n) = {X ∈ Mat(n, IR) | ∃Y ∈ Mat(n, IR) :
2
t
Y = −Y, X = AY }.
3. SL(n, IR): für A ∈ SL(n, IR) ist
TA SL(n, IR) = {X ∈ Mat(n, IR) | ∃Y ∈ Mat(n, IR) : tr(Y ) = 0 ∧ X = AY }.
Bemerkungen:
1. O(n) hat zwei Wegzusammenhangskomponenten. Zunächst: det(A) = ±1 für A ∈
O(n). Sei SO(n) = {A ∈ O(n) | det(A) = 1}. Dann ist SO(n) wegzusammenhängend:
sei nämlich A ∈ SO(n). Dann gibt es eine Matrix B ∈ SO(n), so daß BAB −1
Normalform hat, also

BAB −1
D1
 .
 ..


0

=
 0
 .
 .
 .
0
...
...
0
..
.
. . . Dk
... 0
..
.
... 0
0
..
.
0
1
..
.
0

... 0
.. 
.

... 0

,
... 0
. . . .. 

.
... 1
60
Di =
µ
cos αi
− sin αi
¶
sin αi
.
cos αi
Daher ist

c(t) = B
−1
D1 (t) . . .
 .
...
 ..








0
0
..
.
0

0
..
.
0 ... 0
..
.. 
.
.


. . . Dk (t) 0 . . . 0 
 B,
...
0
1 ... 0
..
.. . .
.
. .. 

.
.
...
0
0 ... 1
Di (t) =
µ
cos tαi
− sin tαi
sin tαi
cos tαi
¶
ein stetiger (sogar C ∞ -) Weg von c(0) = I zu c(1) = A. Damit folgt die Behauptung.
Es folgt auch, daß M = {A ∈ O(n) | det A = −1} wegzusammenhängend ist. Denn
sei


−1 0 . . . 0

. . . .. 
 0
1
.
;
C=
... ...
 ..

 .
0
0 ... 0 1
dann ist M → SO(n), A 7→ CA, ein Homöomorphismus.
Es gibt keinen stetigen Weg von SO(n) nach M, denn die Determinantenabbildung
ist stetig und nimmt auf O(n) nur die Werte 1 und −1 an. Also besteht O(n) aus den
Wegzusammenhangskomponenten SO(n) und M.
Übung: Eine Untermannigfaltigkeit ist zusammenhängend genau dann, wenn sie wegzusammenhängend ist.
2. SL(n, IR) ist wegzusammenhängend. Sei dazu A ∈ SL(n, IR). Dann gibt es eine Matrix B ∈ SO(n) und eine positiv definite symmetrische Matrix C mit A = BC. Denn
t
At A ist positiv definit und symmetrisch
√ (hA Av, vi = hAv, Avi > 0 für v 6= 0, also
t
t
t
t
Av 6= 0, (A A) = A A).
Sei C = A
A, definiert wie folgt: es gibt M ∈ SO(n),


π1 . . . 0
√
.
 ..
−1 t
so daß M A AM =  . . . . .. 
At A =
 mit πi > 0, 1 ≤ i ≤ n. Setze
0 . . . πn
√

π1 . . .
0
√
.
.. 
...
t
M −1 
 ..
.  M. Dann ist A A positiv definit und symmetrisch und
√
πn
0
...
√
2
t
t
( A A) = A A, denn
√

√

π1 . . .
0
π1 . . .
0
√
.
.. 
.. 
−1  .
...
...
( At A)2 = M −1 
 ..
.  MM  ..
. M
√
√
πn
πn
0
...
0
...


π1 . . . 0
.
−1  ..
t
= M  . . . . .. 
 M = A A.
0 . . . πn
61
√
√
−1
−1
!
Noch zu zeigen: (AC −1 )t = (AC −1 )−1 . Nun (A At A )t (A At A ) =
√
√
√
√
√
√
−1
−1
−1
−1
( At A )t At A At A = At A
At A At A At A = I. Also ist B = AC −1 ∈
O(n). Nun ist det B = det A(det C)−1 > 0, also B ∈ SO(n).
Sei nun u(t) = Bc(t), 0 ≤ t ≤ 1, wobei
√ t

π1 . . .
0
.
.. 
...
c(t) = M −1 
 ..
. M
√ t
πn
0
...
ein C ∞ -Weg von I nach C ist, der in SL(n, IR) verläuft wegen π1 · . . . · πn = 1. Also
ist u(t), 0 ≤ t ≤ 1, ein C ∞ -Weg von B nach A, der in SL(n, IR) verläuft. Nun gibt es
nach der ersten Bemerkung einen C ∞ -Weg von I nach B, der in SO(n, IR) ⊆ SL(n, IR)
verläuft. Insgesamt erhalten wir einen stetigen Weg von I nach A, der in SL(n, IR)
verläuft. Also ist SL(n, IR) wegzusammenhängend.
5.2
Normalraum und Multiplikatorregel von Lagrange
Sei M ⊂ IRn eine d-dimensionale Untermannigfaltigkeit. Dann heißt
Na M = (Ta M)⊥
der Normalraum zu M in a ∈ M. Die Elemente aus Na M heißen Normalvektoren zu
M in a.
Satz: Sei M Niveaumenge der C k -Abbildung ϕ : U → IRm , d = n − m ≥ 0,
M = ϕ−1 (c), wobei c ein regulärer Wert von ϕ ist. Schreibe ϕ = (ϕ1 , . . . , ϕm ). Dann
ist {gradϕ1 (a), . . . , gradϕm (a)} eine Basis von Na M, a ∈ M.
Beweis: Nach einem früheren Satz gilt
Ta M = ker dϕ(a) = ker dϕ1 (a) ∩ . . . ∩ ker dϕm (a),
also v ∈ Ta M ⇔ hgradϕi (a), vi = 0, 1 ≤ i ≤ m. Daher sind gradϕ1 (a), . . . , gradϕm (a) ∈
Na M. Weil Rang(dϕ(a)) = m ist, sind sie linear unabhängig, also eine Basis von Na M
(dim Na M = m). qed.
Umformulierung der Multiplikatorregel: Falls die C 1 -Funktion f : U → IR unter
der Nebenbedingung ϕ = c ein Extremum in a ∈ M = {x ∈ U | ϕ(x) = c} hat und c ein
regulärer Wert von f ist, so ist gradf (a) ∈ Na M.
Beispiel: Sei M ⊂ IRn eine C k -Untermannigfaltigkeit und x0 ∈ IRn − M. Sei a ∈ M ein
Punkt, der unter allen Punkten von M minimalen (oder maximalen) Abstand zu x0 hat.
Dann ist a − x0 ∈ Na M. Die Funktion f : IRn − {x0 } → IR, f (x) = kx − x0 k ist C ∞ und
x−x0
gradf (x) = kx−x
. Nach der Multiplikatorregel ist daher a − x0 ∈ Na M.
0k
Wir wollen Na M in Beispielen berechnen.
62
1. Sn : Na S n = {λa | λ ∈ IR}.
2. O(n) : auf Mat(n, IR) wählen wir als Skalarprodukt
hX, Y i = tr(X t Y ).
Sei so(n, IR) ⊂ Mat(n, IR) der Raum der schiefsymmetrischen und S(n) ⊂ Mat(n, IR)
der Raum der symmetrischen Matrizen. Dann ist so(n, IR) = TI O(n) und NI O(n) =
, dim S(n) = n(n+1)
und tr(X t Y ) = 0
S(n) = (so(n, IR))⊥ , denn dim so(n, IR) = n(n−1)
2
2
falls X ∈ so(n, IR) und Y ∈ S(n): Falls X schiefsymmetrisch und Y symmetrisch, so
gilt −tr(XY ) = tr(X t Y ) = tr(Y X t ) = tr(XY t ) = tr(XY ). Ferner gilt für X, Y ∈
Mat(n, IR), A ∈ O(n),
tr((AX)t (AY )) = tr(X t (At A)Y ) = tr(X t Y ).
Also ist NA O(n) = {Z ∈ Mat(n, IR) | ∃Y ∈ S(n) : Z = AY }.
3. SL(n, IR) : sei sl(n, IR) = {Y ∈ Mat(n, IR) | trY = 0} = TI SL(n, IR). Dann ist
(sl(n, IR))⊥ = {αI | α ∈ IR}, denn tr((αI)t Y ) = αtr(Y ) = 0. Ferner
NA SL(n, IR) = {α(A−1 )t | α ∈ IR},
denn falls trY = 0, so ist AY ∈ TA SL(n, IR) und
tr((α(A−1 )t )t AY ) = αtrY = 0.
5.3
Krümmung von Kurven
Sei I offen, c : I → IR2 eine C 2 -Kurve, c0 (t) 6= 0. Wir suchen zu t ∈ I einen Kreis,
der die Kurve in c(t) ”gut” approximiert. Seien dazu t1 < t2 < t3 Punkte in I ”nahe”
an t. Falls c(t1 ), c(t2 ), c(t3 ) nicht auf einer Geraden liegen, so gibt es einen eindeutigen
Kreis durch diese Punkte mit Mittelpunkt m(t1 , t2 , t3 ). Betrachte die Funktion f : t 7→
kc(t) − m(t1 , t2 , t3 )k2 . Diese Funktion ist C 2 und hat in t1 , t2 , t3 denselben Wert, nämlich
den Radius des gegebenen Kreises. Also gibt es τ1 ∈ (t1 , t2 ), τ2 ∈ (t2 , t3 ) mit f 0 (τi ) = 0;
hc0 (τi ), c(τi ) − m(t1 , t2 , t3 )i = 0,
i = 1, 2.
(1)
Betrachte g : t 7→ hc0 (t), c(t) − m(t1 , t2 , t3 )i. Es gibt σ ∈ (τ1 , τ2 ) mit g 0 (σ) = 0:
hc00 (σ), c(σ) − m(t1 , t2 , t3 )i = −kc0 (σ)k2 .
(2)
Falls t1 , t2 , t3 → t und m(t1 , t2 , t3 ) → m, dann folgt aus (1) und (2)
hc0 (t), c(t) − mi = 0
63
(3)
hc00 (t), c(t) − mi = −kc0 (t)k2 .
(4)
Gleichung (3) zeigt, daß der erwartete Limeskreis, der sogenannte Schmiegkreis, die Kurve
im Punkte c(t) berührt. Die Gleichung (4) bestimmt m, sofern c00 (t) kein Vielfaches von c0 (t)
ist. Ferner folgt aus (4), daß c00 (t) kein Vielfaches von c0 (t) sein kann (unter den gegebenen
Voraussetzungen). Einfachheitshalber nehmen wir ab jetzt an, daß kc0 (s)k ≡ 1. Dann ist
hc0 (s), c00 (s)i ≡ 0. Dann besagt (4), daß die Krümmung von c, also der Kehrwert des Radius
des Schmiegkreises, in c(t) gegeben ist durch kc00 (t)k.
Satz: Sei c : I → IR2 eine C 2 -Kurve mit kc0 (s)k ≡ 1. Sei t ∈ I und c00 (t) 6= 0. Dann gibt
es ein ε > 0, so daß für alle t1 < t2 < t3 ∈ (t − ε, t + ε) gilt, daß c(t1 ), c(t2 ), c(t3 ) nicht
auf einer Geraden liegen. Für t1 , t2 , t3 → t konvergiert m(t1 , t2 , t3 ) → m, so daß der Kreis
mit Mittelpunkt m durch c(t) Radius 1/kc00 (t)k hat. Wir setzen κ(t) = kc00 (t)k (auch in
Punkten mit c00 (t) = 0).
Beweis: Seien t1 < t2 < t3 Punkte in I, so daß c(t1 ), c(t2 ), c(t3 ) auf einer Geraden L
liegen. Nach dem verallgemeinerten Mittelwertsatz gibt es τ1 ∈ (t1 , t2 ), τ2 ∈ (t2 , t3 ), so daß
c0 (τ1 ), c0 (τ2 ) auf der zur gegebenen Geraden parallelen Geraden L durch 0 liegen. Deshalb
gibt es einen Punkt σ ∈ (τ1 , τ2 ) mit c00 (σ) ∈ L. Also ist c00 (σ) ein Vielfaches von c0 (τ1 )
bzw. c0 (τ2 ) = ±c0 (τ1 ). Falls für jedes ε > 0 ein solches Tripel t1 < t2 < t3 ∈ (t − ε, t + ε)
existiert, dann ist c00 (t) ein Vielfaches von c0 (t). Widerspruch, denn c00 (t) 6= 0 ist senkrecht
zu c0 (t). Nun sei m der eindeutige Punkt mit (3) und (4), wobei in (4) auf der rechten Seite
−kc0 (t)k2 = −1 steht. Es ist klar, daß dann m der Grenzwert der m(t1 , t2 , t3 ) ist. qed.
5.4
Ein Beispiel aus der Variationsrechnung
Wir betrachten das Problem, zwischen zwei koaxiale Kreise wie im Bild eine Drehfläche
kleinsten Flächeninhalts einzuspannen. Wir betrachten dazu C 2 -Funktionen y : [a, b] → IR,
y(a) = α, y(b) = β. Diese definieren Drehflächen durch Rotation um die Achse, siehe Bild.
Der Flächeninhalt ist dann
A(y) = 2π
Z b
a
q
y(x) 1 + (y 0 (x))2 dx.
β
α
a
b
64
Aufgabe: Finde unter allen C 2 -Funktionen y : [a, b] → IR mit y(a) = α, y(b) = β eine
Funktion mit minimalem A(y). Dies führt zunächst zu folgendem allgemeinen Problem: sei
F : [a, b] × IR × IR → IR, (x, p, q) 7→ F (x, p, q) eine C 2 -Funktion. Sei K = {y ∈ C 2 ([a, b], IR) |
y(a) = α, y(b) = β}. Sei J : K → IR definiert durch
J(y) =
Z b
F (x, y(x), y 0 (x)) dx.
a
Aufgabe: Gesucht ist y ∈ K mit minimalem (oder maximalem) J(y). Wir leiten jetzt eine
notwendige Bedingung für y her.
Satz (Euler): Falls J in y ∈ K ein Minimum oder Maximum hat, so gilt
d
dx
Ã
!
∂F
∂F
(x, y(x), y 0 (x)) −
(x, y(x), y 0 (x)) = 0.
∂q
∂p
Beweis: Sei K0 = {h ∈ C 2 ([a, b], IR) | h(a) = h(b) = 0}. Für y ∈ H und h ∈ K0 ist
y + h ∈ K. Sei y nun ein (lokales) Extremum und h ∈ K0 . Dann hat die Funktion
f : ε 7→ f (ε) = J(y + εh) =
Z b
F (x, y(x) + εh(x), y 0 (x) + εh0 (x)) dx
a
in ε = 0 ein (lokales) Extremum. Nun ist f wegen unserer Voraussetzung differenzierbar
und
!
Z bÃ
∂F
∂F
0
0
0
0
(x, y(x), y (x))h(x) +
(x, y(x), y (x))h (x) dx.
0 = f (0) =
∂p
∂q
a
Partielle Integration des zweiten Summanden:
Z b
a
Z b
∂F
d ∂F
∂F
0 0
0
b
(x, y, y )h dx =
(x, y, y )h|a −
(
(x, y, y 0 ))h dx
∂q
∂q
a dx ∂q
|
{z
=0
}
weil h(a) = h(b) = 0. Insgesamt gilt daher für alle h ∈ K0 :
Z bÃ
a
d
dx
Ã
!
!
∂F
∂F
(x, y, y 0 ) −
(x, y, y 0 ) h dx = 0.
∂q
∂p
Der Integrand ist eine stetige Funktion von x. Wenn der Integrand nicht identisch verschwindet, gibt es ein x0 ∈ (a, b) und ein δ > 0, so daß a < x0 − δ < x0 + δ < b ist und der
Integrand auf (x0 − δ, x0 + δ) überall > 0 oder < 0 ist. Dann wählen wir h ∈ K0 wie folgt:
65
a
1. Die Funktion f : IR → IR, f (x) =
k ≥ 0.
2. Die Funktion g : IR → IR, g(x) =
x0
x0 − δ
(
(
x0 + δ
1
e− x2
0
−1
b
x 6= 0
ist C ∞ mit f (k) (0) = 0 für
x=0
−1
e (x−1)2 e (x+1)2
0
x ∈ (−1, 1) ist C ∞ und positiv
sonst
auf (−1, 1).
0
) ist C ∞ mit g(x) > 0 für x ∈ (x0 − δ, x0 + δ)
3. Die Funktion h : IR → IR, h(x) = g( x−x
δ
und g(x) = 0 sonst.
R ³
³
´
´
d
∂F
(x, y, y 0 ) − ∂F
(x, y, y 0 ) h dx > 0 bzw. < 0, Widerspruch. qed.
Dann ist ab dx
∂q
∂p
Die Differentialgleichung im Satz lautet
∂2F
∂2F
∂2F
∂F
0 00
0 0
0
(x,
y,
y
(x,
y,
y
(x, y, y 0 ) = 0.
(x,
y,
y
)y
+
)y
+
)
−
2
∂q
∂p∂q
∂x∂q
∂p
Falls F nicht von x anhängt, also partielle Ableitungen nach x verschwinden, so ist
F (y, y 0 ) −
∂F
(y, y 0 )y 0 = const.
∂q
wenn y eine Lösung ist:
d
∂F 0
∂F 0 ∂F 00
∂ 2 F 0 0 ∂ 2 F 00 0 ∂F 00
(F −
y) =
y +
y −
yy − 2y y −
y
dx
∂q
∂p
∂q
∂p∂q
∂q
∂q
Ã
!
∂ 2 F 0 ∂ 2 F 00
0 ∂F
−
y − 2 y = 0.
= y
∂p
∂p∂q
∂q
√
In unserem Beispiel: F (x, p, q) = p 1 + q 2 . F hängt nicht von x ab. Die Differentialgleichung lautet


q
d 
y 0 (x)
 − 1 + (y 0 (x))2 = 0,
y(x) q
dx
1 + (y 0 (x))2
66
also yy 00 = 1 + (y 0 )2 . Nach unserer Bemerkung gilt auch
y
q
1 + (y 0 )2
= c.
q
Nun sind in unserem Beispiel α, β > 0. Also muß c > 0 sein und damit ist y = c 1 + (y 0 )2
und
1q
y 00 =
1 + (y 0 )2 .
c
Dies ist eine Differentialgleichung für y 0 und es gilt Arsinhy 0 (x) = 1c (x − x0 ), x0 ∈ IR, also
1
y(x) = c cosh (x − x0 ),
c
eine Kettenlinie. Zu bestimmen: c und x0 . Dazu nehmen wir an b > 0 und a = −b, ferner
α = β. Dann ist x0 aus Symmetriegründen gleich 0. Zu lösen
α
cosh(b/c)
=
.
b
b/c
Die Funktion f (t) = 1t cosh t hat folgendes Verhalten:
• ∃t0 , so daß f auf (0, t0 ] streng monoton fällt und auf [t0 , ∞) streng monoton wächst;
• limt→ 0 f (t) = limt→∞ = ∞.
Für
α
b
< f (t0 ) gibt es keine Lösung, für
α
b
= f (t0 ) eine und für
67
α
b
> f (t0 ) zwei Lösungen.
Zugehörige Unterlagen
Herunterladen