Vorlesung Analysis 2 - Universität Hamburg

Werbung
Analysis II
Vorlesung
Reiner Lauterbach
L(γ) =
R1
kγ 0 (t)kV dt
0
Universität Hamburg, 2015
ii
Inhaltsverzeichnis
Einleitung
iv
7 Anwendungen des Riemann-Integrals
7.1 Uneigentliche Integrale . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Taylorpolynome und Taylorreihen . . . . . . . . . . . . . . . . . .
8 Differentialrechnung
8.1 Der Raum Rn als Banachraum . . . . . . . . . . . .
8.2 Kurven im Raum . . . . . . . . . . . . . . . . . . . .
8.2.1 Elementare Eigenschaften . . . . . . . . . . .
8.2.2 Integration Banachraum-wertiger Abbildungen
8.2.3 Kurvenlänge . . . . . . . . . . . . . . . . . . .
8.2.4 Transformationen . . . . . . . . . . . . . . . .
8.3 Ableitungen . . . . . . . . . . . . . . . . . . . . . . .
8.3.1 Definition der Ableitung . . . . . . . . . . . .
8.3.2 Hilberträume und Gradienten . . . . . . . . .
8.4 Mittelwertsatz und Anwendungen . . . . . . . . . . .
8.5 Höhere Ableitungen . . . . . . . . . . . . . . . . . . .
8.6 Taylorpolynome und Taylorreihen . . . . . . . . . . .
8.7 Differenzierbare Abbildungen . . . . . . . . . . . . .
8.8 Multilineare Abbildungen . . . . . . . . . . . . . . .
9 Anwendungen der Differentialrechnung
9.1 Der Fixpunktsatz von Banach . . . . .
9.2 Der Satz über implizite Funktionen . .
9.3 Extrema mit Nebenbedingungen . . . .
9.4 Parameterabhängige Integrale . . . . .
10 Banachalgebren
10.1 Algebren . . . . . . . . . . . .
10.2 Potenzreihen . . . . . . . . . .
10.3 Der Satz von Stone-Weierstraß
10.4 Fourierreihen . . . . . . . . .
.
.
.
.
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
1
8
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
14
24
24
29
34
39
41
41
51
57
59
63
70
75
.
.
.
.
77
77
81
91
96
.
.
.
.
103
103
105
111
117
iv
11 Differentialgleichungen
11.1 Motivation . . . . . . . . . .
11.2 Matrixexponentialfunktion .
11.3 Ein allgemeiner Existenzsatz
11.4 Randwertprobleme . . . . .
11.4.1 Klassifizierung . . . .
INHALTSVERZEICHNIS
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
125
125
130
136
140
140
Index
142
Literaturverzeichnis
144
Einleitung
Die Vorlesung Analysis II baut auf die Analysis I und auch auf die Lineare Algebra
I auf.
In der Vorlesung werden wir über weite Strecken den Werken von Otto Forster,
Analysis II [8], von Rolf Walter, Einführung in die Analysis 2 [18], bzw. von
Jürgen Pöschel, Etwas mehr Analysis [15], folgen. Letztgenanntes ist Teil einer
neuen und modernen darstellung der Analysis [14, 15, 16], die vielleicht insgesamt
der Vorlesung Analysis I–II am Nächsten kommt.
Darüber hinaus gibt es eine ganze Reihe hervorragender Bücher zum Thema
Analysis, ich möchte nur wenige nennen: [2, 3, 7, 10, 13] von denen jeweils auch
Ideen und Inhalte in die Gestaltung dieser Vorlesung einfließen. Nicht direkt als
Begleitlektüre, jedoch als Nachschlagewerke für später bzw. als weiterführende
Bücher zur Analysis möchte ich erwähnen, jedoch explizit nicht dazu ermuntern
jetzt schon einen Blick hineinzuwerfen: [6, 9, 11]. Wobei wir beim Satz über
implizite Funktionen und in der Darstellung des Beweises auch Ideen aus dem
zehnten Kapitel des Werkes von Jean Dieudonné, Grundzüge der Analysis, Bd1,
[6] verwenden werden. Beim Beweis des Satzes von Stone-Weierstraß folgen wir
der Darstellung von Walter Rudin [17].
Wir wollen uns in diesem Semester zunächst einigen Schlussfolgerungen aus
dem Integralbegriff widmen, dabei auch die Taylorreihen behandeln. Den größten
Teil der Vorlesung nimmt die Differentialrechnung in mehreren Veränderlichen
ein.
Am Ende des Semesters wollen wir uns noch mit Differentialgleichungen, einigen Anwendungen und deren Lösungstheorie befassen. Ausführliches gibt es dann
dazu in einer Vorlesung, die sich speziell den Differentialgleichungen widmet.
v
vi
INHALTSVERZEICHNIS
Kapitel 7
Anwendungen des
Riemann-Integrals
In diesem Abschnitt wollen wir den am Ende des letzten Semesters eingeführten
Integralbegriff dazu nutzen die Analysis einer Variablen zu vertiefen. Wir
werden einerseits uneigentliche Integrale definieren und behandeln und
andererseits werden wir für allgemeine Funktionen Reihenentwicklungen
herleiten und Abschätzungen für das Restglied entwickeln.
Inhalt
7.1
7.1
Uneigentliche Integrale . . . . . . . . . . . . . . . . . .
1
7.2
Taylorpolynome und Taylorreihen . . . . . . . . . . .
8
Uneigentliche Integrale
Bisher hatten wir beschränkte Funktionen auf einem kompakten Intervall integriert. Wir wollen nun diese beiden Voraussetzungen der Beschränktheit und
der Kompaktheit abschwächen. Die technische Realisierung dieser Abschwächung
beruht auf der Forderung, dass gewisse Grenzwerte existieren. Der wesentliche Inhalt dieses Abschnittes sind die folgenden Definitionen.
1
2
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
Definition 7.1.1 (Uneigentliches Integral – beschränktes Intervall)
1. Ist [a, b] ⊂ R kompakt, es sei f ∈ F ([c, b], R) für jedes c > a. Ist
f ∈ R([c, b], R) für jedes c > a und existiert der Grenzwert
Zb
lim
f (x) dx,
c&a
c
so sagen wir, f ist auf [a, b] uneigentlich integrierbar und setzen
Zb
Zb
f (x) dx = lim
f (x) dx.
c&a
a
c
2. Ist [a, b] ⊂ R kompakt, es sei f ∈ F ([a, c], R) für jedes c < b. Ist
f ∈ R([a, c], R) für jedes c < b und existiert der Grenzwert
Zc
lim
f (x) dx,
c%b
a
so sagen wir auch, f ist auf [a, b] uneigentlich integrierbar, und setzen
Zc
Zb
f (x) dx.
f (x) dx = lim
c%b
a
a
3. Ist [a, b] ⊂ R kompakt, sei f ∈ F ([c, d], R) für jedes Paar c, d ∈ R
mit a < c < d < b. Ist f ∈ R([c, d], R) für jedes solche Paar c, d mit
a < c < d < b und existiert der Grenzwert
Zd
lim
f (x) dx
c&a,d%b
c
so sagen wir wiederum, f ist auf [a, b] uneigentlich integrierbar und
setzen
Zb
Zd
f (x) dx = lim
f (x) dx.
c&a,d%b
a
c
7.1. UNEIGENTLICHE INTEGRALE
3
Definition 7.1.2 (Uneigentliches Integral – unbeschränktes Intervall)
1. Ist f ∈ R([a, b], R) für jedes −∞ < a < b und existiert
Zb
lim
f (x) dx ,
a→−∞
a
so nennen wir f im uneigentlichen Sinne auf (−∞, b] Riemann-integrierbar und setzen
Zb
Zb
f (x) dx = lim
f (x) dx.
a→−∞
−∞
a
2. Entsprechend sei f ∈ R([a, b], R) für jedes b < ∞ und existiert
Zb
f (x) dx ,
lim
b→∞
a
so nennen wir f im uneigentlichen Sinne auf [a, ∞) Riemann-integrierbar und setzen
Z∞
Zb
f (x) dx = lim
f (x) dx.
b→∞
a
a
Ganz entsprechend lassen sich die beiden letzten Fälle miteinander und mit
dem jeweilig anderen Fall aus den beiden Fällen der Definition 7.1.1 kombinieren und wir vereinbaren die jeweiligen Definitionen und sprechen vom
uneigentlichen Integral.
Beispiel 7.1.3 (Uneigentlich integrierbare Funktionen)
1. Wir betrachten für α ∈ R die Funktion
f (x) = xα für x ∈ (0, 1].
4
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
Für jedes c > 0 ist f ∈ F ([c, 1], R) und für α 6= −1 ist
Z1
c
Damit ist
Z1
1
1
α+1 x dx =
x .
α+1
c
α
xα dx =
1
(1 − cα+1 ).
α+1
c
Der Grenzwert
lim cα+1
c→0
existiert, falls 1 + α > 0, d. h. α > −1.
2. Wir betrachten für α ∈ R die Funktion
f (x) = xα für x ∈ [1, ∞).
Für jedes c > 1 ist f ∈ F ([1, c], R) und für α 6= −1 ist
Zc
1
Damit ist
Zc
c
1
α+1 x dx =
x .
α+1
1
α
xα dx =
1
(cα+1 − 1).
α+1
1
Der Grenzwert
lim cα+1
c→∞
existiert, falls 1 + α < 0, d. h. α < −1.
Aufgabe 7.1.4 (Der Fall α = −1)
Man kläre die Existenz des uneigentlichen Integrales in den beiden Fällen
des Beispiels 7.1.3 für α = −1. Gibt es einen Wert von α ∈ R, so dass das
uneigentliche Integral
Z∞
xα dx
0
existiert? Begründen Sie Ihre Antwort!
7.1. UNEIGENTLICHE INTEGRALE
Beispiel 7.1.5 (e−x )
Das uneigentliche Integral
Z∞
5
e−x dx
0
existiert, denn für c > 0 gilt
Zc
c
e−x dx = −e−x 0 = 1 − e−c
0
und
lim e−c = 0
c→∞
existiert.
Definition 7.1.6 (Γ-Funktion)
Wir definieren die sogenannte Γ-Funktion oder Gamma-Funktion für x > 0
durch das folgende uneigentliche Integral.
Z∞
Γ(x) =
tx−1 e−t dt.
0
Satz 7.1.7 (Funktionalgleichung der Γ-Funktion)
1. Für x > 0 existiert das uneigentliche Integral in der Definition von
Γ(x).
2. Für n ∈ N gilt
Γ(n + 1) = n!.
3. Für alle x > 0 gilt die Funktionalgleichung
Γ(x + 1) = xΓ(x).
Beweis. Wir beginnen mit einer natürlichen Zahl n ∈ N und erhalten
Z∞
Γ(n + 1) =
tn e−t dt.
0
Dieses Integral ist nun nur bei ∞ uneigentlich und wir müssen die Existenz und
6
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
den Wert des Grenzwertes
Zc
lim
c→∞
tn e−t dt
0
untersuchen. Partielle Integration, vollständige Induktion und Beispiel 7.1.5 liefern
Zc
n −t
t e
dt =
−tn e−t |c0
Zc
+n
0
tn−1 e−t dt
0
= −tn e−t |c0 − ntn−1 e−t |c0 + n(n − 1)
Zc
tn−2 e−t dt
0
..
.
. = ..
= −
n−1
X
n!
tn−j e−t |c0 + n!
(n − j)!
j=0
Zc
e−t dt.
0
Als Grenzwert ergibt sich dann
Zc
lim
c→∞
tn e−t dt = n!.
0
Damit ist die zweite Aussage gezeigt.
Wir kommen zur ersten Aussage. Da x > 0 und damit x − 1 > −1 ist, existiert
für c > 0 das Integral
Zc
tx−1 e−t dt
0
zumindest im uneigentliche Sinne. Wir betrachten eine Folge {cn }n∈N mit limn→∞ cn =
∞ und erhalten für 1 ≤ cn < cm und x < k ∈ N
Zcm
0≤
t
x−1 −t
cn
e
Zcm
dt ≤
tk−1 e−t dt.
cn
Dann existiert zu ε > 0 ein N ∈ N mit n, m > N impliziert
Zcm
cn
tx−1 e−t dt ≤ ε,
7.1. UNEIGENTLICHE INTEGRALE
7
da das entsprechende uneigentliche Integral für k ∈ N nach dem ersten Schritt
existiert.
Wir kommen zum dritten Punkt. Sei x > 0 fest. Für Γ(x + 1) ergibt sich
Zc
Γ(x + 1) =
lim
c→∞
tx e−t dt
0
=
lim [−tx e−t ]c0 + lim
Zc
c→∞
c→∞
xtx−1 e−t dt
0
=
x −c
lim (−c e ) + xΓ(x).
c→∞
Satz 7.1.8 (Integralkriterium)
Es sei f : [1, ∞) → R eine nichtnegative monoton fallende Funktion. Dann
existiert das uneigentliche Integral
Z∞
f (x) dx
1
genau dann wenn die Reihe
∞
X
f (k)
k=0
konvergiert.
Beweis. Wegen der Monotonie ist f auf jedem Intervall [n, n+1] integrierbar vgl.
Satz 6.3.2. Wir nehmen zunächst an, dass das uneigentliche Intergral existiert,
und betrachten die Teilsummenfolge (beachte für x ∈ [k, k +1] gilt f (k) ≥ f (x) ≥
f (k + 1)):
Zn
Z∞
n
X
f (k) ≤ f (1) + f (x) dx ≤ f (1) + f (x) dx.
k=1
1
1
Also konvergiert die Reihe.
Für die Umkehrung betrachten wir eine Folge {cn }n∈N . Dann ist für 1 ≤ cn < cm
Zcm
dcm e
f (x) dx ≤
cn
X
f (k).
k=bcn c
Dies wird wegen der Konvergenz der Reihe für n, m hinreichend groß, kleiner als
jede vorgegebene Schranke.
8
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
7.2
Taylorpolynome und Taylorreihen
Wir haben bereits einige Funktionen kennengelernt, die eine natürliche Darstellung als Reihe besaßen. Wir erinnern an die Exponentialfunktion, die trigonometrischen Funktionen und insbesondere auch an die Darstellung des Arcustangens
durch eine Reihe, was uns die wunderschöne Darstellung von π4 am Ende der
Vorlesung Analysis I möglich machte. Reihendarstellungen von Funktionen sind
sehr alt, bereits Euler stellte viele Funktionen als Reihen dar. Oft wurden Manipulationen mit Funktionen durch Bearbeitung der Reihen durchgeführt. Speziell
für Funktionen auf C sind Reihendarstellungen sehr natürlich, wir werden uns
noch ausführlich damit beschäftigen. Wir beginnen mit einem wichtigen Darstellungssatz.
Satz 7.2.1 (Satz von Taylor1 )
Es sei [a, b] ⊂ R ein kompaktes Intervall und f eine auf [a, b] definierte,
(n + 1).-mal stetig differenzierbare Funktion. Dann gilt für alle x ∈ [a, b] die
Darstellung
f (x) = f (a) +
f 00 (a)
f (n) (a)
f 0 (a)
(x − a) +
(x − a)2 + · · · +
(x − a)n + Rn+1 (x),
1!
2!
n!
mit
1
Rn+1 (x) =
n!
Zx
(x − t)n f (n+1) (t) dt.
a
Beweis. Beweis durch vollständige Induktion. Der Induktionsanfang ist die Formel
Zx
f (x) = f (a) + f 0 (t) dt,
a
die wir ja schon gut kennen.
Wir nehmen also an, dass die obige Darstellungsformel für n gezeigt sei, dass
f (n+2) stetig differenzierbar sei. Das Restglied hat die oben angegebene Gestalt
1
Rn+1 (x) =
n!
Zx
(x − t)n f (n+1) (t) dt.
a
1
Brook Taylor (18.8.1685–29.12.1731) stammte aus reicher Familie und studierte in Cambridge. Ab 1712 war er Mitglied der Royal Society. In seinem Hauptwerk untersuchte er die
schwingende Saite und stellte zum ersten Mal die nach ihm benannten Reihen vor.
7.2. TAYLORPOLYNOME UND TAYLORREIHEN
9
Durch partielle Integration formen wir dies um:
Zx
Rn+1 (x) =
1
(x − t)n f (n+1) (t) dt
n!
a
x
1
(x − t)n+1 f (n+1) (t)a +
= −
(n + 1)!
Zx
1
(x − t)n+1 f n+2 (t) dt
(n + 1)!
a
1
=
f (n+1) (a)(x − a)n+1 + Rn+2 (x).
(n + 1)!
Definition 7.2.2 (Taylorpolynom)
Für (n + 1)-mal stetig differenzierbares f heißt
f (a) +
f (n) (a)
f 0 (a)
(x − a) + · · · +
(x − a)n
1!
n!
das Taylorpolynom n-ten Grades von f im Entwicklungspunkt a.
Korollar 7.2.3 (Charakterisierung von Polynomen)
Ist f : [a, b] → R (n + 1)-mal stetig differenzierbar und ist f (n+1) (x) = 0 für
alle x ∈ [a, b], so ist f ein Polynom vom Grad höchstens n.
Beweis. Folgt sofort aus der obigen Darstellung mit Rn+1 (x) = 0 für alle x.
Andere Darstellungen des Restgliedes kann man nun mit dem Mittelwertsatz der
Integralrechnung leicht angeben.
Satz 7.2.4 (Lagrange2 – Form des Restgliedes)
Es seien [a, b], f wie im Satz 7.2.1. Dann gibt es ein ξ ∈ [a, b] mit
Rn+1 (x) =
2
f (n+1) (ξ)
(x − a)n+1 .
(n + 1)!
Joseph Louis Lagrange (25.1.1736–10.4.1813) war Mathematiker, Physiker und Astronom.
Er arbeitete zunächst über Variationsprobleme. Auf Einladung von Friedrich II verbrachte er
20 Jahre in Berlin und verfasste hier unter anderem sein Werk Mécanique analytique. Neben
seinen Beiträgen zur Analysis (nach ihm sind die eben eingeführte Restgliedformel und der
sogenannte Multiplikator, den wir auch noch kennenlernen werden, benannt) stammen auch
algebraische Erkenntnisse von ihm.
10
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
Beweis. Der Mittelwertsatz der Integralrechnung ergibt die Existenz von
ξ ∈ [a, x] mit
1
Rn+1 (x) =
n!
Zx
(x − t)n f (n+1) (t) dx = f (n+1) (ξ)
a
Zx
1
(x − t)n dt.
n!
a
Dies ergibt
−f (n+1) (ξ)
x
1
1
(x − t)n+1 a = f (n+1) (ξ)
(x − a)n+1 .
(n + 1)!
(n + 1)!
Korollar 7.2.5 (Andere Form des Restgliedes)
Sei [a, b] → R n-mal stetig differenzierbar und c ∈ [a, b]. Dann hat f für
x ∈ [a, b] eine Darstellung
f (x) =
n
X
f (k) (c)
k=0
k!
(x − c)k + η(x)(x − c)n ,
mit
lim η(x) = 0.
x→c
Beweis. Das Lagrange-Restglied wird durch
n−1 (k)
X
f (c)
f (n) (ξ)
n
(x − c) = f (x) −
(x − c)k
n!
k!
k=0
=
f (n) (c)
f (n) (c) − f (n) (ξ)
(x − c)n −
(x − c)n
n!
n!
Setze
f (n) (ξ) − f (n) (c)
,
n!
wobei die Abhängigkeit von x durch die Abhängigkeit von ξ entsteht, welches
wiederum von c abhängt. Da ξ zwischen c und x liegt konvergiert mit x → c auch
ξ → c. Dann impliziert die Stetigkeit der n-ten Ableitung f (n) , dass
η(x) =
lim η(x) = 0
x→c
ist.
7.2. TAYLORPOLYNOME UND TAYLORREIHEN
11
Definition 7.2.6 (Taylorreihe)
Ist f auf [c, d] stetig und auf (c, d) unendlich oft stetig differenzierbar, ist
a ∈ (c, d), so nennt man
∞
X
f (k) (a)
T(f,a) (x) =
k=0
k!
(x − a)k
die Taylorreihe von f im Punkt a.
Es stellt sich die Frage, ob diese Reihe konvergiert, für welche x ∈ [c, d] die Reihe
konvergiert und inwieweit Tf,a (x) = f (x) gilt. Die Antworten auf diese Fragen
sind unterschiedlich schwierig.
Satz 7.2.7 (Konvergenz der Taylorreihe)
1. Die Taylorreihe konvergiert genau dann gegen f (x), wenn
lim Rn (x) = 0.
n→∞
2. Es gibt Funktionen, so dass T(f,a) (x) eine konvergente Reihe ist, jedoch
nicht gegen f (x) konvergiert.
Beweis. (1) Folgt direkt aus der Darstellung.
(2) Wir betrachten die Funktion
0
1
f (x) =
e− x 2
für
für
x≤0
.
x>0
1
Da limx→0 e− x2 = 0 ist, ist f im Nullpunkt stetig. In allen Punkten ist f als
Zusammensetzung stetiger Funktionen stetig, ja sogar differenzierbar.
Im Anschluss an Satz 7.2.7 stellt sich allgemein die Frage, wann komplexe Reihen
der Form
∞
X
aj (z − z0 )j
j=0
eine auf C (oder auf einer entsprechend angepassten Teilmenge K ⊂ C) (komplex-)differenzierbare Funktion darstellen. Wir werden dies in allgemeinerem Kontext im Kapitel 10 über Banachalgebren untersuchen.
12
KAPITEL 7. ANWENDUNGEN DES RIEMANN-INTEGRALS
Kapitel 8
Differentialrechnung
Zu Beginn wollen wir den Raum Rn metrisieren und normieren. Dies führt zum
Begriff des Banachraumes. Wir werden die Differentialrechnung in diesem
Kontext einführen, vgl. Pöschel [15], Walter [18], Dieudonné [6]. Es zeigt sich,
dass diese Struktur uns erlaubt, Beweise ohne Referenz auf Darstellungen der
zu untersuchenden Abbildungen bezüglich fester Basen durchzuführen. Dieses
Kapitel ist Grundlage der Theorie partieller Differentialgleichungen, ebenso die
Grundlage der Differentialgeometrie und der komplexen Analysis. Insofern ist
dies ein zentrales Thema der Analysis. Viele unserer Betrachtungen übertragen
sich auf die Differentialrechnung im Cn und auf komplexe Banachräume, aus
Zeitgründen betrachten wir hier nur die Räume Rn und reelle Banachräume.
Inhalt
Rn als Banachraum
8.1
Der Raum
. . . . . . . . . . . . .
14
8.2
Kurven im Raum . . . . . . . . . . . . . . . . . . . . .
24
8.3
8.2.1
Elementare Eigenschaften . . . . . . . . . . . . . . . .
24
8.2.2
Integration Banachraum-wertiger Abbildungen . . . .
29
8.2.3
Kurvenlänge . . . . . . . . . . . . . . . . . . . . . . .
34
8.2.4
Transformationen . . . . . . . . . . . . . . . . . . . . .
39
Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . .
41
8.3.1
Definition der Ableitung . . . . . . . . . . . . . . . . .
41
8.3.2
Hilberträume und Gradienten . . . . . . . . . . . . . .
51
8.4
Mittelwertsatz und Anwendungen . . . . . . . . . . .
57
8.5
Höhere Ableitungen . . . . . . . . . . . . . . . . . . . .
59
8.6
Taylorpolynome und Taylorreihen . . . . . . . . . . .
63
8.7
Differenzierbare Abbildungen . . . . . . . . . . . . . .
70
8.8
Multilineare Abbildungen . . . . . . . . . . . . . . . .
75
13
14
8.1
KAPITEL 8. DIFFERENTIALRECHNUNG
Der Raum
Rn als Banachraum
Definition 8.1.1 (Rn )
Die Menge aller geordneten n-Tupel reeller Zahlen






x
1





 x2  

 x =  ..  xj ∈ R


 . 






xn
wird als Rn bezeichnet, ganz entsprechend definieren wir Cn und Kn schreiben
wir, wenn wir beide Fälle gleichzeitig oder alternativ meinen.
Die Räume Kn sind Ihnen aus der Linearen Algebra vertraut. Es sind dies endlich
dimensionale Vektorräume. Als solche besitzen sie eine Basis, die Standardeinheitsvektoren wollen wir mit e1 , . . . , en bezeichnen. Der Vektor x entspricht dann
der Summe
n
X
x=
xi e i .
i=1
Wir werden später oft eine Schreibweise benötigen, die wir schon heute festlegen
wollen: Ist x ∈ Kn , so steht x̂i für den Vektor


x1
 .. 
 . 


 x

x̂i ∈ Kn−1 : x̂i =  i−1  .
 xi+1 
 . 
 .. 
xn
Die Abbildung x 7→ x̂i ist eine lineare Abbildung, sogar ein Projektor auf den
Unterraum, der von den Basisvektoren e1 , . . . , ei−1 , ei+1 , . . . en aufgespannt wird.
Aus der Sicht der Analysis ist neben der Struktur des linearen Raumes eine
metrische Struktur von Bedeutung.
Auf den Räumen Kn kann man auf verschiedene Weise Metriken definieren,
einige Möglichkeiten dafür zeigt die folgende Definition.
Definition 8.1.2 (Metrik in Kn )
Sind x, y ∈ Kn , so setzen wir für p ∈ [1, ∞)
v
u n
uX
p
dp (x, y) = t
|xi − yi |p
i=1
8.1. DER RAUM
und
RN ALS BANACHRAUM
15
n
o
d∞ (x, y) = max |xi − yi | i = 1, . . . , n .
Lemma 8.1.3 (Metriken in Kn )
Für p ∈ [1, ∞] ist dp : Kn × Kn → R+ eine Metrik.
Beweis. Wir beweisen dies nur für die beiden wichtigsten Fälle p = 2, p = ∞
vollständig. Für die anderen Fälle verweisen wir auf die Literatur, z. B. Alt [1].
Wir müssen die Eigenschaften einer Metrik (M1), (M2) und (M3) nachweisen.
Wir beginnen mit (M1). Offenkundig ist dp (x, y) ≥ 0 für alle p ∈ [0, ∞] und
dp (x, x) = 0 ist ebenso offensichtlich. Falls dp (x, y) = 0, so ist für alle i = 1, . . . , n
auch |xi − yi | = 0 und deshalb x = y.
Um (M2) zu zeigen beachten wir, dass alle Terme symmetrisch in x, y sind und
daher gilt dp (x, y) = dp (y, x).
Schließlich müssen wir noch die Dreiecksungleichung beweisen. Für p = ∞ ist
dies einfach, seien x, y, z ∈ Kn gegeben, so findet man
o
n
d∞ (x, z) = max |xi − zi | i = 1, . . . , n
n
o
≤ max |xi − yi | + |yi − zi | i = 1 . . . , n
o
o
n
n
≤ max |xi − yi | i = 1 . . . , n + max |yi − zi | i = 1 . . . , n
= d∞ (x, y) + d∞ (y, z)
Den Fall p = 2 wollen wir nach den folgenden Überlegungen noch ausführen.
In R oder C wird die Metrik durch den Betrag induziert. Hier, im höherdimensionalen Raum, gibt es eine verwandte Struktur.
Definition 8.1.4 (Norm)
Sei V ein linearer Raum über K. Eine Abbildung von k · kV : V → R+ heißt
Norm, wenn sie folgende Eigenschaften besitzt:
(N1) kxkV = 0 ⇐⇒ x = 0;
(N2) kλxkV = |λ| kxkV für λ ∈ K, x ∈ V ;
(N3) kx + ykV ≤ kxkV + kykV für alle x, y ∈ V (Dreiecksungleichung).
Das Paar (V, k · kV ) nennen wir normierten Raum über
K.
16
KAPITEL 8. DIFFERENTIALRECHNUNG
Auch dieser Begriff ist Ihnen aus der Vorlesung Lineare Algebra bekannt. Die
Dreiecksungleichung wird oft in der Form
∀x, y ∈ V : |kxkV − kyk|V ≤ kx − ykV
(8.1)
benötigt, diese kennen Sie sicher auch bereits.
Beispiel 8.1.5 (Normen)
1. Auf Rn finden wir für p ≥ 1
v
u n
uX
p
kxkp = t
|xi |p
i=1
bzw.
n
o
kxk∞ = max |xi | i = 1, . . . , n .
Damit erhalten wir normierte Räume (Rn , k · kp ) für p ∈ [1, ∞].
2. Auf dem Vektorraum C([a, b]; R) definiert man eine Norm durch
n
o
kf k∞ = max |f (x)| x ∈ [a, b] .
Der Paar (C([a, b]; R), k · k∞ ) ist ein normierter Raum.
3. Auf R([a, b], R) aus Satz 6.2.20 finden wir mit
k[f ]kR([a,b],R) =
Zb
[|f |](x)dx.
a
eine Norm. Der Raum (R([a, b], R), k · kR([a,b],R) ) ist ein normierter
Raum.
Natürlich müssen wir in jedem Fall (N1–3) überprüfen. Wir machen dies in
den Übungen.
Satz 8.1.6 (Metrik und Norm)
Ist V ein linearer Raum, k · k eine Norm auf V , so wird durch
d(x, y) = kx − yk
eine Metrik auf V × V definiert.
8.1. DER RAUM
RN ALS BANACHRAUM
17
Beweis. Natürlich ist d ≥ 0 und d(x, y) = 0 genau dann, wenn x = y. Wegen
(N2) ist k − xk = kxk und damit d(x, y) = d(y, x). Die letzte Eigenschaft einer
Metrik schließt man leicht mittels
d(x, z) = kx − zk = kx − y + y − zk
≤ kx − yk + ky − zk = d(x, y) + d(y, z).
Damit können wir von stetigen Abbildungen zwischen normierten Räumen sprechen. Speziell wollen wir uns für die Stetigkeit linearer Abbildungen interessieren.
Satz 8.1.7 (Stetigkeit linearer Abbildungen)
Es seien (Vj , k · kVj ) für j = 1, 2 normierte Räume, L : V1 → V2 sei linear.
Dann ist L : (V1 , dV1 ) → (V2 , dV2 ) stetig, genau dann wenn
n
o
sup kLxkV2 kxkV1 = 1 < ∞.
Die Menge L(V1 , V2 ) der stetigen linearen Abbildungen (V1 , k · kV1 ) → (V2 , k ·
kV2 ) bildet in natürlicher Weise einen linearen Raum, mit
n
o
kLkL(V1 ,V2 ) = sup kLxkV2 kxkV1 = 1
wird dieser zum normierten linearen Raum.
Beweis. Ist L : V1 → V2 bezüglich der angegebenen Metriken stetig, so ist
L insbesondere bei x = 0 stetig. Dann gibt es zu ε > 0 ein δ > 0, so dass
kxkV1 < δ impliziert, dass kLxkV2 < ε. (Beachte (d(x, 0) = kxk.) Dann ist für x
mit kxkV1 = 1 2δ x ∈ BδV1 (0), der δ-Kugel in V1 bzgl. dV1 um 0 ∈ V1 . Also ist
δ
kL( x)kV2 < ε
2
und damit
2ε
< ∞.
δ
Zur Gegenrichtung bemerken wir, dass die Voraussetzung die Stetigkeit bei x = 0
impliziert. Daraus folgt aber leicht die Stetigkeit in jedem Punkt x0 ∈ V1 . Dass
die stetigen linearen Abbildungen einen linearen Raum bilden ist sofort klar.
Wir müssen noch (N 1) − (N 3) nachprüfen. Dabei ist die einzige wirklich ernsthafte Fragestellung, ob (N3) gilt. Sind L1 , L2 zwei stetige lineare Abbildungen,
so gilt für kxkV1 = 1
kL(x)kV2 <
k(L1 + L2 )xkV2 ≤ kL1 (x)kV2 + kL2 (x)kV2
wegen der Linearität und der Dreiecksungleichung in V2 . Nehmen wir nun das
Supremum über alle x von der V1 -Norm 1, so erhalten wir
kL1 + L2 kL(V1 ;V2 ) ≤ kL1 kL(V1 ;V2 ) + kL2 kL(V1 ;V2 ) .
18
KAPITEL 8. DIFFERENTIALRECHNUNG
In der linearen Algebra wird auch der Zusammenhang zwischen inneren Produkten und gewissen Normen hergestellt.
Definition 8.1.8 (Skalarprodukt)
Auf einem linearen Raum V über R nennen wir eine Abbildung
V × V → R : (x, y) 7→ hx, yiV
mit den Eigenschaften
(SP1) hx, xiV ≥ 0 und hx, xiV = 0 genau dann, wenn x = 0;
(SP2) hx + y, ziV = hx, ziV + hy, ziV ;
(SP3) hx, yiV = hy, xiV ;
(SP4) hλx, yiV = λhx, yiV
ein Skalarprodukt oder auch ein inneres Produkt auf V . Im Fall K = C
hat man eine ähnliche Struktur, indem man (SP3) durch hx, yiV = hy, xiV
ersetzt.
Beispiel 8.1.9 (Normen und Skalarprodukte)
1. Auf den Räumen Rn findet man die Abbildung
* n
+
n
X
X
(x, y) 7→ hx, yiRn =
xi e i ,
y i ei
i=1
i=1
Rn
=
n
X
xi y i .
i=1
Die Eigenschaften eines Skalarproduktes
Pn weist man leicht nach. Entsprechend definiert man hz, wiCn = i=1 zi wi .
2. Es sei [a, b] ⊂ R kompakt. Auf dem Raum C([a, b]; R) findet man ein
Skalarprodukt durch
Zb
(f, g) 7→
f (x)g(x) dx.
a
Auf einem Raum mit Skalarprodukt erhält man auf einfache Weise eine Norm.
Satz 8.1.10 (Cauchy-Schwarzsche-Ungleichung)
Ist h·, ·iV ein Skalarprodukt auf einem linearen Raum V über
p
kxk = hx, xiV
R, so ist
8.1. DER RAUM
RN ALS BANACHRAUM
19
eine Norm auf V und es gilt die Cauchy-Schwarzsche Ungleichung (CSU)
|hx, yiV | ≤ kxkkyk.
Beweis. Wir müssen die Eigenschaften (N1–3) nachprüfen. (N1) folgt sofort aus
(SP1). Für (N2) setzen wir
p
p
kλxk = hλx, λxiV = λ2 hx, xiV = |λ|kxk.
Es bleibt die sogenannte Dreiecksungleichung (N3). Wir betrachten für λ ∈ R
kx + λyk2 = hx + λy, x + λyiV = kxk2 + 2λhx, yi + λ2 kyk2 .
Ist y 6= 0, so ist dies eine quadratische Funktion in λ mit positivem Koeffizienten
bei λ2 . Die Funktion besitzt ein eindeutiges Minimum bei
λ=−
hx, yiV
.
kyk2
Es gilt dann
2 hx, yiV
hx, yiV
hx, yiV y = x−
y, x −
y
.
0 ≤ x −
kyk2 kyk2
kyk2
V
Durch Auswerten dieses Ausdrucks ergibt sich
0 ≤ kxk2 − 2
hx, yi2V
hx, yi2V
hx, yi2V
2
+
=
kxk
−
.
kyk2
kyk2
kyk2
Damit hat man
hx, yi2V ≤ kxk2 kyk2
oder durch Wurzelziehen
|hx, yiV | ≤ kxkkyk.
Damit haben wir die Cauchy-Schwarzsche1 Ungleichung. Um (N3) zu beweisen
betrachten wir nun
kx + yk2 = hx + y, x + yiV
= kxk2 + 2hx, yiV + kyk2 ≤ kxk2 + 2kxkkyk + kyk2 = (kxk + kyk)2 .
Damit ist (Wurzelziehen!)
kx + yk ≤ kxk + kyk.
Also ist k · k eine Norm auf V .
1
Hermann Amandus Schwarz (25.1.1843–30.11.1921) studierte zunächst Chemie und wechselte unter dem Einfluss von Karl Weierstraß zur Mathematik. Nach Promotion (1864), Habilitation (1867) wurde er schließlich Professor für Mathematik an der ETH Zürich, schließlich
wurde er 1892 Nachfolger von Weierstraß an der Berliner Universität. Seine Hauptarbeitsgebiete
waren konforme Abbildungen, Minimalflächen und Arbeiten zur Potentialtheorie, Funktionentheorie (Schwarz’sches Spiegelungsprinzip) und Variationsrechnung.
20
KAPITEL 8. DIFFERENTIALRECHNUNG
Eine wichtige Abschätzung für die verschiedenen Normen auf dem
das folgende Lemma.
Rn gibt uns
Lemma 8.1.11 (Vergleich zweier Normen)
Für x ∈ Kn gilt
√
kxk∞ ≤ kxk2 ≤ nkxk∞ .
Beweis.
kxk∞ = max{|xi | | i = 1, . . . , n}
p
= max{ |xi |2 | i = 1, . . . , n}
v
u n
uX
≤t
|xi |2
i=1
p
n max{|xi |2 | i = 1, . . . , n}
√
= nkxk∞ .
≤
Korollar 8.1.12 (2-Norm, Vollständigkeit)
k · k2 ist eine Norm auf Kn und d2 eine Metrik auf
Metrik wird Kn zum vollständigen metrischen Raum.
Kn × Kn. Mit dieser
Beweis. Alle Eigenschaften bis auf die Vollständigkeit sind geklärt. Angenommen {xm }m∈N ist eine Cauchy-Folge bezüglich d2 , so bedeutet dies, dass zu jedem
ε > 0 ein N ∈ N existiert, so dass für j, k > N gilt
kxj − xk k2 ≤ ε.
Dann gilt für jede Koordinate i = 1, . . . , n , dass die Folge {xi,m }m∈N eine CauchyFolge ist, denn für j, k > N gilt nach Lemma 8.1.11, dass
|xi,j − xi,k | ≤ ε,
und damit konvergiert diese Folge gegen einen Wert xi,0 . Damit konvergiert die
Folge xm gegen x0 , also in Kurzform

 

x1,0
limm→∞ x1,m
 x2,0   limm→∞ x2,m 

 

x0 =  ..  = 
.
..
 .  

.
xn.0
limm→∞ xn,m
Es ist (mit Lemma 8.1.11) leicht nachzuprüfen, dass die Konvergenz im Sinne der
Metrik d2 vorliegt.
8.1. DER RAUM
RN ALS BANACHRAUM
21
Wir wollen im Folgenden den metrischen Raum (Rn , d2 ) betrachten, sollte eine
andere Metrik gemeint sein, wollen wir das explizit angeben. Die folgenden Überlegungen zeigen, dass ein Wechsel der Norm im Regelfall keine Veränderung der
Begriffe bringt, wir formulieren dies explizit für die Kompaktheit.
Definition 8.1.13 (Äquivalenz von Normen)
Zwei Normen k · ka , k · kb auf einem linearen Raum V heißen äquivalent,
wenn es Zahlen 0 < m < M gibt, so dass für alle x ∈ V gilt
mkxka ≤ kxkb ≤ M kxka .
Lemma 8.1.14 (Äquivalenz von Normen)
1. Äquivalenz von Normen ist eine Äquivalenzrelation.
2. Je zwei Normen auf dem
Kn sind äquivalent.
Beweis. Die erste Aussage ist (fast) trivial, die zweite beweisen wir in den Übungen.
Definition 8.1.15 (Banachraum)
Sei K = R oder K = C.
1. Ist (V, k · kV ) ein normierter linearer Raum, der bezüglich der Metrik
dV (x, y) = kx − ykV
vollständig ist, so nennen wir (V, k · kV ) einen
K-Banachraum2.
2. Ist (V, k · kV ) ein Banachraum und gibt es ein Skalarprodukt h·, ·iV auf
V mit
kvk2V = hv, viV
für alle v ∈ V , so nennen wir den Raum (V, h·, ·iV ) einen Hilbertraum3 .
3
Stefan Banach (30.3.1892–31.8.1945), polnischer Mathematiker. Er war der Begründer der
Theorie linearer, normierter Räume und ihren linearen Abbildungen. Seine Arbeiten sind die
Grundlage der modernen Funktionalanalysis. Er und seine Schüler zeigten viele Anwendungen
der Funktionalanalysis auf.
3
David Hilbert (23.1.1862–14.2.1943) war einer der bedeutendsten deutschen Mathematiker
und einer der bedeutendsten Mathematiker seiner Zeit. Er befasste sich mit vielen Aspekten
der Mathematik und stellte diese auf neue Grundlagen. Er hat mit einem Vortrag im Jahr 1900
in Paris, wo er 10 Probleme (aus einer späteren Liste von 23 Problemen) vorstellte, von denen
er glaubte, dass sie die Mathematik des zwanzigsten Jahrhunderts prägen würden und auch
über seine Schüler großen Einfluss auf die Entwicklung der Mathematik ausgeübt.
22
KAPITEL 8. DIFFERENTIALRECHNUNG
Beispiel 8.1.16 (Beispiele von Banachräumen)
1. (Rn , k · k), wobei k · k eine beliebige Norm auf
Banachraum.
2. Entsprechend ist (Cn , k · k) ein
Rn
ist, ist ein
R-
C-Banachraum.
3. Sei K ein kompakter metrischer Raum, dann ist C(K; K) mit
n
o
kf kC(K;K) = max |f (x)| x ∈ K
ein
K-Banachraum.
4. Sei K ein kompakter metrischer Raum, dann ist C(K; Kn ) mit der
Norm
n
o
kF kC(K;Kn ) = max kF (x)k2 x ∈ K
ein
K-Banachraum.
5. Wir haben gesehen, dass (L(V1 ; V2 ), k · kL(V1 ;V2 ) ) für normierte Räume
(V, j, k · kVj ) j = 1, 2 ein normierter Raum ist. Ist (V2 , k · kV2 ) ein Banachraum, so ist auch (L(V1 ; V2 ), k · kL(V1 ;V2 ) ) ein Banachraum.
Wir haben in der Analysis I (Definition 4.1.11) den Begriff der Kompaktheit
in metrischen Räumen kennen gelernt und auch kompakte Mengen in R mit
dem Satz von Heine-Borel (Satz 4.1.14) charakterisiert, wobei im Beweis der
Satz von Bolzano-Weierstraß (Satz 2.5.12) eine große Rolle spielte. Wir beweisen
nun eine Version des Satzes von Bolzano-Weierstraß für den Rn und auch eine
entsprechende Charakterisierung kompakter Mengen.
Definition 8.1.17 (Beschränktheit)
1. Eine Menge A in einem normierten linearen Raum (V, k · k) heißt beschränkt, wenn es ein K > 0 gibt, so dass für alle a ∈ A gilt kak ≤ K.
2. Eine Folge {x
N heißt
n m }m∈
o beschränkt, wenn die zugrunde liegende
Menge X = xm m ∈ N beschränkt ist.
Bemerkung 8.1.18 (Beschränktheit im Rn )
1. Eine Menge A ⊂ Kn ist genau dann beschränkt, wenn es eine Kugel
BK (0) bezüglich der Metrik d2 gibt mit A ⊂ BK (0).
2. Der Begriff der Beschränktheit im
Norm ab.
Kn hängt nicht von der Wahl der
8.1. DER RAUM
RN ALS BANACHRAUM
23
Bemerkung 8.1.19 (Kompaktheit und Einheitskugel)
Die abgeschlossene Einheitskugel ist in einem nicht-endlich dimensionalen
Banachraum beschränkt, aber nicht kompakt. Insofern gelten die nachfolgenden Aussage nicht für unendlich dimensionale Banachräume.
Satz 8.1.20 (Bolzano-Weierstraß)
Eine beschränkte Folge in Kn besitzt eine konvergente Teilfolge.
Beweis. Diesen Beweis erhält man direkt aus dem Beweis von Satz 2.5.12.
Satz 8.1.21 (Heine-Borel)
Eine Menge in Kn ist genau dann kompakt, wenn sie beschränkt und abgeschlossen ist.
Beweis. Der Beweis von Satz 4.1.14 kann wörtlich übertragen werden.
Bemerkung 8.1.22 (Kompaktheit, Beschränktheit, Norm)
Der Begriff der Kompaktheit im Kn hängt nicht von der Norm ab, denn
1. die offenen Mengen bezüglich verschiedener Normen sind die gleichen,
2. wie bereits bemerkt hängt der Begriff der Beschränktheit nicht von der
Wahl der Norm ab.
Ein weiterer wichtiger Begriff ist der Begriff des Zusammenhangs. Wir wollen
diesen nun definieren und dann ein paar einfache Konsequenzen herleiten.
Definition 8.1.23 (Zusammenhang)
Es sei (X, dX ) ein metrischer Raum. Eine Menge U ⊂ X heißt zusammenhängend, wenn es keine nichtleeren und offenen Mengen V, W ⊂ X gibt,
so dass V ∩U 6= ∅ =
6 W ∩U , (V ∩U )∩(W ∩U ) = ∅ und (U ∩V )∪(U ∩W ) = U
ist.
Satz 8.1.24 (Zwischenwertsatz)
Ist (X, dX ) ein metrischer Raum und U ⊂ X zusammenhängend, f : U → R
stetig, x, y ∈ U . Dann gibt es zu jedem w ∈ [f (x), f (y)] bzw. w ∈ [f (y), f (x)]
ein u ∈ U mit f (u) = w.
24
KAPITEL 8. DIFFERENTIALRECHNUNG
Beweis. Sei w wie angegeben, setze
n
V = z∈U
und
o
f
(z)
>
w
n
o
W = z ∈ U f (z) < w .
V, W sind beide im metrischen Raum (U, dX ) offen (Satz 4.2.6), V, W sind disjunkt und beide sind nichtleer (x ∈ V und y ∈ W oder umgekehrt). Gibt es kein
u mit f (u) = w, so ist
U = (U ∩ V ) ∪ (U ∩ W )
im Widerspruch zur Voraussetzung, dass U zusammenhängend ist.
Aufgabe 8.1.25 (Riemann Integral und Nullstelle)
Es sei [a, b] = I ⊂ R ein kompaktes Intervall, ferner sei V = C(I; R), k·kV wie
oben, so dass (V, k · kV ) ein R-Banachraum ist. Ω ⊂ V sei zusammenhängend
Rb
Rb
und es seien f, g ∈ Ω mit f (x) dx g(x) dx < 0, dann gibt es ein h ∈ Ω
a
a
und ein x0 ∈ I mit h(x0 ) = 0.
8.2
Kurven im Raum
In diesem Abschnitt interessieren wir uns für Abbildungen
meiner R → V , wobei ein Banachraum ist.
8.2.1
R → Rn oder allge-
Elementare Eigenschaften
Definition 8.2.1.1 (Kurve)
Es sei (V, k · kV ) ein normierter linearer Raum über R. Es sei I = [a, b] ein
kompaktes Intervall in R und γ : I → V stetig. Dann heißt das Paar (I, γ)
eine Kurve in V . Für die Menge der Kurven auf einem gegebenem Intervall
schreiben wir C(I; V ).
Ist V endlich dimensional, so kann man eine Kurve als Vektor von Funktionen


γ1 (x)


γ(x) =  ... 
γn (x)
auffassen. In diesem Fall ist die Definition der Differenzierbarkeit besonders einfach.
8.2. KURVEN IM RAUM
25
Definition 8.2.1.2 (Kurve, differenzierbar)
Es sei I wie in der vorherigen Definition.
1. Eine Kurve γ : I → Rn heißt differenzierbar im Punkt t0 ∈ (a, b), wenn
alle Funktionen γ1 , . . . , γn im Punkt t0 differenzierbar sind.
2. Die Kurve heißt stetig differenzierbar, wenn alle Funktionen γ1 , . . . , γn
stetig differenzierbar sind, d. h. für i = 1, . . . , n ist γi ∈ C(I; R) und
γi0 : (a, b) → R ist stetig auf (a, b) und stetig fortsetzbar auf I = [a, b].
Beispiel 8.2.1.3 (Geraden und andere Kurven)
1. Das einfachste Beispiel ist das einer Geraden in Rn . Dazu sei ein Punkt
a ∈ Rn gegeben und ein Vektor v ∈ Rn . Dann ist
g(t) = a + t · v : R → Rn
eine stetig differenzierbare Kurve, die geometrisch eine Gerade darstellt.
2. Sei r > 0 und
k(t) =
r cos(t)
r sin(t)
eine stetig differenzierbare Kurve. Sie hat folgende Eigenschaften: k(2π) =
k(0) und kk(t)k = r für alle r ∈ R+ . Damit definiert diese Kurve eine
Kreislinie im R2 mit Radius r um den Ursprung.
3. Nun definieren wir eine Schraubenlinie im R3 durch


r cos(t)
s : R → R3 : t 7→  r sin(t)  .
rt
Die Projektion auf die ersten beiden Komponenten
x1
3
2
p : R → R : x 7→
x2
bildet die Linie auf einen Kreis mit Radius r ab, die Abbildung s ist
injektiv, die Abbildung p ◦ s ist nicht injektiv.
26
KAPITEL 8. DIFFERENTIALRECHNUNG
4. Es sei V = C([a, b]; R) und (V, k · k∞ ) der Banachraum der stetigen
Funktionen auf [a, b]. Wir betrachten die Kurve
γ : [a, b] → V : t 7→ γ(t) ∈ C([a, b]; R),
wobei wir setzen
γ(t)(x) = etx .
Man überzeuge sich, dass die Abbildung t → γ(t) stetig ist.
Definition 8.2.1.4 (Tangentialvektor einer glatten Kurve)
Es sei γ : I → Rn eine stetig differenzierbare Kurve. Dann heißt der Vektor


γ10 (t)


v(t) =  ... 
γn0 (t)
der Tangentialvektor an γ im Punkt γ(t).
Bemerkung 8.2.1.5 (Tangentialvektor und Differenzenquotient)
Wie in der Differentialrechnung auf R kann man den Tangentialvektor als
Grenzwert eines Differenzenquotienten auffassen. Formal sieht er genauso aus
wie in der Analysis I für Funktionen R → R:
1
(f (t + h) − f (t)) .
h→0 h
v(t) = lim
Wir sehen an dieser Betrachtung, dass diese Definition auch in allgemeineren
Situationen verwendet werden kann.
Definition 8.2.1.6 (Differenzierbare Kurve im Banachraum)
Es sei (V, k · kV ) ein reeller Banachraum, I ⊂ R ein offenes Intervall und
γ : I → V eine Kurve, t0 ∈ I. Gibt es eine lineare Abbildung v : R → V mit
1
lim kγ(t0 + h) − γ(t0 ) − v(h)kV = 0,
h→0 h
so nennen wir die Kurve im Punkt t0 differenzierbar.
8.2. KURVEN IM RAUM
27
Bemerkung 8.2.1.7 (Lineare Abbildungen)
Man beachte, dass man jeden C-Banachraum durch Vergessen der komplexen Struktur auch als R-Vektorraum auffassen kann. Der Raum der linearen
Abbildungen
n
o
L(R; V ) = v : R → V v ist linear
ist dann als linearer Raum isomorph zu V . Damit wird L(R; V ) in natürlicher
Weise zum Banachraum. Man beachte, dass jede lineare Abbildung v : R →
V stetig ist. Damit trägt L(R; V ) auch die Struktur eines Banachraumes aus
Beispiel 8.1.16 (v). Beide Sichtweisen führen auf isomorphe Banachräume.
Wir identifizieren die lineare Abbildung v ∈ L(R; V ) mit dem Element v =
v(1).
Definition 8.2.1.8 (Stetig differenzierbare Kurve im Banachraum)
Es sei γ : I → V eine Kurve, wobei I ⊂ R ein abgeschlossenes Intervall
[a, b] und (V, k · kV ) ein Banachraum. γ heißt stetig differenzierbar, wenn γ
in jedem Punkt t ∈ (a, b) differenzierbar ist und die Abbildung
I → L(R; V ) : t 7→ γ 0 (t)
stetig auf (a, b) und stetig fortsetzbar auf [a, b] ist. Wir schreiben für die
Menge der stetig differenzierbaren Kurven auf I C 1 (I; V ).
Lemma 8.2.1.9 (Eindeutigkeit der Ableitung)
Ist γ im Punkt t0 differenzierbar, so ist die Ableitung eindeutig bestimmt.
Beweis. Angenommen v1 , v2 seien zwei Ableitungen, so gilt
1
lim kγ(t0 + h) − γ(t0 ) − hvi kV = 0.
h→0 h
Dann ist
1
lim kγ(t0 + h) − γ(t0 ) − hv1 − γ(t0 + h) + γ(t0 ) + hv2 kV = 0.
h→0 h
Also ist
1
lim khv1 − hv2 kV = lim kv1 − v2 kV = kv1 − v2 kV = 0.
h→0 h
h→0
28
KAPITEL 8. DIFFERENTIALRECHNUNG
Abbildung 8.1: Approximation des Tangentialvektors durch Differentialquotienten
Satz 8.2.1.10 (Kettenregel)
Es seien I ein Intervall, (V, k · kV ) ein Banachraum γ ∈ C 1 (I, V ) eine Kurve
und ϕ : [c, d] → [a, b] stetig und auf (c, d) differenzierbar, so ist γ ◦ ϕ ∈
C 1 ([c, d]; V ) und (γ ◦ ϕ)0 (s0 )(h) = γ 0 (ϕ(s0 ))ϕ0 (s0 )(h).
Beweis. Der Beweis folgt im Grunde dem Beweis von Satz 5.1.8, wir geben
trotzdem eine kurze Form des Beweises. Wir betrachten wir den Grenzwert für
h → 0 von
1 γ ◦ ϕ(s0 + h) − γ ◦ ϕ(s0 ) − γ 0 (t0 )ϕ0 (s0 )h
R(s0 , h) =
V
|h|
und zeigen, dass dieser Null ist, dann ist die lineare Abbildung R → V : h 7→
γ 0 (t0 )ϕ0 (s0 )h mit t0 = ϕ(s0 ) die Ableitung von γ ◦ ϕ(s0 ). Wir führen folgende
Schreibweisen ein:
1 γ ◦ ϕ(s0 + h) − γ ◦ ϕ(s0 ) − γ 0 (t0 ) (ϕ(s0 + h) − ϕ(s0 )) kV
R1 (s0 , h) =
|h|
und
R2 (s0 , h) =
1 γ 0 (t0 ) (ϕ(s0 + h) − ϕ(s0 )) − γ 0 (t0 )ϕ0 (s0 )hkV .
|h|
Die Dreiecksungleichung ergibt
R(s0 , h) ≤ R1 (s0 , h) + R2 (s0 , h).
Für den Grenzwert erhalten wir für R2 wegen der Differenzierbarkeit von ϕ:
kγ 0 (t0 )kV
|ϕ(s0 + h) − ϕ(s0 ) − ϕ0 (s0 )h| = 0
h→0
|h|
0 ≤ lim R2 (s0 , h) ≤ lim
h→0
8.2. KURVEN IM RAUM
29
und für R1 mit k = ϕ(s0 + h) − ϕ(s0 ) folgt:
|k| 1
kγ(t0 + k) − γ(t0 ) − γ 0 (t0 )kkV = 0,
h→0 |h| |k|
0 ≤ lim R1 (s0 , h) = lim
h→0
mit der Definition der Ableitung, denn der erste Quotient ist beschränkt, mit
h → 0 gilt auch k → 0. Also gilt limh→0 R(s0 , h) = 0. Dies war zu zeigen.
8.2.2
Integration Banachraum-wertiger Abbildungen
Entsprechend dem Riemann-Integral für reellwertige Funktionen definieren wir
ein Integral für Abbildungen von R in einen Banachraum V . Da die meisten
Schritte formal denen aus der eindimensionalen Theorie entsprechen werden wir
uns kurz fassen, wichtig ist eine Aussage, die dem Hauptsatz der Differential- und
Integralrechnung entspricht. Auf dem Weg dorthin haben wir im eindimensionalen Fall auch den Mittelwertsatz der Differentialrechnung Korollar 5.3.7, der im
neuen Kontext etwas schwerer zu beweisen ist als der eindimensionale Fall.
Die Ableitung γ 0 : I → V einer stetig differenzierbaren Kurve ist durch die oben
genannte Identifizierung also wieder eine Kurve. Insofern können wir die Frage
stellen, ob es zu einer stetigen Abbildung γ : I → V eine Stammfunktion, also
ob es eine stetig differenzierbare Kurve gibt, deren Ableitung gerade γ ist. Es sei
I = [a, b] ein Intervall in R und γ ∈ C(I; V ) eine stetige Kurve in V . Wir wollen
dafür ein Integral definieren.
Definition 8.2.2.1 (Riemannsumme für Kurven)
Es sei I = [a, b] ein Intervall, (V, k · kV ) ein Banachraum und γ ∈ C(I; V ).
Wir betrachten eine Zerlegung Z = {ζ0 < · · · < ζn } des Intervalls I und
setzen für ein ξj ∈ (ζj , ζj+1 ) für j ∈ {0, . . . , n − 1}
R(γ, Z, ξ) =
n−1
X
(ζj+1 − ζj )γ(ξj )
j=0
und nennen dies eine Riemann-Summe von γ zur Zerlegung Z und der Auswahl ξ = (ξ0 , . . . , ξn−1 )T ∈ V n .
Definition 8.2.2.2 (Integral einer Kurve)
Existiert der Grenzwert
lim R(γ, Z, ξ)
∆(Z)→0
für jede Auswahl von Punkten ξj ∈ (ζj , ζj+1 ) j = 0, . . . , |Z|, so nennen wir
30
KAPITEL 8. DIFFERENTIALRECHNUNG
die Kurve γ : I → V integrierbar und schreiben
Zb
γ(t) dt = lim R(γ, Zξ).
∆(Z)→0
a
Dann gilt der Satz, dass jede Kurve integrierbar ist.
Satz 8.2.2.3 (Integrierbarkeit von Kurven)
Jede Kurve γ ∈ C(I; V ) auf einem Intervall I = [a, b] mit Werten in einem
Banachraum V ist integrierbar.
Beweis. Zu zeigen ist, dass zu jedem ε > 0 ein δ > 0 existiert, so dass ∆(Z1 ), ∆(Z2 ) <
δ impliziert, dass
kR(γ, Z1 ) − R(γ, Z2 )kV < ε
ist, unabhängig von der Wahl der ξj ∈ (ζj , ζj+1 , j = 0, . . . , n − 1. Sei also ε > 0
gegeben. Da γ : I → V stetig ist, ist die Kurve auch gleichmäßig stetig (Satz
4.3.9), d. h. es gibt eine Zahl δ > 0, so dass |t1 − t2 | < δ impliziert, dass kγ(t1 ) −
ε
ist. Mit dieser Wahl von δ > 0, wählen wir Zerlegungen Z1,2 , so
γ(t2 )kV < 2(b−a)
dass
∆(Zj ) < δ, für j = 1, 2.
Seien Z1 = {a = η0 < · · · < ηn = b} und Z2 = {a = µ0 < · · · < µm = b}. Wir
wählen eine Auswahl σ durchσj ∈ (ηj , ηj+1 ), j = 0, . . . , n − 1 und eine Auswahl
τ durchτk ∈ (µk , µk+1 ), k = 0, . . . , m − 1. Wir schreiben
R1 = R(γ, Z1 , σ) =
n−1
X
(ηj+1 − ηj )γ(σj )
j=0
und
R2 = R(γ, Z2 , τ ) =
m−1
X
(µk+1 − µk )γ(τk ).
k=0
Sei Z = {a = ζ0 < · · · < zN } eine gemeinsame Verfeinerung von Z1 und Z2 und
sei ξ eine Auswahl mit ξ` ∈ (ζ` , ζ`+1 ) für ` = 0, . . . , N − 1. Dann ist ∆(Z) < δ.
Ferner seien j(`) das eindeutig bestimmte j, so dass (ζ` , ζ`+1 ) ⊂ (ηj , ηj+1 ) und
8.2. KURVEN IM RAUM
31
k(`) das eindeutig bestimmte k, so dass (ζ` , ζ`+1 ) ⊂ (µk , µk+1 )
kR1 − R2 kV ≤ kR1 − R(γ, Z)k + kR(γ, Z) − R2 kV
≤
≤
N
−1
X
(ζ`+1 − ζ` )kγ(ξ` ) − γ(σj(`) )kV +
`=0
N
−1
X
(ζ`+1 − ζ` )kγ(ξ` ) − γ(τk(`) )kV
`=0
(ζ`+1 − ζ` )
`=0
=
N
−1
X
ε
(b − a)
N
−1
X
ε
+
2(b − a)
N
−1
X
(ζ`+1 − ζ` )
`=0
ε
2(b − a)
(ζ`+1 − ζ` )
`=0
= ε.
Sei {Zk }k∈N eine Folge von Zerlegungen von [a, b] mit limk→∞ ∆(Zk ) = 0, so
bilden die zugehörigen Riemann-Summen eine Cauchyfolge und der Grenzwert
existiert, da (V, k · k) vollständig ist. Unsere Rechnung zeigt, dass der Grenzwert
unabhängig von der gewählten Folge ist.
Entsprechend der Konstruktion des Riemann-Integrales findet man einfache Konsequenzen, die wir nun als Lemma formulieren wollen, die sich aber zum großen
Teil direkt aus der Definition beweisen lassen.
Lemma 8.2.2.4 (Einfache Eigenschaften des Integrals von Kurven)
1. Für jedes a < t < b das Integral einer Kurve γ über [a, b] gleich der
Summe der Integrale über [a, t] und [t, b] ist, also
Zb
Zt
γ(s)ds =
a
Zb
γ(s)ds +
γ(s)ds.
t
a
2. Es gilt
b
Z
Zb
n
o
γ(s) ds ≤ kγ(s)kV ds ≤ sup kγ(s)kV s ∈ [a, b] (b − a).
a
V
a
Beweis. Die erste Eigenschaft ist offensichtlich, wir kommen gleich zur zweiten
Eigenschaft.
Sei ε > 0 gegeben und δ > 0 so gewählt, dass für Zerlegungen Z mit ∆(Z) < δ
und jede Auswahl ξ jede Riemann-Summe von γ zu einer Zerlegung gilt
b
Z
γ(s) ds − R(γ, Z, ξ) < ε.
a
V
32
KAPITEL 8. DIFFERENTIALRECHNUNG
Dann betrachten wir
b
b
Z
Z
γ(s) ds ≤ γ(s) ds − R(γ, Z) + kR(γ, Zk
V
a
V
a
≤ε+
V
n−1
X
(ζj+1 − ζj )kγ(ξj )kV
j=0
n
o
≤ ε + sup kγ(s)kV s ∈ [a, b] (b − a).
Die mittlere Zeile liefert (nach Übergang zum Grenzwert, der existiert, weil s 7→
kγ(s)kV stetig und damit integrierbar ist) die erste Abschätzung, die untere Zeile
die zweite Abschätzung. Damit ist das Lemma gezeigt.
Definition 8.2.2.5 (Stammfunktion einer Kurve)
Eine Kurve β : [a, b] → V heißt Stammfunktion der Kurve γ : [a, b] → V ,
falls β ∈ C 1 ([a, b]; V ) ist und β 0 (t) = γ(t) für alle a < t < b.
Satz 8.2.2.6 (Existenz einer Stammfunktion)
Die Funktion
Zt
β(t) = γ(s)ds
a
ist eine Stammfunktionen von γ.
Beweis. Wir betrachten den Differenzenquotienten
 t+h

Z
1
1
(β(t + h) − β(t) − γ(t)h) =  γ(s) ds − γ(t)h .
h
h
t
Dies folgt sofort aus der ersten Aussage von Lemma 8.2.2.4. Sei ε > 0 gegeben,
δ > 0 so gewählt, dass |t − t0 | < δ impliziert
kγ(t) − γ(t0 )kV < ε.
Ist nun |h| < δ, dann ist die rechte Seite (für h > 0) durch
t+h
t+h
Z
Z
Zt+h
1
1
1
εh
γ(s) ds − γ(t)h
= (γ(s) − γ(t))ds
≤
kγ(s) − γ(t)kV ds <
=ε
h
h
h
h
t
abzuschätzen.
V
t
V
t
8.2. KURVEN IM RAUM
33
Satz 8.2.2.7 (Konstanzbedingung)
1. Es sei (V, k · kV ) ein Banachraum, I = [a, b] ein abgeschlossenes Intervall und γ ∈ C 1 (I, V ) eine Kurve mit γ 0 (t) = 0 für alle t ∈ (a, b).
Dann ist γ(a) = γ(b).
2. Sind βj ∈ C 1 (I; V ) für j = 1, 2 zwei Stammfunktionen von γ ∈ C(I; V ),
dann unterscheiden sich β1 und β2 um eine Konstante in V .
Beweis.
1. Sei oBdA a = 0, b = 1 und γ(0) = 0 (durch Verschieben und einer
Skalierung ist dies immer zu erreichen, z. B. γ̃(t) = γ(a + t(b − a)) − γ(a)).
Sei ε > 0 gegeben. Wir betrachten die Menge
n
o
K = r ∈ [0, 1] ∀s∈[0,r] : kγ(s)kV ≤ εs .
Dann ist 0 ∈nK, also istK 6= ∅.oIst K 6= [0, 1], so ist die Menge [0, 1]\K 6= ∅.
/ K . Ist kγ(x)kV > εx, so gibt es wegen der
Sei x = inf z ∈ [0, 1] z ∈
Stetigkeit von kγ(x)kV ein x0 < x mit kγ(x0 )kV > εx > εx0 . Also ist x ∈ K
und x < 1. Dann ist γ 0 (x) = 0. Also ist
1
lim kγ(x + h) − γ(x)k = 0
h→0 h
und es gibt ein h0 > 0 mit 0 < h < h0 impliziert
1
kγ(x + h) − γ(x)k < ε.
h
Dann ist aber für 0 < h < h0
kγ(x + h)kV < kγ(x)kV + εh ≤ εx + εh = ε(x + h).
n
o
Also ist x 6= inf z ∈ [0, 1] z ∈
/ K . Damit ist K = [0, 1] und γ(0) = γ(1).
2. Sind βj j = 1, 2 Stammfunktionen, so gilt βj0 = γ und (β1 − β2 )0 (t) = 0 für
alle t ∈ (a, b). Dann ist (β1 − β2 ) konstant und damit unterscheiden sich
beide Funktionen um eine Konstante.
Damit folgt der Hauptsatz der Differential- und Integralrechnung in der nachfolgenden Version.
Satz 8.2.2.8 (Hauptsatz für differenzierbare Banachraum-wertige
Abbildungen)
Sei I ⊂ R ein Intervall und t, t0 ∈ I.
34
KAPITEL 8. DIFFERENTIALRECHNUNG
1. Für γ ∈ C(I; V ) und für eine Stammfunktion β ∈ C 1 (I; V ) von γ gilt
Zt
β(t) − β(t0 ) =
γ(s) ds.
t0
2. Insbesondere ist für γ ∈ C 1 (I; V )
Zt
γ(t) − γ(t0 ) =
γ 0 (s) ds.
t0
Korollar 8.2.1 (Wachstumsschranken für C 1 -Abbildungen)
Ist γ ∈ C 1 (I; V ), dann ist für t, t0 ∈ I
kγ(t)−γ(t0 )kV ≤
Zt0
n
o
kγ 0 (s)kV ds ≤ sup kγ 0 (s)kV s ∈ [t, t0 ] oder [t0 , t] |t−t0 |.
t
Beweis. Dies folgt sofort aus dem Hauptsatz (Satz 8.2.2.8) und dem Satz von
den einfachen Eigenschaften des Integrales (Satz 8.2.2.4).
8.2.3
Kurvenlänge
Es sei I = [a, b] ein Intervall in R und Z eine Zerlegung des Intervalls. Wir wollen
diese nutzen um eine Approximation einer Kurve zu definieren.
Definition 8.2.3.1 (Polygonzug)
Es sei (V, k · kV ) ein Banachraum und γ : [a, b] → V eine Kurve und Z =
{ζ0 < · · · < ζm } eine Zerlegung des Intervalls. Wir definieren

x − ζi

γ(ζi ) +
(γ(ζi+1 ) − γ(ζi )), für x ∈ (ζi , ζi+1 )
pZ (x) =
ζi+1 − ζi

γ(x),
für x ∈ Z.
pZ heißt der Polygonzug zur Zerlegung Z.
Die Länge eines Polygonzuges ist die addierte Länge der einzelnen Geradenstücke.
Definition 8.2.3.2 (Länge eines Polygonzuges)
8.2. KURVEN IM RAUM
35
Abbildung 8.2: Approximation einer Kurve durch einen Polygonzug
Die Länge des Polygonzuges p ist gegeben durch
L(pZ ) =
m−1
X
kγ(ζj+1 ) − γ(ζj )kV .
j=0
Definition 8.2.3.3 (rektifizierbar, Länge einer Kurve)
Gegeben sei eine Kurve γ : [a, b] → V , wobei (V, k · kV ) ein Banachraum sei.
Ist
n
o
L(γ) = sup L(pZ ) Z ist Zerlegung von [a, b] < ∞,
so nennt man die Kurve rektifizierbar. L(γ) heißt dann die Länge der Kurve.
Bemerkung 8.2.3.4 (Länge eines Polygonzuges als Integral)
Man beachte, dass der Polygonzug einer Kurve zu einer gegebenen Zerlegung
auf den Zerlegungsintervallen differenzierbar ist und die Ableitung durch den
Differenzenquotienten zu den Zerlegungspunkten gegeben ist. Betrachtet man
also
Zb
k(pZ )0 (x)kdx
a
als Integral einer Treppenfunktion, so erhält man genau die Länge L(pZ ).
Betrachtet man eine Verfeinerung Z0 der Zerlegung Z so gilt offensichtlich
L(pZ0 ) ≥ L(pZ ),
d. h. auch die Integrale der Treppenfunktionen werden durch Verfeinerung der
36
KAPITEL 8. DIFFERENTIALRECHNUNG
Zerlegungen monoton steigend. Daher ist die Kurve genau dann rektifizierbar, wenn es für die Integrale dieser Treppenfunktionen eine ober Schranke
gibt. Da dies der Fall ist, wenn es eine obere Schranke für die möglichen Differenzenquotienten gibt, ist zu erwarten, dass stetig differenzierbare Kurven
rektifizierbar sind.
Definition 8.2.3.5 (Lipschitz stetig)
Die Kurve γ : I → V , V Banachraum heißt Lipschitz stetig, falls es eine
Konstante M > 0 gibt, so dass für alle t1 , t2 ∈ I gilt
kγ(t2 ) − γ(t1 )kV ≤ M |t1 − t2 |.
Lemma 8.2.3.6 (Lipschitzstetigkeit differenzierbarer Kurven)
Ist γ : [a, b] → V eine differenzierbare Kurve mit kγ 0 (t)kV ≤ M für alle
t ∈ (a, b), dann ist für alle t, t0 ∈ [a, b]
kγ(t) − γ(t0 )kV ≤ M |t − t0 |.
Beweis. Folgt sofort aus dem Korollar über Wachstumsschranken differenzierbarer Abbildungen (Korollar 8.2.1).
Bevor wir zum zentralen Satz bezüglich der Rektifizierbarkeit von Kurven kommen, führen wir noch einen Begriff ein und zeigen eine wichtige Aussage, die uns
beim Beweis der zentralen Aussage helfen wird.
Bemerkung 8.2.3.7 (Rektifizierbarkeit von Teilkurven)
Die Rektifizierbarkeit einer Kurve γ ∈ C([a, b]; V ) impliziert für jedes t ∈
[a, b] die Rektifizierbarkeit der Kurve γt = γ|[a,t] .
Definition 8.2.3.8 (Wegelängenfunktion)
Zu einer rektifizierbaren Kurve und zu t ∈ [a, b] schreiben wir
Lt (γ) = L(γ|[a,t] )
für die Länge der Einschränkung der Kurve γ auf das Teilintervall [0, t]. Wir
bezeichnen Lt (γ) als die Wegelängenfunktion.
Aufgabe 8.2.3.9 (Stetigkeit der Wegelängenfunktion)
Zeigen Sie: Die Wegelängenfunktion einer rektifizierbaren Kurve ist stetig.
8.2. KURVEN IM RAUM
37
Lemma 8.2.3.10 (Differenzierbarkeit der Wegelängenfunktion für
glatte Kurven)
Ist γ ∈ C 1 (I; V ), so ist die Abbildung t 7→ Lt (γ) differenzierbar, die Ableitung
an der Stelle t ergibt sich zu kγ 0 (t)kV .
Beweis. Wir beginnen mit einer einfachen Beobachtung – für a ≤ t1 < t2 ≤ b
gilt
Zt2
t1
t2
(8.2)
kγ(t2 ) − γ(t1 )kV ≤ L (γ) − L (γ) ≤ kγ 0 (s)kV ds
t1
– und wollen diese beweisen. Wir approximieren γ|[t1 ,t2 ] durch einen Polygonzug
pZ (t1 , t2 ) der γ(t1 ) mit γ(t2 ) verbindet. Dann ist offensichtlich
kγ(t2 ) − γ(t1 )kV ≤ L(pZ (t1 , t2 )) ≤ Lt2 (γ) − Lt1 (γ).
Für jeden Abschnitt eines Polygonzuges der Form
x − ζi
γ(ζi ) +
(γ(ζi+1 ) − γ(ζi ))
ζi+1 − ζi
gilt, dass die Länge nach oben durch das Integral
ζi+1
Z
kγ 0 (s)kV ds
ζi
abzuschätzen ist, durch Aneinanderfügen mehrerer solcher Abschnitte ergibt sich,
dass die obige Abschätzung (8.2) gilt. Wir müssen den Quotienten
1 t+h
(L (γ) − Lt (γ)
h
für h → 0 untersuchen. Wir haben
Zt+h
γ(t + h) − γ(t) =
γ 0 (s) ds.
t
Damit erhalten wir für den genannten Quotienten eine Abschätzung nach oben
und unten:
Zt+h
1
1 t+h
1
t
kγ(t + h) − γ(t)kV ≤ |L (γ) − L (γ)| ≤
kγ 0 (s)kV ds.
|h|
h
|h|
t
Durch Grenzübergang und der Differenzierbarkeit der Funktionen deren Differenzenquotienten auf der linken und rechten Seite stehen, ergibt sich, dass der
Quotient in der Mitte gegen kγ 0 (t)kV konvergiert und damit ist kγ 0 (t)kV k die
Ableitung der Wegelängenfunktion im Punkt t.
38
KAPITEL 8. DIFFERENTIALRECHNUNG
Satz 8.2.3.11 (Kriterium für Rektifizierbarkeit)
Sei (V, h·, ·iV ) ein Banachraum.
1. Ist γ : I → V Lipschitz stetig, so ist die Kurve rektifizierbar.
2. Ist γ : [a, b] → V stetig differenzierbar, so ist die Kurve γ rektifizierbar
und
Zb
L(γ) = kγ 0 (x)kV dx.
a
Beweis. Im ersten Fall sei Z eine beliebige Zerlegung von [a, b], dann ist
L(pZ ) =
m−1
X
kγ(ζj+1 ) − γ(ζj )kV ≤
j=0
m−1
X
M |ζj+1 − ζj | = M (b − a).
j=0
Also ist das Supremum über alle Zerlegungen höchstens M (b − a). Die zweite
Aussage beweisen wir wie folgt. Da γ stetig differenzierbar ist, ist die Abbildung
[a, b] → V : t 7→ γ 0 (t) stetig, das Bild γ 0 ([a, b]) ist kompakt, daher beschränkt,
und es existiert eine Zahl M > 0 mit
kγ 0 (t)kV < M, t ∈ [a, b].
Dann ist γ Lipschitz stetig mit Konstante M und damit rektifizierbar.
Es bleibt noch zu zeigen, dass die Länge der Kurve durch das angegebene Integral
gegeben ist. Da die Ableitung der Wegelängenfunktion durch kγ 0 (t)kV gegeben
ist, folgt die Darstellung der Funktion unmittelbar.
Bemerkung 8.2.3.12 (Kurvenlänge und Norm)
Die Länge einer Kurve hängt von der Wahl der Norm ab, die Rektifizierbarkeit nicht, in dem Sinne, dass für zwei äquivalente Normen k · k1 , k · k2
eine Kurve γ genau dann bzgl. k · k1 rektifizierbar ist, wenn sie bzgl. k · k2
rektifizierbar ist.
Als Anwendung betrachten wir die Länge des Kreisbogens.
Satz 8.2.3.13 (Kreisbogen)
Es sei r > 0
γ : [0, 2π] → R : t 7→
2
r cos(t)
r sin(t)
der Kreisbogen mit Radius r im (R2 , k · k2 ). Dann ist L(γ) = 2πr.
8.2. KURVEN IM RAUM
39
Beweis. Es ist γ stetig differenzierbar, also ist γ rektifizierbar und es gilt
Z2π
L(γ) =
Z2π q
kγ 0 (s)k2 ds = r (cos2 (t) + sin2 (t)) dt = 2πr.
0
0
Es stellt sich die Frage, ob diese Länge ein Charakteristikum der Punktmenge im
Raum V ist oder von der gewählten Kurve abhängt. Dieser Frage gehen wir im
nächsten Abschnitt nach. Davor noch zwei Begriffe.
Definition 8.2.3.14 (Spur)
Wir unterscheiden die Kurve γ und ihr Bild, d. h. die Punktmenge
n
o
γ(t) t ∈ [a, b]
in V , letzteres bezeichnen wir als die Spur der Kurve.
8.2.4
Transformationen
Wir wollen das Verhalten einer Kurve bzw. des Tangentialvektors unter sogenannten Parametertransformationen untersuchen. Wir betrachten dabei folgende
grundlegende Situation:
Es sei γ : [a, b] → V eine Kurve, ϕ : [c, d] → [a, b] eine stetige, bijektive Abbildung. Dann ist natürlich
γ ◦ ϕ : [c, d] → V
eine Kurve.
Definition 8.2.4.1 (Parametertransformation)
Wir sagen die Kurve γ ◦ϕ geht durch die Parametertransformation ϕ aus der
Kurve γ hervor. Sind die Abbildungen ϕ und ϕ−1 beide stetig differenzierbar,
so sprechen wir von einer C 1 -Parametertransformation.
Lemma 8.2.4.2 (Parametertransformation)
Ist ϕ eine C 1 -Parametertransformation, so ist ϕ0 (t) 6= 0 für alle t ∈ [c, d].
Beweis. Es gilt ϕ ◦ ϕ−1 = 1l auf [a, b], wobei 1l für die Abbildung 1l(x) = x steht.
Dann ist nach der Kettenregel
1 = (ϕ ◦ ϕ−1 )0 (t) = ϕ0 (ϕ−1 (t))(ϕ−1 )0 (t).
Also ist sowohl ϕ0 wie auch (ϕ−1 )0 nirgends Null.
Daher hat ϕ0 ein konstantes Vorzeichen auf [c, d].
40
KAPITEL 8. DIFFERENTIALRECHNUNG
Definition 8.2.4.3 (Parametertransformation und Orientierung)
Die C 1 -Parametertransformation heißt orientierungserhaltend, wenn ϕ0 > 0
ist, im anderen Fall nennt man sie orientierungsumkehrend.
Wir betrachten zunächst das Verhalten der Tangentialvektoren unter Parametertransformationen. Ist γ : [a, b] → V eine Kurve, ϕ eine C 1 -Parametertransformation, ϕ : [c, d] → [a, b] bijektiv, so ist
(γ ◦ ϕ)0 (t) = γ 0 (ϕ)ϕ0 (t).
Daran sieht man, dass die Richtung der Tangentialvektoren unter C 1 -Parametertransformationen erhalten bleibt.
Satz 8.2.4.4 (Invarianz der Länge)
Ist γ eine stetig differenzierbare Kurve, ϕ eine C 1 -Parametertransformation,
so ist L(γ) = L(γ ◦ ϕ).
Beweis. Dies folgt sofort aus der Substitutionsregel:
Zd
L(γ ◦ ϕ) =
k(γ ◦ ϕ)0 (s)kV ds
c
Zd
=
kγ 0 (ϕ(s))ϕ0 (s)kV ds
c
Zd
=
kγ 0 (ϕ(s))kV |ϕ0 (s)| ds
c
Zd
=±
kγ 0 (ϕ(s))kV ϕ0 (s) ds
c
ϕ(d)
Z
=±
kγ 0 (t)kV dt
ϕ(c)
Zb
=
kγ 0 (t)kV dt
a
Definition 8.2.4.5 (Äquivalenz von Kurven)
Wir nennen zwei Kurven γ1,2 ∈ C(I1,2 ; V ) äquivalent, wenn es eine Parame-
8.3. ABLEITUNGEN
41
tertransformation φ : I1 → I2 gibt mit γ1 = γ2 ◦ φ.
Lemma 8.2.4.6 (Äquivalenzrelation und Kurven)
Äquivalenz von Kurven ist eine Äquivalenzrelation auf der Menge der Paare
(I, γ).
Definition 8.2.4.7 (Weg)
Eine Äquivalenzklasse von Kurven bezüglich der eben definierten Relation
heißt Weg.
Diese Begriffsbildung rechtfertigt den Begriff der Wegelängenfunktion.
8.3
Ableitungen
8.3.1
Definition der Ableitung
Wir wollen in diesem Abschnitt den Begriff der Ableitung einer auf einer offenen
Teilmenge eines Banachraumes definierten, K-wertigen Funktion einführen und
gleichzeitig den Begriff der partiellen Ableitung für Funktionen, die auf Teilmengen eines Banachraumes V definiert sind. Dies ist etwas komplizierter als der
Begriff der Ableitung für Funktionen einer einzigen reellen oder komplexen Variablen. Funktionen f : V → R treten bei der Beschreibung von Vorgängen in
der Natur, Technik und Wissenschaft in mannigfacher Weise auf. Dabei ist man
oft an Extremalstellen interessiert, die man wie bisher mit Ableitungen charakterisiert. Daher ist der nun zu definierende Begriff zentral für die Anwendungen
der Mathematik in anderen Fächern. Wir wollen wegen dieser Wichtigkeit einige
Beispiele von solchen Funktionen aus verschiedenen Bereichen angeben.
Beispiel 8.3.1.1 (Extremalprobleme in mehreren Veränderlichen)
1. (Meteorologie) Eine Abbildung T : R3 → R, die jedem Punkt der
Atmosphäre die Temperatur an diesem Punkt zuordnet. Gleiches gilt
für Druck p, Luftfeuchtigkeit etc. Weitere Fragen könnten Isotherme
sein, wie sehen diese aus?
2. (Geographie) Die Abbildung, die jedem Punkt auf der Landkarte (R2 )
die Höhe über NN zuordnet.
3. (Chemische Industrie) Die Abbildung T : R3 → R, die jedem Punkt in
einem mit einem reagierenden Gemisch gefüllten Tank die Temperatur
zuordnet. Die Kenntnis dieser Funktion ist für die Sicherheit chemischer
Anlagen von extrem hoher Wichtigkeit, obwohl man diese Funktion im
42
KAPITEL 8. DIFFERENTIALRECHNUNG
Regelfall nicht messen kann. Typischerweise misst man Temperaturen
nur am Rand des Tanks oder an wenigen ausgewählten Punkten.
4. (Physik) Die Dichte eines Stoffes als Funktion vom Ort ist z. B. für das
Trägheitsmoment wichtig.
5. (Biologie) Permeabilität einer Grenzschicht in Abhängigkeit vom Ort
auf der Grenzschicht.
6. (Medizin) Gewebedichte in Abhängigkeit vom Ort im menschlichen
Körper. Z. B. spielt dies bei der Bekämpfung von Tumoren mit Hyperthermie eine große Rolle. Dies spielt auch bei bildgebenden Verfahren
in der Medizin eine Rolle.
7. (Wirtschaft) Inflationsrate als Funktion von Leitzinsen, Exporten, Importpreisen, Geldmenge.
8. (Flugzeugbau) Auftrieb in Abhängigkeit von Fluggeschwindigkeit, Luftdruck und Lufttemperatur (die ihrerseits von Ort und Zeit abhängig
ist).
9. (Fahrzeugentwicklung) Luftwiderstand eines Fahrzeugs als Funktion
der Fahrzeugform, in diesem Fall ist die Funktion in natürlicher Weise auf einem nicht endlich dimensionalen Banachraum, dem Raum der
Formen, definiert.
Der Begriff der Stetigkeit für solche Funktionen ist uns bekannt, da wir ja diesen Begriff im Kontext metrischer Räume kennengelernt haben und wie oben
dargestellt der Banachraum V auch ein metrischer Raum ist.
Definition 8.3.1.2 (Differenzierbarkeit)
Es sei (V, k · kV ) ein K-Banachraum U ⊂ V eine offene Menge, f : U → K
sei eine Abbildung, x0 ∈ U . f heißt differenzierbar im Punkt x0 , wenn es
eine stetige, lineare Abbildung ` : V → K gibt, so dass gilt
1
(f (x0 + h) − f (x0 ) − `(h)) = 0.
khkV →0 khkV
lim
Die Bedingung besagt, dass für eine beliebige Folge von Vektoren {hm }m∈N mit
hm ∈ V mit limm→∞ hm = 0 gilt
lim
m→∞
1
khm kV
(f (x0 + hm ) − f (x0 ) − `(hm )) = 0.
(8.3)
Folgen und deren Grenzwerte sind uns in beliebigen metrischen Räumen bekannt,
damit auch der Limes h → 0, der, wie gerade erläutert, über solche Folgen definiert wird. Man beachte dabei natürlich, dass es (wegen der Offenheit von U )
8.3. ABLEITUNGEN
43
für x0 ∈ U und limm→∞ hm = 0 ein N ∈
x0 + hk ∈ U ist.
N gibt, so dass für k > N
der Vektor
Bemerkung 8.3.1.3 (Approximation durch lineare Abbildungen)
Oft wird die Bedingung auch so formuliert, vgl. Satz 5.1.9: f ist im Punkt
x0 differenzierbar, wenn es eine stetige lineare Abbildung ` : V → K gibt, so
dass für die Funktion
R(h) = f (x0 + h) − f (x0 ) − `(h)
gilt
lim
h→0
1
R(h) = 0.
khkV
Diese Bedingung ist (offensichtlich) äquivalent zu der in der Definition angegebenen Bedingung.
Definition 8.3.1.4 (Dualraum)
Ist (V, k · kV ) ein K-Banachraum, so bezeichnen wir mit V 0 den Dualraum
von V , wobei
n
o
V 0 = ` : V → K ` ist stetig und linear .
Lemma 8.3.1.5 (Eigenschaften des Dualraumes)
Der Dualraum ist ein normierter linearer Raum, dessen Norm durch
n
o
k`kV 0 = sup |`(x) kxkV = 1 .
definiert ist. Mit dieser Norm gilt für jedes x ∈ V
|`(x)| ≤ k`kV 0 kxkV .
V 0 wird mit dieser Norm zum
K-Banachraum.
Beweis. Vgl. Beispiel 8.1.16 (5).
Satz 8.3.1.6 (Eindeutigkeit der Ableitung)
Gibt es eine lineare Abbildung `, die der Bedingung (8.3) genügt, so ist sie
eindeutig.
44
KAPITEL 8. DIFFERENTIALRECHNUNG
Beweis. Angenommen wir hätten zwei solche Abbildungen `1 , `2 . Dann ist
0 =
lim
m→∞
1
khm kV
(f (x0 + hm ) − f (x0 ) − `2 (hm ))
− lim
1
m→∞
=
lim
m→∞
1
khm kV
khm kV
(f (x0 + hm ) − f (x0 ) − `1 (hm ))
(`1 (hm ) − `2 (hm )).
Angenommen `1 6= `2 . Dann gibt es ein h ∈ V , khkV = 1 mit `1 (h) 6= `2 (h).
Dann ist aber für t > 0, t ∈ R
1
1
0 = lim (`1 (th) − `2 (th)) = lim (t(`1 (h) − `2 (h))) = `1 (h) − `2 (h) 6= 0.
t→0 t
t→0 t
Dieser Widerspruch impliziert die Eindeutigkeit der linearen Abbildung.
Definition 8.3.1.7 (Differential)
Existiert eine lineare Abbildung, die der Bedingung (8.3) genügt, so heißt
diese Abbildung die Linearisierung oder auch das Differential von f an der
Stelle x0 . Wir schreiben dafür Df (x0 ) (oder auch df (x0 )).
Bemerkung 8.3.1.8 (Ableitung und Basiswechsel)
1. Man beachte, dass Df (x0 ) eine lineare Abbildung ist, die Punkte x ∈ V
auf Werte in R abbildet. Dafür schreiben wir
Df (x0 )(x) = w ∈ R.
2. Die Linearisierung einer Abbildung an einer Stelle hängt nicht von der
Wahl der Basis in unserem Vektorraum ab. Allerdings hängt die Darstellung als Matrix bezüglich der Basis (für endlich dimensionales f )
sehr wohl davon ab.
Lemma 8.3.1.9 (Ableitung in Koordinaten)
Gegeben sei eine im Punkt x0 ∈ U , U ⊂ Rn offen, differenzierbare Funktion
f , B = {ei | i = 1, . . . , n} sei die übliche Basis. Die 1 × n-Matrix
(Df (x0 )(e1 ) Df (x0 )(e2 ) . . . Df (x0 )(en ))
stellt die Ableitung von f im Punkt x0 bezüglich B dar.
8.3. ABLEITUNGEN
45
Beweis. Es besteht der übliche Zusammenhang
!
n
X
Df (x0 )(x) = Df (x0 )
xi e i
i=1
=
n
X
xi Df (x0 )(ei )
i=1



= (Df (x0 )(e ) Df (x0 )(e ) . . . Df (x0 )(e )) 

1
2
n
x1
x2
..
.



.

xn
Bemerkung 8.3.1.10 (Affin lineare Abbildungen und Approximation)
Es ist naheliegend die affin lineare Abbildung
A : x 7→ f (x0 ) + Df (x0 )(x − x0 )
zu betrachten. Die Differenz R(x−x0 ) = Ax−f (x) verschwindet mit x → x0
sogar noch nach Division durch kx − x0 kV , in diesem Sinne approximiert die
Abbildung A die Funktion f .
Beispiel 8.3.1.11 (Differenzierbare Abbildungen)
1. Lineare Abbildungen f : Rn → R sind in jedem Punkt x0 ∈
differenzierbar, es gilt Df (x0 ) = f , denn
Rn
f (x0 + h) − f (x0 ) − f (h) = 0.
2. Ist (V, k·k) ein Banachraum, so sind stetige lineare Abbildungen V → K
differenzierbar.
3. Ist (V, h·, ·iV ) ein Hilbertraum und A : V → V eine stetige lineare
Abbildung, so ist
f (x) = hx, AxiV
in jedem Punkt differenzierbar, die Linearisierung ist
Df (x0 )(h) = hh, Ax0 iV + hx0 , AhiV .
Zur Begründung betrachten wir
hx + h, A(x + h)iV = hx, AxiV + hh, AxiV + hx, AhiV + hh, AhiV .
46
KAPITEL 8. DIFFERENTIALRECHNUNG
In diesem Fall ist
|R(h)| = |hh, AhiV | ≤ khkV kAhkV
und
|R(h)|
≤ kAhkV → 0
khkV
mit h → 0.
Ist A zusätzlich symmetrisch bzgl. h·, iV , d. h. hAx, yiV = hx, AyiV (für
endlich dimensionale Räume und der Darstellung bzgl. Standard-Basis
und dem üblichen Skalarprodukt bedeutet dies A = AT ), so ist
Df (x0 )(h) = 2hAx0 , hiV .
Eine wichtige Eigenschaft differenzierbarer Funktionen ist bereits aus der eindimensionalen Analysis bekannt. Wir beginnen mit einem Hilfssatz.
Satz 8.3.1.12 (Stetigkeit differenzierbarer skalarer Abbildungen)
Ist (V, k · kV ) ein K-Banachraum und U ⊂ V offen, f : U → K eine im
Punkt x0 differenzierbare Funktion, so ist f im Punkt x0 stetig.
Beweis. Sei ε > 0 gegeben. Für h ∈ V gilt
f (x0 + h) + f (x0 ) = Df (x0 )(h) + R(h).
Wegen limh→0
|R(h)|
khkV
= 0 gibt es ein δ1 > 0, so dass khkV < δ1 impliziert
|R(h)|
ε
< .
khkV
2
Dann ist
ε
|R(h)| < khkV .
2
Da Df (x) eine stetige lineare Abbildung ist, gibt es ein δ2 > 0, so dass
ε
khkV < δ2 impliziert |Df (x0 )(h)| < .
2
Dann ist aber
ε
|f (x0 + h) − f (x0 )| ≤ |Df (x0 )(h)| + |R(h)| ≤ 2 = ε,
2
solange nur khkV ≤ min{δ1 , δ2 }.
Wir stellen nun die Frage, wie man eine Funktion auf Differenzierbarkeit testet
und wie man im Fall der Differenzierbarkeit die Linearisierung oder auch die
Ableitung berechnet.
8.3. ABLEITUNGEN
47
Definition 8.3.1.13 (Richtungsableitung)
Es (V, k · kV ) ein K-Banachraum und U ⊂ V sei offen, f : U → K sei eine
Abbildung. Es sei x0 ∈ U und a ∈ V . Wir betrachten die Abbildung
fx0 ,a : K → K : w 7→ f (x0 + wa).
Ist diese Funktion im Punkt w = 0 differenzierbar, so sagen wir, dass die
Richtungsableitung von f im Punkt x0 in Richtung a existiert und den Wert
fx0 0 ,a (0) hat. Wir bezeichnen diese mit ∂a f (x0 ).
Ist V = Kn , so werden die Richtungsableitungen in Richtung der Vektoren
der Standardbasis als partielle Ableitungen bezeichnet, als Symbol schreiben
wir
∂
f (x0 ) = ∂ei f (x0 ) ,
∂xi
dafür schreiben wir auch kurz ∂i f (x0 ). Existieren die partiellen Ableitungen
von f , so sagen wir, f ist partiell differenzierbar.
Sind alle partiellen Ableitungen stetig, so sprechen wir von einer stetig partiell
differenzierbaren Funktion.
Aus unserer bisherigen Diskussion folgt der Satz:
Satz 8.3.1.14 (Differenzierbarkeit und Darstellung der Ableitung)
Ist U ⊂ Kn offen, f : U → K in x0 differenzierbar, so ist f im Punkt x0
partiell differenzierbar und es existieren alle Richtungsableitungen und die
Linearisierung von f hat die Darstellung
n
X
∂
f (x0 )hi .
Df (x0 )(h) =
∂x
i
i=1
Damit hat man eine Strategie, die Ableitung einer Funktion f : Kn → K zu
bestimmen: Man bestimme alle partiellen Ableitungen im Punkt x0 und verifiziere
dann, ob die durch die damit gebildete 1 × n-Matrix definierte lineare Abbildung
die Bedingung an die Ableitung erfüllt.
Zunächst jedoch ein Beispiel an dem man erkennt, dass diese Strategie nicht
immer erfolgreich ist.
Beispiel 8.3.1.15 (Partielle Differenzierbarkeit und Differenzierbarkeit)
48
KAPITEL 8. DIFFERENTIALRECHNUNG
Es sei f : R2 → R definiert durch

x1
0


0, falls
=

x2
0
f (x1 , x2 ) =
2
x
x

2

 2 1 2 , sonst.
x1 + x2
a1
Ist 0 6= a =
∈ R2 , so ist mit f0,a (t) = f (ta)
a2
f (ta) − f (0) = f (ta) = t
a21 a2
= tf (a)
a21 + a22
und
1
lim (f (ta) − f (0) − f (a)t) = 0.
t→0 t
Also ist die Richtungsableitung in Richtung a durch f (a) gegeben. Da auf
den Koordinatenachsen die Funktion verschwindet, sind die beiden partiellen
Ableitungen 0. Als einzige lineare Abbildung kommt damit die Nullabbildung
als Ableitung in Frage. Damit ist, will man die Differenzierbarkeit von f in
0 nachprüfen, zu untersuchen
1 x21 x2
x21 x2
=
lim
.
x→0 kxk3
x→0 kxk kxk2
lim
Wählen wir nun eine Folge von Vektoren {xm }m∈N mit xm =
alle m ∈ N und xm → 0 für m → ∞. Dann ergibt sich
xm
xm
für
1
x3
6= 0.
(f (xm , xm ) − f (0) − 0) = lim √ m
xm →0 2 2|x |3
kxm k
m
Damit ist f nicht differenzierbar. Eine Veranschaulichung der Funktion f
zeigt die Abbildung 8.3.
Einer der zentralen Sätze der Theorie besagt nun, dass im Fall stetig partiell
differenzierbarer Funktionen die oben genannte Strategie erfolgreich ist.
Satz 8.3.1.16 (Stetige Partielle Differenzierbarkeit und Differenzierbarkeit)
Ist U ⊂ Rn offen und f : U → R im Punkt eine Abbildung, so dass auf einer
Umgebung W von x0 alle partiellen Ableitungen von f existieren und f im
Punkt x0 stetig partiell differenzierbar ist, so ist f im Punkt x0 differenzierbar.
8.3. ABLEITUNGEN
49
Abbildung 8.3: Eine partiell differenzierbare, nicht differenzierbare Funktion
Beweis. Sei h ∈ Rn , so dass x0 + h ∈ V ist und γ(t) sei der Polygonzug, der
aus Parallelen zu den Koordinatenachsen aufgebaut ist, d. h.
" n
#
i−1
i
i−1
i−1
X
X
X
X
X
γ : 0,
|hi | → Rn : (
|hj |,
|hj |) 3 t 7→ x0 +
hj ej +sgn(hi )(t−
|hj |)ei .
i=1
j=1
j=1
j=1
j=1
Setze für j ≥ 1: xj = xj−1 + hj ej . Dies sind genau die Eckpunkte des Polygonzuges. Das Prinzip der vorgestellten Konstruktion wird vielleicht aus der Abbildung
8.4 deutlich. Dann ist
f (x0 + h) − f (x0 ) =
n
X
(f (xj ) − f (xj−1 )) .
j=1
Längs des Geradenstücks zwischen je zwei solchen Punkten betrachten wir für
i = 0, . . . , n − 1 die Funktion aus Definition 8.3.1.13
fxi ,ei+1 : R → R.
Es gilt f (xi ) = fxi ,ei+1 (0) und f (xi+1 ) = fxi ,ei+1 (hi+1 ). Dann ist (Mittelwertsatz)
für i = 0, . . . , n − 1
f (xi+1 ) − f (xi ) = fx0 i ,ei+1 (ξi )hi+1
= ∂ei+1 f (xi + ξi ei+1 )hi+1 .
50
KAPITEL 8. DIFFERENTIALRECHNUNG
e3
x 3 = x 0+h
h 3e 3
h
x2
h 2e 2
1
x0
h1e
x1
e2
e1
Abbildung 8.4: Der verbindende Polygonzug und die wesentlichen Punkte.
Nun schreiben wir
f (x0 + h) − f (x0 ) =
n−1
X
∂ei+1 f (xi + ξi ei+1 )hi+1 .
i=0
Dann ist
f (x0 +h)−f (x0 ) =
n−1
X
(∂ei+1 f (xi + ξi e
i+1
n−1
X
) − ∂ei+1 f (x0 ) hi+1 +
∂ei+1 f (x0 )hi+1 .
i=0
i=0
Wir bezeichnen mit
R(h) =
n−1
X
(∂ei+1 f (xi + ξi ei+1 ) − ∂ei+1 f (x0 ) hi+1 .
i=0
Nun gilt wegen der Stetigkeit der partiellen Ableitungen und der Tatsache, dass
hi
für h → 0 beschränkt ist, dass
khk2
lim
h→0
R(h)
= 0.
kh||2
8.3. ABLEITUNGEN
51
Satz 8.3.1.17 (Ableitung und Richtungsableitung)
Sei (V, k · kV ) ein Banachraum, U ⊂ V offen, f : U → R im Punkt x0 ∈ U
differenzierbar. Dann existiert für alle a ∈ V die Richtungsableitung ∂a f (x0 )
und es gilt
∂a f (x0 ) = Df (x0 )(a).
Beweis. Folgt sofort aus der Definition.
8.3.2
Hilberträume und Gradienten
Satz 8.3.2.1 (Parallelogrammgleichung)
Eine Norm k · kV auf einem Banachraum V wird genau dann von einem
Skalarprodukt induziert, wenn die Norm der sogenannten Parallelogrammgleichung
kx + yk2V + kx − yk2V = 2kxk2V + 2kyk2V
genügt.
Beweis. Gegeben sei ein Skalarprodukt mit zugehöriger Norm auf V . Dann ist
kx + yk2V + kx − yk2V
= hx + y, x + yiV + hx − y, x − yiV
= 2hx, xiV + 2hy, yiV
= 2kxk2V + 2kyk2V .
Für die Umkehrung setzen wir (in einem komplexen Banachraum)
hx, yiV =
1
4
kx + yk2V + kx − yk2V + i kx + iyk2V + kx − iyk2V .
Dann kann man alle Eigenschaften eines Skalarproduktes nachprüfen.
Satz 8.3.2.2 (Orthogonales Komplement)
Es sei (V, h·, ·iV ) ein Hilbertraum und U ⊂ V ein abgeschlossener, linearer
Unterraum von V , d. h. U ist ein linearer Unterraum und Ū = U . Dann gibt
es einen abgeschlossenen, linearen Unterraum W ⊂ V mit
U ⊕W =V
und für alle u ∈ U und alle w ∈ W gilt
hu, wiV = 0
oder auch in Kurzform W = U ⊥ .
52
KAPITEL 8. DIFFERENTIALRECHNUNG
Beweis. Sei U ein abgeschlossener Unterraum und
n
o
U ⊥ = x ∈ V hu, xiV = 0 für alle u ∈ U .
Dann ist
U⊥ =
o
\n
x ∈ V hu, xiV = 0 .
u∈U
n
o
Jede der Mengen x ∈ V hu, xiV = 0 ist abgeschlossen, der Schnitt also abgeschlossen. Jede dieser Mengen ist offenkundig ein Unterraum, daher gilt dies
auch für den Schnitt. Wir wollen noch zeigen, dass U ⊥ ein Komplementärraum
zu U ist. Offenkundig ist U ∩ U ⊥ = {0}, denn für ū ∈ U ∩ U ⊥ ist hū, ūiV = 0
und daher ū = 0. Wir müssen noch zeigen, dass U + U ⊥ = V ist.
Ist x0 ∈ V , betrachte
d = inf kx0 − ykV .
y∈U
Dazu gibt es ein y0 ∈ U mit
kx0 − y0 kV = d.
Um die Existenz zu zeigen, betrachten mir eine minimierende Folge
{yn } ⊂ U mit lim kx0 − yn kV = d.
n→∞
Diese Folge ist eine Cauchyfolge, denn betrachten wir die Parallelogrammgleichung mit
x = x0 − y n , y = x0 − ym
und erhalten
2
1
+ kym − yn k2V = 2 kx0 − yn k2V + kx0 − ym k2V .
4 x0 − (yn + ym )
2
V
Mit n, m → ∞ konvergiert die rechte Seite gegen 4d2 , also auch die linke Seite.
Da 12 (yn + ym ) ∈ U ist der erste Ausdruck größer oder gleich 4d2 und der zweite
Ausdruck konvergiert gegen 0. Also ist {yn }n∈N eine Cauchyfolge und der Grenzwert existiert wegen der Vollständigkeit von V . Gäbe es zwei Elemente y0 , y1 in
U mit minimalem Abstand zu x0 , so hätte die quadratische Abbildung
f : R → R : t 7→ kx0 − y0 + t(y1 − y0 )k2V
zwei Minima bei t = 0, t = 1 und wäre damit konstant, also y1 − y0 = 0.
Nun ist klar, dass x0 = y0 + (x0 − y0 ). Wir müssen also noch zeigen, dass
x0 − y0 ∈ U ⊥ liegt. Sei u ∈ U , dann ist
q(t) = hx0 − y0 + tu, x0 − y0 + tuiV ≥ 0,
8.3. ABLEITUNGEN
53
quadratisch in t und hat bei t = 0 ein einziges Minimum. Also ist q 0 (0) = 0, d. h.
0 = q 0 (0) = hx0 − y0 , uiV + hu, x0 − y0 iV .
Also ist Rehx0 − y0 , uiV = 0. Im reellen Fall sind wir damit fertig, im komplexen
Fall betrachte man noch
q(it) ∈ R
und auf gleiche Weise folgt
d
q(it)|t=0
dt
= 0 und Imhx0 − y0 , uiV = 0.
Definition 8.3.2.3 (Komplementärraum)
Der Raum W aus dem vorigen Satz wird als Komplementärraum (zu U )
bezeichnet.
Aufgabe 8.3.2.4 (Komplementärraum)
Zeigen Sie W ⊥ = U oder auch (U ⊥ )⊥ = U .
Lemma 8.3.2.5 (Riesz4 )
Es sei (V, h·, ·iV ) ein Hilbertraum. Zu einer stetigen linearen Abbildung ` :
V → R gibt es einen eindeutig bestimmten Vektor y ∈ V , so dass für alle
x ∈ V gilt:
`(x) = hy, xiV .
Beweis. Ist ` = 0, so ist nichts zu zeigen. Ist ` 6= 0, so ist U = ker ` ein
abgeschlossener linearer Unterraum. Die Tatsache, dass der Kern ein Unterraum
ist, folgt aus Sätzen der Linearen Algebra, die, dass der Kern abgeschlossen ist,
folgt, weil dieser das Urbild einer abgeschlossenen Menge unter einer stetigen
Abbildung ist (Satz 4.2.6). Dann ist V = U ⊕ U ⊥ . Da die Kodimension von U
gleich 1 ist, ist dim U ⊥ = 1. (Beachte: Aus der Linearen Algebra ist bekannt, dass
das Urbild isomorph zur direkten Summe aus Kern und Bild ist.) Daher gibt es
einen Vektor 0 6= ȳ ∈ U ⊥ , der diesen Raum erzeugt. Für diesen Vektor und für
alle z ∈ ker(`) gilt
hȳ, ziV = 0.
4
Frigyes Riesz (22.1.1880–28.2.1956) ungarischer Mathematiker und älterer Bruder von Marcel Riesz (einem ebenfalls bekannten Mathematiker). Er wurde in Budapest geboren, studierte
dort und auch in Zürich und Göttingen Mathematik. Im Jahr 1902 promovierte er in Budapest,
ging auf einen Lehrstuhl nach Kolozsvar, dies ist ein Ort, der damals in Ungarn und heute in
Rumänien liegt. Als Kolozsvar rumänisch wurde, wurde die Universität in das südungarische
Szeged verlegt, wo Riesz das bekannte Janos-Bolyai Institut gründete. Nach 1945 war er wieder
an der Universität Budapest. Er publizierte in ungarisch, deutsch und französisch und gilt als
einer der Begründer der Funktionalanalysis.
54
KAPITEL 8. DIFFERENTIALRECHNUNG
Da hȳ, ȳiV 6= 0 ist, ist die Gleichung
hcȳ, ȳi = `(ȳ)
lösbar. Setze
y = cȳ.
Jedes x ∈ V hat eine Darstellung x = u + w mit u ∈ ker(`), w = αȳ. Also
erhalten wir für x ∈ V
hy, xiV = hy, u + αȳiV = αhy, ȳiV = α`(ȳ) = `(u + αȳ) = `(x).
Definition 8.3.2.6 (Gradient)
Sei (V, h·, ·iV ) ein Hilbertraum. Ist U ⊂ V offen und f : U →
x0 ∈ U differenzierbar, so heißt der Vektor y ∈ V mit
R im Punkt
Df (x0 )(x) = hy, xiV
der Gradient von f im Punkt x0 . Wir schreiben dafür auch ∇f (x0 ).
Lemma 8.3.2.7 (Gradient, Darstellung)
Ist (V, k · kV ) = (Rn , k · k2 ), so gilt

∂f
 ∂x1 (x0 )

 ∂f

(x0 )

∇f (x0 ) =  ∂x2
..

.


 ∂f
(x0 )
∂xn






.




Beweis. Folgt sofort aus unserer Definition des Skalarproduktes.
Bemerkung 8.3.2.8 (Gradient und Ableitung)
Man beachte, dass es verschiedene Skalarprodukte gibt und die Darstellung
des Gradienten vom Skalarprodukt abhängt. Nur die Linearisierung ist durch
f und den Punkt festgelegt, die Ableitung in Koordinaten hängt von der Wahl
der Basis und der Gradient vom gewählten Skalarprodukt ab.
Obwohl die Ableitung die natürliche Konstruktion ist, wird oft in praktischen
Rechnungen der Gradient herangezogen. Wir formulieren die wichtigen Aussagen
in beiden Varianten. Der Gradient hat mehrere Anwendungen, die wir gleich
betrachten wollen. Wir erinnern an die Definition von Extrema (Definition 5.3.1)
aus der Analysis I.
8.3. ABLEITUNGEN
55
Satz 8.3.2.9 (Extremalstellen)
Es sei (V, k · kV ) ein Banachraum. Ist U ⊂ V offen und f : U → R differenzierbar, so verschwindet Df (x0 ) an jeder Extremalstelle x0 .
Beweis. Wir betrachten oBdA Maxima. Sei x0 ein lokales Maximum der Funktion f . Dann hat für jedes a ∈ V die Funktion
fx0 ,a : R → R
ein lokales Maximum im Punkt 0, daher verschwindet die Ableitung. Damit ist
für alle a ∈ V die Richtungsableitung ∂a f (x0 ) = 0 und damit ist die Ableitung
0.
Definition 8.3.2.10 (Niveaumenge)
Sei U ⊂ V offen, f : U → R differenzierbar und w ∈
Niveaumenge von f zum Niveau w als
R. Wir definieren die
Nf (w) = f −1 (w).
Bemerkung 8.3.2.11 (Niveaumengen)
Die Bestimmung und Charakterisierung von Niveaumengen ist eine wichtige
Aufgabe, die Untersuchung dieses Problems hat viele Entwicklungen in der
Mathematik angestoßen. Wir wollen zunächst zeigen, dass (im Hilbertraum)
der Gradient senkrecht auf der Niveaumenge steht. Da aber die Niveaumenge kein linearer Unterraum ist, wollen wir eine etwas andere Formulierung
wählen, um diesen Sachverhalt auszudrücken. Wir werden später sehen, wie
man diesen Sachverhalt sachgemäß formuliert.
Satz 8.3.2.12 (Niveaumengen und Tangentialvektoren)
Sei U ⊂ V offen, f : U → R differenzierbar, w ∈ R und Nf (w) die Niveaumenge. Ist γ : R → U eine differenzierbare Kurve mit γ(t) ∈ Nf (w) für alle
t ∈ (−ε, ε) für eine Zahl ε > 0. Sei γ 0 (0) = v der Tangentialvektor an γ im
Punkt 0, so gilt
Df (γ(0))(γ 0 (0)) = 0.
Ist (V, k · kV ) ein Hilbertraum, so gilt
h∇f (γ(0)), viV = 0.
Beweis. Wir betrachten die Funktion g : R →
differenzierbar und auf (−ε, ε) konstant. Also ist
R
: t 7→ f (γ(t)). Diese ist
0 = g 0 (0) = Df (γ(0))γ 0 (0) = h∇f (γ(0)), vi.
56
KAPITEL 8. DIFFERENTIALRECHNUNG
Die zuletzt genutzte Formel ist eine verallgemeinerte Kettenregel, die wir noch
begründen wollen.
Satz 8.3.2.13 (Kettenregel)
Es sei (V, k · kV ) ein Banachraum. Ist U ⊂ V offen, γ : I → U eine stetig
differenzierbare Kurve und f : U → R im Punkt x0 = γ(t0 ) differenzierbar,
so ist f ◦ γ im Punkt t0 differenzierbar und es gilt
(f ◦ γ)0 (t0 ) = Df (x0 )(γ 0 (t0 )).
Beweis. Aufgrund der Differenzierbarkeit von f, γ haben wir Darstellungen
f (x0 + h) = f (x0 ) + `(h) + R(h)
γ(t0 + h) = γ(t0 ) + hv + R̃(h).
|R̃(h)|
|R(h)|
→ 0 mit h → 0 und
→ 0 mit h → 0. Dann ist mit v = γ 0 (t0 )
|h|
khkV
und ` = Df (x0 )
mit
1
|f ◦ γ(t0 + h) − f ◦ γ(t0 ) − h`(v)| =
|h|
1 =
f (γ(t0 ) + hv + R̃(h)) − f (γ(t0 )) − `(hv)
|h|
1 =
f (γ(t0 )) + `(hv + R̃(h)) + R(hv + R̃(h)) − f (γ(t0 )) − `(hv)
|h|
1
1
≤
|`(R̃(h))| +
|R(hv + R̃(h))|
|h|
! |h|
R̃(h) R(hv + R̃(h)) khv + R̃(h)k
V
= `
.
+
|h| khv + R̃(h)kV
|h|
Da ` stetig ist folgt aus
kR(h)k2
→ 0 auch die Konvergenz
|h|
!
R̃(h) lim `
= 0.
h→0 |h| Der zweite Faktor im zweiten Term ist beschränkt, der erste konvergiert gegen 0,
damit konvergiert der Ausdruck
1
|f ◦ γ(t0 + h) − f ◦ γ(t0 ) − h`(v)|
|h|
mit h → 0 gegen 0 also ist `(v) die Ableitung von f ◦ γ in t0 .
8.4. MITTELWERTSATZ UND ANWENDUNGEN
8.4
57
Mittelwertsatz und Anwendungen
Aus der Analysis I erinnern wir uns an den Mittelwertsatz der Differentialrechnung Satz 5.3.7, der besagt, dass die Differenz zweier Funktionswerte eine Darstellung als Produkt aus der Differenz der Argumente und der Ableitung an einer
Zwischenstelle hat, also
f (b) − f (a) = f 0 (ξ)(b − a) mit ξ ∈ (a, b).
Die Verallgemeinerung dieses Satzes für höherdimensionale Räume sieht ähnlich
aus, ist aber im Detail etwas anders.
Satz 8.4.1 (Mittelwertsatz)
Es sei U ⊂ V offen und x, y ∈ U seien Punkte, so dass die Verbindungsstrecke, d. h. die Menge
o
n
S(x, y) = x + t(y − x) t ∈ [0, 1]
in U enthalten ist. Ferner sei f : U →
ein ξ ∈ S(x, y) mit
R differenzierbar. Dann gilt: Es gibt
f (y) − f (x) = Df (ξ)(y − x).
Beweis. Wir betrachten die Funktion
g(t) = f (x + t(y − x)).
Diese Funktion g : [0, 1] → R ist stetig, auf (0, 1) differenzierbar und
g(0) = f (x), g(1) = f (y).
Daher gibt es ein ζ ∈ (0, 1) mit
g 0 (ζ) = f (y) − f (x).
Die Ableitung errechnet sich zu
g 0 (ξ) = Df (x + ξ(y − x))(y − x).
Aus dem eben bewiesenen Satz folgt sofort die Abschätzung
n
o
|f (y) − f (x)| ≤ sup kDf (z)kV 0 z ∈ S(x, y) ky − xkV .
Daraus kann man nun sofort eine Schranke für f herleiten, falls U eine beschränkte, offene Menge ist und die Norm kDf (x)kV 0 auf U beschränkt ist.
58
KAPITEL 8. DIFFERENTIALRECHNUNG
Definition 8.4.2 (Gebiete)
Es sei (V, k · kV ) ein Banachraum.
1. Eine zusammenhängende, offene Teilmenge von V heißt Gebiet. Ein
Gebiet U heißt beschränkt, wenn es ein R > 0 gibt mit U ⊂ BR (0).
2. Ist U ⊂ V eine Menge, so dass für je zwei Punkte x, y ∈ U S(x, y) ⊂ U
gilt, so nennt man U konvex.
3. U ⊂ V heißt wegezusammenhängend, wenn es zu je zwei Punkten
x, y ∈ U eine Kurve γ : [a, b] → U gibt mit γ(a) = x, γ(b) = y.
Aufgabe 8.4.3 (Wegezusammenhängende Gebiete)
1. Konvexe Gebiete sind wegezusammenhängend.
2. Wegezusammenhängende Mengen sind zusammenhängend.
3. Die Umkehrung beider Aussagen gilt nicht.
Bemerkung 8.4.4 (Gebiete und Zusammenhang)
Es ist oft wesentlich leichter zu beweisen, dass eine Menge wegezusammenhängend ist, als dass sie zusammenhängend ist.
Satz 8.4.5 (Beschränktheit)
Ist U ⊂ V ein beschränktes, konvexes Gebiet und f : U → R stetig differenzierbar mit beschränkter Ableitung, so ist f auf U beschränkt, genauer gilt:
Ist R > 0 mit U ⊂ BR (0), kDf (x)kV ≤ M für alle x ∈ U , so ist für x0 ∈ U
|f (x)| ≤ |f (x0 )| + 2M R.
Beweis. Es gilt für ein geeignetes z ∈ S(x, x0 )
f (x) − f (x0 ) = Df (z)(x − x0 ).
Damit ist mit kx − x0 kV < 2R und kDf (z)kV < M
|f (x)| ≤ |f (x0 )| + M kx − x0 kV ≤ |f (x0 )| + 2M R.
8.5. HÖHERE ABLEITUNGEN
59
Satz 8.4.6 (Integration längs Kurven)
U ⊂ V sei wegezusammenhängend, ferner gebe es zu je zwei Punkten x, y ∈
U eine C 1 Kurve γ : [a, b] → U mit γ(a) = x, γ(b) = y. Dann ist
Zb
f (y) − f (x) =
Df (γ(t))(γ 0 (t)) dt.
a
Im Hilbertraum schreibt man auch
Zb
h∇f (γ(t)), γ 0 (t)i dt.
a
Definition 8.4.7 (Linienintegral)
Das Integral
Zb
Df (γ(t))γ 0 (t) dt
a
heißt das Linienintegral des Differentials von f längs der Kurve γ.
Beweis. Der Satz ist eine direkte Anwendung der Kettenregel.
8.5
Höhere Ableitungen, der Satz von Schwarz
und multilineare Abbildungen
Hat man eine Funktion f : U → R, deren Richtungsableitung für a ∈ V existiert,
dann ist
∂a f : U → R
wiederum eine reellwertige Funktion und man kann fragen, ob diese Funktion
Richtungsableitungen besitzt. Insbesondere können wir für x0 ∈ U und b ∈ V
nach der Existenz von
∂b (∂a f (x0 ))
fragen. Man kann diesen Prozess iterieren und auch für eine endliche Anzahl von
Vektoren a1 , a2 , . . . , ar die Existenz der iterierten Richtungsableitung
∂ar . . . ∂a1 f (x0 )
und eventuell deren Eigenschaften untersuchen.
Wir beginnen mit einer einfachen Aussage.
60
KAPITEL 8. DIFFERENTIALRECHNUNG
Satz 8.5.1 (Schwarz)
Es sei (V, k · kV ) ein Banachraum. U ⊂ V offen, f : U → R sei stetig. Es seien a, b ∈ V . Existieren für alle x ∈ U die Richtungsableitungen
∂a f (x), ∂b f (x), ∂a ∂b f (x), ∂b ∂a f (x) und sind die Abbildungen
x 7→ ∂a f (x), x 7→ ∂b f (x), x 7→ ∂b ∂a f (x), x 7→ ∂a ∂b f (x)
stetig, so gilt für alle x ∈ U die Gleichheit
∂b ∂a f (x) = ∂a ∂b f (x).
Bemerkung 8.5.2 (Partielle Ableitungen höherer Ordnung) 1. Im
Rn haben wir die den Standardeinheitsvektoren zugeordneten Richtungsableitungen als partielle Ableitungen bezeichnet. Insofern besagt
unser Satz in diesem Kontext, dass die Stetigkeit der ersten partiellen Ableitungen und die Existenz und Stetigkeit der zweiten partiellen
Ableitungen impliziert, dass die Reihenfolge keine Rolle spielt.
2. Im Rn kann man tatsächlich etwas mehr beweisen, nämlich: Aus der
2
Stetigkeit der partiellen Ableitungen ∂i f , ∂j f und ∂x∂ ∂fx im Punkt x0
i
j
2
0)
und die im Satz befolgt die Existenz der partiellen Ableitung ∂∂xf (x
j ∂x i
hauptete Gleichheit. Einen Beweis dieser Bemerkung findet man z. B.
bei Königsberger [12].
Beweis. Wir betrachten für festes a, b ∈ V, x0 ∈ U und festes h, k ∈
folgenden Ausdruck
R den
A(h, k) = f (x0 + ha + kb) − f (x0 + kb) − f (x0 + ha) + f (x0 ).
Mit
g(h, k) = f (x0 + ha + kb) − f (x0 + kb)
hat A die Gestalt
A(h, k) = g(h, k) − g(h, 0).
Für festes h ist g(h, ·) eine differenzierbare Funktion der Veränderlichen k und
daher gilt: Es gibt ein k̂(h) mit
A(h, k) = ∂k g(h, k̂(h))k.
Damit ist
A(h, k) = ∂b f (x0 + ha + k̂(h)b) − ∂b f (x0 + k̂(h)b) k.
8.5. HÖHERE ABLEITUNGEN
61
Betrachten wir nun die rechte Seite für fixiertes k̂(h) als Funktion von h in der
ersten Komponente, so gibt es ein ĥ mit
A(h, k) = ∂a ∂b f (x0 + ĥa + k̂(h)b)kh.
Natürlich erhält man auf gleiche Weise (indem man einfach a und b und entsprechend h und k vertauscht
A(h, k) = ∂b ∂a f (x0 + ĥ(k)a + k̂b)kh.
Also ist
∂a ∂b f (x0 + ĥa + k̂(h)b) = ∂b ∂a f (x0 + ĥa + k̂(h)b).
Mit den Grenzwerten h → 0, k → 0 folgt das Resultat.
Korollar 8.5.3 (Höhere partielle Ableitungen und Permutationen)
Ist eine Funktion f : Rn → R k-mal stetig partiell differenzierbar, dann gilt
für jede Permutation π ∈ S(n)
∂eik . . . ∂ei1 f (x0 ) = ∂eiπ(k) . . . ∂eiπ(1) f (x0 ).
Beweis. Folgt sofort aus dem Satz von Schwarz.
Höheren Ableitungen kann man multilineare Abbildungen zuordnen, wir wollen
dies am Beispiel zweiter Ableitungen beschreiben, da diese eine besondere Rolle
spielen werden, auf den allgemeinen Fall kommen wir noch zurück.
Definition 8.5.4 (Bilineare Abbildung)
Eine Abbildung B : V ×V → K mit D(B) = V ×V und B(x, y) ist für jeweils
festes x bzw. festes y linear in der anderen Komponente, heißt bilinear. Entsprechend heißt eine Abbildung m : V
· · × V} → R k-linear, wenn m in
| × ·{z
k−mal
jeder Komponente bei festgehaltenen anderen Einträgen linear ist. Eine Abbildung heißt multilinear, falls sie k-linear für ein k ∈ N ist. Mit Mk (V ; K)
bezeichnen wir die Menge der k-linearen stetigen Abbildungen, also
n
o
Mk (V ; R) = m : V × · · · × V → K m ist k-linear und stetig .
Wir wollen zweiten Ableitungen eine bilineare stetige Abbildung zuordnen, da
aber df : V → V 0 ist, ist an dieser Stelle noch nicht klar, was eine zweite Ableitung sein könnte. Dies wird später im Detail untersucht werden, hier wollen
wir eine spezielle Situation betrachten. Wir beginnen mit einem Banachraum
62
KAPITEL 8. DIFFERENTIALRECHNUNG
(V, k · kV ) einer offenen Teilmenge U ⊂ V .
Wir betrachten für v ∈ V die Richtungsableitung als Abbildung
V → R : x 7→ ∂v f (x).
Wir fassen dies als reellwertige Funktion auf V auf. Wir setzen voraus, dass diese
Funktion differenzierbar ist. Dann können wir für x0 ∈ U und u ∈ V wieder die
Richtungsableitung
∂u ∂v f (x0 )
bilden. Sind f und ∂v f in x0 differenzierbar, so ist die Abbildung
(u, v) 7→ ∂u ∂v f (x0 )
bilinear. Wir wollen nun im endlichdimensionalen Fall, (V, k · kV ) = (Rn , k ·
k2 ), eine Darstellung dieser bilinearen Abbildung bezüglich der Standardbasis
angeben. Es ergibt sich
n
X
∂v f (x) =
∂ei f (x)vi .
i=1
Davon die Richtungsableitung in Richtung u ergibt sich zu
∂u ∂v f (x) =
n
X
∂u ∂ei f (x)vi .
i=1
Dies ergibt
∂u ∂v f (x) =
n X
n
X
(uj ∂ej ∂ei f (x)) vi .
i=1 j=1
Da
∂ej ∂ei f (x) = ∂ei ∂ej f (x)
ist, kann man dies schreiben als
n X
n
X
∂ei ∂ej f (x)uj vi
i=1 j=1
oder auch als
hu, Avi
mit




A=


∂ 2 f (x0 )
...
∂x21
..
.
∂ 2 f (x0 )
...
∂xn ∂x1
∂ 2 f (x0 )
∂x1 ∂xn
..
.
∂ 2 f (x0 )
.
∂x2n







8.6. TAYLORPOLYNOME UND TAYLORREIHEN
63
Definition 8.5.5 (Hesse-Matrix)
Die Matrix A heißt Hesse-Matrix5 von f , wir schreiben dafür auch Hess(f )(x0 ).
Die Hesse-Matrix ist nach dem Satz von Schwarz, wenn alle partiellen und alle
zweiten partiellen Ableitungen stetig sind, symmetrisch. Im allgemeinen Banachraum gibt es natürlich unter den entsprechenden Voraussetzungen eine stetige
bilineare Abbildung, die die Rolle der Hesse-Matrix übernimmt, auch darauf werden wir nochmals zurückkommen.
8.6
Taylorpolynome und Taylorreihen
Für differenzierbare Funktionen R → R hatten wir eine Approximation durch Polynome untersucht und sind dabei auf das Taylorpolynom bzw. auf die Taylorreihe
gestoßen. Eine ähnliche Konstruktion gibt es auch für Funktionen f : V → R.
Wir sprechen zunächst über Polynome in mehreren Veränderlichen, dann über
das Taylorpolynom einer hinreichend oft differenzierbaren Funktion. Wir beginnen mit der Definition eines Polynoms.
Definition 8.6.1 (Polynom)
1. Eine Funktion f :
der Form
Kn
f (x) =
→
K heißt Polynom, falls f
k1 X
k2
X
···
i1 =0 i2 =0
kn
X
eine Darstellung
ai1 i2 ...in xi11 xi22 · · · xinn
in =0
hat. Der Grad des Polynoms ist gegeben durch
n
o
grad(f ) = max i1 + i2 + · · · + in ai1 i2 ...in 6= 0 .
2. Sei (V, k · kV ) ein
K-Banachraum. Eine Abbildung
v 7→
r
X
mk (v, v, ·, v),
k=0
wobei r ∈ N und mk ∈ MK (V ; K) ist, nennen wir ein Polynom.
5
Ludwig Otto Hesse (22.4.1811–4.8.1874) stammt aus Königsberg, dem heutigen Kaliningrad, und war Professor in Halle, Heidelberg und München. Seine wichtigsten mathematischen
Arbeiten betreffen Algebra, Analysis und analytische Geometrie.
64
KAPITEL 8. DIFFERENTIALRECHNUNG
Beispiel 8.6.2 (Polynom dritten Grades auf R2 )
Ein Polynom dritten Grades R2 → R hat die allgemeine Gestalt für x =
(x1 , x2 )T
f (x) = a30 x31 +a21 x21 x2 +a12 x1 x22 +a03 x32 +a20 x21 +a11 x1 x2 +a02 x22 +a10 x1 +a01 x2 +a0 .
Aufgabe 8.6.3 (Gleichwertigkeit der beiden Definitionen)
Zeigen Sie, dass die beiden Begriffe für Abbildungen Kn → K zusammenfallen.
Wir wollen nun für Polynome auf Kn eine etwas einfachere Notation einführen,
die jedoch auch etwas weniger anschaulich ist.
Definition 8.6.4 (Multiindex)
Ein Element α ∈ Zn mit αi ≥ Q
0 für alle i heißt Multiindex. Für einen
Multiindex α definieren wir α! = ni=1 αi ! und für x ∈ Kn setzen wir
α
x =
n
Y
xαi i .
i=1
Wir definieren die Länge eines Multiindex α durch
|α| =
n
X
αi .
i=1
Damit nimmt die allgemeine Gestalt eines Polynomes vom Grad k auf V =
die Form
X
P (x) =
aα x α
Kn
|α|≤k
an.
Definition 8.6.5 (α-te partielle Ableitung)
Ist α ein Multiindex, so setzen wir
dα f (x0 ) =
∂xα1 1
∂ |α|
f (x0 ).
. . . ∂xαnn
Definition 8.6.6 (Räume k-fach stetig differenzierbarer Funktionen)
Sei U ⊂ Rn ein Gebiet. Wir definieren
n
o
k
C (U ; R) = f ∈ C(U ; R) f ist k-mal stetig partiell differenzierbar .
8.6. TAYLORPOLYNOME UND TAYLORREIHEN
65
Satz 8.6.7 (Vorbereitung Taylor)
Es sei U ⊂ Rn offen, f ∈ C k (U ; R) und x0 ∈ U , ξ ∈ Rn mit S(x0 , x0 + ξ) ∈
U . Wir setzen für t ∈ [0, 1]
g(t) = f (x0 + tξ).
Dann ist g : [0, 1] → R stetig und auf (0, 1) k-mal stetig differenzierbar und
es gilt für j = 1, . . . , k
g (j) (t) =
X j!
dα f (x0 + tξ)ξ α .
α!
|α|=j
Beweis. Wir beweisen durch Induktion über j. Im Fall j = 1 erhalten wir genau
die Richtungableitung in Richtung ξ.
n
X
X
d
g (t) = fx0 ,ξ (t) = Df (x0 + tξ)ξ =
∂ei f (x0 + tξ)ξi =
dα f (x0 + tξ)ξ α .
dt
i=1
0
|α|=1
Damit ist der erste Schritt getan.
Der Induktionsschritt beruht auf der Einsicht, dass
d (j)
g (t)
dt 

d  X j! α
=
d f (x0 + tξ)ξ α 
dt
α!
|α|=j


n
X
X j!
=
∂ei 
dα f (x0 + tξ)ξ α  ξi
α!
i=1
|α|=j
X
=
τβ dβ f (x0 + tξ)ξ β ,
g (j+1) (t) =
|β|=j+1
wobei wir noch τβ bestimmen müssen. Nun, ein Koeffizient von dα f (x0 + ξ)ξ α
trägt zu τβ bei, wenn α und β bis auf eine Komponente übereinstimmen. Die
Summe aller dieser Koeffizienten liefert genau τβ . Wir setzen β 0 = (β1 − 1, β2 −
66
KAPITEL 8. DIFFERENTIALRECHNUNG
1, . . . , βn − 1).
τβ =
n
X
Q
r=1
=
=
n
X
r=1
n
X
r=1
=
j!
!
i6=r βi !(βr − 1)
n
X
(β 0 )!
i6=r
βi
j!βr
β!
βr
r=1
= |β|
j!
Q
j!
β!
j!
β!
j!
β!
(j + 1)!
=
.
β!
= (j + 1)
Damit können wir nun aus der Taylorformel im Falle n = 1 direkt eine Taylorformel für f : U → R, U ⊂ Rn herleiten.
Satz 8.6.8 (Restglied)
Sei U ⊂ Rn offen, f ∈ C m+1 (U ; R) und x0 ∈ U , ξ ∈ Rn , so dass S(x0 , x0 +
ξ) ⊂ U . Dann ist gibt es ein θ ∈ (0, 1), so dass gilt
f (x0 + ξ) = f (x0 ) +
m X
X
X
1 ∂ |α|
α
f
(x
)ξ
+
0
α! ∂xα
j=1
|α|=j
Beweis. Wir setzen
|α|=m+1
∂ |α|
f (x0 + θξ)ξ α .
∂xα
g : [0, 1] → R : t 7→ fx,ξ (t).
g : [0, 1] → R ist (m + 1)-mal stetig differenzierbar, daher gilt die Taylorformel
aus Satz 7.2.1. Dies gibt uns für ein θ ∈ (0, 1) eine Darstellung von g(1) in der
Form
m
X
1 (j)
1
g(1) = g(0) +
g (0)1j +
g (m+1) (θ)1m+1 .
j!
(m + 1)!
j=1
Einsetzen der Darstellungen aus Satz 8.6.7 ergibt den folgenden Ausdruck
m
X
X
1 ∂ |α|
α
f (x0 + ξ) = f (x0 ) +
f
(x
)ξ
+
0
α! ∂xα
j=1
|α|=m+1
Dies ist der gewünschte Ausdruck.
1 ∂ |α|
f (x0 + θξ)ξ α .
α! ∂xα
8.6. TAYLORPOLYNOME UND TAYLORREIHEN
67
Definition 8.6.9 (Taylorpolynom)
Das Polynom
m X
X
1 ∂ |α|
f (x0 ) +
f (x0 )ξ α
α
α!
∂x
j=1
|α|=j
heißt Taylorpolynom von f vom Grad höchstens m im Punkt x0 .
Korollar 8.6.10 (Charakterisierung Taylorpolynom)
Sei U ⊂ Rn offen und x0 ∈ U , δ > 0, so dass
Bδ (x0 ) ⊂ U.
Für f ∈ C m+1 (U ; R) und dem Taylorpolynom Pf,x0 ,m+1 (ξ) von f vom Grad
höchstens m + 1 im Entwicklungspunkt x0 und kξk2 < δ gilt dann
f (x0 + ξ) = Pf,x0 ,m+1 (ξ) + o(kξkm+1
) für ξ → 0.
2
Beweis. Wir wissen
f (x0 + ξ) = Pf,x0 ,m+1 (ξ) −
X
|α|=m+1
X
1 ∂ |α|
α
f
(x
)ξ
+
0
α! ∂xα
|α|=m+1
1 ∂ |α|
f (x0 + θξ)ξ α
α! ∂xα
= Pf,x0 ,m+1 (ξ) + R(ξ),
wobei aufgrund der Stetigkeit der m + 1-ten Ableitungen gilt
|α|
∂ |α|
∂
lim
f (x0 + θξ) − α f (x0 ) = 0.
∂x
ξ →0 ∂xα
Da
|α|
|ξ α | ≤ kξk2
gilt für |α| = m + 1
|ξ α |
kξkm+1
2
≤
= 1,
kξk2m+1
kξkm+1
2
und damit ist
R(ξ)
lim
m+1 = 0.
ξ →0 kξk2
Dies war zu zeigen.
Bemerkung 8.6.11 (Bestapproximierende)
Das Taylorpolynom für Funktionen auf R stellt unter allen Polynomen gleichen Grades jenes dar, welches die Funktion f nahe dem Entwicklungspunkt
am besten approximiert. Wir erinnern: Das Differential ist unter den linearen
Abbildungen, das Taylorpolynom zweiten Grades unter allen quadratischen
68
KAPITEL 8. DIFFERENTIALRECHNUNG
Abbildungen und das Taylorpolynom m-ten Grades eben unter allen Polynomen m-ten Grades die beste Approximation. Diese Überlegung überträgt
sich auf Funktionen und approximierende Polynome m-ten Grades auf dem
Rn .
Ist eine Funktion unendlich oft differenzierbar, so kann man für jeden Grad ein
Taylorpolynom angeben. Insgesamt hat man die folgende Definition.
Definition 8.6.12 (Taylorreihe)
Seien U ⊂ Rn offen, f : U → R beliebig oft stetig partiell differenzierbar
(d. h. f ∈ C m (U ; R) für alle m ∈ N). Die Taylorreihe von f im Punkt x0 ist
∞ X
X
1 ∂ |α|
T(f,x0 ) (ξ) =
f (x0 )ξ α .
α
α!
∂x
k=0
|α|=k
Wir wollen die oben angegebene Abschätzung nutzen um hinreichende Bedingungen für lokale Extrema anzugeben. Wir wissen, dass das Verschwinden der
Ableitung notwendig ist. Das Taylorpolynom zweiten Grades hat die Form:
Pf,x0 ,2 (ξ) = f (x0 ) + ∂e1 f (x0 )ξ1 + · · · + ∂en f (x0 )ξn
1 ∂2
1 ∂2
2
f (x0 )ξ1 + · · · +
f (x0 )ξn2
+
2
2
2 ∂x1
2 ∂xn
∂2
∂2
∂2
+
f (x0 )ξ1 ξ2 +
f (x0 )ξ1 ξ3 + · · · +
f (x0 )ξn−1 ξn
∂x1 ∂x2
∂x1 ∂x3
∂xn−1 ∂xn
1
= f (x0 ) + h∇f (x0 ), ξi + hξ, Hess(f )(x0 )ξi2 .
2
Definition 8.6.13 (Positiv definit)
Eine symmetrische Matrix heißt
1. positiv (negativ) definit, wenn für alle x ∈ Rn , x 6= 0 gilt
hx, Axi > 0 (hx, Axi < 0).
2. positiv (negativ) semidefinit , wenn für alle x ∈ Rn , x 6= 0 gilt
hx, Axi ≥ 0 (hx, Axi ≤ 0).
3. indefinit, falls es x, y ∈ Rn gibt mit
hx, Axi < 0 < hy, Ayi.
Unter Verwendung der Hesse-Matrix gelingt es uns Extremalstellen zu charakterisieren.
8.6. TAYLORPOLYNOME UND TAYLORREIHEN
69
Satz 8.6.14 (Hinreichende Bedingung)
Sei U ⊂ Rn offen, f : U → R zweimal stetig partiell differenzierbar, sei
x0 ∈ U mit ∇f (x0 ) = 0. Dann gilt:
1. Ist Hess(f )(x0 ) positiv (negativ) definit, so liegt ein lokales Minimum
(Maximum) vor.
2. Ist Hess(f )(x0 ) indefinit, so ist Hess(f )(x0 ) keine lokale Extremwertstelle.
3. Ist x0 lokale Extremwertstelle, so ist Hess(f )(x0 ) im Falle eines Minimums positiv semidefinit, im Falle eines Maximums negativ semidefinit.
Beweis. Aus dem Korollar 8.6.10 ergibt sich eine Darstellung der Funktion f
mittels des quadratischen Taylorpolynoms in Form von
1
f (x0 + h) = f (x0 ) + h∇f (x0 ), hi + hh, Hess(f )(x0 )hi + R2 (h) ,
2
wobei
R2 (h)
=0
h→0 khk2
2
lim
ist. Daher finden wir zu ε > 0 ein δ > 0, so dass khk2 ≤ δ impliziert
|R2 (h)| < εkhk22 .
(8.4)
Wir beweisen nun die einzelnen Aussagen, dabei ist der Beweis des zweiten Falles
in der ersten Aussage identisch mit dem des ersten Falles und wir beschränken
uns auf diesen.
(1) Wir setzen A = Hess(f )(x0 ) und betrachten die Funktion
ψ : Rn → R : h 7→ hh, Ahi.
Da A positiv definit ist, hat ψ ein Minimumm bei h = 0 mit dem Wert 0. Wir
wollen untersuchen wie schnell ψ(h) gegen Null konvergiert. Aus Beispiel 8.3.1.11,
zweiter Teil, wissen wir, dass ψ differenzierbar ist, als solches ist ψ stetig (Satz
8.3.1.12). Die Menge
o
n
S n−1 = x ∈ Rn kxk2 = 1
ist abgeschlossen (da das Komplement offenkundig offen ist) und beschränkt
(nach Definition), also kompakt. Damit ist ψ(S n−1 ) nach Satz 4.3.5 kompakt
in R. Da 0 ∈
/ ψ(S n−1 ) ist, gibt es ein h0 ∈ S n−1 mit
0 < ψ(h0 ) ≤ ψ(h) für alle h ∈ S n−1 .
70
KAPITEL 8. DIFFERENTIALRECHNUNG
(Setze µ = inf ψ(S n−1 ), da ψ(S n−1 ) kompakt ist, ist µ ∈ ψ(S n−1 ) und damit gibt
es ein h0 mit ψ(h0 ) = µ.) Dann ist für 0 6= khk2 < δ
2
1
1
h =
ψ(h)
0<µ≤ψ
khk2
khk2
also
µkhk22 ≤ ψ(h).
Ist ε < µ so folgt für 0 6= khk2 < δ
f (x0 + h) =
≥
=
>
f (x0 ) + ψ(h) + R2 (h)
f (x0 ) + µkhk22 − εkhk22
f (x0 ) + (µ − ε)khk22
f (x0 ).
Damit hat f bei x0 ein isoliertes lokales Minimum.
(2) Ist A indefinit, so gibt es h1 , h2 ∈ S n−1 mit
ψ(h1 ) < 0 < ψ(h2 ).
Wir betrachten nun die Funktion
fx0 ,h1 (t)
bzw.
fx0 ,h2 (t)
für t nahe 0. Sei ε < min{|ψ(h1 )|, ψ(h2 )} und δ > 0 das in Gleichung (8.4)
definierte δ = δ(ε). Dann ist für |t| < δ, und h ∈ S n−1
fx0 ,h (t) = f (x0 ) + t2 ψ(h) + R(th)
und damit
f (x0 ) + t2 ψ(h) − εt2 < fx0 ,h (t) < f (x0 ) + t2 ψ(h) + εt2 .
Damit ist für t 6= 0 und h = h1 die Funktion fx0 ,h1 (t) < 0 und für h = h2 die
Funktion fx0 ,h2 (t) > 0. Also hat f im Punkt x0 kein lokales Extremum.
(3) Folgt sofort aus (2).
8.7
Differenzierbare Abbildungen
Wir beginnen nun Abbildungen von Rn → Rm oder allgemeiner von V → W ,
wobei V, W Banachräume sind, zu betrachten. Im Fall eines endlich dimensionalen
8.7. DIFFERENZIERBARE ABBILDUNGEN
71
Bildraumes wird die Abbildung als Vektor von Abbildungen angesehen, d. h. sei
U ⊂ V offen


f1 (x)
 f2 (x) 


f : U → Rm : x 7→ 
,
..


.
fm (x)
wobei für i = 1, . . . , m die Funktion fi : U → R abbildet. Wir führen den Begriff
der Differenzierbarkeit sofort im allgemeinen Kontext ein.
Definition 8.7.1 (Differenzierbarkeit)
Es seien (V, k·kV ), (W, k·kW ) Banachräume, ferner sei U ⊂ V offen, f : U →
W eine Abbildung. Die Abbildung f heißt im Punkt x0 ∈ U differenzierbar,
wenn es eine stetige lineare Abbildung L : V → W gibt, so dass
1
(f (x0 + h) − f (x0 ) − L(h)) = 0.
khkV →0 khkV
lim
L wird als Differential Df (x0 ) von f im Punkt x0 bezeichnet.
Wiederum hat man die Eindeutigkeit von L.
Satz 8.7.2 (Eindeutigkeit der Ableitung)
Gibt es eine lineare Abbildung wie in der Definition 8.7.1 angegeben, so ist
diese eindeutig.
Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz
8.3.1.6.
Satz 8.7.3 (Charakterisierung der Differenzierbarkeit)
Sei U ⊂ V offen, f : U → Rm ist im Punkt x0 genau dann differenzierbar, wenn jede Funktion fi : U → R im Punkt x0 differenzierbar ist. Das
Differential erhält man als Vektor der Differentiale `i der Funktionen fi .
Beweis. Angenommen f ist im Punkt x0 differenzierbar, so ist
1
(f (x0 + h) − f (x) − L(h)) = 0.
khkV →0 khkV
lim
Dann gilt aber für jede Komponente fi , i = 1, . . . , m
1
(fi (x0 + h) − fi (x0 ) − (Lh)i ) = 0.
khkV →0 khkV
lim
Setzen wir `i (h) = (Lh)i , so zeigt diese Gleichung, dass `i das Differential von fi
ist.
72
KAPITEL 8. DIFFERENTIALRECHNUNG
Andererseits,
 hat
 man Differentiale `i von fi im Punkt x0 , so hat man auch,
`1
 .. 
dass L =  .  die obige Gleichung erfüllt und sich als Differential von von f
`m
ergibt.
Satz 8.7.4 (Stetigkeit differenzierbarer Abbildungen)
Ist die Abbildung f : U → V im Punkt x0 differenzierbar, so ist sie im Punkt
x0 stetig.
Beweis. Der Beweis ist eine wörtliche Wiederholung des Beweises von Satz
8.3.1.12.
Definition 8.7.5 (Jacobimatrix)
Wählt man eine Basis in den Räumen Rn , Rm aus, so wird dadurch dem
Differential eine Matrix zugeordnet. Bestehen diese Basen jeweils aus den
Standardeinheitsvektoren, so ist zugehörige Matrix gegeben durch die ersten
partiellen Ableitungen der Komponentenfunktionen


∂e1 f1 (x0 ) . . . ∂en f1 (x0 )


..
..
..


.
.
.
∂e1 fm (x0 ) . . .
∂en fm (x0 )
und wird als Jacobimatrix6 bezeichnet. Wir schreiben dafür f 0 (x0 ).
Wir schauen nun nochmals auf ein weiteres Konzept aus der Linearen Algebra,
den Begriff der Norm einer linearen Abbildung (oder auch einer Matrix). Dies
nimmt das Beispiel 8.1.16 (5) wieder auf und verallgemeinert das Konzept der
Norm im Dualraum V 0 , das wir inzwischen häufig benutzt haben.
Definition 8.7.6 (Norm für lineare Abbildungen)
Es seien (V, k · kV ), (W, k · kW ) Banachräume. Die Menge
n
o
L : V → W L ist stetig und linear
6
Carl Gustav Jacob Jacobi(10.12.1804–18.2.1851) war ein sehr erfolgreicher deutscher Mathematiker, der als erster jüdischer Mathematiker eine Professorenstelle an einer deutschen
Universität erhielt. In seiner Kindheit wurde er von einem Onkel unterrichtet, danach besuchte
er das Gymnasium in Potsdam, wurde sehr schnell in die letzte Klasse versetzt, bis er auch formal die Universität besuchen konnte. Er studierte in Berlin Mathematik, wurde 1827 Professor
in Königsberg, dem heutigen Kaliningrad, und entwickelte wichtige Beiträge zur Analysis, zur
Zahlentheorie und zu sogenannten elliptischen Funktionen.
8.7. DIFFERENZIERBARE ABBILDUNGEN
73
werde mit L(V ; W ) bezeichnet. Wir definieren für L ∈ L(V ; W ) die Norm
n
o
kLkL(V ;W ) = sup kLxkW kxkV ≤ 1 .
Wir nennen L auch Operator und k · kL(V ;W ) Operatornorm.
Aufgabe 8.7.7 (Norm für stetigen linearen Abbildungen)
k · kL(V ;W ) ist eine Norm auf dem Raum aller stetigen linearen Abbildungen
V → W , damit gilt
kLvkW ≤ kLkL(V ;W ) kvkV .
Satz 8.7.8 (Banachraum von Operatoren)
(L(V ; W ), k · kL(V ;W ) ) ist ein Banachraum.
Beweis. Wir folgen dem Beweis, dass (V 0 , k · kV 0 ) ein Banachraum ist. Offensichtlich ist L(V ; W ) ein linearer Raum. Die Vollständigkeit wird wie im Fall der
Vollständigkeit von V 0 gezeigt.
Damit können wir die Ableitung Df einer Abbildung f : U → W mit U ⊂ V
offen, (V, k · kV ), (W, k · kW ) Banachräume als Abbildung
Df : U → L(V ; W )
auffassen.
Definition 8.7.9 (Stetig differenzierbar, höhere Ableitungen)
Sind (V, k · kV ), (W, k · kW ) Banachräume, U ⊂ V offen und f : V → W
sei differenzierbar. Ist Df : U → L(V ; W ) stetig, so nennen wir f stetig
differenzierbar. Ist Df : U → L(V ; W ) differenzierbar, so sprechen wir von
einer zweimal differenzierbaren Abbildung. Die zweite Ableitung D2 f (x0 ) ist
nun ein Element in L(V ; L(V ; W )), D2 f : U → L(V ; L(V ; W )). Dies kann
nun iteriert werden und wir können von k-fach differenzierbaren Abbildungen
sprechen, beachte Dk f : U → L(U ; Lk−1 (V ; W )), wobei wir iterativ definieren
L1 (V ; W ) = L(V ; W ), für k ≥ 2 : Lk (V ; W ) = L(V ; Lk−1 (V ; W )).
Es wird eine wichtige Aufgabe sein, die Räume Lk (V ; W ) richtig zu interpretieren.
Wir haben folgende wichtige Rechenregeln.
74
KAPITEL 8. DIFFERENTIALRECHNUNG
Satz 8.7.10 (Kettenregel)
Es seien (V, k · kV ), (W, k · kW ), (Z, k · kZ ) Banachräume, U ⊂ V , Y ⊂ W
seien offene Teilmengen, f : U → V sei im Punkt x0 ∈ U differenzierbar,
f (x0 ) = y0 ∈ Y und g : Y → Z sei in y0 differenzierbar. Dann gibt es
ein δ > 0, so dass g ◦ f auf Bδ (x0 ) definiert ist und g ◦ f ist im Punkt x0
differenzierbar und es gilt für h ∈ V
D(g ◦ f )(x0 )h = Dg(y0 )Df (x0 )h.
Beweis. Der Beweis folgt dem von Satz 8.3.2.13 praktisch wörtlich.
Satz 8.7.11 (Allgemeiner Mittelwertsatz)
Es seien (V, k · kV ), (W, k · k) Banachräume und U ⊂ Rn offen, f : U → W
stetig differenzierbar, es seien x, y ∈ U , so dass S(x, y) ⊂ U . Dann gilt mit
n
o
M = sup kDf (x + t(y − x))kL(V ;W ) t ∈ [0, 1]
kf (y) − f (x)kW ≤ M kx − ykV .
Beweis von Satz 8.7.11. Wir betrachten für ξ = y − x die Hilfsfunktion
G(t) = f (x0 + tξ) : [0, 1] → W.
G : R → W ist differenzierbar, die Ableitung ist (Begründung wie zuvor)
G0 (t)h = Df (x0 + tξ)hξ.
Nun ist nach Lemma 8.2.3.6 für ein τ ∈ (0, 1)
n
o
kG(1) − G(0)kW ≤ sup kG0 (τ )kW τ ∈ [0, 1] ,
wegen der Kompaktheit von [0, 1] und der Stetigkeit von kG0 kW gibt es ein τ0 ∈
[0, 1] mit
kG(1) − G(0)kW ≤ kG0 (τ0 )kW .
Also haben wir
kf (x0 + ξ) − f (x0 )kW ≤ kDf (x + τ ξ)kL(V ;W ) kξkV .
Daraus folgt die Aussage.
8.8. MULTILINEARE ABBILDUNGEN
75
Korollar 8.7.12 (Konstante Abbildung)
Sind (V, k · kV ) und (W, k · kW ) Banachräume, U ⊂ V offen und zusammenhängend, ferner sei f : U → W differenzierbar, Df (v) = 0 für alle
v ∈ U , dann ist f konstant auf U .
8.8
Multilineare Abbildungen
In diesem Abschnitt wollen wir die iterierten linearen Abbildungen, d. h. die Elemente in Lk (V ; W ) mit multilinearen Abbildungen identifizieren.
Definition 8.8.1 (Multilineare Abbildungen)
Es seien (Vj , k · kVj ), (W, k · kW ), j = 1, . . . , k Banachräume, wir setzen
V = V1 × · · · × Vk .
Man beachte, dass V auf natürliche Weise zum Banachraum wird. Eine Abbildung
M:V →W
heißt k-linear von V nach W , wenn M in jeder Komponente linear ist. Eine
Abbildung heißt multilinear, wenn es ein k ∈ N gibt, so dass die Abbildung
k-linear ist. M k (V ; W ) bezeichnen wir die Menge der stetigen, k-linearen
Abbildungen.
Satz 8.8.2 (Stetigkeit)
Eine k-lineare Abbildung
Mk : V k → W
ist genau dann stetig, wenn es eine positive reelle Konstante K gibt mit
kMk (v1 , . . . , vk )kW ≤ Kkv1 kV · · · · · kvk kV .
Beweis. Wir wissen aus den Übungen, dass für lineare Abbildungen Stetigkeit
bei 0 und Stetigkeit äquivalent sind. Diese Aussage überträgt sich sofort auf multilineare Abbildungen. Aus der angegebenen Bedingung folgt aber die Stetigkeit
in 0 sofort.
Aus der Stetigkeit in 0 folgt auch die Existenz dieser Konstanten. Wir werden
dies in den Übungen nochmals nachprüfen.
Nun sei (V, k · kV ) ein Banachraum. Der zentrale Satz dieses Abschnitts identifiziert die Elemente aus Lk (V ; W ) mit k-linearen Abbildungen. Dazu noch eine
Vorüberlegung:
E : V × L(V ; W ) : (v, L) 7→ Lv
76
KAPITEL 8. DIFFERENTIALRECHNUNG
ist linear in jeder Komponente und stetig, denn wir haben gesehen, dass
kEvkW ≤ kLkL(V ;W ) kvkV .
Ist nun A : V → L(V ; W ) stetig und linear, v ∈ V , so ist A(v) ∈ L(V ; W ) und
wir können die stetige und lineare Abbildung
ṽ 7→ A(v)(ṽ)
betrachten. Damit haben wir eine Abbildung
B(v, ṽ) = A(v)(ṽ).
Nun ist B bilinear und wegen
k B(v, ṽ)kW = k A(v)(ṽ)kW ≤ k A(v)kL(V ;W ) kṽkV ≤ k A kL(V ;L(V ;W )) kvkV kṽkV
stetig, also haben wir eine Abbildung
L2 (V ; W ) → M 2 (V ; W ).
Da für festes v ∈ V und eine gegebene bilineare Abbildung M2 ∈ M 2 (V ; W ) gilt
L(V ; W ) 3 M2 (v, ·) : V → W
und damit v 7→ M2 (v, ·) eine Abbildung in L(V ; L(V ; W )) ist, die durch obige Konstruktion auf M2 abgebildet wird. Also sind M 2 (V ; W ) und L2 (V ; W )
kanonisch isomorph. Durch Induktion beweist man den folgenden Satz.
Satz 8.8.3 (Isomorphie)
Die Räume Lk (V ; W ) und M k (V ; W ) sind kanonisch isomorph (als Banachräume).
Kapitel 9
Anwendungen der
Differentialrechnung
In diesem Kapitel widmen wir uns einigen wichtigen Anwendungen der
höherdimensionalen Analysis, speziell dem wichtigen Satz über implizite
Funktionen und dessen Anwendungen. Den Einstieg bildet der sogenannte
Banachsche Fixpunktsatz. Am Ende des Kapitels werden wir Extrema mit
Nebenbedingungen und parameterabhängige Integrale besprechen.
Inhalt
9.1
9.1
Der Fixpunktsatz von Banach . . . . . . . . . . . . . .
77
9.2
Der Satz über implizite Funktionen . . . . . . . . . .
81
9.3
Extrema mit Nebenbedingungen . . . . . . . . . . . .
91
9.4
Parameterabhängige Integrale . . . . . . . . . . . . . .
96
Der Fixpunktsatz von Banach
In diesem kurzen Abschnitt wollen wir nur einen Satz beweisen, der allerdings so
bedeutend ist, dass wir ihm einen ganzen Abschnitt widmen wollen. Dieser Satz
wird oft als Fixpunktsatz von Banach zitiert.
Satz 9.1.1 (Banach)
Sei (X, d) ein vollständiger metrischer Raum, T : X → X eine Abbildung,
die überall definiert sei, so dass es ein 0 ≤ θ < 1 gibt, so dass für je zwei
Punkte x, y ∈ X gilt
d(T x, T y) ≤ θd(x, y).
77
78
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Dann gibt es genau einen Punkt x0 ∈ X mit der Eigenschaft
T x0 = x0 .
Definition 9.1.2 (Fixpunkt)
1. Ein Punkt mit der Eigenschaft T x0 = x0 heißt Fixpunkt der Abbildung
T.
2. Eine Abbildung mit der im Satz angegebenen Eigenschaft d(T x, T y) ≤
θd(x, y) wird als Kontraktion bezeichnet, die Zahl 0 ≤ θ < 1 als Kontraktionszahl.
Abbildung 9.1: Stefan Banach (30.3.1892–31.8.1945)
Beweis. Wir beweisen den Fixpunktsatz von Banach in drei Schritten, zunächst
zeigen wir die Eindeutigkeit des Fixpunktes, dann identifizieren wir den verdächti”
gen“ Punkt, danach zeigen wir, dass dieser Punkt tatsächlich ein Fixpunkt ist.
(1) Eindeutigkeit Angenommen wir hätten zwei Fixpunkte x0 , y0 der Abbildung T . Dann haben wir
d(x0 , y0 ) = d(T x0 , T y0 ) ≤ θd(x0 , y0 ).
Daraus folgt nun, da θ < 1 ist, dass d(x0 , y0 ) = 0 ist, und mit (M1), dass x0 = y0
ist.
9.1. DER FIXPUNKTSATZ VON BANACH
79
(2) Konstruktion Wir wählen einen Punkt x1 ∈ X und betrachten die Folge
{x1 , x2 = T x1 , x3 = T x2 = T 2 x1 , x4 = T x3 , . . . },
die rekursiv für i ∈ N durch
xi+1 = T xi
definiert wird. Eine triviale Induktion zeigt, xi+1 = T i x1 für i ∈ N und
d(T i x, T i y) ≤ θi d(x, y).
Wir beweisen nun, dass die Folge {xi }i∈N eine Cauchyfolge ist, d. h. zu jedem
ε > 0 gibt es ein N ∈ N mit n, m > N impliziert d(xn , xm ) < ε. Sei ε > 0
gegeben, wähle N , so dass
(1 − θ)ε
.
θN −2 <
d(x1 , x2 )
Dann gilt für m ≥ n > N aufgrund der Dreiecksungleichung und der oben
erwähnten Induktion
d(xn , xm ) ≤ d(xn , xn+1 ) + d(xn+1 , xn+2 ) + · · · + d(xm−1 , xm )
= d(T n−1 x1 , T n−1 (T x1 )) + · · · + d(T m−2 x1 , T m−2 (T x1 )).
Damit ist
d(xn , xm ) ≤
m−n
X
d(T n−2+j x1 , T n−2+j x2 )
j=1
≤
m−n
X
θn−2+j d(x1 , x2 )
j=1
≤ θ
n−2
d(x1 , x2 )
m−n
X
θj
j=1
≤ θn−2 d(x1 , x2 )
∞
X
θj
j=0
n−2
θ
d(x1 , x2 )
1−θ
θN −2
≤
d(x1 , x2 )
1−θ
(1 − θ)ε d(x1 , x2 )
<
d(x1 , x2 ) 1 − θ
= ε.
=
Da X vollständig ist, ist die Cauchyfolge {T j−1 x1 }j∈N = {xj }j∈N konvergent.
Wir setzen
x0 = lim xj .
j→∞
80
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
(3) Fixpunkteigenschaft Wir müssen jetzt noch zeigen, dass x0 ein Fixpunkt
der Abbildung T ist. Aufgrund unserer Überlegung in Beispiel 4.2.5 ist T stetig.
Wir betrachten
d(T x0 , x0 ) = d(T ( lim T j−1 x1 ), x0 ) = d( lim T (T j−1 x1 ), x0 )
j→∞
j→∞
j
= d( lim T x1 , x0 ) = d(x0 , x0 ) = 0.
j→∞
Also ist T x0 = x0 und der Satz ist damit gezeigt.
Wir wollen nun einen vergleichbaren Satz beweisen, wenn die Abbildung stetig
von einem weiteren Parameter abhängt. Speziell soll gezeigt werden, dass dann
der Fixpunkt stetig von dem weiteren Parameter abhängig ist.
Satz 9.1.3 (Stetige Abhängigkeit des Fixpunktes)
Es seien (X, dX ), (Y, dY ) metrische Räume, X sei vollständig,
T :X ×Y →X
sei stetig und für jedes feste y ∈ Y eine Kontraktion mit Kontraktionszahl
0 ≤ θy < 1. Wir setzen voraus, dass es eine Zahl θ < 1 gibt, so dass für alle
y ∈ Y gilt 0 ≤ θy ≤ θ < 1, d. h. die Kontraktionszahlen sind gleichmäßig von
1 wegbeschränkt. Dann hängt der nach Satz 9.1.1 existierende Fixpunkt xy
stetig von y ab.
Beweis. Sei ε > 0 gegeben, y0 ∈ Y und x0 sei der Fixpunkt der Abbildung
T (·, y0 ). Sei δ > 0, so dass dY (y, y0 ) < δ, dX (x, x0 ) < δ impliziert
dX (T (x, y), T (x0 , y0 )) < ε(1 − θ).
Sei y ∈ Y , so dass d(y, y0 ) < δ und xy sei der Fixpunkt der Abbildung
T (·, y) : X → X.
Dann ist
d(x0 , xy ) = d(T (x0 , y0 ), T (xy , y)) ≤ d(T (x0 , y0 ), T (x0 , y)) + d(T (x0 , y), T (xy , y))
≤ ε(1 − θ) + θy d(x0 , xy )
≤ ε(1 − θ) + θd(x0 , xy ).
Damit folgt
(1 − θ)d(x0 , xy ) ≤ ε(1 − θ).
Insbesondere gilt
d(x0 , xy ) < ε.
9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
9.2
81
Der Satz über implizite Funktionen
In diesem Abschnitt beweisen wir einen der zentralen Sätze der Theorie und wir
wollen diesen Satz anhand einiger Anwendungen motivieren.
Beispiel 9.2.1 (Abhängigkeit von Parametern)
(1) Wir wollen die Entwicklung eines Kapitals mit konstanter Ansparrate A
und konstantem Zinssatz p > 0 betrachten, wobei wir von einer kontinuierlichen Verzinsung ausgehen. Es sei K0 ein Grundkapital und K(T, p, A) das
Kapital zum Zeitpunkt T > 0. Es errechnet sich durch folgende Formel
A
A
pT
− .
K(T, p, A) = e
K0 +
p
p
Betrachtet man den Fall p = 0, so muss man den Satz von l’Hospital (Satz
5.6.2) heranziehen. Im Kapitel 11 werden wir die Begründung für diese Formel kennenlernen. Wählen wir p = 0.03, A = 30 und K0 = 1000, so ergibt
sich mit
log(10.5)
T =
p
ein Endkapital von 20000. Die Abhängigkeit von p, A wird durch Abbildung
9.2 klar. Wir stellen uns nun die Frage, ob wir bei bei veränderten Zinssatz,
die Ansparrate so verändern können, dass bei gleicher Endzeit das gleiche
Kapital erzielt wird. Andere Varianten der Frage lassen sich leicht formulieren.
(2) Eine Rakete der Masse m(t) und Anfangsmasse m0 steige senkrecht auf,
die Schubkraft sei F = cβ mit β als Massendurchsatz der Triebwerke und
c der äquivalenten Ausströmgeschwindigkeit. Dann berechnet sich die Höhe
der Rakete zum Zeitpunkt t > 0 zu
m
m(t)
1
,
h(c, β, m0 , t) = − g0 t2 + ct + c log
2
β
m0
wobei m(t) = m0 − βt und g0 die Erdbeschleunigung bezeichne. Wir fassen
h = h(c, β, m0 , t) als Funktion von vier Variablen auf und stellen die Frage, ob
bei verändertem m00 > 0, c0 , β 0 (ein) Wert(e) t0 existier(t)en, so dass die gleiche Höhe erreicht wird, also dass die Beziehung h(c0 , β 0 , m00 , t0 ) = h(c, β, m0 , t)
gilt. Ist t der Zeitpunkt zu dem die Rakete die Scheitelhöhe erreicht, so ist
∂h
= 0 und es ist einsichtig, dass z. B. eine Erhöhung von m0 dazu führt,
∂t
dass diese Höhe nicht erreicht wird. Ist man zum Zeitpunkt t nicht an der
Scheitelhöhe (d. h. ∂h
6= 0), so führt eine geringfügigen Änderung der ande∂t
ren Parameter dazu, dass die gegebene Höhe etwas früher oder etwas später
erreicht wird.
82
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
(3) Wir betrachten
die Funktion f : R × R → R : (x, y) 7→ x2 + y 2 . Für
√
x0 = y0 = 22 gilt f (x, y) = 1. Lokales Auflösen ist nach beiden Variablen
möglich, für x1 = 0, y1 = 1 ist lokales Auflösen nach x nicht möglich.
K
K(p,A,T)
p
(p,A)
A
Abbildung 9.2: Kapital zum Zeitpunkt T > 0 in Abhängigkeit vom Zinssatz p
und der Sparrate A
Die angegebenen Beispiele deuten darauf hin, dass es interessant sein kann, Gleichungen der Form f (x, y) = c zu lösen, so dass man zu jedem x in der Nähe
einer bekannten Lösung ein entsprechendes y = y(x) finden kann, das diese Gleichung löst. Man sagt die Lösungsfunktion y = y(x) sei durch die Gleichung
f (x, y) = c implizit gegeben. Wichtig ist dabei, dass wir in der Nähe einer uns
bereits bekannten Lösung arbeiten. Da für allgemeine Gleichungen eine solche
Auflösung y = y(x) oft nicht explizit angegeben werden kann, wollen wir zumindest die Existenz einer solchen Funktion beweisen und eventuell sogar ihre
Ableitung bzw. das Taylorpolynom eines gewissen Grades einer solchen Funktion
bestimmen. Es stellt sich heraus, dass diese Informationen für viele Anwendungen
ausreichend sind, d. h. eine genaue analytische Darstellung von y = y(x) nicht
notwendig ist. Der Satz, der die Existenz solcher implizit gegebenen Funktionen
garantiert, wird, naheliegenderweise, als Satz über implizite Funktionen (engl.
implicit function theorem) bezeichnet. Leider verdeckt die technisch präzise Formulierung etwas den eher elementaren Inhalt des Satzes. Wir wollen zwei Sätze
angeben, die jeweils einen Teil des Satzes über implizite Funktionen darstellen:
die Existenz einer solchen Funktion und deren Stetigkeit, die Differenzierbarkeit
und die Berechnung der Ableitung.
9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
83
Die Grundfrage bei der Anwendung des Satzes über implizite Funktionen betrifft
immer die folgende Situation: Wir haben eine Funktion
f :V →Z
und eine Stelle x0 ∈ V mit f (x0 ) = a, wie sieht für eine kleine Zahl δ > 0 die
Menge
n
o
L = x ∈ V kx − x0kV < δ, f (x) = a
aus? Wäre f linear, V, Z endlich dimensional, so wüssten wir die Antwort aus der
linearen Algebra: Diese Menge wäre der Schnitt eines affinen Unterraums mit der
δ-Kugel um x0 , wobei die Dimension des Unterraumes von den Dimensionen n
von V , m von Z und dem Rang von f abhängt.
Noch ein Wort zur Notation: Für eine stetig differenzierbare Abbildung f : U ×
V → Z, U offen in X, V offen in Y ist für festes y0 ∈ V die Abbildung
hy0 : U → Z : x 7→ f (x, y0 )
differenzierbar. Wir setzen
Dx f (x0 , y0 ) = Dhy0 (x0 )
und bezeichnen dies als Differential bezüglich der ersten Variablen. Entsprechend
lassen sich Differentiale bezüglich der zweiten und eventuell weiterer Variablen
bilden. In der Literatur ist es oft gebräuchlich dafür auch D1 f (x0 , . . . ) bzw.
Dj f (x0 , . . . ) zu schreiben, um auf die Ableitung bezüglich der ersten bzw. jten Variablen hinzuweisen. Solange wir die Variablen unterschiedlich bezeichnen,
sind die Schreibweisen äquivalent. Wir nennen dies auch partielle Ableitung bzgl.
der entsprechenden Variablen.
Satz 9.2.2 (Satz über implizite Funktionen, Teil 1: Existenz)
Es seien (X, k · kX ), (Y, k · kY ), (Z, k · kZ ) Banachräume, U ⊂ X, V ⊂ Y
und f : U × V → Z sei stetig differenzierbar. Es sei für x0 ∈ U , y0 ∈ V
f (x0 , y0 ) = a und die Ableitung
Dx f (x0 , y0 ) : X → Z
sei invertierbar und Dx f (0, 0)−1 sei stetig. Dann gibt es Umgebungen Ω ⊂ U
von x0 und Γ ⊂ V von y0 und eine Abbildung g : Γ → Ω mit der Eigenschaft:
1. f (g(y), y) = a für alle y ∈ Γ.
2. Ist (x, y) ∈ Γ × Ω mit f (x, y) = a, so ist x = g(y).
Ferner gilt: g ist stetig.
84
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Bemerkung 9.2.3 (Stetigkeit der inversen Abbildung)
Die Forderung, dass Dx f (0, 0)−1 stetig ist, ist an sich überflüssig, endlich
dimensional ist dies offensichtlich, im Banachräumen folgt dies aus dem sogenannten Satz von der offenen Abbildung, der als einer der wichtigen Sätze
von Banach gilt. Dieser wird typischerweise in der Vorlesung Funktionalanalysis bewiesen und ist uns deshalb an dieser Stelle noch nicht bekannt.
Beweis. (0) Vorbemerkung. Wir betrachten die Linearisierung Dx f (x, y) für
(x, y) in der Nähe von (x0 , y0 ). Diese Abbildung
(x, y) 7→ Dx f (x, y)
ist stetig, denn laut Voraussetzung sind alle partiellen Ableitungen stetig.
(1) Konstruktion der Abbildung. Laut Voraussetzung ist die lineare Abbildung Dx f (x0 , y0 ) invertierbar.
OBdA setzen wir voraus, dass (x0 , y0 ) = (0, 0) und a = 0 ist (dies kann erreicht
werden durch eine Verschiebung des Problems um den entsprechenden Vektor).
Setze dazu
f˜(x, y) = f (x0 + x, y0 + y) − f (x0 , y0 ).
Dann ist f˜(0, 0) = 0.
Definiere
T(x, y) = x − (Dx f (0, 0))−1 f (x, y).
Diese Abbildung ist auf U × V stetig, da Dx f (0, 0)−1 stetig ist und gleiches für f
gilt.
(2) Konstruktion einer Menge, die in sich abgebildet wird. Zeige: Es
gibt δ > 0, δ1 > 0, so dass für alle y ∈ V mit kykY < δ1 die Abbildung die
δ-Kugel um 0 in U in sich abbildet, d. h.
T (·, y) : Bδ (0) → Bδ (0).
Beweis dieser Behauptung: T (·, y) ist für fest gewähltes y ∈ V differenzierbar
und
Dx T (0, 0) = 1l − (Dx f (0, 0))−1 Dx f (0, 0) = 0.
Daher existiert nach unserer Vorbemerkung ein δ > 0, so dass sowohl in X
Bδ (0) ⊂ U wie in Y Bδ (0) ⊂ V gilt und für kxkX < δ, kykY < δ
kDx T (x, y)kL(X) <
1
2
gilt. Dann ist für solche kxkX < δ, kykY < δ
kT (x, y)kX ≤ kT (x, y) − T (0, y)kX + kT (0, y) − T (0, 0)kX .
9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
85
n
o
Den ersten Term können wir durch δ sup kDx T (ξ, y)kL(X) ξ ∈ S(0, x) ≤ 2δ
abschätzen (unter Verwendung des Allgemeinen Mittelwertsatzes 8.7.11). Der
zweite Teil folgt aus der Stetigkeit von T auf {0} × Bδ (0). Daher existiert ein
0 < δ1 ≤ δ, so dass kykY ≤ δ1 impliziert kT (0, y) − T (0, 0)kX < 2δ . Dann ist
insgesamt
kT (x, y)kX ≤ δ,
falls kxkX < δ und kykY < δ1 . Daher bildet T : Bδ (0) × Bδ1 (0) → Bδ (0) ab (nach
Satz 4.2.6 Teil 3).
(3) Nachweis der Kontraktionseigenschaft. T ist für alle y ∈ Bδ1 (0) eine
Kontraktion auf Bδ (0). Sind x1 , x2 ∈ Bδ (0), so ist für kykY < δ1
1
kT (x1 , y) − T (x2 , y)kX ≤ kx1 − x2 kX ,
2
denn die Ableitung genügt der Bedingung kDx T (·, y)kL(X;Y ) ≤ 21 und die Abschätzung
folgt wieder aus Satz 8.7.11. Die Kontraktionsrate 12 ist unabhängig von y ∈
Bδ1 (0) und damit existiert nach dem Banachschen Fixpunktsatz 9.1.1 ein eindeutiger Fixpunkt von T (xy , y) = xy und nach Satz 9.1.3 ist die Abbildung y 7→ xy
stetig. Wir setzen g : Bδ1 (0) → Bδ (0) : g(y) = xy und erhalten
T (g(y), y) = g(y).
Nach der Eindeutigkeitsaussage im Banachschen Fixpunktsatz gibt es keine weiteren Fixpunkte.
(4) Auflösungseigenschaft. Wir wollen noch sehen, dass
f (g(y), y) = 0.
Da
g(y) = T (g(y), y) = g(y) − (Dx f (0, 0))−1 f (g(y), y)
folgt
(Dx f (0, 0))−1 f (g(y), y) = 0
und damit
f (g(y), y) = 0.
(5) Ausschluss weiterer Lösungen. Ist f (x, y) = 0, so ist
T (x, y) = x − (Dx f (0, 0))−1 0
und damit ist x Fixpunkt von T (·, y), also x = g(y).
86
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Satz 9.2.4 (Satz über implizite Funktionen, Teil 2: Differenzierbarkeit)
Es seien U ⊂ X, V ⊂ Y offen und f : U × V → Z stetig differenzierbar. Es
sei für x0 ∈ U , y0 ∈ V f (x0 , y0 ) = 0 und die Ableitung
Dx f (x0 , y0 ) : X → Z
sei invertierbar mit stetiger Inverse. Gibt es Umgebungen Ω ⊂ U von x0 und
Γ ⊂ V von y0 und eine stetige Abbildung g : Γ → Ω mit der Eigenschaft
f (g(y), y) = 0 für alle y ∈ Ω,
so ist g differenzierbar im Punkt y0 .
Beweis. Wiederum ist es keine Beschränkung der Allgemeinheit anzunehmen,
dass der Punkt (x0 , y0 ) = (0, 0) ist. Auf X × Y schreiben wir
q
k(x, y)kX×Y = kxk2X + kyk2Y
für die übliche Norm.
Wir prüfen die Differenzierbarkeit von g nach, indem wir g in der Form
g(y) = −(Dx f (0, 0))−1 Dy f (0, 0)y + ψ(y)
schreiben und zeigen, dass
1
ψ(y) = 0
y→0 kykY
lim
ist. Damit haben wir dann die Linearisierung im Nullpunkt bestimmt.
Wir beginnen mit einer Darstellung von f in der Form
f (x, y) = Dx f (0, 0)x + Dy f (0, 0)y + R(x, y)
(9.1)
kR(x, y)kZ
= 0.
(x,y)→0 k(x, y)kX×Y
(9.2)
mit
lim
Für y ∈ Ω gilt nun
0 = f (g(y), y) = Dx f (0, 0)g(y) + Dy f (0, 0)y + R(g(y), y).
Damit erhalten wir eine Darstellung von g in der Form
g(y) = −Dx f (0, 0)−1 (Dy f (0, 0)y + R(g(y), y)) .
9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
87
Mit der oben angegebenen Linearisierung hat nun ψ(y) die Gestalt
ψ(y) = −Dx f (0, 0)−1 R(g(y), y).
Will man dies nun abschätzen, so reicht es nicht aus, dass g(0) = 0 ist und g
stetig ist, sondern man benötigt noch, dass
1
g(y)
kykY
für y → 0 beschränkt ist.
Dazu zeigen wir, dass g einer Abschätzung der Form
kg(y)kX ≤ KkykY
(9.3)
genügt mit einer geeigneten Konstanten K > 0.
Dafür ist der Ausgangspunkt die oben angegebene Formel für g.
Wir beginnen mit einer Abschätzung für R. Wegen (9.2) gibt es ein δ > 0, so
dass kxkX , kykY < δ impliziert
1
kR(x, y)kZ
≤ k(Dx f (0, 0)−1 k−1
L(Z;X) ,
k(x, y)kX×Y
2
also
1
kR(x, y)kZ ≤ kDx f (0, 0)−1 k−1
L(Z;X) k(x, y)kX×Y
2
1
≤ kDx f (0, 0)−1 k−1
L(Z;X) (kxkX + kykY ).
2
(9.4)
(9.5)
Die Stetigkeit von g impliziert, dass ein 0 < δ1 < δ existiert mit kg(y)kX < δ für
kykY < δ1 . Dann ist für kykY < δ1
1
kR(g(y), y)kZ ≤ kDx f (0, 0)−1 k−1
L(Z;X) (kg(y)kX + kykY ).
2
Nun bekommen wir aus der obigen Gleichung (9.1), dass
0 = f (g(y), y) = Dx f (0, 0)g(y) + Dy f (0, 0)y + R(g(y), y),
also
g(y) = −(Dx f (0, 0))−1 Dy f (0, 0)y − (Dx f (0, 0))−1 R(g(y), y).
Damit erhalten wir aus (9.4)
1
kg(y)kX ≤ k(Dx f (0, 0))−1 Dy f (0, 0)kL(Y ;Z) kykY + (kg(y)kY + kykY ).
2
88
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Durch Umschreiben erhalten wir
kg(y)kX ≤ (2k(Dx f (0, 0))−1 Dy f (0, 0)kL(Y ;X) + 1)kykY .
Damit ist die Zwischenbehauptung (9.3) gezeigt.
Nun ist ψ aufgrund der obigen Gleichung gegeben durch
ψ(y) = −(Dx f (0, 0))−1 R(g(y), y).
Damit lässt sich der Quotient abschätzen durch
1
1
kψ(y)kX ≤
kDx f (0, 0))−1 kL(Z;X) kR(g(y), y)kZ
kykY
kykY
p
kg(y)k2X + kyk2Y
kR(g(y), y)kZ
−1
≤ kDx f (0, 0) kL(Z;X) p
.
kykY
kg(y)k2X + kyk2Y
√
−1
kg(y)k2 +kyk2
X
Y
Da kDx f (0, 0)) kL(Z;X) eine Konstante ist,
beschränkt ist und
kykY
der verbleibende Teil gegen 0 konvergiert, erhalten wir die behauptete Konvergenzaussage und die Differenzierbarkeit von g. Das Differential von g ist aufgrund
der gleichen Rechnung gegeben durch
Dg(0) = −Dx f (0, 0))−1 Dy f (0, 0).
Lemma 9.2.5 (Differenzierbarkeit der Inversen)
Es sei U ⊂ X ein Gebiet in einem Banachraum (X, k·kX ) und A : U → L(X)
sei eine k-fach stetig differenzierbare Abbildung, für ein x0 ∈ U sei A(x0 )
stetig invertierbar. Dann gibt es ein δ > 0, so dass die Abbildung
A−1 : Bδ (x0 ) → L(X) : x 7→ A(x)−1
eine C k -Abbildung ist.
Beweis. Wir zeigen in den Übungen, dass für ein hinreichend kleines δ > 0 A(x)−1
für x ∈ Bδ (x0 ) durch eine absolut konvergierende Reihe dargestellt werden kann.
Setzt man dort eine C k -Funktion ein, so ergibt sich eine C k -Funktion.
Korollar 9.2.6 (Satz über implizite Funktionen, Teil 3: Glattheit)
Unter den Voraussetzungen der Sätze 9.2.2, 9.2.4 und unter der Annahme
f ∈ C k (U × V ; Z) ist die Funktion g auch k-fach stetig differenzierbar.
9.2. DER SATZ ÜBER IMPLIZITE FUNKTIONEN
89
Beweis. Der Beweis erfolgt durch vollständige Induktion. Angenommen wir hätten
den Satz für k − 1 gezeigt. Dann ist wegen
f (g(y), y) = 0
auch
0 = Dy f (g(y), y) = D1 f (g(y), y)Dy g(y) + D2 f (g(y), y).
Damit ist
Dy g(y) = − (D1 f (g(y), y))−1 D2 f (g(y), y).
Also ist die rechte Seite C k−1 , dies ist aufgrund der angegebenen Gleichung die
erste Ableitung von g, also ist g ∈ C k (Bδ (x0 ); L(X)).
Fragt man sich, wann differenzierbare Funktionen invertierbar sind, erlaubt einem
die eben hergeleitete Beziehung eine einfache notwendige Bedingung zu finden.
Existiert f −1 und ist dies differenzierbar, so gilt
f −1 (f (x)) = x
und die Differentiation dieser Formel liefert sofort
D(f −1 )(f (x))Df (x) = 1l,
also D(f −1 )(f (x)) ist invertierbar und
D(f −1 )(f (x)) = (Df (x))−1 .
Dass die Invertierbarkeit des Differentials auch hinreichend für die Umkehrbarkeit
der Funktion ist, folgt aus dem nachfolgenden Satz.
Satz 9.2.7 (Umkehrsatz)
Es seien (X, k · kX ), (Y, k · kY ) ein Banachräume. Ferner sei U ⊂ X offen,
f : U → Y differenzierbar. Ist Df (x0 ) stetig invertierbar, so gibt es eine
Umgebung U1 ⊂ U von x0 und V ⊂ Y von f (x0 ), so dass f : U1 → V eine
differenzierbare Bijektion ist mit f −1 : V → U1 differenzierbar und es gilt
D(f −1 )(f (x)) = (Df (x))−1 .
Beweis. Für x ∈ U und y ∈ Y setzen wir
F(x, y) = y − f (x).
Dann ist
F(x0 , f (x0 )) = 0
und
Dx F(x, y) = −Df (x).
90
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Daher ist Dx F(x, y) im Punkt (x0 , f (x0 )) stetig invertierbar, also gibt es Umgebungen Γ von f (x0 ) = y0 und Ω von x0 und eine Abbildung g : Γ → Ω mit
F (g(y), y) = 0
oder x = g(y). Nach der Vorbemerkung oder der im Satz über implizite Funktionen angegebenen Formel gilt
Dg(y0 ) = (Df (x0 ))−1 .
Definition 9.2.8
Sind U ⊂ Rn , V ⊂ Rm offen und Ψ : U → V eine differenzierbare Bijektion,
so dass Ψ, Ψ−1 stetig differenzierbar sind, dann heißt Ψ Diffeomorphismus.
Beispiel 9.2.9 (Polarkoordinaten)
Wir betrachten die Abbildung
Φ : [0, ∞) × R → R : (r, ϕ) 7→
2
r cos ϕ
r sin ϕ
.
Für r > 0 gilt
0
Φ (r, ϕ) =
cos ϕ −r sin ϕ
sin ϕ r cos ϕ
.
Die Determinante dieser Jacobimatrix ist
cos ϕ −r sin ϕ
det
= r(cos2 ϕ + sin2 ϕ) = r > 0.
sin ϕ r cos ϕ
Demzufolge ist der Umkehrsatz anwendbar, auf jeder Menge der Form R+ ×
(a − π, a + π) ist Φa = Φ : R+ × (a − π, a + π) → R2 ein Diffeomorphismus
mit Bild
cos a
2
R \ t sin a t ≥ 0 .
Die Umkehrabbildung von Φa ist
Φ−1
a (x) = (
q
x21 + x22 , ϕ),
x2
, sin ϕ = p 2
und ϕ ∈ (a−π, a+π). Für a = 0
+
x1 + x22
nennt man die Paare (r, ϕ) die Polarkoordinaten des Punktes x ∈ R2 .
wobei cos ϕ = p
x1
x21
x22
Typisch für den Satz über implizite Funktionen ist eine lokale Aussage, man beschreibt die Lösungsmenge einer Gleichung in der Nähe einer gegebenen Lösung,
9.3. EXTREMA MIT NEBENBEDINGUNGEN
91
insofern ist der folgende Satz als Prototyp einer anderen Entwicklung zu sehen.
Es ist die einfachste Version eines solchen Satzes, formuliert wurden Sätze mit
dieser Zielrichtung in der siebziger Jahren des 20 Jahrhunderts. Wir benötigen
dazu noch einen Begriff.
Definition 9.2.10 (Zusammenhangskomponente)
Es sei (X, d) ein metrischer Raum A ⊂ X eine nichtleere Teilmenge, x ∈ A
sei gegeben. Die Zusammenhangskomponente Cx (A) von A des Punktes x ist
gegeben als
[
Cx (A) =
T.
T ⊂A:T ist zusammenhängend
Satz 9.2.11 (Satz über implizite Funktionen: globale Version)
Es sei (X, k · kX ) ein Banachraum, U ⊂ X ein Gebiet, h : U → R sei
im Punkt x0 ∈ U differenzierbar, h(x0 ) = 0 und Dh(x0 ) 6= 0. Dann zerlegt
die Menge h−1 (0), die den Punkt x0 enthält, das Gebiet U in mindestens
zwei Komponenten, d. h. sei C = h−1 (0), so besitzt U \ C mindestens zwei
Komponenten.
Beweis. C = h−1 (0) 6= U ist abgeschlossen in U (d. h. bzgl. des metrischen
Raumes (U, d), wobei d die zur Norm in X gehörende Metrik ist). U \ C 6= ∅
ist daher offen. Damit ist gleichwertig (Aufgabe 2 auf Blatt 20), dass U \ C
zusammenhängend und U \ C wegezusammenhängend ist. Angenommen der Satz
ist falsch. Dann ist U \ C wegezusammenhängend. Es gibt Punkte x1,2 ∈ U \ C
mit h(x1 ) > 0 > h(x2 ). Dann gibt es einen Weg γ : [0, 1] → U \ C mit γ(0) = x1 ,
γ(1) = x2 . Wegen der Stetigkeit von h ◦ γ und der Tatsache, dass h ◦ γ(0) > 0 >
h ◦ γ(1) ist, gibt es ein τ ∈ (0, 1) mit
h ◦ γ(τ ) = 0.
Dann ist h(γ(τ ) = 0 und γ(τ ) ∈ C. Dies liefert einen Widerspruch, der den Satz
beweist.
9.3
Extrema mit Nebenbedingungen
In diesem Abschnitt wollen wir die Maxima und Minima von Funktionen bestimmen, allerdings nicht auf einer offenen Menge, sondern auf einer durch Gleichungen definierten Teilmenge. Zur Motivation wieder ein paar Beispiele.
92
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Beispiel 9.3.1 (Nebenbedingungen)
1. Zunächst beginnen wir mit dem Paradebeispiel der Wanderung im Gebirge. Wir beschreiben den Wanderweg als Bild einer Kurve auf der
Landkarte und suchen nach dem Punkt der höchsten (geringsten) Höhe
über NN längs des Weges.
x1
2. Wir betrachten die Menge der Zahlenpaare
xi > 0 als
x2
Kantenlängen von Rechtecken. Suchen wir nun unter denen gleicher
Fläche h(x) = x1 x2 = c das maximaler Kantenlänge L = 2(x1 + x2 ), so
lösen wir das Problem: Maximiere L unter der Nebenbedingung h = c.
3. Ein Zug fahre von A nach B, wobei der Abstand der beiden Stationen
d > 0 sei. Als Steuermöglichkeit kann der Zugführer die Beschleunigungen −a, 0, a für eine Zahl a > 0 wählen, wobei er die Zeitintervalle
der Beschleunigung auswählt, d. h. er bestimmt eine Treppenfunktion
ϕ, die nur die Werte a, 0, −a annimmt, so dass mit v 0 (t) = ϕ(t) gilt
Z∞
v(t) dt = d,
0
(dies ist die Bedingung, dass die zurückgelegte Strecke d ist). In der ökologischen Variante will er nun unter der angegebenen Bedingung mit minimalen Energieverbrauch, in der ökonomischen Variante in möglichst
kurzer Zeit ankommen. Dabei ist die Energie (proportional zu)
Z∞
E=
ϕ+ (t) dt .
0
4. Wir wollen nun eine rein mathematische Bedingung angeben. Angenommen γ(t) sei eine Kurve im R2 , die h = c parametrisiert. Wir
suchen eine Extremalstelle x0 einer differenzierbaren Funktion unter
der Nebenbedingung h(x) = c. Also ist mit γ(t0 ) = x0
(f ◦ γ)0 (t0 ) = 0
oder
h∇f (γ(t0 )), γ 0 (t0 )i = 0.
9.3. EXTREMA MIT NEBENBEDINGUNGEN
93
Da h(γ(t)) = 0 ist, folgt auch h∇h(γ(t0 )), γ 0 (t0 )i = 0 und damit sind
∇f (x0 ) und ∇h(x0 ) linear abhängig. Dieses Beispiel wird Grundlage
der weiteren Überlegungen.
Satz 9.3.2 (Lagrange-Multiplikator)
Es sei (X, k · kX ) ein Banachraum, ferner sei U ⊂ X offen, h : U → R
sei eine stetig differenzierbare Abbildung, es sei c ∈ R mit Dh(x) 6= 0 für
alle x mit h(x) = c. f : U → R sei stetig differenzierbar. Sei x0 ∈ U mit
h(x0 ) = c, so dass ein δ > 0 existiert mit kx − x0 kX < δ und h(x) = c
implizieren f (x) ≤ f (x0 ) (d. h. f hat in x0 ein lokales Maximum unter der
Nebenbedingung h(x) = c). Dann gibt es ein λ ∈ R mit
Df (x0 ) = λDh(x0 ).
Definition 9.3.3 (Lagrange-Multiplikator)
Die Zahl λ aus dem Satz 9.3.2 heißt Lagrange-Multiplikator.
Beweis. Sei x0 wie im Satz 9.3.2 angegeben. Da h(x0 ) = c ist, ist laut Voraussetzung
Dh(x0 ) 6= 0.
Dann kann man schreiben
X = ker Dh(x0 ) ⊕ [y0 ] = K ⊕ Y.
K, Y sind mit geeigneten Normen Banachräume, wir schreiben für k ∈ K, y ∈ Y
H(k, y) = h(x0 + y + k).
Dann ist für H(0, 0) = c und D2 H(0, 0) = Dh(x0 )|Y : Y → R (Ableitung
bezüglich der zweiten Variablen) ein Isomorphismus, insbesondere gibt es aufgrund des Satzes über implizite Funktionen, Satz 9.2.2, Umgebungen Γ 3 k, Ω 3
y und g : Γ → Ω mit
H(k, g(k)) = c.
Betrachte nun
F (k, g(k)) = f (x0 + k + g(k)).
k 7→ F (k, g(k)) ist auf einer Umgebung von 0 ∈ K definiert und hat bei 0 ein
lokales Extremum. Also ist
Dk F (0) = 0.
Dies impliziert Df (x0 )|K = 0. Betrachten wir nun
fx0 0 ,y0 (0) = Df (x0 )(y0 ) ∈ R.
94
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Da Dh(x0 )(y0 ) 6= 0 gibt es eine reelle Zahl λ mit
λDh(x0 )(y0 ) = Df (x0 )(y0 ).
Für beliebiges x ∈ X ist nun x = k + ty0 . Dann ist
Df (x0 )(x) = Df (x0 )(k + ty0 ) = tDf (x0 )(y0 ) = tλDh(x0 )(y0 ) = λDh(x0 )(x).
Ganz entsprechend kann man mehrere Nebenbedingungen behandeln. Man erhält
dann die nachfolgende Aussage.
Satz 9.3.4 (Lokale Extrema und Nebenbedingungen)
Es sei (X, k · kX ) ein Banachraum, U ⊂ X offen, h : U → Rk eine stetig
differenzierbare Abbildung mit
o
n
Dhi (x) i = 1, . . . , k ist linear unabhängig ∀x mit h(x) = c.
Ferner sei f : U → R stetig differenzierbar.
Sei x0 ∈ U mit h(x0 ) = c, so dass ein δ > 0 existiert mit kx − x0 kX < δ und
h(x) = c implizieren f (x) ≤ f (x0 ) (d. h. f hat in x0 ein lokales Maximum
unter der Nebenbedingung h(x) = c).
Dann gibt es λi ∈ R, i = 1, . . . , k mit
Df (x0 ) =
k
X
λi Dhi (x0 ).
i=1
Definition 9.3.5 (Lagrange-Multiplikatoren)
Die Zahlen λ1 , . . . , λk heißen Lagrange-Multiplikatoren.
Korollar 9.3.6 (Lagrange-Multiplikatoren und Gradienten)
Es sei (V, h·, ·iV ) ein Hilbertraum bzw. V = (Rn , h·, ·i2 ). Dann gilt unter den
Voraussetzungen des Satzes 9.3.4
∇f (x0 ) =
k
X
i=1
λi ∇hi (x0 ) .
9.3. EXTREMA MIT NEBENBEDINGUNGEN
95
Bemerkung 9.3.7 (Extremalwerte und Lagrange-Multiplikatoren)
Die Bestimmung der Extremwerte von f unter der Nebenbedingung h = c
beinhaltet die Bestimmung der Lagrange-Multiplikatoren.
Beweis. Sei x0 so eine Extremalstelle mit h = c. Dann sind die linearen Abbildungen Dhi (x0 ) linear unabhängig. Sei K = ker Dh(x0 ) und Y ein Komplementärraum. Beide Räume sind Banachräume und wie zuvor wird K × Y zum
Banachraum mit Norm
q
k(k, y)kK×Y = kkk2K + kyk2Y .
K × Y ist isomorph (als Banachraum) zu X. Dann ist Dh(x0 )|Y : Y →
Isomorphismus (von Banachräumen). Setze
Rk ein
H(k, y) = h(x0 + k + y).
Dann ist
H(0, 0) = c und D2 H(0, 0) : Y → Rk ein Isomorphismus.
Daher gibt es Umgebungen 0 3 Γ ⊂ K und 0 3 Ω ⊂ Y und g : Γ → Ω mit
H(k, g(k)) = c.
Setze für X 3 x = x0 + k + y
F (k, y) = f (x0 + k + y).
Dann ist für k nahe Null
F (k, g(k)) ≤ F (0, 0)
und
Dk F (0, 0) = 0.
Dy F (0, 0) : Y → Rk
ist eine lineare Abbildung. Da D2 H(0, 0) : Y → Rk ein Isomorphismus ist, gibt
es
m
X
λ1 , . . . , λ m ∈ R :
λi Dhi (x0 )|Y = Df (x0 )|Y .
i=1
Wie oben ergibt sich
Df (x0 ) =
m
X
i=1
λi Dhi (x0 ).
96
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
h1 = c 1
h=c
h2 = c 2
x0
Abbildung 9.3: Wir betrachten ein Problem mit zwei Nebenbedingungen h1 (x) =
c1 , h2 (x2 ) = c2 mit den entsprechenden Gradienten. In gelb sieht man die Niveaufläche einer Funktion f (x) = f (x0 ). Liegen die Niveauflächen zu höheren
Niveaus hinter“ dieser, so liegt im Punkt x0 ein lokales Minimum mit Neben”
bedingung h = c vor. Der Gradient von f ergibt sich als Linearkombination der
Gradienten der hi .
9.4
Parameterabhängige Integrale
Mit diesem Abschnitt schließen wir das Kapitel 9 ab. Wir wollen Integrale der
Form
Zb
F (y) = f (x, y) dx
a
untersuchen, die ihrerseits wieder Funktionen F (y) definieren. Die naheliegende
Frage ist, inwieweit sich Stetigkeit bzw. Differenzierbarkeit von f auf F übertragen.
Satz 9.4.1 (Stetigkeit des Integrals)
Es sei [a, b] ⊂ R ein kompaktes Intervall positiver Länge, U ⊂ Rm offen und
f : [a, b] × U → R stetig. Dann ist die Funktion
F : U → R : y 7→
Zb
f (x, y)dx
a
stetig.
9.4. PARAMETERABHÄNGIGE INTEGRALE
97
Beweis. Sei y fest, dann gibt es ein δ > 0, so dass [a, b] × Bδ (y) ⊂ [a, b] × U .
Die Menge K = [a, b] × Bδ (y) ist kompakt und f ist gleichmäßig stetig auf K
(Satz 4.3.9). Daher gibt es zu ε > 0 ein δ1 > 0, so dass k(x, y) − (x0 , y0 )k2 < δ1
impliziert, dass
ε
.
|f (x, y) − f (x0 , y0 )| <
b−a
Dann ist für ky − y0 k2 < δ1
b
Z
Zb
0
0
|F (y) − F (y )| = f (x, y) dx − f (x, y ) dx
a
a
b
Z
0
= f (x, y) − f (x, y ) dx
a
Zb
≤
|f (x, y) − f (x, y0 )| dx
a
Zb
≤
ε
ε
dx =
(b − a) = ε.
b−a
b−a
a
Ganz entsprechend behandeln wir die Frage der Differenzierbarkeit.
Satz 9.4.2 (Differenzierbarkeit des Integrals)
Es sei [a, b], [c, d] ⊂ R kompakte Intervall positiver Länge, f : [a, b] × [c, d] →
R stetig und auf (c, d) stetig partiell nach y differenzierbar. Dann ist
F (y) : [c, d] → R : y 7→
Zb
f (x, y)dx
a
stetig auf (c, d) differenzierbar
0
Zb
F (y) =
∂
f (x, y) dx.
∂y
a
Beweis. Wir betrachten für y ∈ (c, d), h > 0, so dass y + h ∈ (c, d),
Rb
F (y + h) − F (y)
=
h
f (x, y + h) dx −
a
Rb
a
h
f (x, y) dx
Zb
=
a
f (x, y + h) − f (x, y)
dx.
h
98
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Die Funktion

f (x, y + h) − f (x, y)


h
ϕ(x, h) =
∂


f (x, y)
∂y
für
h>0
für
h=0
ist auf [a, b] × [0, H] für ein H > 0 stetig, also gleichmäßig stetig. Damit folgt für
die Differenz der Integrale
Zb Zb
F (y + h) − F (y)
f (x, y + h) − f (x, y) ∂f (x, y) ∂f
(x,
y)
dx.
−
dx ≤ −
h
∂y
h
∂y
a
a
Wie im vorigen Beweis nutzen wir die gleichmäßige Stetigkeit des Integranden
um dieses Integral abzuschätzen.
Beispiel 9.4.3
Wir berechnen das Integral
Za
x2 cos(x) dx.
0
Die wohl geradlinigste Methode wäre eine zweimalige partielle Integration,
jedoch kann man dieses Integral auch sehr einfach mittels der parameterabhängigen Integration behandeln.
Wir schreiben f (x, y) = cos(xy) und
Za
F (y) =
cos(xy) dx,
0
für
1
2
≤ y ≤ 2. Nach unserem Satz gilt
00
Za
F (y) =
x2 cos(xy) dx.
0
Damit ist
00
Za
F (1) =
0
x2 cos(x) dx.
9.4. PARAMETERABHÄNGIGE INTEGRALE
99
Das Integral für F lässt sich allerdings auswerten
F (y) =
Damit ist
sin(ay)
.
y
2 sin(ay) 2a cos(ay) a2 sin(ay)
F (y) =
.
−
−
y3
y2
y
00
Also hat man
Za
x2 cos(x) dx = F 00 (1) = (2 − a2 ) sin(a) − 2a cos(a).
0
Wir schließen diese Kapitel ab mit der Beobachtung, dass für eine stetige Funktion
von zwei (oder auch mehreren) Variablen f (x, y) auf [a, b] × [c, d] die Funktion
Zb
F (y) =
f (x, y) dx
a
selbst wieder integrierbar ist. Gleiches gilt für die Funktion
Zd
G(x) =
f (x, y) dy.
c
Die naheliegende Frage ist nun, ob
Zd
Zb
F (y) dy =
c
G(x) dx
a
gilt.
Definition 9.4.4 (Doppelintegral)
Das Integral
Zd
F (y) dy
c
heißt Doppelintegral
Zd

Zb
f (x, y) dx dy

c

a
100
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
der Funktion f . Offensichtlich kann man durch Auswahl der Integrationsreihenfolge verschiedene Doppelintegrale oder Mehrfachintegrale definieren.
Satz 9.4.5 (Vertauschbarkeit)
Für eine stetige Funktion f : [a, b] × [c, d] → R gilt




Zb Zd
Zd Zb
 f (x, y) dx dy =  f (x, y) dy  dx.
c
a
a
c
Beweis. Wir definieren eine Funktion


Zb Zy
ϕ(y) =  f (x, t) dt dx.
a
c
Es ist ϕ(c) = 0 und
ϕ0 (y) =
Zb

∂
∂y
a
Zy

f (x, t) dt dx.
c
Dies ist wegen des Hauptsatzes der Differential und Integralrechnung gerade
Zb
0
ϕ (y) =
f (x, y) dx.
a
Damit folgt nun




Zd Zb
Zd
Zb Zd
 f (x, y) dx dy = ϕ0 (y) dy = ϕ(d) =  f (x, y) dy  dx.
c
a
c
a
Aufgabe 9.4.6 (Anwendung)
Berechnen Sie das Integral
Z1
0
x5 − x3
dx.
log(x)
c
9.4. PARAMETERABHÄNGIGE INTEGRALE
101
Korollar 9.4.7 (Allgemeine Vertauschbarkeit)
Es seien [ai , bi ] für i = 1, . . . , n kompakte Intervalle, f : [a1 , b1 ] × · · · ×
[an , bn ] → R stetig. Dann gilt für jedes Permutation σ ∈ Sn


b

Zn
Zb1 Zb2
 . . .  f (x1 , x2 , . . . , xn ) dxn  . . . dx2  dx1 =
a1
an
a2
bσ(1)

Z
=
bσ(2)


aσ(1)

Z
aσ(2)
bσ(n)


Z

...
aσ(n)


f (x1 , x2 , . . . , xn ) dxσ(n)  . . . dxσ(2)  dxσ(1) .
102
KAPITEL 9. ANWENDUNGEN DER DIFFERENTIALRECHNUNG
Kapitel 10
Banachalgebren
In diesem Kapitel befassen wir uns zunächst mit Banachalgebren und mit
Potenzreihen in Banachalgebren. Wir charakterisieren Konvergenzradien und
führen auf wichtige Entwicklungen in verschiedenen Kontexten hin. Danach
beweisen wir den berühmten Satz von Stone-Weierstraß und erhalten den
bekannten Approximationssatz von Weierstraß als Konsequenz. Der Vorteil
dieses Vorgehens liegt darin, dass die Voraussetzungen des Satzes von
Stone-Weierstraß in einer Reihe von weiteren wichtigen Anwendungen leicht
nachgeprüft werden können und damit auf einfache Weise ein sehr wichtiger
und leicht anwendbarer Satz entsteht.
Inhalt
10.1 Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
10.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . 105
10.3 Der Satz von Stone-Weierstraß . . . . . . . . . . . . . 111
10.4 Fourierreihen . . . . . . . . . . . . . . . . . . . . . . . . 117
10.1
Algebren
Gemeinsam für die reellen Zahlen, die komplexen Zahlen und die n × n-Matrizen
ist: eine additive Struktur, eine multiplikative Struktur mit jeweiligen Assoziativgesetzen, mit einem Distributivgesetz und die Existenz einer Norm. Da wir
in Zukunft nicht immer schreiben wollen, dass ein Satz entweder für R, C oder
für die Menge der n × n-Matrizen gelten soll, wollen wir einen gemeinsamen
Begriff einführen, der aber ein weit darüberhinausgehendes eigenes Leben entfalten wird. Wir schreiben K für den zugrundeliegenden Körper und meinen damit
immer K = R oder K = C.
103
104
KAPITEL 10. BANACHALGEBREN
Definition 10.1.1 (Algebra)
Eine Algebra A ist ein Vektorraum über K mit einer Multiplikation, so dass
das Assoziativgesetz gilt und für λ, µ ∈ K und x, x1 ,x2 , y, y1 , y2 ∈ A gilt
(A1) (λx1 + µx2 )y = λ(x1 y) + µ(x2 y),
(A2) x(λy1 + µy2 ) = λ(xy1 ) = µ(xy2 ).
Definition 10.1.2 (Banachalgebra)
Ist A eine Algebra und k · kA eine Norm auf A mit
kxykA ≤ kxkA kykA
so sprechen wir von einer normierten Algebra, ist A mit dieser Norm vollständig, so bezeichnen wir A als Banachalgebra.
Beispiel 10.1.3 (Beispiele von Banachalgebren)
1. Beispiele für Banachalgebren sind (R, | · |), (C, | · |) und (L(Rn , Rn ), k ·
kL(Rn ;Rn ) ).
2. Ein weiteres wichtiges Beispiel einer Banachalgebra ist die Menge
n
o
C(X; R) = f : K → R f ist stetig ,
wobei X ein kompakter metrischer Raum ist. Die Norm ist dabei
n
o
kf kC(X;R) = max |f (x)| x ∈ K .
Offensichtlich gilt
kf gkC(X;R) ≤ kf k[C(X;R) kgk[C(X;R) .
3. Die Quaternionen Q bilden ein wichtiges Beispiel für eine Algebra.
Entsprechend der Erweiterung von R auf C durch Einführen von i, mit
i2 = 1 führen wir drei solche Wurzeln von −1 ein: i, j, k und schreiben
ein Element der Quaternionen als
q = a + b i +c j +d k
(10.1)
und fassen dies als reellen Vektorraum-Isomorphismus Q mit dem R4
auf. Wir führen die Vertauschungsrelationen k = i j = − j i und davon
10.2. POTENZREIHEN
105
abgeleitet k j = − i usw. ein. Wie in C definiert man zu q das konjugierte Element q̄ = a − b i −c j −d k.
Dann gilt q q̄ = a2 + b2 + c2 + d2 = |q|2 = k(a, b, c, d)T k22 .
Die Quaternionen bilden einen Schiefkörper, d. h. einen nichtkommutativen Körper, der mehrere isomorphe Bilder von C enthält. Mittels der
Quaternionen können andere wichtige mathematische Objekte dargestellt werden:
n
o
S3 = q ∈ Q |q| = 1
bildet bezüglich der Multiplikation eine Gruppe, diese ist isomorph zu
SU(2) und eine doppelte Überlagerung von SO(3). Dabei beachten wir,
dass S3 auf R4 wirkt, indem wir R4 mit der obigen Gleichung (10.1)
mit Q identifizieren und die Wirkung von S3 durch q ∗ ∈ S3 auf q ∈ Q
schreiben als
q ∗ (q) = q ∗ q q̄ ∗ .
Man rechnet leicht nach, dass
q ∗ (1) = 1,
(klar, da 1 mit allen anderen Quaternionen vertauscht, d. h. 1 ∈ C(S3 ))
und wir schreiben R4 = span[1] ⊕ span[i, j, k]. Die Aktion von S3 bildet den dreidimensionalen Raum span[i, j, k] in sich ab, die Aktion ist
orthogonal und hat als Kern [−1]. Damit ist
SO(3) ≡ S3 /h−1i.
Diese Identifikation nennen wir doppelte Überlagerung (d. h. eine stetige Abbildung S3 → SO(3), die surjektiv ist, und so dass jede Bild
genau zwei Urbilder hat) und diese ist in der Robotik für die numerische Berechnung von Bewegungen von Roboterarmen essentiell. Auch
in der Quantenmechanik spielen die eben angestellten Überlegungen eine wichtige Rolle. Eine sehr schöne Darstellung der modernen Theorie
der Quaternionen und ihre Anwendungen in verschiedenen Bereichen
der Mathematik findet man in Conway &Smith [5].
10.2
Potenzreihen
Wir kommen nun zur Definition Exponentialfunktion für Matrizen, bevor wir dies
in aller Allgemeinheit angehen, wollen wir ein Beispiel betrachten.
Beispiel 10.2.1
106
KAPITEL 10. BANACHALGEBREN
Wir betrachten die Matrix
A=
0 −1
1 0
und berechnen die formale Reihe
∞
X
tn
n=0
n!
An .
Dazu beachten wir, dass A2 = −1l und A3 = −A, A4 = 1l ist, also können
wir schreiben
Aj = Aj mod 4 .
Einsetzen der Reihe ergibt
∞
∞
2n
X
X
t2n+1
n t
n
(−1)
−
(−1)
∞
X
(2n)!
(2n + 1)!
tn n 
 n=0
n=0
A = X
∞
∞
X
n!

t2n+1
t2n
n=0
(−1)n
(−1)n
(2n + 1)!
(2n)!
n=0
n=0
cos(t) − sin(t)
=
.
sin(t) cos(t)






Definition 10.2.2 (Potenzreihe)
Es sei A eine Banachalgebra über K und an ∈ A für n ∈ N0 . Für x, x0 ∈ A
wird
∞
X
an (x − x0 )n
n=0
als Potenzreihe zum Entwicklungspunkt x0 ∈ A bezeichnet.
Lemma 10.2.3 (Konvergenzkreis)
P
n
Ist r > 0 in R, so dass ∞
n=0 kan kA r < ∞, dann konvergiert für kxkA < r
(oder allgemeiner für kx − x0 kA < r) die Reihe
∞
X
n=0
an x
n
oder auch
∞
X
n=0
an (x − x0 )n
10.2. POTENZREIHEN
107
und es gilt
∞
∞
∞
X
X
X
n
n
an x ≤
kan kA kxkA ≤
kan kA rn .
n=0
n=0
A
n=0
Beweis. Wir betrachten die Partialsumme
S(n) =
n
X
an xn .
k=0
Dann ist für n > m
n
n
X
X
j
kS(n) − S(m)k = aj x ≤
kaj xj kA
≤
j=m+1
n
X
A
j=m+1
n
X
kaj kA kxkjA ≤
j=m+1
kaj kA rj .
j=m+1
P∞
Aus der Konvergenz der Reihe n=0 |an |rn folgt, dass die Teilsummenfolge dieser
Folge eine Cauchyfolge bildet und daher zu ε > 0 ein N ∈ N existiert mit
n > m > N impliziert
n
X
kaj kA rj < ε.
j=m+1
Daher ist auch unsere Folge {S(n)}n∈N eine Cauchyfolge, aufgrund der Vollständigkeit von A ist diese Folge dann konvergent.
Definition 10.2.4 (Konvergenzradius)
Es sei
(
)
∞
X
ρ = sup r ≥ 0 kaj kA rj konvergiert. .
j=0
Die Zahl ρ nennt man Konvergenzradius der Potenzreihe.
Korollar 10.2.5
Für jedes 0 < r < ρ und jedes x0 ∈ A ist die Potenzreihe auf Br (x0 ) ⊂ A
absolut und gleichmäßig konvergent, wobei absolute Konvergenz die gleiche
Bedeutung wie in Definition 3.2.1 hat, nur dass der Betrag durch die Norm
ersetzt wird.
Beweis. Folgt sofort aus dem Lemma.
Wir wollen jetzt noch kurz angeben, wie der Konvergenzradius berechnet wird.
108
KAPITEL 10. BANACHALGEBREN
Satz 10.2.6 (Cauchy-Hadamard1 , Euler)
Für den Konvergenzradius einer Potenzreihe gilt
−1
p
n
ρ = lim sup kan k|A
,
n→∞
wobei die Inverse von 0 als ∞ und die Inverse von ∞ mit 0 angegeben werde.
Eine alternative Charakterisierung ergibt sich
kan k|A
,
n→∞ kan+1 k|A
ρ = lim
falls dieser Grenzwert existiert.
p
Beweis. Sei ρ−1 = lim supn→∞ n kan kA und kxkA < r < ρ. Für δ > 0 sei N1 ∈ N
so gewählt, dass
p
sup n kan kA < ρ−1 (1 + δ).
n≥N1
Dann ist für n > N1
∞
∞
∞
X
X
X
r n ρn
n
n
an x ≤
kan kA r ≤
kan kA n
ρ
j=n
j=n
j=n
A
n
∞ n r n X
X
p
r
n
n
kan kA ρ
≤
(1 + δ)
.
≤
ρ
ρ
j=n
Für hinreichend kleines δ > 0 ist (1 + δ) ρr < 1 und damit der Rest eine geometrische Reihe, also kann zu ε > 0 ein N > N1 gefunden werden, so dass der
∞
X
n
r
(1 + δ)
< ε.
ρ
j=N
n
Der Beweis für die entsprechende Behauptung für die andere Darstellung des
Konvergenzradius wird entsprechend auf die Quotientenregel zurückgeführt.
Definition 10.2.7 (Exponentialfunktion ex )
Es sei A eine Banachalgebra, dann definieren wir für x ∈ A die Exponenti-
1
Jacques Hadamard (8.12.1865–17.10.1963) beschäftigte sich vielen mathematischen Themen, vor allem aber die Funktionentheorie, wo er sich speziell mit Potenzreihen befasste.
10.2. POTENZREIHEN
109
alfunktion ex durch die Potenzreihe
∞
X
1 n
e =
x .
n!
n=0
x
Lemma 10.2.8 (Konvergenzradius der Exponentialfunktion)
Der Konvergenzradius dieser Reihe ist ρ = ∞, d. h. die Reihe konvergiert für
alle x ∈ A.
√
Beweis. Da limn→∞ n n! = ∞ folgt die Behauptung sofort.
Der Beweis von Satz 3.5.5 zeigt sofort den folgenden Satz.
Satz 10.2.9 (Funktionalgleichung)
Ist A eine Banachalgebra, so gilt für kommutierende x, y ∈ A, d. h. für x, y ∈
A mit xy = yx die Funktionalgleichung
ex+y = ex ey .
Dieser Satz impliziert sofort für Matrizen bzw. lineare Abbildungen A ∈ L(Rn ; Rn )
oder auch A ∈ L(X), X Banachraum
e(t+s)A = etA esA .
Daraus folgt nun der folgende zentrale Satz, der in der Theorie der linearen Differentialgleichungen sehr wichtig werden wird. Bevor wir diesen angeben, jedoch
noch zwei Lemmata.
Lemma 10.2.10 (Produktregel und Kurven in Banachalgebren)
Es sei A eine endlich-dimensionale Banachalgebra, γ1,2 : R → A : t 7→ x1,2 (t)
differenzierbare Kurven, dann ist
d
γ1 (t)γ2 (t)h = γ10 (t)hγ2 (t) + γ1 (t)γ20 (t)h.
dt
Beweis. Es funktioniert der übliche Beweis, vgl. Satz 5.1.7.
γ1 (t + h)γ2 (t + h) − γ1 (t)γ2 (t)
= γ1 (t + h)γ2 (t + h) − γ1 (t)γ2 (t + h) + γ1 (t)γ2 (t + h) − γ1 (t)γ2 (t)
= (γ1 (t + h) − γ1 (t))γ2 (t + h) + γ1 (t)(γ2 (t + h) − γ2 (t)).
Dividiert man nun durch h und betrachtet den Grenzwert h → 0, so ergibt sich
die Behauptung (unter Benutzung der Stetigkeit von γ2 ).
110
KAPITEL 10. BANACHALGEBREN
Lemma 10.2.11 (Konsequenzen der Funktionalgleichung)
−1
Es gilt xex = ex x und für invertierbares y ∈ A folgt yex y−1 = eyxy . Ferner
gilt e−x = (ex )−1 .
Beweis. Es gilt wegen der Stetigkeit der Multiplikation mit x und der gleichmäßigen Konvergenz der Reihe auf jeder Kugel Br (0)
!
∞
∞
∞
X
X
X
1
1
1
xn =
xn+1 =
xn x.
xex = x
n!
n!
n!
n=0
n=0
n=0
Das gleiche Argument zeigt für alle Partialsummen
!
n
n
X
X
1 j
1
−1
y
x y =
(yxy−1 )n .
j!
j!
j=0
j=0
Die Konvergenz ergibt das gewünschte Resultat. Zu guter Letzt folgt
ex e−x = e0 = 1l.
Satz 10.2.12 (Lineares Anfangswertproblem)
Es sei (X, k · kX ) ein Banachraum, A ∈ L(X). Dann ist für x0 ∈ X die
Kurve
x(t) = etA x0
differenzierbar und es gilt
ẋ = Ax.
Ferner gilt für jede differenzierbare Kurve
γ : R → X : γ(0) = x0
und
γ 0 (t) = Aγ(t)
die Gleichheit
γ(t) = x(t).
Beweis. Zunächst zeigen wir, dass t 7→ etA x0 differenzierbar ist. Dazu ist
1
1 (t+h)A
e
x0 − etA x0 = (ehA − 1l)etA x0 .
h
h
Nun ist
ke
hA
− 1lkL(X) = k
∞
X
hn
n=1
n!
n
A kL(X) ≤
∞
X
|h|n
n=1
n!
kAknL(X) ≤ |h|M
10.3. DER SATZ VON STONE-WEIERSTRASS
111
mit einer Konstanten M > 0. Genauer ist
hA
e
− 1l − hA =
∞
X
hn
n=2
und
n!
An
∞
X
1 hA
hn−1
(e − 1l) − A
≤
kAknL(X)
h
n!
L(X)
n=2
und dies konvergiert mit h gegen 0. Daher existiert der Grenzwert
1 (t+h)A
e
x0 − etA x0 = AetA x0 .
h→0 h
lim
Damit haben wir die Existenz einer Lösung des erwähnten Anfangswertproblems nachgewiesen. Der Eindeutigkeitsteil kopiert den Beweis von Korollar
5.3.10. Angenommen γ(t) ist eine Kurve mit
γ(0) = x0
und
γ̇(t) = Aγ(t),
so gilt
d −tA
e γ(t) = −Ae−tA γ(t) + e−tA Aγ(t) = −Ae−tA γ(t) + Ae−tA γ(t) = 0.
dt
Also ist e−tA γ(t) konstant und diese Konstante ist γ(0) = x0 . Also folgt
e−tA γ(t) = x0
oder
γ(t) = etA x0 .
10.3
Der Satz von Stone-Weierstraß
In diese Abschnitt wollen wir uns mit dem klassischen Approximationssatz von
Weierstraß befassen. Für den Beweis folgen wir zunächst einem Weg zum moderneren Satz von Stone-Weierstraß, aus dem wir dann den Satz von Weierstraß
herleiten werden. Beim Beweis des Satzes von Stone-Weierstraß folgen wir der
Darstellung von Brosowsi & Deutsch [4]. Wir beginnen mit einer wichtigen
Definition.
112
KAPITEL 10. BANACHALGEBREN
Definition 10.3.1 (Trennungseigenschaft)
Sei (X, d) ein metrischer Raum, F ⊂ C(X; R) sei eine Familie von Funktionen. Wir sagen die Familie F separiert Punkte, wenn zu je zwei Punkten
x1 , x2 ∈ X eine Funktion f = fx1 ,x2 ∈ F existiert mit f (x1 ) 6= f (x2 ).
Satz 10.3.2 (Stone2 -Weierstraß)
Sei (X, d) ein kompakter, metrischer Raum und A ⊂ C(X; R) eine Unteralgebra die folgenden Bedingungen genüge
SW1 1 ∈ A,
SW2 A separiert Punkte in X.
Dann ist A = C(X; R).
Wir werden den Beweis mittels mehrerer Lemmata führen.
Lemma 10.3.3 (Trennungssatz)
Es sei (X, d) ein kompakter, metrischer Raum, A eine Unteralgebra von
C(X; R), die Punkte trennt, 1 ∈ A. Dann gibt es zu jedem Punkt x0 ∈ X
und jeder Umgebung x0 ∈ U ⊂ X eine Umgebung x0 ∈ V ⊂ U , so dass zu
jedem ε > 0 eine Funktion f ∈ C(X; R) existiert mit
1. 0 ≤ f (x) ≤ 1,
2. für alle x ∈ V ist 0 < f (x) < ε,
3. für alle x ∈ X \ U ist 1 − ε < f (x) < 1.
Beweis.
1. Seien x0 ∈ X und U ⊂ X, wie im Satz gefordert, gegeben. Zu
x̄ ∈ X \ U existiert wegen der Trennungseigenschaft von A eine Funktion
gx̄ ∈ A mit
gx̄ (x0 ) 6= gx̄ (x̄).
Setze fx̄ = gx̄ − gx̄ (x0 ). Dann gilt
fx̄ (x0 ) = 0 und fx̄ (x̄) 6= 0.
2. Setze hx̄ =
2
1
(fx̄ )2 .
kfx̄ k2C(X;R)
(10.2)
Es gilt 0 ≤ hx̄ ≤ 1, hx̄ (x0 ) = 0 und hx̄ (x̄) > 0.
Marshall Harvey Stone (8.4.1903–9.1.1989) war ein amerikanischer Mathematiker, der aus
Chicago stammte. Seine wesentlichen Beiträge zur Mathematik waren auf den Gebieten der
Analysis, der Funktionalanalysis und Booleschen Algebra. Er lehrte in Harvard, an der University of Chicago und an der University of Massachusetts.
10.3. DER SATZ VON STONE-WEIERSTRASS
113
3. Setze für x̄ ∈ X \ U
n
o
Ux̄ = x ∈ X hx̄ (x) > 0 .
Dann folgt, dass
[
X \U ⊂
Ux̄ .
x̄∈X\U
Da X \ U kompakt ist, gibt es x̄1 , . . . , x̄s ∈ X \ U mit
X \U ⊂
s
[
Ux̄j .
j=1
P
Wir setzen für x ∈ X p̃(x) = 1s sj=1 hx̄j (x). Für p̃ finden wir 0 ≤ p̃ ≤ 1,
p̃(x0 ) = 0 und p̃(x̄) > 0 für alle x̄ ∈ X \ U .
4. Da X \ U kompakt ist, gibt es ein 1 > δ > 0, so dass p̃ ≥ δ auf X \ U . Wir
setzen
δ
V = x ∈ X p̃(x) <
.
2
Damit ist V ⊂ U .
5. Nach dem archimedischen Prinzip gibt es ein k0 ∈ N mit k0 > 1δ . Dann ist
die Menge
1
M = k∈Nk>
δ
nichtleer und eine Teilmenge von N, wegen der Wohlordnungseigenschaft
von N gibt es ein kleinstes Element k0 ∈ M . Dann ist
k0 − 1 ≤
1
< k0 .
δ
Damit folgt
k0 ≤
1+δ
< k0 .
δ
Wir schließen
1 ≤ k0 δ < 2.
6. Nun betrachten wir für n ∈ N die Funktionen
n
qn (x) = (1 − p̃n (x))k0 .
Es gilt für alle n ∈ N qn ∈ A, 0 ≤ qn ≤ 1 und qn (x0 ) = 1.
114
KAPITEL 10. BANACHALGEBREN
7. Nun gilt für x ∈ V
δ
<1
2
und mit der Bernoullischen Ungleichung Satz 2.3.5 erhalten wir
n
δ
n
qn (x) ≥ 1 − (k0 p̃(x)) ≥ 1 − k0
→ 1( für n → ∞)
2
k0 p̃(x) ≤ k0
gleichmäßig auf V .
8. Betrachten wir nun ein x ∈ X \ U , so erhalten wir
k0 p̃(x) ≥ k0 δ > 1.
Eine erneute Anwendung der Bernoullischen Ungleichung Satz 2.3.5 liefert
1
1
n
(1 − p̃n (x)k0 )(1 + k0 n p̃n (x))
n
(k0 p̃(x))
1
1
n
n
n
(1 − p̃n (x)k0 )(1 + p̃n )k0 =
(1 − p̃2n (x))k0
≤
n
n
(k0 p̃(x))
(k0 p̃(x))
1
→0
≤
(k0 δ)n
qn (x) =
k0n p̃n (x)
n
(1 − p̃n (x))k0 k0 n p̃n (x) ≤
für n → ∞ gleichmäßig auf X \ U . Damit haben wir 0 ≤ qn ≤ 1, qn < ε auf
X \ U für n hinreichend groß, qn > 1 − ε auf V für n hinreichend groß.
9. Setzen wir nun f = 1 − qn , so folgt das Ergebnis.
Lemma 10.3.4 (Trennung abgeschlossener Mengen)
Es sei (X, d), A wie im letzten Satz und A, B ⊂ X seien abgeschlossen und
disjunkt. Dann gibt es zu jedem ε > 0 ein p ∈ A mit
1. 0 ≤ p(x) ≤ 1 für alle x ∈ X,
2. 0 ≤ p(x) < ε für alle x ∈ A und
3. 1 − ε < p(x) ≤ 1 für alle x ∈ B.
Beweis. Setze U = X \ B. Dies ist offen und enthält A. Für jedes x0 ∈ A betrachten wir die nach Lemma 10.3.3 existierenden Umgebung Vx0 . Nun bilden die
Mengen {Vx0 }x0 ∈A eine offene Überdeckung von A. Da A als abgeschlossene Teilmenge der kompakten Menge X kompakt ist, kann man eine endliche Teilmenge
J ⊂ A auswählen, so dass
[
A⊂
V x0 .
x0 ∈J
10.3. DER SATZ VON STONE-WEIERSTRASS
115
Sei m = #(J) die Anzahl der Elemente in J. Sei ε > 0 gegeben. Dann existieren
für x0 ∈ J Funktionen px0 ∈ A mit px0 (x) < mε für x ∈ Vx0 und px0 (x) > 1 − mε
für x ∈ X \ U = B. Dann hat die Funktion
f (x) =
Y
px0 (x)
x0 ∈J
die folgenden Eigenschaften
1. f (x) <
ε
m
< ε für x ∈ A und
2. f (x) > (1− mε )m > 1−ε (unter Ausnutzung der Bernoullischen Ungleichung
Satz 2.3.5) für x ∈ B.
Beweis des Satzes von Stone-Weierstraß. Sei f ∈ C(X; R) und ε > 0 gegeben.
OBdA ist f ≥ 0, ansonsten betrachten wir f +kf kC(X;R) (beachte kf kC(X;R) ∈ A).
Weiterhin nehmen wir an ε < 31 . Wähle n ∈ N minimal mit (n − 1)ε ≥ kf kC(X;R) .
Wir definieren Mengen Aj , Bj für j = 0, . . . , n durch
1
1
Aj = x ∈ X f (x) ≤ (j − )ε , Bj = x ∈ X f (x) ≥ (j + )ε .
3
3
Dann gilt Aj ∩ Bj = ∅ und
∅ = A0 ⊂ A1 ⊂ · · · ⊂ An = X und B0 ⊃ B1 ⊃ · · · ⊃ Bn = ∅.
Dann gibt es nach Lemma 10.3.4 zu dem Paar Aj , Bj ein Element pj ∈ A mit
0 ≤ pj (x) ≤ 1 für alle x ∈ X und pj (x) < nε für x ∈ Aj und pj (x) > 1 − nε für
x ∈ Bj . Dann ist die Funktion
A 3 g(x) = ε
n
X
pj (x)
j=0
ein Element von A. Jedes x ∈ X ist für ein j ≥ 1 in Aj \ Aj−1 . Damit ergibt sich
4
1
(j − )ε < f (x) ≤ (j − )ε
3
3
(10.3)
und
ε
n
für i ≥ j. Für i ≤ j − 2 ist ein solches x in Bi . Wir erhalten
pi (x) <
1 ≥ pi (x) > 1 −
ε
.
n
(10.4)
(10.5)
116
KAPITEL 10. BANACHALGEBREN
Aus Gleichung (10.4) folgt dann
g(x) = ε
j−1
X
ps (x) + ε
s=0
n
X
ps (x)
s=j
≤ jε + ε(n − j + 1)
ε
n
≤ jε + ε2
1
< (j + )ε.
3
Mit Gleichung (10.5) folgern wir für j ≥ 2
g(x) ≥ ε
j−2
X
pj (x)
s=0
≥ (j − 1)ε(1 − ε/n)
> (j − 1)ε − ((j − 1)/n)ε2
> (j − 1)ε − ε2
4
> (j − )ε.
3
Für j = 1 gilt trivialerweise g(x) > (j − 43 )ε und damit hat man
1
4
|f (x) − g(x)| ≤ (j + )ε − (j − )ε < 2ε.
3
3
Eine Konsequenz ist der folgende Satz von Weierstraß.
Satz 10.3.5 (Weierstraß)
Es sei [a, b] ⊂ R kompakt, dann gibt es zu jeder stetigen Funktion f ∈
C([a, b], R) und jedem ε > 0 ein Polynom p mit
|f (x) − p(x)| < ε
für alle x ∈ [a, b].
Beweis. Sei A die von den Polynomen erzeugte Algebra. Dann ist 1 ∈ A, A
separiert Punkte und daher ist
Ā = C([a, b], R).
Das bedeutet zu jedem ε > 0 und jedem f ∈ C([a, b], R) gibt es ein Polynom p
mit d(f, p) < ε. Dies beweist genau die im Satz formulierte Behauptung.
10.4. FOURIERREIHEN
117
Definition 10.3.6 (Selbstadjungierte Algebren)
Es sei (X, d) ein kompakter metrischer Raum, A eine Algebra in dem Raum
der komplexwertigen stetigen Funktionen C(X; C). A heißt selbstadjungiert,
falls f ∈ A impliziert, dass f¯ ∈ A.
Satz 10.3.7 (Stone-Weierstraß im Komplexen)
Sei K eine kompakte Menge in einem metrischen Raum, A ⊂ C(K; C) eine
separierende, selbst-adjungierte Algebra mit 1K ∈ A. Dann ist A dicht in
C(K; C).
Beweis. Wir betrachten die Menge AR der reellwertigen Funktionen in A. Ist
f ∈ A, f = u + iv, so ist f¯ = u − iv ∈ A. Sind x1,2 zwei Punkte in K, so gibt
es ein f ∈ A mit f (x1 ) 6= f (x2 ). Also ist g(x) = f (x) − f (x1 ) ∈ A mit g(x1 ) = 0
und g(x2 ) 6= 0. Dann ist
h(x) = g(x)g(x) ∈ AR
mit h(x1 ) = 0 < h(x2 ). Damit ist AR separierend und 1 ∈ AR . Dann ist AR
dicht in C(K; R). Ebenso ist iAR dicht in C(X; iR). Dann ist aber A dicht in
C(K; C).
10.4
Fourierreihen
In diesem Abschnitt wollen wir uns mit einigen Aspekten der Fourieranalysis
beschäftigen. Eine Zielsetzung könnte sein, Töne in die Grundschwingungen zu
zerlegen. Allgemeiner wollen wir periodische Funktionen als Reihen von bestimmten einfachen periodischen Funktionen schreiben. Fourieranalysis tritt überall
dort auf, wo Schwingungen und Wellen auftreten, aber auch an ganz anderen
Stellen, sie erlaubt auch Lösungen für die Wärmeleitungsgleichung und andere
partielle Differentialgleichungen aufzuschreiben. Wir erinnern uns an den Begriff
der periodischen Funktion (Definition 4.3.14).
Im Folgenden interessieren wir uns für 2π-periodische Funktionen und bezeichen mit
n
o
C2π (R; R) = f : R → R ist stetig und 2π-periodisch .
Definition 10.4.1 (Trigonometrisches Polynom)
Wir betrachten Funktionen f : K → C der Form
f (x) =
n
X
k=−n
ck eikx ,
118
KAPITEL 10. BANACHALGEBREN
wobei x ∈ R, ck ∈ C. Dann heißt f ein trigonometrisches Polynom.
Offensichtlich sind Summen und Produkte trigonometrischer Polynome wieder
trigonometrische Polynome. Man kann mittels eikx = cos(kx)+i sin(kx) die Funktion f in der reellen Form
n
a0 X
+
f (x) =
(ak cos(kx) + bk sin(kx))
2
k=1
darstellen, wobei wir haben
a0 = 2c0 , ak = ck + c−k , bk = i(ck − c−k ).
Für n ∈
gilt
N ist einx die Ableitung der 2π-periodischen Funktion
1
2π
Zπ
e
inx
dx =
1
0
einx
in
und damit
für n = 0
für n = ±1, ±2, . . .
−π
Für ein trigonometrisches Polynom
n
X
f (x) =
ck eikx
k=−n
erhält man nach Multiplikation mit e−imx und Integration die Beziehung
Zπ
1
cm =
f (x)e−imx dx.
2π
−π
Ein trigonometrisches Polynom ist genau dann reell, wenn c−n = cn . Eine trigonometrische Reihe ist eine Reihe der Form
∞
X
cn einx .
n=−∞
Für integrierbare Funktionen f : [−π, π] → C (d. h. Real- und Imaginärteil sind
Riemann integrierbar) bezeichnen wir mit
Zπ
1
cn =
f (x)e−inx dx
2π
−π
den Fourierkoeffizienten von f und mit
F(f ) =
∞
X
cn einx
n=−∞
die Fourierreihe von f . Wieder wird sich die Frage stellen, inwieweit die Fourierreihe einer Funktion diese darstellt. Wir beginnen unseren Weg dies zu untersuchen mit folgender Beobachtung.
10.4. FOURIERREIHEN
119
Satz 10.4.2 (Approximation durch trigonometrische Polynome)
Ist f : [−π, π] → C stetig und periodisch mit Periode 2π, so gibt es zu ε > 0
ein trigonometrisches Polynom T (x) mit
|f (x) − T (x)| < ε für alle x ∈ R.
n
o
Beweis. Es gibt eine Abbildung p : R → S 1 = z ∈ C |z| = 1 durch
x 7→ eix .
Wir identifizieren auf diese Weise π mit −π, d. h. p(π) = p(−π) und eine stetige
periodische Funktion f wird durch
f˜(p(x)) = f (x)
mit einer stetigen Funktion f˜ : S 1 → C identifiziert. Wir betrachten die Algebra
C(S 1 ; C). Darin sei A die Algebra, die mittels der genannten Identifikation aus
der Menge der trigonometrischen Polynome entsteht. Wir nennen dies wieder die
Algebra der trigonometrischen Polynome. Dann gilt
1. 1 ∈ A.
2. A ist separierend.
3. A ist selbst-adjungiert.
Dann folgt die Behauptung sofort aus dem Satz 10.3.7 von Stone-Weierstraß im
Komplexen.
Als Korollar erhalten wir sofort den Identitätssatz für Fourierreihen.
Korollar 10.4.3 (Identitätssatz für Fourierreihen)
Sind f, g ∈ C2π (R; C) mit gleichen Fourierreihen F(f ) = F(g), so gilt f = g.
Beweis. Sei h = f − g. Wir betrachten für m ∈ Z das Integral
Zπ
−π
h(x)eimx dx =
Zπ
−π
f (x)eimx dx −
Zπ
g(x)eimx dx = 0.
−π
Daraus folgt, für jedes trigonometrische Polynom T gilt
Zπ
h(x)T (x) dx = 0.
−π
120
KAPITEL 10. BANACHALGEBREN
Nun finden wir eine Folge von trigonometrischen Polynomen {Tn }n∈N , die auf
gleichmäßig gegen h konvergiert. Dann gilt
Zπ
R
Zπ
2
|h(x)| dx =
−π
h(x)h(x) dx
−π
Zπ
h(x) lim Tn (x) dx
=
n→∞
−π
Zπ
=
h(x) lim Tn (x) dx
n→∞
−π
Zπ
=
lim
n→∞
−π
h(x)Tn (x) dx
= 0.
Damit ist |h|2 identisch Null und damit h, also f = g.
Korollar 10.4.4 (Darstellungssatz für Fourierreihen)
Ist f ∈ C2π (R; C) mit gleichmäßig konvergenter Fourierreihe
vergiert die Fourierreihe F(f ) gegen f .
Beweis. Sei
F(f ) =
∞
X
F(f ), so kon-
cn einx
n=−∞
die Fourierreihe von f . Da diese nach Voraussetzung gleichmäßig konvergiert,
stellt diese eine stetige 2π-periodische Funktion g dar, die die gleiche Fourierreihe
wie f hat, d. h. F(f ) = F(g). Also ist f = g.
Beispiel 10.4.5 (Sägezahnfunktion)
Wir betrachten f : [−π, π] → R : x 7→ |x| und setzen diese auf R stetig
und periodisch fort. Wir schreiben nun die Fourierkoeffizienten in der reellen
Form. f ist eine gerade Funktion, daher verschwinden alle Integrale der Form
Zπ
f (x) sin(nx) dx
−π
10.4. FOURIERREIHEN
121
und alle Koeffizienten bk sind 0. Die Koeffizienten ak berechnen sich wie folgt
1
ak =
π
Zπ
2
|x| cos(kx) dx =
π
−π
Zπ
x cos(kx) dx.
0
Damit ergibt sich a0 = π und
ak = −
2 1
(1 − (−1)k ).
2
πk
Die Fourierreihe ergibt sich zu
F(f ) = π2 − π4
∞
X
cos(2k + 1)x
k=0
(2k + 1)2
!
.
Diese Reihe ist gleichmäßig konvergent und konvergiert also gegen |x|. Für
x = 0 ergibt sich
∞
X
1
π2
= .
(2k + 1)2
8
k=1
Wir hatten in Aufgabe 6.6.8 die Funktion Dn definiert.
Definition 10.4.6 (Dirichlet-Kern)
Die Funktion
n
1 X ikx
Dn (x) =
e
2π k=−n
heißt Dirichlet-Kern n-ten Grades.
Man erhält aus der Darstellung für die Teilsummenfolge für geometrische Reihen
die Darstellung


1 sin n + 12


für x ∈
/ 2π Z
2π
sin x2
Dn (x) =
.

1


(2n + 1)
für x ∈ 2π Z
2π
Definition 10.4.7 (Stückweise stetig)
Es sei [a, b] ein Intervall, f : [a, b] → R heißt stückweise stetig wenn es eine
Zerlegung Z von [a, b] gibt, so dass f stetig auf [a, b]\Z ist und in den inneren
Zerlegungspunkten die linken und rechten Grenzwerte von f existieren. An
den Randpunkten verlangen wir die Existenz der einseitigen Grenzwerte.
122
KAPITEL 10. BANACHALGEBREN
Satz 10.4.8 (Riemann-Lebesgue)
Ist eine Funktion f : [a, b] → R stückweise stetig, so gilt
Zb
lim
f (x) sin(kx) dx = 0.
k→∞
a
Beweis. Wir hatten die Aussage für stetig differenzierbares f gezeigt. Ist f stetig
auf [a, b], so gibt es (Satz von Weierstraß 10.3.5) eine Folge von Polynomen pn ,
die gleichmäßig gegen f konvergiert. Insbesondere gibt es ein Polynom p, so dass
ε
. Zu p gibt es ein K ∈ R mit k > K
für alle x ∈ [a, b] gilt |f (x) − p(x)| < 2(b−a)
impliziert (Satz von Riemann 6.6.7)
Zb
ε
p(x) sin(kx) dx < .
2
a
Dann ist
b
b
b
Z
Z
Z
f (x) sin(kx) dx ≤ (f (x) − p(x)) sin(kx) dx + p(x) sin(kx) dx
a
a
Zb
≤
a
|f (x) − p(x)| |sin(kx)| dx +
ε
2
a
≤ ε.
Im allgemeinen Fall der stückweise stetigen Funktion benutzen wir diesen Beweisschritt auf jedem Intervall [ζi , ζi+1 ].
Lemma 10.4.9 (Dirichlet)
1. Dn ist gerade.
2. Für alle n ∈ N0 ist
Zπ
Dn (x) dx = 1.
−π
3. Ist f auf [−π, π] stückweise stetig, auf Intervallen (0, ε0 ), (−ε0 , 0) differenzierbar und existieren die Grenzwerte
f+ =
lim f (x) und f− =
x→0,x>0
lim f (x),
x→0,x<0
10.4. FOURIERREIHEN
123
so gilt
Zπ
lim
n→∞
−π
f (x)Dn (x) dx =
f+ + f−
.
2
Beweis. Die ersten beiden Aussagen sind offensichtlich.
Wir kommen zur dritten Aussage. Aus
Zπ
Dn (x) dx = 1
−π
und der Geradheit von Dn ergibt sich
Zπ
f + Dn (x) dx =
f+
.
2
0
Damit ist
Zπ
f+
f (x)Dn (x) dx −
=
2
0
Zπ
(f (x) − f+ )Dn (x) dx.
0
Wir haben eine Darstellung von Dn in der oben genannten Übungsaufgabe hergeleitet:
!
n
n
1 X ikx
1 sin((n + 12 )x)
1 1 X
cos(kx) =
Dn (x) =
e =
+
.
2π k=−n
π 2 k=1
π 2 sin( 21 x)
Setzen wir dies in das obige Integral ein, so erhalten wir einen Ausdruck der Form
1
π
Zπ
0
f (x) − f+
1
sin((n + )x) dx =
1
2
2 sin( 2 x)
Zπ
0
f (x) − f+
x
1
sin((n + )x) dx.
1
x
2
2π sin( 2 x)
Auf dieses Integral wenden wir das Riemannsche Lemma an, dazu benötigen wir
zwei Überlegungen. Die Funktion
f (x) − f+
x
x
2π sin( 12 x)
ist beschränkt, dazu betrachten wir den Punkt x = 0, dort haben wir einen
Grenzwert der Form 00 , die Anwendung des Satzes von l’Hospital 5.6.2 ergibt die
Beschränktheit. Die Funktion ist offensichtlich auf [0, π] stückweise stetig und
damit folgt mit dem Satz von Riemann-Lebesgue die Behauptung.
124
KAPITEL 10. BANACHALGEBREN
Satz 10.4.10 (Fourierreihe)
Es sei f : R → R 2π-periodisch und auf jedem Kompaktum stückweise stetig.
Es sei x ∈ [−π, π] und f besitze in x ∈ [−π, π] eine linksseitige und eine
rechtsseitige Ableitung. Dann gilt:
1. Ist f in x stetig, so konvergiert die Fourierreihe von f gegen f (x).
2. Ist f in x unstetig, so konvergiert die Reihe gegen das arithmetische
Mittel der linksseitigen und rechtsseitigen Grenzwerte von f .
Beweis. Die n-te Partialsumme Fn (f ) der Fourierreihe F(f ) von f hat die Darstellung
Zπ
n
X
1
Fn(f )(x) = π f (y) eik(x−y) dy.
k=−n
−π
Dies ist gerade
Zπ
Zπ
f (y)Dn (x − y) dy =
−π
f (x + w)Dn (w) dw.
−π
Nun wenden wir das Lemma von Dirichlet an und erhalten das Resultat.
Kapitel 11
Differentialgleichungen
In diesem Abschnitt wollen wir Differentialgleichungen, speziell einige einfache
Aspekte diskutieren. Einen genaueren Einblick gewährt eine Vorlesung über
gewöhnliche Differentialgleichungen, die nach dem Analysis Kurs angeboten
werden wird. Differentialgleichungen spielen bei der Anwendung der
Mathematik in anderen Wissenschaften eine dominante Rolle, auch die
Begründer der Analysis, wie Newton, die Bernoullis, Euler und viele andere
beschäftigten sich mit Differentialgleichungen. Zur Motivation möchte ich einige
Fragen aufwerfen, die gestellt werden und deren Antwort mittels
Differentialgleichungen gefunden werden kann. Danach wollen wir die
notwendigen Techniken zum Auffinden der Antwort bereitstellen.
Inhalt
11.1 Motivation
. . . . . . . . . . . . . . . . . . . . . . . . . 125
11.2 Matrixexponentialfunktion . . . . . . . . . . . . . . . . 130
11.3 Ein allgemeiner Existenzsatz . . . . . . . . . . . . . . . 136
11.4 Randwertprobleme
. . . . . . . . . . . . . . . . . . . . 140
11.4.1 Klassifizierung . . . . . . . . . . . . . . . . . . . . . . 140
11.1
Motivation
Differentialgleichungen sind Gleichungen für uns a-priori unbekannter Funktionen, wobei wir eine Relation zwischen dieser Funktion und ihren Ableitungen
kennen. Ziel ist es die Funktion zu bestimmen. Dies ist keine formale Definition
und wir werden den Begriff der Differentialgleichung auch nicht formal definieren.
Durch Umgang werden wir Klassen von solchen Gleichungen kennenlernen und
gleichzeitig werden wir eine Fülle von Anwendungen sehen, die in der Sprache
der Differentialgleichungen formuliert werden.
125
126
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Bevor wir die Diskussion formalisieren ein Problem der Politik: In Deutschland
spielt die Diskussion um die Entwicklung der Konjunktur immer wieder eine
wichtige Rolle. Eine Frage, die immer wieder in der Diskussion auftaucht, ist
die, ob man Abschwächungen der Konjunktur durch Steuersenkungen verhindern
kann. Dabei wird der Effekt, je nach politischer Couleur, unterschiedlich bewertet:
Typische Argumente sind (oder könnten sein):
1. Steuersenkung vermindert die Staatseinnahmen, dies führt zu höheren Kreditaufnahmen, erhöht damit den Zinssatz und dieses behindert die wirtschaftliche Entwicklung.
2. Eine Steuersenkung stärkt die private Kaufkraft, vermehrt die Wirtschaftstätigkeit, dies vermehrt die Steuereinnahmen und befördert dadurch insgesamt
die Konjunktur.
Welches der beiden Argumente ist wahr? Wie entscheidet man eine solche Frage?
Das folgende Diagramm zeigt, wie eine Steuersenkung sich (vielleicht) auf einige
wirtschaftliche Parameter auswirken könnte und dass die Antwort auf diese Frage zwangsläufig zu einem hochkomplexen mathematischen Modell führt, dessen
Analyse unsere momentanen Fähigkeiten beträchtlich übersteigt.
Steuersenkung
private Kredite
Staatsverschuldung
Steueraufkommen
private
kraft
Zinssatz
öffentlicher Kreditbedarf
staatliche Investitionen
Inflation
Kauf-
Wirtschaftswachstum
Abbildung 11.1: Darstellung von einigen Abhängigkeiten in einem ökonomischen Modell, grüne Kästchen lassen in diesem Bereich eine Verbesserung, rote
Kästchen eine Verschlechterung zu erwarten, bei grauen ist eine direkte Entscheidung nur durch genauere Rechnung möglich.
11.1. MOTIVATION
127
Außer Acht bleiben dabei Kenngrößen wie Kindergeld, Lebenserwartung, Rentenversicherung, Sozialversicherungen, Außenhandel, Außenwert der Währung,
Bildungsausgaben, Auslandsreisen. Man kann versuchen, diese Beziehungen durch
Differentialgleichungen zu erfassen und dann jenseits von Partikularinteressen
richtige Antworten zu finden.
Da dies im Moment vielleicht doch zu ambitioniert erscheint, erstmal einige einfachere Beispiele: Wachstumpsrozesse: radioaktiver Zerfall, Populationsdynamik, Räuber-Beute-Modelle, Bewegungsgleichungen von Himmelskörpern, Bestimmung der Flugbahnen von Raumsonden etc. Beginnen wir mit einem einfachen Wachstumsmodell, auf einer unendlichen Wiese vermehrt sich eine Population von Hasen, die Zunahme ist proportional zur gegenwärtigen Population, die
ich mit h(t) bezeichnen möchte. Der Proportionalitätsfaktor sei mit α bezeichnet
und wir machen die unrealistische Annahme, dass h(t) ∈ R und t → h(t) differenzierbar sei. t steht dabei für die Zeit, wir wollen Ableitung nach der Zeit mit
einem Punkt bezeichnen, also
ḣ = h0 (t).
Dann ist die Änderung unserer Population ḣ und dies ist nach unserer Annahme
proportional zu h, also
ḣ = αh.
Nehmen wir noch an, zum Zeitpunkt t = 0 gäbe es h0 Hasen, so lautet aufgrund
von Satz 5.3.10 die Entwicklung der Hasenpopulation
h(t) = h0 eαt .
Das Wachstum zeichnet sich durch eine konstante Verdoppelungsrate aus und ist
unbegrenzt. Um diese unrealistische Aussage zu korrigieren, gehen wir nun von
einer begrenzten Wiese mit einer maximalen Kapazität von K ∈ R Hasen aus.
Das Wachstum sei für Populationen weit von dieser Grenze entfernt immer noch
proportional zu h, die maximale Aufnahmefähigkeit wird dann durch einen Term
der Form K − h modelliert und wir erhalten die Gleichung
ḣ = αh(K − h) = αhK − αh2 .
Nun ist etwas schwieriger Lösungen zu finden. Wir lernen an dieser Gleichung die
erste elementare Lösungsmethode für Differentialgleichungen kennen. Mit β =
αK und S = α (Stressfaktor) erhalten wir
dh
= βh − Sh2 .
dt
(11.1)
dh
1
= 1.
dt βh − Sh2
(11.2)
Ist βh − Sh2 6= 0 erhält man
128
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Integration dieser Gleichung von 0 bis t liefert
Zt
dh(s)
ds
=
dt βh(s) − Sh(s)2
0
Zt
ds = t.
(11.3)
0
Ist βh − Sh2 6= 0, so ist auch h0 6= 0 und die linke Seite ergibt mit der Substitutionsregel
Zh
dz
.
βz − Sz 2
h0
Dies wird mittels einer Partialbruchzerlegung integriert. Es ergibt sich (wir führen
diese Rechnung einmal sehr ausführlich durch) mit K = β/S
1
β
Zh 1
1
+
z K −z
1
dz =
β
log
|h|
|h − K|
− log
|h0 |
|h0 − K|
.
h0
Da die Größe der Population jeweils nicht negativ ist, kann man h > 0, h0 > 0
annehmen. Daher hat man
h|h0 − K|
log
= β(t − t0 ).
(11.4)
|h − K|h0
Einsetzen und Auflösen nach h bringt uns die endgültige Gestalt der Lösung
h(h0 − K)
= eβt .
(h − K)h0
(11.5)
Hier beachtet man noch, dass die Annahme, dass h(s) 6= K für alle s ∈ [0, t]
dazu führt, dass h − K und h0 − K gleiches Vorzeichen haben. Daraus erhält man
h(t) =
eβt h0
(h(t) − K).
h0 − K
Bezeichnet man den hier aufgetretenen Bruch mit B so ergibt sich
h(1 − B) = −BK
und damit
h=
BK
.
(B − 1)
Einsetzen ergibt
h(t) = K
eβt h0
.
eβt h0 − h0 + K
11.1. MOTIVATION
129
Multiplikation mit e−β(t) führt auf
h(t) =
Kh0
.
h0 − e−βt (h0 − K)
(11.6)
Wie erwartet liefert das Einsetzen von t = 0 den Wert h0 . Um das Verhalten von
h für t → ∞ zu studieren, muss man sich nur anschauen, was der Nenner macht.
Er konvergiert gegen h0 und insgesamt ergibt sich der Wert K.
Wir wollen noch die Frage stellen, woher kommen die Lösungen für t < t0 , sozusagen fragen wir nach der Vergangenheit. Ist h0 ∈ (0, K), so existiert die Lösung
für alle Zeiten t ∈ R und konvergiert für t → −∞ gegen 0. Ist jedoch h0 > K,
so würde formal die Grenzwertbetrachtung t → −∞ den gleichen Wert ergeben,
dies jedoch erscheint absurd. Man überlegt sich, dass der Nenner für ein t < t0
eine Nullstelle t1 (h0 ) hat und demzufolge die Lösung nur auf dem Intervall (t1 , ∞)
existiert.
Die hier behandelte Gleichung wird oft logistische Gleichung genannt. Sie geht
auf den belgischen Mathematiker Verhulst1 zurück.
Eine wichtige Veränderung bringt die Einführung von Füchsen, deren Anzahl
mit f (t) bezeichnet werde. Die Veränderung der Zahl der Füchse ist proportional
zur Zahl der Hasen und wirkt sich wiederum auf die Zahl der Hasen aus. Als
Gleichung erhält man dann unter der Annahme, dass die Anzahl der gefressenen
Hasen proportional zur Begegnungshäufigkeit von Hasen und Füchsen ist (Mit
Proportionalitätsfaktor F > 0).
ḣ = βh − Sh2 − F hf
f˙ = β 0 f h − mf,
wobei m die Sterberate der Füchse ist. Dieses System von zwei Differentialgleichungen ist nach Lotka2 und Volterra3 als Lotka-Volterra-System bezeichnet. Hier
kann man durch einfaches Argumentieren die langfristige Verhalten nicht vorhersagen: Eine Vermehrung der Hasen vermehrt die Füchse und dies verringert den
Hasenbestand, hier ist eine genaue Rechnung gefragt. Ein Unterschied zum Steuerproblem ist der zeitliche Horizont, während wir bei Hasen und Füchsen das
langfristige Verhalten (Gleichgewicht, periodischen Populationsentwicklung oder
Aussterben) verstehen wollen, was typische Aussagen eines analytischen Zugangs
sind, wollen wir bei der Steuer die sofortige Auswirkung kennenlernen, die Gültigkeit der Modelle ist zeitlich sehr begrenzt und hängt von so vielen Rahmenbe1
Pierre-Francois Verhulst (28.10.1804–15.2.1849) war Professor an der Freien Universität in
Brüssel und später an der königlichen Militärschule. Seine Arbeiten zum Bevölkerungswachstum
machten ihn zum Begründer der Bevölkerungsstatistik.
2
Alfred James Lotka (2.3.1880–5.12.1949) wurde in Lwow geboren, ging in Frankreich zur
Schule und studierte in Birmingham in England. Später arbeitete er bei der Metropolitan Live
Insurance in USA. Im Jahr 1926 publizierte er die Arbeit, in der die nach ihm benannten
Gleichungen vorgestellt wurden.
3
Vito Volterra (3.51860–11.10.1940)
130
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
dingungen ab, dass nur eine Analyse mit Rechnern uns einem Hinweis auf die
richtige Politik geben kann.
Die Gleichgewichtsbedingung für unser obiges Lotka-Volterra-System
h=
m
β0
und f = Fβ − FmS
. Typische Fragen sind z. B., ob diese Ruhelage stabil ist in dem
β0
Sinn, dass bei einer leichten Störung aus dem Gleichgewicht die von Lösungen
vorhergesagten Populationen in der Nähe der Gleichgewichtspopulationen befinden. Eine genauere Analyse kommt später.
11.2
Lineare Differentialgleichungen und die Matrixexponentialfunktion
Wir haben in der Definition 10.2.7 gesehen, wie wir etA für Elemente aus Banachalgebren definieren und im Lemma 10.2.8 gesehen, dass dies für jedes Element
tatsächlich definiert ist. Insofern können wir dies auch für reelle und komplexe
n × n-Matrizen oder auch für Elemente A ∈ L(Rn ) oder L(Cn ) definieren.
Wir kommen zur konkreten Berechnung der Exponentialfunktion für Matrizen. Wir beschränken uns dabei auf den komplexen Fall, weil dieser etwas einfacher ist, weisen aber darauf hin, welche zusätzlichen Probleme der reelle Fall mit
sich bringt.
Lemma 11.2.1 (Matrixexponentialfunktion für Diagonalmatrizen)
Ist D eine reelle oder komplexe Diagonalmatrix, d. h. sind alle dij = 0 falls
i 6= j, so ist


λ1 0 . . . . . . 0
 0 λ2 0 . . . 0 


..


.
0 
D= 0 0


 0 . . . 0 ... 0 
0 . . . . . . 0 λn
wir schreiben dafür
D = diag (λ1 , . . . , λn ).
Dann ist
etD = diag (etλ1 , . . . , etλn ).
Beweis. Folgt sofort aus den Regeln der Matrixmultiplikation.
Für die allgemeine lineare Gleichung machen wir einen Ausflug in die Lineare
Algebra. Sei A : Rn → Rn eine lineare Abbildung mit zugehöriger Matrix A
11.2. MATRIXEXPONENTIALFUNKTION
131
(diese wird durch die Wahl einer Basis bestimmt). Wir gehen immer von der
kanonischen Basis aus und identifizieren auf diese Weise die lineare Abbildung
mit der Matrix. Eine Zahl λ ∈ C heißt Eigenwert von A, wenn es einen Vektor
u ∈ Cn gibt mit
Au = λu.
Dieser Vektor u wird Eigenvektor von A genannt. Natürlich müssen wir auch
bei reellen Matrizen komplexe Eigenwerte und Eigenvektoren zulassen. Deshalb
arbeiten wir im komplexen Raum Cn . Die Eigenwerte sind Lösungen der charakteristischen Gleichung
det(A − λ1l) = 0.
(11.7)
Wegen des Fundamentalsatzes der Algebra gibt es (mit Vielfachheiten gerechnet)
genau n Wurzeln dieser Gleichung. Jede Wurzel von (11.7) ist auch Eigenwert,
jedoch gibt es im allgemeinen weniger als n Eigenvektoren. Sei λ ein Eigenwert,
so ist
Kλ = ker(A − λ1l)
ein A-invarianter Unterraum, d. h. AKλ ⊂ Kλ , der Eigenraum von A zum Eigenwert λ, der enthalten ist im verallgemeinerten Eigenraum, welchen wir durch
Eλ = {u ∈ Cn | ∃k ∈ N mit (A − λ1l)k u = 0}
definieren. Auch der verallgemeinerte Eigenraum Eλ zum Eigenwert λ ist invariant unter der Abbildung A (nachrechnen!). Eine weitere Zerlegung in invariante
Unterräume ist möglich. Dazu betrachtet man den minimalen Wert k0 , so dass
ker(A − λ1l)k0 = Eλ ist. So eine Zahl existiert immer, denn
ker(A − λ1l)k ⊃ ker(A − λ)k−1 .
Aufgrund der endlichen Dimension, muss diese Folge stationär werden. In Eλ
existiert eine Basis B, welches die Vereinigung von m Mengen H1 , . . . , Hm ist,
wobei jedes Hk die Form
Hk = {uk,1 , . . . , uk,rk }
hat mit
(A − λ1l)uk,i+1 = uk,i , i = 1, . . . , rk , (A − λ1l)uk,1 = 0.
Die Einschränkung von A auf Eλ hat in der Basis B dann die Gestalt


B1 0 . . . . . . 0
 0 B2 0 . . . 0 


 .. . . . . . .
..  ,
 .
.
.
. . 


 0 ... 0
0 
0 . . . . . . 0 Bm
(11.8)
132
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
wobei jeder dieser rk × rk

λk 1
0

 0 λk 1
 .
 . ... ...
 .
Bk =  .
...
 ..

 ..
 .
0 ... ...
Blocks Bk die einfache Form

... ... 0

..
. 0 
0

. . . . . . .. 
. 
 oder Bk = diag (λk , . . . , λk )
... ...
0 


..
. λ 1 
. . . 0 λk
(11.9)
hat. Damit haben wir die komplexe Jordansche Normalform einer Matrix erhalten. In der reellen Jordanschen Normalform hat man auch eine Darstellung in
Blöcken wie in (11.8), jedoch sehen die i. a. Blocks anders aus. Ist λ reell so bleibt
die Form (11.9) erhalten. Für komplexe Eigenwerte λ = eiα , ergibt sich statt
(11.9) die Form


cos α − sin α
1
0
... ... ...
0
 sin α cos α

0
1
0 ... ...
0


 0

0
cos
α
−
sin
α
1
0
.
.
.
0


 0

0
sin α cos α
0
1
...
0


..
..
 ..

...
...
... ...
...
 . (11.10)
.
.
.
Bk = 
 .

.
.
.
 ..

..
.. ..
1
0


 .

.
.
.. ..
 ..

0
1


 0
...
...
...
. . . 0 cos α − sin α 
0
...
...
...
. . . 0 sin α cos α
A kann durch eine Ähnlichkeitstransformation in die Jordansche Normalform
gebracht werden. Sei J die Jordansche Normalform von A und C die Transformationsmatrix, also J = CAC −1 . Wir haben bereits in Lemma 10.2.11 gesehen,
wie sich die Exponentialfunktion unter Konjugation verhält. Wir betrachten nun
das lineare Anfangwertproblem (lineares AWP)
u̇ = Au
u(0) = u0 .
Wir können nun die Lösung u(t, u0 ) des linearen AWP gewinnen, indem wir A in
die Jordansche Normalform überführen, für diese dann die Gleichung lösen und
zurücktransformieren. Wir erhalten mit v0 = Cu0 und v(t, v0 ) = Cu(t, u0 ) das
lineare AWP für v in der Form
v̇ = C u̇ = CAu = CAC −1 v = Jv
v(0) = v0 .
11.2. MATRIXEXPONENTIALFUNKTION
133
Nun ergibt sich aufgrund des allgemeinen Satzes über die eindeutige Lösbarkeit
linearer AWPe und dem Lemma 10.2.11
−1
v(t) = etJ v0 = etCAC v0 = CetA C −1 v0 = CetA u0 .
Damit ist
u(t) = C −1 v(t) = C −1 etJ Cu0 .
Zur allgemeinen Lösung linearer Anfangswertprobleme müssen wir noch etJ ausrechnen. Wir gehen von der Gestalt (11.8) aus. Natürlich gilt für eine Matrix J
in Blockdiagonalgestalt
J = diag(B1 , . . . , Bm ),
dass die Matrixexponentialfunktion auch Blockdiagonalgestalt annimmt, also
etJ = diag(etB1 , . . . , etBm ).
Ist B ein Block der Länge 1, also B = (λ), so ist natürlich etB = eλt . Ist B ein
Block der Länge r > 1 und der zugehörige Eigenwert λ reell, so ergibt sich die
Exponentialreihe aus folgenden Betrachtungen.
Definition 11.2.2 (nilpotent)
Eine Matrix N heißt nilpotent, wenn es ein r ∈ N gibt mit N r = 0.
Lemma 11.2.3 (Jordanblöcke als Summen D + N )
Ein Block der Gestalt (11.9) ist die Summe einer Diagonalmatrix D und einer
nilpotenten Matrix N .
Beweis. Natürlich ist D = diag(λ, . . . , λ). Übrig bleibt die r × r Matrix


0 1
0 ... ... 0


...
 0 0

1
0
0
 .

 . . . . . . . . . . . . . .. 
. 
 .
N = .
(11.11)
 oder N = 0.
.. .. ..
 ..

.
.
.
0


 ..

..
 .
. 0 1 
0 ... ... ... 0 0
Eine einfache Rechnung zeigt für den ersten Fall, dass N r = 0 ist. Damit ist N
nilpotent.
134
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Bemerkung 11.2.4 (D + N allgemein)
Genauer gilt, dass jede Matrix A Summe einer diagonalisierbaren und einer
nilpotenten Matrix ist. Unser Beweis zeigt dies zumindest für reelle Matrizen
mit ausschließlich reellen Eigenwerten.
Lemma 11.2.5 (Matrixexponentialfunktion von Jordanblöcken)
Die Matrixexponentialfunktion etB eines Jordan Blocks (mit nichttrivialem
nilpotenten Anteil) der Länge r zum Eigenwert λ hat die Gestalt


tr−1
1 t t2 /2 t3 /6 . . . (r−1)!

.. 
... ...
 0 1
t
. 


 .. . .

.
.
.
3
.
.
.
.
.
.
. t /6 

etB = eλt  ..
(11.12)

..
..
..
 ..

2
.
.
.
t /2 

 .

.
..
 ..
1
t 
0 ... ... ...
0
1
Beweis. Es gilt DN = N D und daher mit dem Satz 10.2.9
etB = et(D+N ) = etD etN .
Nun ergibt etD = eλt 1l (und damit hat man den Fall mit N = 0 geklärt) und da
N nilpotent ist, hat man
etN = 1l + tN +
tr−1
t2 2
N + ··· +
N r−1 .
2
(r − 1)!
Einsetzen von N ergibt die behauptete Formel.
Bisher haben wir Differentialgleichungen betrachtet, deren rechte Seiten nicht von
t abhängig sind. Solche Gleichungen werden als autonom bezeichnet. Der einfachste Fall einer nichtautonomen Gleichung ist ein AWP der folgenden Struktur
u̇ = Au + f (t)
u(t0 ) = u0 .
Wir werden dies später nochmal etwas allgemeiner formulieren.
Bemerkung 11.2.6 (autonom versus nicht autonom)
Ein wesentlicher Unterschied zwischen autonomen und nichtautonomen Gleichungen besteht darin, dass bei einer autonomen Gleichung eine beliebige Verschiebung um t0 eine Lösung der Gleichung in eine andere Lösung
überführt, d. h. ist u(t) eine Lösung einer autonomen Gleichung, so ist für
jedes t0 > 0 die Funktion u(t + t0 ) wieder eine Lösung (nachprüfen!!) und
damit macht es keinen Unterschied, ob wir Anfangswertprobleme mit t0 = 0
11.2. MATRIXEXPONENTIALFUNKTION
135
oder mit einem beliebigen Anfangszeitpunkt lösen. Bei nichtautonomen Gleichung hat man keine solche Verschiebungsinvarianz, daher ist es wichtig, den
Anfangszeitpunkt zu dokumentieren.
Definition 11.2.7 (Notation für Lösungen von AWP)
Es sei (X, k · kX ) ein Banachraum, A ∈ L(X) sei eine stetige lineare Abbildung, f : R → X sei stetig. Mit u(t, t0 , u0 ) bezeichnen wir eine Lösung des
Anfangswertproblems
u̇ = Au + f (t)
u(t0 ) = u0 .
Satz 11.2.8 (Variation der Konstanten)
Ist f auf dem Intervall [a, b] stetig, so hat für t0 ∈ [a, b] und t ∈ [a, b] das
nichtautonome Anfangswertproblem (oder auch inhomogene lineare Anfangswertproblem)
u̇ = Au + f (t)
u(t0 ) = u0
genau eine Lösung u(t, t0 , u0 ), welche durch
(t−t0 )A
u(t, t0 , u0 ) = e
Zt
u0 +
e(t−s)A f (s) ds
t0
gegeben ist. Die Lösung ist eindeutig.
Beweis. Wir prüfen zunächst nach, dass es sich um eine Lösung handelt, also
betrachten wir


Zt
d  (t−t0 )A
e
u0 + e(t−s)A f (s) ds .
u̇(t, t0 , u0 ) =
dt
t0
Dies ergibt (beachte die Ableitung nach der oberen Grenze eines Integrales ergibt
den Integranden an dieser Stelle) unter Verwendung der Differentiationsregeln für
parameterabhängige Integrale
Ae
(t−t0 )A
0
Zt
u0 + e f (t) + A
t0
e(t−s)A f (s) ds.
136
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Man beachte, dass bei Differentiation nach dem Parameter die Integralgrenze
unabhängig von der Variablen war, nach der differenziert wurde. Um diese kleine
Lücke zu schließen schreiben wir


Zt
Zt
d  tA
d
e(t−s)A f (s) ds =
e−sA f (s) ds .
e
dt
dt
t0
t0
Nun kann man einfach nach der Produktregel differenzieren. Damit ist die angegebene Funktion eine Lösung des inhomogenen linearen Anfangswertproblems.
Wir kommen zur Eindeutigkeit: Sind u1 , u2 zwei Lösungen, so betrachten wir
die Differenz und erhalten
u̇1 − u̇2 = Au1 − Au2 = A(u1 − u2 )
und
u1 (t0 , t0 , u0 ) = u2 (t0 , t0 , u0 ) = u0 .
Damit folgt aber aus Satz 10.2.12 u1 (t, t0 , u0 ) = u2 (t, t0 , u0 ).
Bemerkung 11.2.9 (Lösungsraum)
Betrachtet man nur die Differentialgleichung auf dem Raum (Rn , k · k), so
kann man das Lösungsverhalten charakterisieren: Die homogene Gleichung
u̇ = Au
hat einen n-dimensionalen linearen Raum von Lösungen in C(R; Rn ), diese
erhält man aus einer Basis {uk }1≤k≤n mittels etA uk , während das nichthomogene Problem durch Auffinden einer speziellen
U(t) einen nPn Lösung
tA
dimensionalen affinen Raum der Form U(t) + k=1 λk e uk .
Man kann ganz ähnliche Sätze auch noch beweisen, wenn A von der Zeit abhängt,
darauf wollen wir aber jetzt nicht eingehen.
11.3
Ein allgemeiner Existenzsatz
Es sei (X, k·kX ) ein Banachraum. Wir betrachten eine Abbildung v : R ×X → X
und damit die Differentialgleichung u̇ = v(t, u).
Definition 11.3.1 (Vektorfeld)
Es sei U ⊂ X offen und v : R × U → X eine stetige Abbildung. Wir nennen
v ein Vektorfeld. Ist v stetig differenzierbar, so sprechen wir von einem C 1 Vektorfeld, entsprechend bei höherer Differenzierbarkeit.
11.3. EIN ALLGEMEINER EXISTENZSATZ
137
Die Aufgabe eine Schar von differenzierbaren Kurven zu finden, die an jedem
Punkt γκ (t) die Eigenschaft hat, dass γκ0 (t) = v(γκ (t)) ist eine typische Aufgabenstellung, für die wir nun eine Lösung anstreben. Gibt es solche Kurven und
sind diese in bestimmten Sinne eindeutig? Eine typische Anwendung ist folgende Situation: Man hat U ⊂ Rn offen und eine stetig differenzierbare Abbildung
f : U → R und das Vektorfeld
v(x) = ∇f (x).
Die Lösung dieses Problems gibt uns Kurven, die jeweils dem steilsten Anstieg
folgen, aber die Frage ist, gibt es solche Kurven?
Diese Frage wollen wir noch etwas allgemeiner angehen. Wir betrachten nun
Funktionen f : (a, b) × U → X und suchen Abbildungen
γ : (a, b) → X : γ 0 (t) = f (t, γ).
Definition 11.3.2 (Gewöhnliche Differentialgleichung erster Ordnung)
Wir verstehen unter einer gewöhnlichen Differentialgleichung erster Ordnung, das Problem eine Kurvenschar zu finden, so dass für jede Kurve γ
aus der Schar gilt
γ 0 (t) = f (t, γ(t)).
Hängt f explizit von der Zeit ab, so nennen wir dies eine nichtautonome
Differentialgleichung, im anderen Fall eine autonome Differentialgleichung.
Das Problem in einem der beide eine Lösungskurve zu finden, welche zum
Zeitpunkt t0 den Wert x0 annimmt heißt nichtautonomes bzw. autonomes
Anfangswertproblem.
Bemerkung 11.3.3 (Notation)
Es ist üblich Differentialgleichungen etwas anders aufzuschreiben, man schreibt
normalerweise
ẏ = f (t, y).
Dann steht die Variable y einerseits für eine Variable in X und andererseits
für eine Kurve t 7→ y(t).
Wir beweisen nun, dass unter gewissen Voraussetzungen ein nichtautonomes Anfangswertproblem eine eindeutig bestimmte Lösung besitzt. Natürlich folgt das
dann auch für das autonome Anfangswertproblem (unter entsprechenden Voraussetzungen). Im Folgenden sei (X, k · kX ) ein Banachraum.
138
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Satz 11.3.4 (Lokaler Existenzsatz)
Sei U ⊂ X offen, f : R × U → X stetig und bezüglich der zweiten Variablen
lokal Lipschitz stetig. Dann gibt es zu jedem u0 ∈ U, t0 ∈ R eine Zahl δ > 0
und eine auf dem Intervall I = [t0 − δ, t0 + δ] definierte stetige Funktion
u : I → U mit folgenden Eigenschaften:
• u ist auf (t0 − δ, t0 + δ) stetig differenzierbar;
• u(t0 ) = u0
• u löst die Differentialgleichung
u̇ = f (t, u).
Gibt es ein Intervall I, welches t0 enthält, und eine Funktion ũ : I → U mit
den Eigenschaften ũ(t0 ) = u0 und ũ löst die Differentialgleichung u̇ = f (t, u),
so gilt u = w̃ auf Iδ ∩ I.
Beweis. Sei W eine Umgebung von (t0 , u0 ) in R × U , so dass auf W die Funktion f bezüglich der zweiten Variablen die Lipschitz Konstante MW hat, und
kf (t, u)kX ≤ NW ∀(t, u) ∈ W . Sei
n
o
∆ = inf k(t, x) − (t0 , u0 )kR×X (t, x) ∈ (R × X) \ W .
Ist (R × X) \ W leer, so sei ∆ eine beliebige positive Zahl. Wähle λ ∈ (0, 1). Setze
M = max{1, MW }, N = max{1, NW }
und
∆ 3λ
1
min{ , }.
3
N M
Mit C(Iδ ; Ū ) bezeichnen wir die Menge der auf Iδ definierten stetigen Funktionen
mit Werten in Ū . Mit der Metrik
o
n
d(u, v) = max ku(t) − v(t)k t ∈ Iδ
δ=
wird C(Iδ ; Ū ) zum vollständigen metrischen Raum. Man prüfe alle Eigenschaften
nach! Für u ∈ C(Iδ ; Ū ) definieren wir eine neue Funktion T u ∈ C(Iδ ; Ū ) durch
Z t
(T u)(t) = u0 +
f (s, u(s))ds.
(11.13)
t0
Wir zeigen
1.) T ist eine starke Kontraktion auf C(Iδ ; Ū ).
2.) Der Fixpunkt u ist eine Funktion mit den gewünschten Eigenschaften.
11.3. EIN ALLGEMEINER EXISTENZSATZ
139
Zu 1.) Zunächst prüfen wir, ob für v ∈ C(Iδ ; Ū ) auch T v wieder in diesem Raum
liegt. Die Stetigkeit von T v ist nahezu offensichtlich, denn für t1 , t2 ∈ Iδ und
t1 < t2 ist
t
Z 2
Zt2
kT v(t2 ) − T v(t1 )kX ≤ f (s, v(s))ds ≤ kf (s, v(s))kds ≤ NW (t2 − t1 ).
t1
X
t1
Um einzusehen, dass T v(t) ∈ Ū liegt, zeigen wir, dass sogar (t, T v(t)) ∈ W
gilt. Offensichtlich ist (t0 , T n
v(t0 )) = (t0 , u0 ) ∈ U . Wegen
der Stetigkeit von T v
o
folgt, dass die Menge IW = t ∈ Iδ (t, T v(t)) ∈ W offen in Iδ ist. Ist IW 6= Iδ ,
so gibt es ein t̃ ∈ Iδ \ IW . O.B.d.A. ist t̃ > t0 . Sei t1 = inf t̃ > t0 , t̃ ∈ Iδ \ IW .
Dann ist aber (t1 , T v(t1 )) ∈ W . Dazu schätzen wir für ein solches t die Differenz
k(t1 , T v(t1 )) − (t0 , u0 )kR×X ab:
t
Z
k(t1 , T v(t1 )) − (t0 , u0 )kR×X ≤ f (s, v(s))ds + δ
t0
X
Zt
≤
kf (s, v(s))kX ds + δ
t0
≤ δNU + δ
≤ δ(1 + N )
< ∆.
Damit ist (t1 , T v(t1 )) ∈ W und t − 1 ∈ IW . Die Menge IW ist damit offen und
abgeschlossen in Iδ . Da t0 ∈ IW liegt, gilt IW = Iδ . Insbesondere ist für jedes
u ∈ C(Iδ ; Ū ) und jedes t ∈ Iδ (t, T u(t)) ∈ W und ku0 − T u(t)kX ≤ ∆.
Wir kommen zur Kontraktionseigenschaft.
Seien v,
n
o w ∈ C(Iδ ; U1 ), wobei U1 ⊂ U
abgeschlossen mit U1 = u ∈ Ū ku − u0 kX ≤ ∆ . Dann ist
d(T v, T w) = max{|T v(t) − T w(t)| | t ∈ Iδ }
Z t
≤ (f (s, v(s)) − f (s, w(s))) ds
t0
X
Zt
≤
kf (s, v(s)) − f (s, w(s))kX ds
(11.14)
t0
≤ δMU d(v, w)
< λd(v, w).
Aus dem Banachschen Fixpunktsatz 9.1.1 folgt nun die Existenz von genau einem
Fixpunkt von T .
140
KAPITEL 11. DIFFERENTIALGLEICHUNGEN
Zu 2.) Ist T u = u, so gilt für t ∈ Iδ
Zt
f (s, u(s)) ds.
u(t) = u0 +
(11.15)
t0
Damit ist klar, dass u im Inneren des Intervalls stetig differenzierbar ist. Die
Ableitung u̇(t) ist nach dem HDI gleich f (t, u(t)).
11.4
Randwertprobleme
In diesem Abschnitt betrachten wir Randwertprobleme für gewöhnliche Differentialgleichungen, das sind Aufgabenstellungen, bei denen ein Intervall in R
vorgegeben ist, auf dem Intervall eine Relation zwischen einer unbekannten Funktion und ihren Ableitungen gegeben ist und Angaben über die Werte am Rand
des Intervalles eine eindeutige Lösbarkeit erzwingen sollen. Eine typische Aufgabenstellung ist das Problem der Kettenlinie, für uns ist ein Seil der Länge L
gegeben und wir hängen dies an zwei Endpunkten auf. Ziel ist es die Form des
durchhängenden Seiles zu bestimmen.
11.4.1
Klassifizierung
Wir beginnen mit einem Intervall I = [a, b] und Funktionen p ∈ C([a, b]; R) ∩
C 1 ((a, b); R) mit p(x) > 0 für alle a < x < b, q ∈ C([a, b]; R), g ∈ C([a, b]; R).
Damit schreiben wir eine Differentialgleichung in der Form
(p(x)u0 (x))0 + q(x)u(x) = g(x).
(11.16)
Solche Gleichungen bestimmen im Allgemeinen die gesuchte Funktion nicht eindeutig. Im Spezialfall p = 1, q = 0 und g = 0 ergibt sich
u00 (x) = 0,
jede Funktion der Form u(x) = ax + b löst die Gleichung. Um Eindeutigkeit einer
möglichen Lösung zu erreichen, gibt man noch Randwerte vor: In der allgemeinsten Form betrachten wir nichttriviale lineare Abbildungen R1,2 : R2 → R und
betrachten die Bedingungen
u(a)
u(b)
R1
+ R2
= 0.
u0 (a)
u0 (b)
Wir nennen eine solche Aufgabe Sturmsches Randwertproblem nach Ch. Sturm4 .
%
4
Ch. Sturm (1803–1855)
11.4. RANDWERTPROBLEME
141
Index
C 1 -Parametertransformation, 39
C k (U R), 65
Γ-Funktion, 5
k-linear, 61, 75
Äquivalenz
Normen, 21
Überlagerung
doppelte, 105
Ableitung
partielle, 47, 83
affin lineare, 45
Algebra, 104
Argebra
normiert, 104
Banachalgebra, 104
Banachraum, 21
Basis, 14
beschränkt, 58
bilinear, 61
Cauchy-Schwarzsche Ungleichung, 19
Doppelintegral, 99
Dualraum, 43
Eigenraum, 131
verallgemeinerter, 131
Eigenvektor, 131
Entwicklungspunkt, 106
Fixpunkt, 78
Folge
beschränkt, 22
Fourierkoeffizienten, 118
Fourierreihe, 118
Funktionalgleichung, 5
Gamma-Funktion, 5
Gebiet, 58
konvex, 58
wegezusammenhängend, 58
Gradient, 54
Hauptsatz, 33
Hesse-Matrix, 63
Hilbertraum, 21
Diagonalmatrix, 130
indefinit, 68
Diffeomorphismus, 90
Integral
Differential, 44, 71
uneigentliches, 3
Differential bezüglich der ersten Variablen, 83
Jacobimatrix, 72
Differentialgleichung
autonome, 134
Komplementärraum, 53
nichtautonom, 134, 137
Konstanzbedingung, 33
differenzierbar, 42
Kontraktion, 78
Abbildung, 71
Kontraktionszahl, 78
Differenzierbare Abbildungen
Konvergenzradius, 107
Wachstumsschranken, 34
Kurve, 24
Dirichlet-Kern, 121
differenzierbar, 25
142
INDEX
integrierbar, 30
rektifizierbar, 35
stetig differenzierbar, 25
stetig differenzierbar, 27
Kurven
äquivalente, 40
Länge, 35
Lagrange-Multiplikator, 93
linear abhängig, 93
Linearisierung, 44
Linienintegral, 59
Lipschitz stetig, 36
Losungsraum, 136
Mehrfachintegrale, 100
Menge
beschränkt, 22
zusammenhängend, 23
Metrik, 15, 16
Multiindex, 64
Länge, 64
multilinear, 61
negativ definit, 68
negativ semidefinit, 68
Niveaumenge, 55
Norm, 15, 19
Äquivalenz, 21
einer linearen Abbildung, 73
Operator, 73
Operatornorm, 73
orientierungserhaltend, 40
orientierungsumkehrend, 40
Parallelogrammgleichung, 51
Parametertransformation, 39
partiell differenzierbar, 47
Polarkoordinaten, 90
Polygonzug, 34
Länge, 35
Polynom, 63
trigonometrisches, 118
143
positiv definit, 68
positiv semidefinit, 68
Potenzreihe, 106
Produkt
inneres, 18
Projektion, 25
Punkte
separiert, 112
Reihe
trigonometrische, 118
Richtungsableitung, 47
Riemann integrierbar
uneigentlich, 3
Riemann-Summe, 29
Robotik, 105
Räume
metrisch, 42
Schraubenlinie, 25
separiert, 112
Skalarprodukt, 18, 51
Spur, 39
Stammfunktion, 32, 34
stetig
stückweise, 121
Sturmsches Randwertproblem, 140
Tangentialvektor, 26
Taylorpolynom, 9, 67
Taylorreihe, 11
uneigentlich integrierbar, 2
Vektorfeld, 136
Verbindungsstrecke, 57
Weg, 41
Wegelängenfunktion, 36
Zusammenhangskomponente, 91
144
INDEX
Literaturverzeichnis
[1] H. W. Alt. Lineare Funktionalanalysis. Springer Verlag, Berlin, 1999.
[2] M. Barner & F. Flohr. Analysis I. de Gruyter, 1974.
[3] C. Blatter. Analysis I. Springer Verlag, 1980.
[4] B. Brosowski & F. Deutsch. An Elementary Proof of the StoneWeierstrass Theorem. Proceedings of the Am. Math. Soc., 81(1), 89-92, 1981.
[5] J. H. Conway & D. A. Smith. On Quaternions and Octonions, their
geometry, arithmetic and symmetry. A K Peters, 2003.
[6] J. Dieudonné. Grundzüge der modernen Analysis. VEB Deutscher Verlag
d. Wissenschaften, Berlin, 1972.
[7] K. Endl & W. Luh. Analysis I. AULA-Verlag, Wiesbaden, 1989.
[8] O. Forster. Analysis 2. Vieweg, Braunschweig, 5. Auflage, 1999.
[9] A. Friedman. Foundations of Modern Analysis. Holt Rinehart and Winston, 1972.
[10] H. Heuser. Lehrbuch der Analysis, Teil 1. B. G. Teubner, Stuttgart, 15.
Auflage, 2003.
[11] E. Hewitt & K. Stromberg. Real and abstract analysis. Springer Verlag,
Berlin, 1969.
[12] K. Königsberger. Analysis II, Springer Lehrbuch. Springer Lehrbuch.
Springer Verlag, Berlin Heidelberg New York, 2000.
[13] K. Königsberger. Analysis I, Springer Lehrbuch 8. Springer Verlag,
Berlin Heidelberg New York, 4. Auflage, 2004.
[14] J. Pöschel. Etwas Analysis. Springer Spektrum, Wiesbaden, 2014.
[15] J. Pöschel. Etwas mehr Analysis. Springer Spektrum, Wiesbaden, 2014.
145
146
LITERATURVERZEICHNIS
[16] J. Pöschel. Noch mehr Analysis. Springer Spektrum, Wiesbaden, 2015.
[17] W. Rudin. Functional Analysis. Mc Graw Hill, Inc, New York, 1973.
[18] R. Walter. Einführung in die Analysis 2. de Gruyter, 2007.
Herunterladen