Skelett zur Vorlesung mit Definitionen und Sätzen

Werbung
1
Das Integral
Stets seien a < b reelle Zahlen.
Definition 1
a) Eine Zerlegung Z von [a, b] ist eine endliche Folge Z =
(x0 = a, x1 , x2 , . . . , xn = b) mit xi < xi+1 für alle i zwischen 0 und n − 1.
Die xi ’s heißen die Teilungspunkte der Zerlegung.
b) Eine Zerlegung Z 0 = (x00 , x01 , x2 , . . . , x0n0 ) heisst feiner als Z = (x0 , x1 , x2 , . . . , xn ),
falls für jedes i ein j existiert mit xi = x0j . Man schreibt dafür Z ≤ Z 0 .
c) Sind Z 0 = (x00 , x01 , x2 , . . . , x0n0 ) und Z = (x0 , x1 , x2 , . . . , xn ) zwei Zerlegungen, so ist Z ∪ Z 0 = (z0 , z1 , . . . , zm ) die eindeutig bestimmte Zerlegung mit
{z0 , z1 , . . . zm } = {x0 , x1 , . . . xn } ∪ {x00 , x01 , . . . x0n0 }.
Bemerkung 1 Immer gilt Z ≤ Z ∪ Z 0 .
Beispiel 1 Für jede natürliche Zahl n ≥ 1 hat man die äquidistante Zerlegung
mit den n + 1 Teilungspunkten xi = a + i b−a
n für i = 0, 1, . . . , n.
Definition 2 Sei f : [a, b] → R eine beschränkte Abbildung und Z = (x0 , x1 , . . . , xn )
eine Zerlegung. Für i = 1, 2, . . . , n sei mi (f ) das Infimum und Mi (f ) das Supremum der Menge f ([xi−1 , xi ]). Dann definiert man die Unter- bzw. die Obersumme von f zur Zerlegung Z als
UZ (f ) =
n
X
mi (f )(xi − xi−1 ) bzw. OZ (f ) =
i=1
n
X
Mi (f )(xi − xi−1 ).
i=1
Bemerkung 2 Ist stets f (x) ≥ 0, so ist die Untersumme eine untere, die Obersumme eine obere Approximation an den noch zu definierenden Inhalt der Fläche
zwischen dem Graphen von f und der x-Achse.
Es gelten folgende einfache, aber wichtige Rechenregeln und Definitionen:
Lemma 1 Sei wieder f : [a, b] → R eine beschränkte Abbildung und Z eine
Zerlegung. Dann gilt:
a) UZ (f ) ≤ OZ (f ).
b) Aus Z ≤ Z 0 folgt UZ (f ) ≤ UZ 0 (f ) und OZ 0 (f ) ≤ OZ (f ).
Rb
c) Das Supremum U a f der UZ (f ) über alle Zerlegungen existiert und es
heißt das Unterintegral von f auf dem Intervall [a, b].
Rb
d) Das Infimum O a f der OZ (f ) über alle Zerlegungen existiert und es heißt
das Oberintegral von f auf dem Intervall [a, b].
Rb
Rb
e) Man hat stets U a f ≤ O a f .
1
Definition 3 Eine Funktion f : [a, b] → R heißt (Riemann-) integrierbar, wenn
f beschränkt ist und Ober-und Unterintegral übereinstimmen. Man nennt diese
Rb
Zahl dann das bestimmte Integral von f über [a, b] und schreibt dafür a f . Für
die Menge der integrierbaren Funktionen auf [a, b] schreibt man R([a, b])
Satz 1 Sei f : [a, b] → R eine Abbildung. Genau dann ist f integrierbar, wenn
f beschränkt ist und für jedes > 0 eine Zerlegung Z existiert mit OZ (f ) −
UZ (f ) < .
Satz 2 Sei f : [a, b] → R eine Abbildung. Falls f monoton ist oder stetig, so
ist f integrierbar.
Beispiele 1
a) Die Funktion f : [0, 1] → R mit f (x) = 1 für rationale und
f (x) = 0 für irrationale Zahlen ist nicht integrierbar, weil jede Obersumme
1 und jede Untersumme 0 ist.
b) Für jedes x in [a, b] ist die Funktion ex : [a, b] → R mit ex (x) = 1 und
ex (y) = 0 für y 6= x integrierbar mit Integral 0.
c) Für a = b lassen wir auch die Zerlegung (x0 = a, x1 = b) zu. Dann ist
jede Funktion auf [a, a] integrierbar mit Integral 0.
Lemma 2 Sei f : [a, b] → R eine Abbildung. Sei a ≤ c ≤ b. Sei f1 : [a, c] → R
definiert durch f1 (x) = f (x) und sei f2 : [c, b] → R analog definiert. Dann
gilt f ∈ R([a, b]) genau dann, wenn f1 ∈ R([a, c]) und f2 ∈ R([c, b]) gelten. In
Rb
Rc
Rb
diesem Fall ist a f = a f1 + c f2 .
Definiert man also in naheliegender Weise stückweise monotone oder stückweise stetige Funktionen, so sind diese integrierbar.
Definition 4 Sei f : [a, b] → R eine Abbildung. Wir definieren f + : [a, b] → R
durch f + (x) = f (x) für f (x) ≥ 0 und f + (x) = 0 sonst. Ferner sei f − : [a, b] →
R gegeben durch f − (x) = −f (x) für f (x) ≤ 0 und f + (x) = 0 sonst.
Satz 3 Seien f, g in R([a, b]). Dann gilt:
Rb
Rb
Rb
a) f + g ist integrierbar mit a (f + g) = a f + a g.
Rb
Rb
b) Für jeden Skalar λ ist λf integrierbar mit a (λf ) = λ a f .
c) f + , f − und | f |= f + + f − sind integrierbar.
Rb
Rb
d) Aus f ≤ g ( d.h. f x ≤ gx für alle x aus [a, b] ) folgt a f ≤ a g.
Rb
Rb
e) | a f |≤ a | f |≤k f k (b − a) mit k f k= sup | f | ([a, b]).
f ) fg ist integrierbar.
2
Bemerkung 3 Die ersten beiden Teile des Satzes besagen gerade, dass R([a, b])
ein Unterraum des Vektorraumes aller reellwertigen Abbildungen auf [a, b] ist
Rb
und a eine lineare Abbildung ist. Es gibt noch einen allgemeineren Integralbegriff als den Riemannschen, nämlich den Lebesgueschen. Dieser liefert einen
viel größeren Raum L([a, b]) von integrierbaren Funktionen und ein allgemeineres Integral, das für Riemann-integrierbare Funktionen mit dem RiemannIntegral übereinstimmt. Der Übergang von den rationalen Zahlen zu den reellen
Zahlen entspricht dabei dem Übergang von den Riemann-integrierbaren zu den
Lebesgue-integrierbaren Funktionen. Das wird in Analysis 3 erklärt.
Satz 4 ( Verallgemeinerter MWS der Integralrechnung ) Sei f : [a, b] → R
stetig, p : [a, b] → R integrierbar mit p ≥ 0. Dann existiert ein ξ aus [a, b] mit
Rb
Rb
(f p) = f (ξ) a p. Speziell für die Funktion p(x) = 1 für alle x folgt also der
a
MWS: Es gibt ein ξ mit
Z b
f = f (ξ)(b − a).
a
Satz 5 Sei (fn ) eine Folge in R([a, b]), die gleichmäßig gegen f konvergiert.
Dann ist auch f integrierbar und es gilt
Z
b
Z
f = lim(
a
2
b
fn ).
a
Der Hauptsatz der Differential- und Integralrechnung
Definition 5 Für integrierbares f : [a, b] → R definieren wir
Ra
b
f =−
Rb
a
f.
Satz
R x 6 Sei f : [a, b] → R integrierbar. Definiere F : [a, b] → R durch F (x) =
f (t)dt. Dann gilt:
a
a) Für alle x, y aus [a, b] ist | F (x) − F (y) |≤k f k| x − y |. Insbesondere ist
F Lipschitz-stetig.
b) Falls f in x0 aus [a, b] stetig ist, so ist F in x0 differenzierbar mit F 0 (x0 =
f (x0 .
Definition 6 Sei I ein Intervall und f : I → R eine Abbildung. Eine Funktion
F : I → R heißt Stammfunktion von f , falls F 0 = f .
Bemerkung 4 Im allgemeinen hat f keine Stammfunktion. Ist F eine Stammfunktion von f , so auch F + c für jede konstante Funktion c. Sind F und G
Stammfunktionen von f , so ist F − G eineR konstante Funktion. Es gibt also
nicht die Stammfunktion. Man schreibt oft f und meint damit eine Stammfunktion von f .
3
Satz 7 ( Hauptsatz der Differential-und Integralrechnung ) Sei I ein Intervall
und f : I → R stetig. Dann gilt:
Rx
a) Für jedes a ∈ I ist F (x) := a f (t)dt eine Stammfunktion von f .
Rb
b) Für jede Stammfunktion G von f und alle a < b mit a, b ∈ I gilt a f (t)dt =
G(b) − G(a) = [G]ba .
Bemerkung 5
a) Nicht jede Ableitung ist beschränkt oder sogar integrier−1
bar. Ein Beispiel
R 0ist f (x) = xsin(x ) für x 6= 0 und f 0 = 0. Also ist eine
’Formel’ wie (f ) = f im allgemeinen Unsinn, weil die linke Seite überhaupt nicht definiert ist. Aber selbst für integrierbares f 0 ist die Formel
mit Vorsicht zu genießen, weil die linke Seite nur bis auf Addition einer
Konstanten festliegt.
R
b) Eine Formel wie ( f )0 = f ist im allgemeinen ebenfalls Unsinn, z.B. für
die integrierbaren Funktionen ex . Diese Formel ist sinnvoll für stetiges
f . Mit ihrer Hilfe erhält man aus der Produktregel und der Kettenregel die
beiden folgenden Sätze, die bei der Integration eine zentrale Rolle spielen.
Satz 8 ( Partielle Integration ) Seien f und g stetig differenzierbar auf [a, b].
R
R
Rb
Rb
Dann gilt (f 0 g) = (f g) − (f g 0 ) bzw. a (f 0 g) = [(f g)]ba − a (f g 0 )
Satz 9 ( Substitutionsregel ) Sei I ein Intervall und f : I → R stetig. Ferner
sei g : [a, b] → R stetig differenzierbar mit g([a, b]) ⊆ I. Dann gilt:
Z b
Z g(b)
0
f (g(t))g (t)dt =
f (u)du.
a
g(a)
Das Problem mit diesen beiden Integrationsmethoden - aber auch die Herausforderung an die mathematische Intuition - ist, dass es unendlich viele Arten
gibt, eine gegebene Funktion h als Produkt (f 0 g) zu schreiben oder als Produkt
(h ◦ g)g 0 . In der Literatur finden sich viele Tipps, was bei bestimmten Typen
von Funktionen zu tun ist. Aber selbst harmlos aussehende Funktionen lassen
sich nicht in geschlossener Form durch elementare Funktionen integrieren. Außerdem ist die Darstellung einer Funktion als Integral oft aus theoretischen und
numerischen Gründen anderen Darstellungen vorzuziehen.
In der Vorlesung gab es zur Illustration nur ein paar nicht-triviale Beispiele
und Anwendungen: Das Wallissche Produkt, die Stirlingsche Formel und die
Formel für den Flächeninhalt des Kreises. All das kann man im Forster gut
nachlesen.
3
Approximation durch Polynome
Stets sei I ein Intervall, f : I → R eine stetige Abbildung eventuell mit gewissen
zusätzlichen Eigenschaften. Gesucht ist ein Polynom bzw. eine polynomiale Abbildung P , die f möglichst gut annähert. Dabei sind viele verschiedene Begriffe
der ’Annäherung’ zu unterscheiden:
4
• ( Interpolation ) P soll an endlich vielen vorgegebenen Stellen mit f übereinstimmen.
• ( Taylor-Polynom und Taylor-Reihe ) P und f sollen in einem Punkt
gleiche Ableitungen haben bis zu einer gewissen Ordnung.
• ( Gleichmäßige Approximation ) Das Supremum der Differenzen der Funktionswerte von f und P soll klein sein.
• ( Approximation im Mittel ) Das Integral von | f − P |2 soll klein sein.
Wir werden uns in diesem Kapitel mit den ersten drei Begriffen auseinandersetzen und beginnen mit dem einfachsten.
Satz 10 Seien x0 , x1 , . . . , xn paarweise verschiedene Elemente aus I und seien
y0 , y1 , . . . , yn beliebige reelle Zahlen. Dann gibt es genau ein Polynom vom Grad
höchstens n mit reellen Koeffizienten, derart dass P (xi ) = yi für alle i gilt.
Insbesondere gibt es zu jeder Funktion f : I → R genau ein Polynom vom Grad
höchstens n mit f (xi ) = P (xi ) für i = 0, 1, . . . , n.
Im folgenden benötigen wir einige grundlegende Sätze aus der Analysis I, an
die wir nun erinnern. Dabei sei stets I ein Intervall mit mindestens 2 Punkten.
Stets sei f : I → R stetig und es sei hn : I → R eine gleichmäßig gegen h
konvergente Folge von Funktionen. Dann gilt:
• Das Bild J := f (I) ist ein Intervall.
• f ist injektiv genau dann, wenn f strikt monoton ist. In diesem Fall ist
die induzierte Abbildung g : I → J mit g(x) = f (x) invertierbar mit
stetiger Umkehrabbildung. Ist g sogar auf I differenzierbar, so ist g −1
genau dann differenzierbar auf J, wenn g 0 (x) 6= 0 für alle x ∈ I. Es ist
1
dann (g −1 )0 (x) = g0 (g−1
(x)) für alle x.
• Sind alle hn stetig, so auch h.
• Sind alle hn integrierbar, so auch h. Ferner gilt
R
R
h = lim hn .
• Sind alle hn differenzierbar und konvergiert die Folge der Ableitungen h0n
gegen eine Funktion g, so ist h differenzierebar und g ist die Ableitung.
• Die wichtigste Anwendung
finden die letzten drei Sätze bei PotenzreiP∞
hen. Sei P (x) =
a
(x
− a)n eine
Potenzreihe mit Konvergenzran
n=0
P∞
n−1
dius
R
>
0.
Setzt
man
dann
Q(x)
=
und R(x) =
n=0 an n(x − a)
P∞ an
n+1
(x
−
a)
,
so
haben
Q(x)
und
R(x)
ebenfalls
Konvergenzradin=0 n+1
us R und es gilt P 0 (x) = Q(x) und R0 (x) = P (x) für alle x im Inneren
des Konvergenzkreises. Kurz: Potenzreihen darf man gliedweise differenzieren und integrieren .
5
Definition 7 Sei f : I → R eine n + 1-mal stetig differenzierbare Funktion.
Sei a ein Punkt aus I. Dann heisst
Ta,n f (x) =
n
X
f i (a)
i=0
i!
(x − a)i
das Taylorpolynom zu f vom Grad n an der Stelle a. Die Differenz Ra,n f (x) =
f (x) − Ta,n f (x) heisst n-tes Restglied. Ist f beliebig oft auf I differenzierbar, so
heisst
∞
X
f i (a)
Ta, f (x) =
(x − a)i
i!
i=0
Taylorreihe von f in a.
Bemerkungen 1
di
mit dx
i f.
• Die ite Ableitung von f bezeichnen wir mit f (i) oder
• Das Taylorpolynom ist das eindeutig bestimmte Polynom P vom Grad n
dessen Ableitungen an der Stelle a bis zur Ordnung n mit denen von f
übereinstimmen.
• Taylorpolynom und Taylorreihe hängen nur von einer -Umgebung von a
ab. Die Reihe konvergiert genau dann im Punkt x gegen die Ausgangsfunktion f , wenn das Restglied an dieser Stelle gegen 0 konvergiert.
P∞
• Ist P = i=0 ai (x − a)i eine Potenzreihe mit Konvergenzradius R > 0, so
ist P auch die Taylorreihe zu der durch P im Inneren des Konvergenzkreises gegebenen Funktion . Somit kennen wir die Taylorreihen an der Stelle
0 von exp, sin, cos.
• Man kann für f (x) = ln(1 − x) direkt induktiv die Taylorreihe in 0 ausrechnen, aber man benutzt besser die geometrische Reihe und gliedweise
Integration. Der gleiche Trick funktioniert auch noch in anderen Fällen,
etwa für arctan(x) in 0.
Satz 11 Sei f : I → R n + 1-mal stetig differenzierbar und a aus I. Dann gilt:
Rx
1
a) Ra,n f (x) = n!
(x − t)n f (n+1) (t)dt. ( Integralform des Restglieds )
a
1
b) Ra,n f (x) = (n+1)!
(x − a)n+1 f (n+1) (ξ) für ein ξ zwischen a und x. ( Lagrangesche Form des Restglieds )
c) Es ist Ra,n f (x) = η(x)(x − a)n für eine Funktion η mit η(x) → 0 für
x → a.
Dieser Satz liefert ein gutes hinreichendes Kriterium für Extremstellen, das
unsere früheren Ergebnisse verallgemeinert und in den Übungen besprochen
wird.
Auf dem Konvergenzkreis einer Potenzreihe kann Divergenz oder Konvergenz vorliegen. Wie wir nun sehen, erhält man im zweiten Fall interessante
Grenzwerte aus Stetigkeitsaussagen.
6
Lemma 3 ( Abelsche partielle Summation
) Seien c0 , c1 , . . . , cn und d0 , d1 , . . . , dn
Pm
komplexe Zahlen. Setze Cm = i=0 ci für m = 0, 1, . . . n und C−1 = 0. Dann
gilt:
n−1
n
X
X
Ci (di − di+1 ) + Cn dn .
ci di =
i=0
i=0
P
Satz 12 ( Grenzwertsatz von Abel ) Sei P (x) =
an (x − a)n eine komplexe
Potenzreihe mit Konvergenzradius 0 < R < ∞. In einem Punkt b auf dem
Rand des Konvergenkreises sei die Reihe konvergent gegen c. Dann konvergiert
die Reihe gleichmäßig auf jeder Teilmenge D des Konvergenzkreises, auf der
| b − x | /(R− | x − a |) beschränkt bleibt. Insbesondere ist P auf D ∪ {b}
definiert und stetig. Es gilt P (b) = c.
• Für D ist immer die Strecke zwischen a und b zugelassen.
Beispiele 2
• ln(2) = 1 −
•
π
4
=1−
1
3
1
2
+
+
1
5
1
3
−
− ...
1
7
+ . . ..
Binomialreihe
Lemma 4 Seien f, g auf dem Intervall I n-mal differenzierbar. Dann gilt
n X
n (i) (n−i)
(f g)(n) =
f g
.
i
i=0
Proposition 1
a) Die Funktion f : R → R mit f (x) = 0 für x ≤ 0 und
f (x) = exp(− x1 ) für x > 0 ist beliebig oft differenzierbar und alle Ableitungen verschwinden im Nullpunkt ( ’f ist platt in 0’ ).
b) Zu beliebigen reellen Zahlen a < a0 < b0 < b gibt es eine beliebig oft
differenzierbare Funktion h : R → R mit 0 ≤ h(x) ≤ 1 für alle x, h(x) =
1 für x aus [a0 , b0 ] sowie h(x) = 0 für x außerhalb von [a, b] ( h heißt
’Hutfunktion’ ).
P
Satz 13 ( E.Borel ) Jede reelle Potenzreihe
an xn ist die Taylorreihe einer
beliebig oft differenzierbaren Funktion f : R → R.
Bemerkung 6 Für eine auf einem Intervall I mit a ∈ I beliebig oft differenzierbare Funktion f existiert immer die Taylor-Reihe T um a, aber folgende
Fälle treten auf:
• T hat Konvergenzradius 0.
• T hat Konvergenzradius R > 0, aber die Potenzreihe zu T stimmt nicht
mit der Ausgangsfunktion überein.
• T hat Konvergenzradius R > 0 und im Inneren des Konvergenzkreises
stimmen f und die Potenzreihe zu T überein. Eventuell ist aber der Konvergenzbereich viel kleiner als I.
7
Definitionen 1 Sei (X, d) ein metrischer Raum und Y eine Teilmenge.
a) Eine offene Überdeckung von Y ist eine Familie (Ui )i∈I von offenen Mengen Ui , derart dass Y ⊆ ∪i∈I Ui gilt.
b) Eine solche offene Überdeckung besitzt eine endliche Teilüberdeckung, falls
es eine endliche Teilmenge J von I gibt, so dass Y ⊆ ∪j∈J Uj gilt.
c) Y heißt kompakt, wenn jede offene Überdeckung von Y eine endliche Teilüberdeckung besitzt.
d) Y heißt folgenkompakt, wenn jede Folge (yn ) aus Y eine konvergente Teilfolge besitzt mit Grenzwert in Y .
Lemma 5 ( Lebesgue ) Sei Y folgenkompakt in einem metrischen Raum und
sei (Ui )i∈I eine offene Überdeckung von Y . Dann gibt es ein > 0, so dass für
jedes y ∈ Y ein Index iy existiert mit U (y) ⊆ Uiy .
Satz 14 Eine Teilmenge eines metrischen Raumes ist genau dann kompakt,
wenn sie folgenkompakt ist.
Definition 8 Sei K ein kompakter metrischer Raum und C 0 (K, R) die Menge
der stetigen Funktionen f : K → R versehen mit der Supremumsnorm kf k =
sup | f (x) |. Eine Teilmenge D von C 0 (K, R) trennt die Punkte, wenn es zu
x 6= y aus K stets eine Funktion f aus D gibt mit f (x) 6= f (y).
Definition 9 Eine Teilmenge D von C 0 (K, R) heißt Unteralgebra, falls sie abgeschlossen ist unter Addition und Multiplikation und die Eins 1 enthält.
Beispiel 2 Für K = [a, b] ist die Menge der Polynome eine Unteralgebra, die
die Punkte trennt.
Satz 15 ( Stone-Weierstrass ) Sei K ein kompakter metrischer Raum und D
eine Unteralgebra von C 0 (K, R), die die Punkte trennt. Dann gibt es zu jedem
f ∈ C 0 (K, R) und jedem > 0 ein g ∈ D mit kf − gk < .
Folgerung 1 ( Klassischer Satz von Weierstrass ) Jede stetige Funktion f :
[a, b] → R ist gleichmäßiger Grenzwert einer Folge von Polynomen.
4
Grundlagen aus der mengentheoretischen Topologie
Definition 10 Sei V ein R-Vektorraum.
a) Ein Skalarprodukt auf V ist eine positiv definite, symmetrische, bilineare
Abbildung [ , ] : V × V → R. Für alle Vektoren x, y, z und alle Skalare
a, b gilt also [x, x] ≥ 0 und [x, x] = 0 nur für x = 0, [x, y] = [y, x] und
[ax + by, z] = a[x, z] + b[y, z]. Ein Vektorraum mit einem Skalarprodukt
heißt Euklidischer Raum. Zwei Vektoren x, y heissen orthogonal, wenn
[x, y] = 0.
8
b) Eine Norm auf V ist eine Abbildung k k: V → R mit k x k ≥ 0 mit
Gleichheit genau für x = 0, k ax k=| a |k x k und mit k x + y k≤k x k
+ k y k für alle Vektoren x, y und alle Skalare a. Das Paar V, k k) heißt
normierter Raum.
Lemma 6 Sei V ein Euklidischer Raum. Dann gilt:
a) ( Cauchy-Schwarzsche Ungleichung ) Für alle x, y gilt [x, y]2 ≤ [x, x][y, y].
Gleichheit gilt genau dann, wenn x und y linear abhängig sind.
p
b) Durch k x k:= [x, x] wird eine Norm auf V induziert.
Pn
Beispiele sind V = Rn mit dem Skalarprodukt [x, y] = i=1 xi yi und V =
Rb
C 0 ([a, b], R mit dem Skalarprodukt [f, g] = a f g. Die zugehörige Norm wird
mit k f k2 bezeichnet.
Definition 11 Ein metrischer Raum (X, d) ist eine Menge X versehen mit
einer Abbildung d : X×X → R, so dass d(x, y) ≥ 0 mit Gleichheit genau für x =
y, d(x, y) = d(y, x) und d(x, y) ≤ d(x, z) + d(z, y) für alle x, y, z gelten. d(x, y)
heißt dann der Abstand von x und y bezüglich der Metrik d. Die Ungleichung
heißt Dreiecksungleichung.
Jeder normierte Raum wird durch d(x, y) =k x − y k zu einem metrischen Raum und jede Teilmenge eines metrischen Raumes wird durch die Einschränkung der Metrik zu einem metrischen Raum.
Definition 12 Sei (X, d) ein metrischer Raum.
• Für > 0 und x aus X ist die −Umgebung U (x) definiert als die Menge
aller Punkte x0 aus X mit d(x, x0 ) < .
• Eine Teilmenge U von X heißt offen in X, wenn es zu jedem u aus U ein
( von u abhängiges ) > 0 gibt, derart dass U (u) in U liegt.
• Eine Teilmenge A heißt abgeschlossen in X, wenn ihr Komplement offen
ist.
• Eine offene Umgebung eines Punktes x ist eine offene Teilmenge von X,
die x enthält.
• Eine Folge (xn ) in X heißt konvergent mit Grenzwert x, falls ein Punkt
x in X existiert, so dass (d(xn , x)) eine Nullfolge ist. Die Folge heißt
Cauchy-Folge, falls zu jedem > 0 ein n0 existiert mit d(xn , xm ) < für
alle n, m ≥ n0 .
• X heißt vollständig, wenn jede Cauchy-Folge in X konvergiert.
• Eine Teilmenge B heißt beschränkt, wenn es einen Punkt x aus X und
eine Konstante C gibt mit d(b, x) < C für alle b aus B gibt.
9
Jede Folge hat höchstens einen Grenzwert, und jede konvergente Folge ist
eine Cauchy-Folge. Die Eigenschaften ’offen’ und ’abgeschlossen’ hängen von der
umgebenden Menge ab, die Eigenschaft ’kompakt’ nicht.
Lemma 7 Sei X ein metrischer Raum mit einer Teilmenge A. Genau dann
ist A abgeschlossen in X, wenn A die Grenzerte aller konvergenten Folgen (an )
mit Folgegliedern aus A enthält.
Satz 16 Sei X ein metrischer Raum und K eine Teilmenge. Dann gilt:
a) Ist K kompakt, so ist K abgeschlossen in X und beschränkt.
b) Ist A eine Teilmenge der kompakten Menge K, die in K abgeschlossen ist,
so ist A kompakt.
Definition 13 Zwei Normen k k und k k0 auf dem gleichen Vektorraum V heißen äquivalent, wenn es Konstanten C, D gibt mit
k x k≤ C k x k0 und k x k0 ≤ D k x k für alle x.
Äquivalente Normen induzieren die gleichen offenen Mengen, die gleichen
konvergenten Folgen etc. , obwohl die -Umgebungen sehr verschieden aussehen
können.
Definition 14 Ein normierter Raum, der bezüglich der induzierten Metrik vollständig
ist, heißt Banachraum.
Satz 17 Sei V ein endlichdimensionaler normierter Raum. Dann gilt:
a) Je zwei Normen auf V sind äquivalent.
b) V ist ein Banachraum.
c) Eine Teilmenge von V ist kompakt genau dann, wenn sie abgeschlossen
und beschränkt ist.
C 0 ([a, b], R) ist bezüglich der Supremumsnorm k k∞ vollständig, aber nicht
bezüglich k k2 . Die abgeschlossene Einheitskugel ist in beiden Normen nicht
kompakt.
Definition 15 Sei f : X → Y eine Abbildung zwischen metrischen Räumen.
a) f heißt stetig im Punkt x, falls zu jedem > 0 ein δ > 0 existiert, so dass
d(f x, f x0 ) < gilt für alle x0 mit d(x, x0 ) < δ.
b) f heißt stetig auf X, falls f in jedem Punkt stetig ist.
c) f heißt gleichmäßig stetigstetig , falls zu jedem > 0 ein δ > 0 existiert,
so dass d(f x, f x0 ) < gilt für alle x, x0 mit d(x, x0 ) < δ.
Satz 18 Sei f : X → Y eine Abbildung zwischen metrischen Räumen. Dann
gilt:
10
a) f ist stetig in x genau dann, wenn für jede gegen x konvergente Folge (xn )
die Folge der Bilder (f xn ) gegen f x konvergiert.
b) f ist stetig auf X genau dann, wenn das Urbild jeder in Y offenen Menge
offen ist in X.
c) Die analoge Aussage gilt für abgeschlossene Mengen.
Trivialerweise ist die Komposition stetiger Abbildungen stetig.
Satz 19 Sei f : X → Y stetig und X kompakt. Dann gilt:
a) f ist gleichmäßig stetig.
b) Das Bild von X ist kompakt. Insbesondere nimmt für Y = R die Funktion
f ihr Minimum und ihr Maximum an.
Definition 16 Sei f : V → W eine lineare Abbildung zwischen normierten
Räumen. Setze dann k f k gleich dem Supremum über alle k f x k, wobei x alle
Vektoren der Norm 1 durchläuft. Falls dies eine relle Zahl ist, heißt f beschränkt.
Lemma 8 Für eine lineare Abbildung f : V → W zwischen normierten Räumen
sind gleichwertig:
a) f ist gleichmäßig stetig.
b) f ist stetig in 0.
c) Es gibt eine Konstante C mit k f x k≤ C k x k für alle x.
d) f ist beschränkt.
Es gilt dann k f x k≤k f kk x k für alle x.
Nimmt man V = W = C 0 ([0, 1], R) so ist die Identität nicht beschränkt,
wenn man auf zuerst die Integralnorm und dann die Supremumsnorm nimmt.
Satz 20 Seien f : V → W und g : W → U lineare Abbildungen zwischen
endlichdimensionalen normierten Räumen. Dann gilt:
a) f ist beschränkt. Man erhält durch f 7→k f k eine Norm auf dem Vektorraum Hom(V, W ), die sogenannte Operatornorm.
b) k gf k≤k g kk f k .
Satz 21 ( Banachscher Fixpunktsatz ) Sei f : X → X eine Selbstabbildung
eines vollständigen metrischen Raumes X. Es gebe eine Konstante K < 1 mit
d(f x, f x0 ) ≤ Kd(x, x0 ) für alle x, x0 aus X. Dann hat f genau einen Fixpunkt
x0 in X. Dabei gilt folgender Zusatz: Wählt man x beliebig und definiert rekursiv
x1 = x sowie xn+1 = f xn , so konvergiert (xn ) gegen x0 und es gilt d(x0 , xn ) ≤
Kn
1−K d(x0 , x1 ).
11
5
Die Ableitung
Definition 17 Seien V, W normierte Vektorräume endlicher Dimension. Sei
U eine offene Teilmenge von V und sei x ∈ U . Eine Abbildung f : U → W
heißt differenzierbar an der Stelle x mit Ableitung f 0 (x) = Df (x) = A, falls
eine lineare Abbildung A : V → W existiert mit
f (x + h) = f (x) + A(h) + ρ(h)
für alle h ∈ V , so dass x + h zu U gehört. Schreibt man dabei ρ(h) = ρ̃(h) k h k,
so muß für h → 0 auch ρ̃(h) → 0 gelten, d.h. zu jedem > 0 existiert ein δ > 0
mit k ρ̃(h) k< für alle h 6= 0 mit x + h ∈ U und k h k< δ.
Ist f in jedem Punkt aus U differenzierbar, so heißt f differenzierbar auf U .
Bemerkungen 2
• Wegen der Offenheit von U gibt es ein ζ > 0, so dass
für alle h mit k h k< ζ stets x+h ∈ U gilt. Für alle solche h sind also ρ(h)
und ρ̃(h) definiert, wobei man ρ̃(0) = 0 vereinbart. Die Differenzierbarkeit
in x hängt nur ab von einer ( beliebig kleinen ) offenen Umgebung von x.
• A und damit auch ρ liegen bei dieser Definition eindeutig fest. Ferner folgt
die Stetigkeit in x aus der Differenzierbarkeit.
• Äquivalente Normen liefern den gleichen Differenzierbarkeitsbegriff und
die gleiche Ableitung. Im endlichdimensionalen Fall ist also alles eindeutig.
• Eine sogenannte affine Abbildung f : V → W ( d.h. es ist f (x) = Ax + b
für eine fest gewählte lineare Abbildung A und einen festen Vektor b ) ist
in jedem Punkt x differenzierbar mit f 0 (x) = A.
• Ist f auf U differenzierbar, so hat man die Abbildung f 0 : U → Hom(V, W ).
• Die Summe von zwei in x differenzierbaren Funktionen ist differenzierbar
und es gilt f 0 x + g 0 x = (f + g)0 x. Für skalare Vielfache gilt die analoge
Aussage.
Satz 22 ( Kettenregel ) Seien X, Y, Z normierte Räume, X 0 offen in X und
Y 0 offen in Y . Ferner seien f : X 0 → Y 0 und g : Y 0 → Z Abbildungen. Ist
dann f differenzierbar in x und g in f x, so ist g ◦ f differenzierbar in x und
es gilt (g ◦ f )0 (x) = g 0 (f x)f 0 (x), wobei rechts die Komposition zweier linearer
Abbildungen steht.
Um mit den Ableitungen rechnen zu können, führen wir nun Koordinaten
ein und wir identifizieren eine lineare Abbildung von Rn nach Rm mit einer
m × n-Matrix. Mit pj : Rm → R bezeichnen wir die Projektion auf die j-te
Komponente und mit fj = pj ◦f die j-te Komponentenfunktion einer Abbildung
f : U → Rm .
12
Definition 18 Sei U eine offene Teilmenge von Rn , f : U → R, u ∈ U
und v ∈ Rn beliebig. Wegen der Offenheit von U existiert ein > 0 mit u +
tv ∈ U für alle |t| < und es ist g = gv :] − , [→ U mit g(t) = u + tv)
differenzierbar in 0 mit Ableitung v. Falls f ◦ gv in 0 differenzierbar ist, so
heisst f an der Stelle u differenzierbar in Richtung v und wir schreiben Dv f (u)
für diese Richtungsableitung von f in Richtung v im Punkt u. Speziell für v = ei
schreibt man kürzer Di statt Dei und wir nennen dies die i.te partielle Ableitung
∂f
von f an der Stelle u. Man schreibt dafür auch ∂x
(u).
i
m
Falls für f : U → R alle partiellen Ableitungen aller Komponentenfunktionen an der Stelle u existieren, so definiert man die Jacobi-Matrix Jf (u) als die
m × n-Matrix mit Dj fi (u) in der i-ten Zeile und j-ten Spalte.
Satz 23 Sei f : U → Rm eine auf einer offenen Teilmenge U des Rn definierte
Abbildung. Dann gilt:
a) f ist genau dann differenzierbar in x, wenn alle Komponentenfunktionen
fj in x differenzierbar sind. Dabei ist f 0 (x) die Matrix, deren i-te Zeile
gerade aus der 1 × n-Matrix fi0 (x) besteht.
b) Ist f in u differenzierbar, so existieren dort alle partiellen Ableitungen und
es gilt f 0 (u) = Jf (u).
c) Genau dann existieren alle partiellen Ableitungen Di fj aller fj auf U
und sind dort stetig, wenn f auf U differenzierbar ist und die Abbildung
f 0 : U → Hom(Rn , Rm ) = Rm×n stetig ist.
Bemerkungen 3
• Jedes Di fj ist wieder eine Abbildung von U nach R
und kann erneut partiell abgeleitet werden.
• Die Existenz aller partieller Ableitungen reicht nicht aus für die Existenz
der ( totalen ) Ableitung.
Definition 19 Sei f : U → Rm wie im Satz. f heißt k-mal stetig differenzierbar
auf U , falls für alle Indizes i1 , i2 , . . . , ir mit r ≤ k und alle j die partielle
Ableitung Dik Dik−1 . . . Di1 fj existiert und stetig ist. Man schreibt C k (U, Rm )
für die Menge dieser Funktionen.
Satz 24 ( Satz von Schwarz ) Für jede C 2 -Funktion f : U → R gilt Di Dj f =
Dj Di f für alle i und j.
Der Satz bleibt nicht gültig ohne die Stetigkeit der partiellen Ableitungen.
6
Lokale Eigenschaften
Stets sei f : U → R eine Abbildung von einer offenen Teilmenge des Rn nach
R. Mit AT bezeichnen wir die transponierte Matrix zu A. A heißt symmetrisch,
falls A = AT .
13
Definition 20
a) f hat ein lokales Maximum bzw. isoliertes Maximum in
u ∈ U , falls auf einer -Umgebung von u gilt f x ≤ f u bzw. f x < f u.
Analoges definiert man für Minima. Ein Extremum ist ein Minimum oder
Maximum.
b) Ist f differenzierbar auf U so ist der Gradient von f das Vektorfeld gradf :
U → Rn definiert durch gradf (u) = f 0 (u)T . u heisst stationärer Punkt
von f , wenn gradf (u) = 0. Ein stationärer Punkt, an dem f kein lokales
Extremum hat, heisst Sattelpunkt.
Der Gradient zeigt die Richtung der stärksten Änderung von f an.
Satz 25 Sei f differenzierbar auf U . Hat f ein lokales Extremum in u, so ist
u ein stationärer Punkt.
T
Beispiel 3 Sei A eine symmetrische Matrix und f x = xxTAx
auf der Menge
x
U aller Vektoren 6= 0 definiert. Dann ist f U das Bild der Menge der Einheitsvektoren. Also hat f ein lokales Maximum und somit einen stationären Punkt
u. Nach Quotientenregel ist dies ein Eigenvektor zum ( maximalen ) Eigenwert
uT Au von A. Induktiv folgt leicht, dass A diagonalisierbar ist und eine Orthonormalbasis aus Eigenvektoren besitzt.
Pn
Definition 21
a) Für h ∈ Rn ist Dh der Differentialoperator i=1 hi Di .
Dann ist Dh f (u) die Richtungsableitung von f in Richtung h an der Stelle
u.
b) Für f aus C 2 ist die Hesse-Matrix Hf (u) zu f an der Stelle u definiert
als die symmetrische (!) Matrix mit Di Dj f (u) in der iten Zeile und jten
Spalte.
Satz 26 ( Taylor-Formel ) Sei f k + 1-mal stetig differenzierbar auf U . Sei u
aus U und > 0 so gewählt, dass U (u) ganz in U liegt. Dann gilt für alle h mit
k h k< die Taylor-Formel
f (u + h) =
k
X
1
1
(Dh )i f (u) +
(Dhk+1 )f (u + th)
i!
(k
+
1)!
i=0
für ein t zwischen 0 und 1. Dabei geht der letzte Term für h → 0 von höherer
Ordnung als k gegen 0. Speziell für k = 2 gilt
1
f (u + h) = f (u) + [gradf (u), h] + [h, Hf (u)h] + ρ(h)
2
mit
ρ
khk2
→ 0 für h → 0.
Definition 22 Eine symmetrische Matrix A heisst positiv definit bzw. positiv
semi-definit, wenn xT Ax > 0 bzw. ≥ 0 für alle x 6= 0 gilt. Analog definiert
man negativ definit bzw. negativ semi-definit. A heisst indefinit, wenn sowohl
xT Ax > 0 als auch y T Ay < 0 für geeignete x, y auftritt.
14
Bemerkung 7 Eine Diagonalmatrix D ist positiv definit bzw. positiv semidefinit bzw. indefinit genau dann, wenn alle Diagonaleinträge dii > 0 bzw. ≥ 0
bzw. einer > 0 und ein anderer < 0 ist.
Satz 27 Sei A eine symmetrische Matrix. Dann kann man mit dem GaussAlgorithmus eine invertierbare Matrix S konstruieren, derart dass SAS T = D
eine Diagonalmatrix ist. Dabei ist A positiv definit bzw semi-definit bzw. indefinit genau dann, wenn das entsprechende für D gilt.
Satz 28 Sei A eine symmetrische Matrix. Dann sind gleichwertig:
a) A ist positiv definit.
b) Für alle i = 1, 2, . . . n ist der sogenannte Hauptminor det(Ai ) > 0. Dabei
ist Ai die i × i-Untermatrix von A in der linken oberen Ecke.
c) Man kann in endlich vielen Schritten eine untere Dreiecksmatrix L mit
lauter Einsen auf der Diagonalen konstruieren , so dass LALT = D eine
Diagonalmatrix mit dii > 0 für alle i ist.
d) Alle Eigenwerte von A sind > 0.
Bemerkung 8 Eine symmetrische Matrix A ist genau dann positiv definit,
wenn eine Konstante C > 0 existiert mit xT Ax ≥ CxT x für alle Vektoren
x.
Satz 29 Sei f dreimal stetig differenzierbar und u ein stationärer Punkt. Dann
gilt:
a) Ist Hf (u) positiv definit, so hat f in u ein ( isoliertes ) lokales Minimum.
b) Hat f in u ein lokales Minimum, so ist Hf (u) positiv semi-definit.
c) Die analoge Aussage gilt für lokale Maxima.
d) Ist Hf (u) indefinit, so ist u ein Sattelpunkt.
7
Der Satz von der inversen Funktion
In diesem Abschnitt arbeiten wir der Einfachheit halber stets mit der MaximumsNorm und der Zeilensummennorm als zugehöriger Operatornorm und schreiben
kurz k x k statt k x k∞ . Ferner bezeichnen wir mit Kr (u) die Menge aller x mit
k x − u k≤ r und nennen dies die abgeschlossene Kugel um u mit Radius r.
Satz 30 ( Mittelwertsatz ) Sei f : U → Rm eine C 1 -Funktion definiert auf
einer offenen Teilmenge U des Rn . Für u ∈ U sei r > 0 so gewählt, dass Kr (u)
in U liegt. Sei M das Maximum aller k f 0 (x) k mit x ∈ Kr (u). Dann gilt
k f x − f x0 k≤ M k x − x0 k
für alle x, x0 aus Kr (u).
15
Definition 23 Ein Diffeomorphismus f ist eine bijektive Abbildung f : U → V
zwischen nicht-leeren offenen Teilmengen des Rn bzw. Rm , so dass f und die
Umkehrabbildung f −1 überall differenzierbar sind. Ist f eine C k -Abbildung mit
k ≥ 1, so heisst f ein C k -Diffeomorphismus.
Bemerkung 9 Ist f ein Diffeomorphismus, so folgt aus der Kettenregel, dass
n = m und (f −1 )0 (y) = (f 0 (f −1 (y)))−1 für alle y gilt. Insbesondere ist dann mit
f auch f −1 eine C 1 -Abbildung.
Jede affine Abbildung x 7→ Ax + b mit invertierbarer Matrix A ist ein C ∞ Diffeomorphismus von Rn nach Rn .
Satz 31 ( Satz von der inversen Funktion ) Sei f : U → Rn eine C 1 -Funktion
definiert auf einer offenen Teilmenge U des Rn . Für ein u ∈ U sei f 0 (u) invertierbar. Dann gibt es offene Umgebungen U1 von u und V1 von f u, so dass die
Abbildung f1 : U1 → V1 definiert durch f1 x = f x ein C 1 -Diffeomorphismus ist.
Lokal in einer ganzen offenen Umgebung vom Punkt u ist also f invertierbar,
falls die Ableitung f 0 (u) nur in dem Punkt invertierbar ist. Der Satz verallgemeinert sich leicht auf C k -Funktionen mit beliebigem k ≥ 1.
8
Implizite Funktionen und Untermannigfaltigkeiten
x0
Für n > m schreiben wir einen Vektor x in R als Spalte
mit x0 ∈ Rn−m
x00
und x00 ∈ Rm sowie eine m × n-Matrix A als eine Zeile A0 A00 bestehend
aus einer m × (n − m)-Matrix A0 und einer m × m-Matrix A00 .
n
n
m
Satz 32 (Satz von der impliziten
0 Funktion ). Sei U offen in R , f : U → R
u
eine C 1 -Funktion, u =
in U und b = f u. Ferner gelte für f 0 (x) =
00
u
(Jf (x))0 (Jf (x))00 , dass Jf (u)00 invertierbar ist. Dann gibt es
Jf (x) =
offene Umgebungen U 0 von u0 und U 00 von u00 sowie eine C 1 -Abbildung g :
U 0 → U 00 , so dass der Graph Γ(g) von g der Durchschnitt von f −1 (b) mit
der U 0 × U 00 ist. g ist i.a. nicht explizit bekannt, aber für die
Ableitung gilt
x0
0
0
0 00 −1
0 0
0
g (h(x )) = −((Jf (hx )) ) (Jf (hx )) . Dabei ist hx =
gx0
Satz 33 ( Extrema mit Nebenbedingungen ) Sei U offen in Rn und seien h :
U → R sowie f : U → Rm stetig differenzierbare Abbildungen. Setze M =
f −1 (0) und es sei der Rang von f 0 (u) für alle u ∈ M gleich m. Ist dann x ∈ U
eine Extremstelle von h unter der Nebenbedingung f (u) = 0 ( d.h. es ist x ∈ M
und es gibt eine in U enthaltene -Umgebung V von x, so dass für alle u ∈
M ∩ V gilt
Pmh(u) ≤ h(x) bzw. h(u) ≥ h(x) ), so gibt es Skalare λ1 , . . . , λm mit
h0 (x) = i=1 λi fi0 (x). Die eindeutig bestimmten Skalare heißen Lagrangesche
Multiplikatoren.
16
Wie das Verschwinden des Gradienten ist dies nur ein notwendiges Kriterium
für eine Extremstelle. Die Existenz muß gesondert nachgewiesen werden.
Im folgenden fassen wir für m < n den Rm als Unterraum von Rn auf, der
aus allen Spalten besteht, deren letzte n − m Komponenten verschwinden.
Definition 24 Eine nicht-leere Teilmenge M des Rn heißt m-dimensionale
C k -Untermannigfaltigkeit, falls es für jeden Punkt p ∈ M eine offene Umgebung
U und eine offene Menge V gibt, sowie einen C k -Diffeomorphismus h : U → V
mit h(M ∩ U ) = V ∩ Rm . Dabei sei k ≥ 1. Ein Vektor v ∈ Rn ist dann ein
Tangentenvektor an M in p, wenn es für eine -Umgebung I von 0 in R eine
differenzierbare Abbildung α : I → Rn gibt mit α(t) ∈ M für alle t, α(0) = p
und α0 (0) = v. Die Menge Tp M aller solcher Tangentenvektoren heißt Tangentialraum an M im Punkt p.
Lokal um p liegt also nach dem ’krummlinigen’ Koordinatenwechsel h die
Menge M so in Rn wie Rm und ein Tangentialvektor ist die Tangente an eine
Kurve durch p.
Wir betrachten von jetzt an der Einfachheit halber nur noch den Fall k = 1.
Eine Ebene im Raum kann man bekanntlich entweder durch eine Gleichung
oder durch eine Parameterdarstellung angeben. Eine analoge Aussage gilt für
Untermannigfaltigkeiten.
Satz 34 Sei m < n und M eine nicht-leere Teilmenge von Rn . Dann sind
äquivalent:
a) M ist eine m-dimensionale C 1 -Untermannigfaltigkeit des Rn .
b) Zu jedem p ∈ M gibt es eine offene Umgebung U und eine C 1 -Abbildung
f : U → Rn−m mit Rangf 0 (p) = n − m, so dass M ∩ U = f −1 (0). ( ’Lokal
wird M durch n − m Gleichungen beschrieben. ’)
c) Zu jedem p ∈ M gibt es eine offene Umgebung U , eine offene Nullumgebung P in Rm , eine C 1 -Abbildung φ : P → Rn mit φ(0) = p und
Rangφ0 (0) = m, so dass φ einen Homöomorphismus zwischen P und
M ∩ U liefert. ( ’Lokal wird M durch m freie Parameter beschrieben ’
).
Sind die Voraussetzungen erfüllt, so gilt Tp M = Kern f 0 (p) = Bild φ0 (0).
Insbesondere ist der Tangentialraum ein Unterraum und seine Dimension ist
m.
Definition 25 Sei f : U → Rn−m eine C 1 -Abbildung mit einer nicht-leeren
offenen Menge U des Rn als Definitionsbereich. Ein Element b im Bild f (U )
heisst regulärer Wert, wenn Rangf 0 (x) = n − m für alle x ∈ U mit f x = b gilt.
Folgerung 2 Ist f : U → Rn−m eine C 1 -Abbildung und b ein regulärer Wert,
so ist M = f −1 (b) eine m-dimensionale Untermannigfaltigkeit
Pn
Für f : Rn → R mit f (x) = i=1 x2i beispielsweise ist 1 ein regulärer Wert
und man erhält die n−1-dimensionale Sphäre M als Untermannigfaltigkeit. Der
Tangentialraum Tx M besteht aus allen Vektoren, die auf x senkrecht stehen.
17
9
Einführung in gewöhnliche Differentialgleichungen
Definition 26 Sei D ein Intervall in R, das sog. Zeitintervall, und U eine
offene Teilmenge des Rn , der sog. Phasenraum. Weiter sei (t0 , u0 ) ∈ D × U .
a) Ein stetiges Vektorfeld ist eine stetige Abbildung v : D × U → Rn .
b) Sei D0 ein offenes Teilintervall, das t0 enthält. Eine lokale Lösung des zu v
und (t0 , u0 ) gehörenden Anfangswertproblems - abgekürzt AWP - oder auch
der zu v gehörenden DGL mit Anfangsbedingung ist eine C 1 -Abbildung
φ : D0 → U , so dass φ(t0 ) = u0 und φ0 (t) = v(t, φ(t)) für alle t aus D0
gilt. Die Lösung heißt maximal, falls φ nicht auf ein größeres Intervall D00
mit D0 ⊂ D00 ⊆ D fortgesetzt werden kann, und global für D0 = D.
c) Das Vektorfeld v erfüllt auf der offenen Menge D0 × U 0 ⊆ D × U eine
Lipschitz-Bedingung, wenn es eine sog. Lipschitz-Konstante L gibt, so dass
für alle t ∈ D0 und u, u0 ∈ U 0 gilt
||v(t, u) − v(t, u0 )|| ≤ L||u − u0 ||.
Das Vektorfeld erfüllt lokale L-Bedingungen, wenn jeder Punkt von D ×
U in einer derartigen offenen Menge liegt, und es erfüllt eine globale LBedingung, wenn v auf D × U eine L-Bedingung erfüllt.
Ein Vektorfeld heftet also jedem Punkt aus U einen von der Zeit t abhängigen
Vektor an, und eine lokale Lösung mit Anfangsbedingung φ(t0 ) = u0 ist eine
Kurve, die zur Zeit t0 durch den Punkt u0 läuft und deren Tangente zur Zeit t
gerade v(t, φ(t)) ist.
2
Beispiel 4 Stets sei D = U = R. Dann erfüllt v(t, u) = u 3 in keiner Umgebung
von (0, 0) eine Lipschitz-Bedingung und v(t, u) = exp(u) zwar lokale, aber keine
globale.
Lemma 9
a) Ist v : D × U → Rn bezüglich der Variablen u stetig differenzierbar, so erfüllt v lokale L-Bedingungen.
b) Ist B : D → Mn×n (R) stetig, so erfüllt v : D × Rn → Rn definiert durch
v(t, u) = B(t)u lokale L-Bedingungen.
Lemma 10 ( Gronwalls Lemma ) Sei h : [a, b] → R stetig und L ≥ 0.
Rx
a) Ist C > 0 eine Konstante mit 0 ≤ h(x) ≤ C +L a h(t)dt für alle x ∈ [a, b],
so ist h(x) ≤ Cexp(L(x − a)) für alle x ∈ [a, b].
Rx
b) Aus 0 ≤ h(x) ≤ L a h(t)dt für alle x ∈ [a, b] folgt h = 0.
18
Bemerkung 10 Die Ableitung einer Kurve ist komponentenweise definiert.
Rb
Analog definiert man das Integral a φ über eine stetige Kurv als den Vektor,
dessen i-te Komponente das Integral der i-ten Komponentenfunktion
φRi ist. Bei
R
Verwendung der Maximumsnorm ist dann die Abschätzung || φ|| ≤ ||φ|| offensichtlich.
Das AWP φ0 (t) = v(t, φ(t)) und φ(t0 = u0 wird damit nach dem Hauptsatz
der Differential- und Integralrechnung äquivalent zur Integralgleichung
Z t
φ(t) = u0 +
v(s, φ(s))ds
t0
.
Diese Uminterpretation ist von entscheidender Bedeutung.
Satz 35 ( Eindeutigkeit lokaler Lösungen ) Sei v ein Vektorfeld, das lokale
Lipschitz-Bedingungen erfüllt, und sei (t0 , u0 ) ∈ D × U . Dann stimmen zwei
lokale Lösungen φi : Di0 → U , i = 1, 2, des zugehörigen AWP auf D10 ∩ D20
überein. Falls das AWP also überhaupt eine lokale Lösung hat, so gibt es genau
eine maximale Lösung.
Bevor wir zur allgemeinen Theorie der Existenz von Lösungen kommen,
behandeln wir zwei wichtige Klassen von Beispielen, die manchmal durch elementare Funktionen lösbar sind.
Satz 36 ( Lineare DGL in einer Variablen ) Sei D ein Intervall und seien a, b stetige Funktionen von D nach R. Sei U = R. Die zum Vektorfeld
v(t, u) = a(t)u + b(t) gehörige DGL φ0 (t) = a(t)φ(t) + b(t) heißt lineare DGL,
und zwar homogene für b = 0 und inhomogene für b 6= 0. Sei (t0 , u0 ) ∈ D × U .
Die zugehörigen AWP besitzen in beiden Fällen eindeutige globale Lösungen,
nämlich:
Rt
a) Mit A(t) = t0 a(s)ds ist φ(t) = u0 exp(A(t)) die Lösung des homogenen
AWP.
b) Sei ψ(t) = exp(A(t))u(t). Genau dann ist ψ eine Lösung des inhomogenen
Rt
AWP’s, wenn u(t) = u0 + t0 exp(−A(s))b(s)ds.
Man wird selbst für die lineare DGL nur in Glücksfällen die Lösungen durch
elementare Funktionen ausdrücken können, weil beispielsweise der inhomogene Fall mit a = 0 das Finden einer Stammfunktion der stetigen Funktion b
erfordert.
Bei den Differentialgleichungen mit getrennten Variablen sind D und U zwei
offene Intervalle und f : D → R sowie g : U → R stetige Abbildungen. Wir
betrachten das Vektorfeld v(t, u) = f (t)g(u) und wollen das AWP für (t0 , u0 )
lösen. Dabei sind zwei Fälle zu unterscheiden:
1.Fall g(u0 ) = 0. Dann ist die konstante Funktion φ = u0 eine Lösung des
AWP. Falls v aber nicht lokalen L-Bedingungen genügt, kann es noch andere
19
2
Lösungen geben. Sei etwa f = 1 und g(u) = 3u 3 . Dann ist φ(t) = t3 nichttriviale Lösung des AWP für (0, 0).
2.Fall g(u0 ) 6= 0.
Wegen der Stetigkeit verschwindet dann g auf einer offenen Umgebung nicht.
Sei J das größte offene Teilintervall von U ( warum existiert dies ? ),
R uauf1 dem
g nicht den Wert 0 annimmt. Definiere G : J → R durch G(u) = u0 g(v)
dv.
1
0
Wegen G = g ist G nach Sätzen aus Analysis I strikt monoton, G(J) ein offenes
Intervall und die Umkehrabbildung H : G(J) → J ist differenzierbar.
Rt
Definiere weiter F : D → R durch F (t) = t0 f (s)ds. Dann ist F (t0 ) = 0 =
G(u0 ). Wegen der Stetigkeit von F wird eine ganze Umgebung von t0 unter F
nach G(J) abgebildet und es sei I das größte offene t0 enthaltende Teilintervall
von D mit dieser Eigenschaft.
Satz 37 ( DGL mit getrennten Variablen ) Mit obigen Voraussetzungen und
Bezeichnungen ist φ(t) = H(F (t)) eine Lösung φ : I → J des AWP.
Ist ψ : D0 → J eine andere lokale Lösung, so ist D0 ⊆ I und ψ ist die
Einschränkung von φ.
Implizit ist also die Lösung durch F = G ◦ φ gegeben.
Beispiel 5 Wir wollen als Beispiel die logistische DGL φ0 t = kφ(t)(K − φ(t))
mit φ(0) = u0 untersuchen. Dabei ist k > 0 der Wachstumsfaktor und K > 0 das
Supremum der Anzahl φ(t) der zur Zeit t vorhandenen ’Lebewesen’. Wir nehmen
an, dass 0 < u0 < K gilt. Es ist g(u) = u(K − u) und J =]0, K[ das größte
1
u0 enthaltende Intervall, auf dem g nirgends verschwindet. Nun gilt v(K−v)
=
1
1 1
K (v + R
K−v ), wie man mit Hilfe sog. Partialbruchzerlegung findet. Also folgt
u
u0
1
1
u
G(u) = u0 g(v)
dv = K
(ln( K−u
) − C) mit C = ln( K−u
). Offenbar ist G(J) =
0
Rt
R und daher D = R = I. Weiter ist F (t) = 0 kds = kt. Aus G(φ(t)) = F (t),
φ(t)
φ(t)
= Kkt+C und durch Exponieren K−φ(t)
= exp(Kkt+C).
erhält man ln( K−φ(t)
K
Der Kehrwert liefert φ(t) = 1 + exp(−kKt − C) also schließlich
φ(t) = K
1
1
=K
.
1 + exp(−kKt − C)
1 + exp(−kKt)( uK0 − 1)
Lemma 11 Sei K ein kompakter und T ein vollständiger metrischer Raum.
Dann ist die Menge C 0 (K, T ) versehen mit der Metrik
d(f, g) = sup{d(f x, gx)|x ∈ K}
ein vollständiger metrischer Raum.
Wir kommen nun zum Hauptsatz über die Existenz lokaler Lösungen von DGL’s
und deren stetige Abhängigkeit von den Anfangswerten. Zur präzisen Formulierung fixieren wir einige Notationen.
Seien zunächst D ein offenes Intervall, U eine offene Teilmenge des Rn ,
v : D × U → Rn ein stetiges Vektorfeld und (t0 , u0 ) ∈ D × U . Sei weiter D0 ⊆ D
20
ein offenes Intervall, das t0 enthält und U 0 ⊆ U eine offene Umgebung von u0 ,
derart dass die Menge K = D0 × U 0 kompakt ist und in D × U liegt. Ist nun
β : K → U eine stetige Abbildung, so sei P β : K → Rn definiert durch
Z t
v(s, β(s, u)ds.
(P β)(t, u) = u +
t0
P heißt Picard-Lindelöf-Operator.
Lemma 12 ( Schlüssel-Lemma ) Wir behalten obige Notationen und Voraussetzungen bei. Zusätzlich gebe es eine Konstante L mit ||v(t, u) − v(t, u0 )|| ≤
L||u − u0 || für alle t ∈ D und u, u0 ∈ U sowie einen vollständigen metrischen
Raum U 00 mit U 0 ⊆ U 00 ⊆ U , so dass (P β)(K) für jedes stetige β : K → U 00
wieder in U 00 liegt. dann gilt:
a) P bildet M = C 0 (K, U 00 ) in sich ab und P ist stetig.
b) Definiert man rekursiv α0 (t, u) = u und αn+1 = P αn , so konvergiert die
Folge (αn ) in M gegen einen Fixpunkt α von P .
c) α induziert eine stetige Abbildung von D0 × U 0 nach U , so dass für jedes
u ∈ U 0 die Kurve αu (t) = α(t, u) eine lokale Lösung der DGL ist mit Anfangsbedingung αu (t0 ) = u.( Diese lokalen Lösungen existieren also alle
auf dem gleichen Zeitintervall und sie hängen stetig von den Anfangsbedingungen ab. )
Satz 38 ( Satz von Picard-Lindelöf ) Sei v : D × U → Rn ein stetiges Vektorfeld, das lokalen L-Bedingungen genügt. Dann gibt es zu jedem Punkt t0 ∈ D
und u0 ∈ U offene Umgebungen D0 ⊆ D und U 0 ⊆ U und eine stetige Abbildung α : D0 × U 0 → U , so dass für jedes u ∈ U 0 die Kurve αu : D0 → U mit
αu (t) = α(t, u) die eindeutige lokale Lösung der DGL mit Anfangswert u ist.
Man kann darüber hinaus zeigen, dass α im letzten Satz stetig differenzierbar
nach u ist, wenn v es ist. Einen Beweis findet man in dem schönen Buch von
Lang ’Undergraduate Analysis’ auf Seite 558 oder im Lehrbuch ’Gewöhnliche
Differentialgleichungen’ von Arnold ab Seite 273.
Definition 27 Sei D ein Zeitintervall und seien B : D → Mn×n (R) sowie
b : D → Rn stetige Abbildungen. Die zum Vektorfeld v : D × Rn → Rn mit
v(t, u) = B(t)u gehörende DGL φ0 (t) = B(t)φ(t) + b(t) heisst lineare DGL. Für
b = 0 heißt die Gleichung homogen, sonst inhomogen. Es sei H die Menge der
Lösungen der homogenen DGL.
Satz 39 ( Lineare DGL ) Mit den Notationen und Annahmen der voranstehenden Definition gilt:
a) Zu jedem (t0 , u0 ) hat das AWP genau eine globale Lösung.
b) H ist ein Unterraum von C 1 (D, Rn ) und für jedes t induziert die Abbildung φ 7→ φ(t) einen Isomorphismus zwischen H und Rn .
21
c) Für eine Basis (φ1 , φ2 , . . . , φn ) von H - ein sogenanntes Fundamentalsystem - ist für jedes s die sog. Fundamentalmatrix F (s) mit φj (s) in der
j.ten Spalte für 1 ≤ j ≤ n invertierbar. Eine spezielle Lösung des inhomogenen AWP ist dann wie im
R t eindimensionalen Fall gegeben durch
ψ(t) = F (t)u(t) mit u(t) = u0 + t0 ((F (s)−1 )b(s)ds.
Besonders einfach wird die Situation, wenn B(t) = A eine konstante Funktion ist.
P∞ i
Definition 28 Für A ∈ Mn×n (R) ist exp(A) = i=0 Ai! .
Diese Reihe konvergiert, weil Mn×n (R) ein Banachraum ist.
Satz 40 Für alle A, B ∈ Mn×n (R) gilt:
a) Aus AB = BA folgt exp(A+B) = exp(A)exp(B) und Bexp(A) = exp(A)B.
Insbesondere ist En = exp(0) = exp(A)exp(−A) = exp(−A)exp(A) und
jedes exp(A) ist invertierbar.
b) Die Abbildung φ : R → Mn×n (R) definiert durch φ(t) = exp(tA) ist
differenzierbar mit φ0 (t) = Aexp(tA) = Aφ(t).
c) Für jedes invertierbare S ist S −1 exp(A)S = exp(S −1 AS).
d) exp(AT ) = exp(A)T .
e) Ist A eine Blockdiagonalmatrix mit zwei Blöcken A1 und A2 , so ist exp(A)
Blockdiagonalmatrix mit Blöcken exp(A1 ) und exp(A2 ). Das verallgemeinert sich auf mehrere Blöcke. Insbesondere ist das Exponential einer Diagonalmatrix eine Diagonalmatrix mit den Exponentialen der Eigenwerte
als Einträge.
f ) Die Abbildungen φi (t) = exp(tA)ei , i = 1, 2, . . . n bilden ein Fundamentalsystem der homogenen linearen DGL ψ 0 (t) = Aψ(t).
Für Matrizen in Jordanscher Normalform kann man also explizit ein Fundamentalsystem angeben. Zu diesem Zweck wurde die Jordansche Normalform
entwickelt. Es ist dabei vorteilhaft über den komplexen Zahlen zu arbeiten. Die
erforderlichen Anpassungen sind alle einfach und man kann sie gut in dem im
Internet frei zugänglichen Buch von Bröcker ’Analysis 3’ auf den Seiten 39 − 63
nachlesen. Dort wird auch gezeigt, wie man mit einem Trick die entwickelte
Theorie übertragen kann auf explizite Differentialgleichungen höheren Grades.
Schließlich wird dort der zweidimensionale Fall und insbesondere der harmonische Oszillator ausführlich behandelt. Die Beweise beruhen neben der von uns
dargestellten allgemeinen analytischen Theorie auf linearer Algebra.
22
Herunterladen