Skript - Institut für Analysis

Analysis B
Vorlesung an der Leibniz Universität Hannover
Sommersemester 2011
Elmar Schrohe
Institut für Analysis
Leibniz Universität Hannover
Welfengarten 1
30167 Hannover
Inhaltsverzeichnis
9 Differentialrechnung im Rn
3
10 Kurven
16
11 Kurvenintegrale, Vektorfelder und Potentiale
18
12 Gewöhnliche Differentialgleichungen
21
13 Norm von Matrizen. Exponentialabbildung
30
14 Lineare Differentialgleichungen
34
15 Riemann-Integral
38
16 Integration über Flächen. Der Gaußsche Integralsatz
45
2
9
Differentialrechnung im Rn
Normen
Es seien (x1 , x2 , x3 ) und (y1 , y2 , y3 ) zwei Punkte in R3 . Dann ist ihr Abstand nach dem Satz des
Pythagoras
p
(x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .
p
Insbesondere ist der Abstand des Punktes (x1 , x2 , x3 ) zum Ursprung (0, 0, 0) gerade x21 + x22 + x23 .
9.1 Definition. Es sei x = (x1 , . . . , xn ) ∈ Rn . Wir nennen
q
kxk = x21 + . . . + x2n die (euklidische) Norm von x.
Der Abstand zweier Punkte x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) ist dann gerade kx − yk.
Die euklidische Norm hat folgende Eigenschaften
(N1) Es ist kxk ≥ 0 für jedes x. Ferner ist kxk = 0 ⇔ x = 0.
(N2) kcxk = |c|kxk für x ∈ Rn und c ∈ R.
(N3) kx + yk ≤ kxk + kyk für alle x, y.
Allgemeiner: Eine Norm auf einem K-Vektorraum V (K = R oder C) ist eine
Abbildung V ∋ v 7→ kvk ∈ R≥0 mit den Eigenschaften (N1), (N2), (N3).
Für die Euklidische Norm gilt
|xj | ≤ kxk ≤ |x1 | + . . . + |xn |,
j = 1, . . . , n.
(1)
Das Skalarprodukt hx, yi der Vektoren x und y in Rn ist gegeben durch
hx, yi =
n
X
xj y j .
j=1
Hier gilt:
(SP1) hcx + dy, zi = chx, zi + dhy, zi, c, d ∈ R, x, y, z ∈ Rn .
(SP2) hx, yi = hy, xi
(SP3) hx, xi ist reell und ≥ 0; hx, xi = 0 ⇔ x = 0.
Es gilt
kxk =
p
hx, xi.
Auch den Begriff des Skalarprodukts kann man auf K-Vektorräume verallgemeinern.
Man fordert dann im Fall K = R die Eigenschaften (SP1), (SP2), (SP3). Für K = C
ersetzt man (SP2) durch
hx, yi = hy, xi
(konjugiert komplex).
Ein Beispiel ist dann gegeben durch
hz, wi =
X
3
zj wj .
(2)
Folgen in Rn
9.2 Grenzwerte. Es sei a ∈ Rn und (ak ) eine Folge in Rn , d.h. jedes ak ist ein n-Vektor
ak = (ak1 , . . . , akn ). Wir schreiben lim ak = a oder ak → a, falls gilt:
Zu jedem ε > 0 existiert ein n0 mit kak − ak ≤ ε für alle k ≥ n0 .
9.3 Satz. Mit obigen Bezeichnungen ist äquivalent
(i)
(ii)
ak → a
Für j = 1, . . . , n gilt akj → aj .
In diesem Fall ist lim ak = (lim ak1 , . . . , lim akn ).
Beweis. Folgt aus 9.1(1).
⊳
9.4 Definition. Es sei U ⊆ Rn , r > 0 und x ∈ Rn .
(a)
(b)
Mit B(x, r) = {y ∈ Rn : kx − yk < r} bezeichnen wir die offene Kugel mit Radius r um x.
Wir nennen eine Teilmenge U von Rn offen, falls zu jedem x ∈ U ein ε > 0 existiert so
dass B(x, ε) ⊆ U gilt. (Intuitiv: Wir können von x aus in jeder Richtung ein kleines Stück
weitergehen, ohne U zu verlassen.)
Beachte: Die offene Kugel B(x, r) ist offen.
Partielle Ableitungen
Im Folgenden sei U ⊆ Rn offen und f : U → Rm eine Funktion. Sie ordnet jedem x ∈ U ein
m−Tupel
f (x) = (f1 (x), . . . , fm (x))
zu. Durch x 7→ f1 (x), . . . , x 7→ fm (x) werden dann m Funktionen f1 , . . . , fm von U nach R
definiert, die sogenannten Komponentenfunktionen von f .
9.5 Beispiel. Es sei f : R3 → R2 definiert durch
f (x1 , x2 , x3 ) = (sin(x1 + x2 ), x1 + 2x3 ).
Dann hat f die Komponentenfunktionen f1 , f2 : R3 → R gegeben durch
f1 (x) = sin(x1 + x2 )
f2 (x) = x1 + 2x3 .
Es ist eigentlich besser (aber oft unpraktisch), die Vektoren vertikal zu schreiben, also
 
x1
sin(x1 + x2 )


f x2 =
.
x1 + 2x3
x3
4
(1)
9.6 Partielle Ableitung. Es sei x ∈ U und ej = (0, . . . , 0, 1, 0, . . . , 0) der j−te Einheitsvektor.
Wir nennen f in x in die j-te Koordinatenrichtung differenzierbar“ oder nach xj partiell
”
”
differenzierbar“, falls der Grenzwert
f (x + hej ) − f (x)
h
f (x1 , . . . , xj−1 , xj + h, xj+1 , . . . , xn ) − f (x1 , . . . , xn )
= lim
h→0
h
∂f
(x) =
∂xj
lim
h→0
( partielle Ableitung von f nach xj in x“) existiert. Man schreibt auch ∂xj f (x), manchmal sogar
”
fxj (x).
Ist f in jedem Punkt partiell nach xj differenzierbar, so heißt f auf U partiell nach xj differenzierbar.
Ist f in alle Koordinatenrichtungen (j = 1, . . . , n) partiell differenzierbar, so heißt f partiell
differenzierbar in x bzw. in U . Sind die partiellen Ableitungen stetig, so heißt f stetig partiell
2f
differenzierbar. Ebenso definiert man k-fache partielle Differenzierbarkeit z.B. ∂x∂2 ∂x
(x).
1
9.7 Satz. Genau dann ist f in x nach xj differenzierbar, wenn jede Komponentenfunktion
fi , i = 1 . . . m, in x nach xj differenzierbar ist. In diesem Fall ist
 ∂f 
1
 ∂x. j 
∂f
. 
=
 . 
∂xj
∂f
m
∂xj
Beweis. Folgt aus Satz 9.3.
⊳
9.8 Bemerkung. Es sei fi eine Komponentenfunktion von f. Wählt man die xk , k 6= j fest
und betrachtet die Funktion
g(t) = fi (x1 , . . . , xj−1 , t, xj+1 , . . . , xn )
die für t nahe bei xj definiert ist, so gilt – falls der Grenzwert existiert –
∂fi
(x) = g ′ (xj ).
∂xj
Die partielle Ableitung einer Komponentenfunktion ist also eine gewöhnliche Ableitung bei festgehaltenen anderen Variablen.
9.9 Beispiel. Für die Funktion aus Beispiel 9.5 ist
∂f
cos(x1 + x2 )
(x) =
1
∂x1
∂f
cos(x1 + x2 )
(x) =
0
∂x2
∂f
0
(x) =
.
2
∂x3
5
Sofort sehen wir, dass die partiellen Ableitungen selbst wieder partiell differenzierbar sind (sogar
beliebig oft). Wir haben z.B.
∂f
∂f
∂
∂
(x) = 0 =
(x).
∂x1 ∂x3
∂x3 ∂x1
P
9.10 Beispiel. r : Rn → R, r(x) = ( nk=1 x2k )1/2 = kxk. Dann ist r auf Rn \ {0} stetig partiell
differenzierbar, mit
xj
1 X 2 −1/2
∂r
· 2xj = .
= (
xk )
∂xj
2
r
9.11 Gradient, Divergenz, Rotation, Laplaceoperator, Wärmeleitung, Wellen.
(a)
(b)
Es sei f : U → R (m = 1!) partiell differenzierbar. Dann heißt
∂f
∂f
(x) . . .
(x) ∈ Rn
grad f (x) =
∂x1
∂xn
der Gradient von f . Manchmal schreibt man auch ∇f (x) Nabla f“. Die Funktion grad f :
”
U → R ordnet jedem Punkt x ∈ U ⊆ Rn den Vektor grad f (x) ∈ Rn zu.
Ganz allgemein nennt man eine Funktion g : U ⊆ Rn → Rn ein Vektorfeld.
Ist g : U ⊆ Rn → Rn (m = n!) ein partiell differenzierbares Vektorfeld, so heißt div g =
Pn ∂gj
j=1 ∂xj die Divergenz von g in x.
Formal ist
div g = h∇, gi,
(c)
wobei ∇ als der Vektor“ ( ∂x∂ 1 , . . . , ∂x∂ n ) interpretiert wird.
”
Ist g : U ⊆ R3 → R3 ein partiell differenzierbares Vektorfeld, so heißt
∂g2 ∂g1
∂g3 ∂g2
∂g1
∂g3
−
,
−
,
−
rot g =
∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
die Rotation von g in x (Englisch: curl g). Formal ist
rot g = ∇ × g.
(d)
Für f : U → R (oder C) zweimal stetig partiell differenzierbar setzt man
∆f =
n
X
∂2f
j=1
und nennt ∆ =
(e)
Pn
∂2
j=1 ∂x2j
∂x2j
den Laplace-Operator. Wichtigster Operator der Math. Physik.
Beachte: ∆ = div grad.
Die Gleichung ∆f = 0 heißt Laplacegleichung; ihre Lösungen harmonische Funktionen.
Die inhomogene Gleichung ∆f = g (bei gegebenem g und gesuchtem f heißt meist Potentialgleichung.
Beispiel: ∆E = 4πρ (E elektrisches Potential, ρ Ladungsdichte) ist die Gleichung für das
elektrische Feld bei gegebener Ladungsverteilung.
6
(f)
Weiterhin sei I ⊆ R ein Intervall. Für Funktionen f : U × I → R heißt
1 ∂f
− ∆x f = 0
k ∂t
P
die Wärmeleitungsgleichung; hier bedeutet ∆x = nj=1
∂2
∂x2j
und k ≥ 0 ist die Leitfähigkeit.
1 ∂2f
− ∆x f = 0
c2 ∂t2
ist die Wellengleichung; c ist die Ausbreitungsgeschwindigkeit.
WARNUNG: Sind die Variablen x und t, und kommt ein ∆ vor, so versteht man die
Gleichung meist so, dass ∆ nur bzgl. der x-Variablen wirkt.
9.12 Satz. (Satz von Schwarz). Ist f : U ⊆ Rn → Cm zweimal stetig partiell differenzierbar,
so ist
∂xj ∂xk f (x) = ∂xk ∂xj f (x), x ∈ U ;
man kann also die Reihenfolge der partiellen Ableitungen vertauschen.
Mehrfache Anwendung des Satzes zeigt, dass man für eine ℓ-mal stetig partiell differenzierbare
Funktionen die Reihenfolge für ℓ partielle Ableitungen vertauschen kann.
9.13 Richtungsableitung. Ist v ein beliebiger Vektor in Rn , so ist die partielle Ableitung von
f nach v in x
f (x + hv) − f (x)
∂f
(x) = lim
,
h→0
∂v
h
sofern der Limes existiert.
9.14 Schwäche der partiellen Ableitung. Auf D ⊆ R differenzierbare Funktionen sind
stetig (Folgerung 6.3). Partiell differenzierbare Funktionen sind jedoch u.U. nicht stetig. Man
führt daher einen stärkeren Ableitungsbegriff ein.
Totale Differenzierbarkeit
9.15 Definition. Es sei U ⊂ Rn offen. Eine Funktion f : U ⊂ Rn → Rm heißt in x ∈ U total
differenzierbar, falls eine (von x abhängige) lineare Abbildung
A : Rn → Rm
existiert, so dass für alle h mit khk < ε (ε wie in 9.4) gilt:
f (x + h) = f (x) + Ah + ϕ(h),
wobei ϕ : {h : khk < ε} → Rm eine Funktion ist mit
ϕ(h)
= 0.
khk→0 khk
lim
(1)
Die lineare Abbildung A ist die Ableitung von f in x. Schreibe A = f ′ (x).
Man nennt f (total) differenzierbar auf U , falls f in jedem Punkt x ∈ U (total) differenzierbar
ist.
Klar: A ist gegeben durch Matrix in Matmn (R) “Jacobi-Matrix”. Wie sieht diese Matrix aus?
7
9.16 Satz. Für f : U → Rm und x ∈ U ist äquivalent
(i)
(ii)
f total differenzierbar in x;
alle Komponentenfunktionen fi , i = 1, . . . , m, sind total differenzierbar
In diesem Fall ist f stetig. Ferner ist f in alle Koordinatenrichtungen partiell differenzierbar,
und für die Jacobi-Matrix A = (aij ), die f ′ (x) darstellt, gilt
aij =
∂fi
(x).
∂xj
Beweis. –
⊳
Nicht jede partiell differenzierbare Funktion ist auch total differenzierbar. Es gilt jedoch folgender
Satz:
9.17 Satz. Folgendes ist äquivalent:
(i)
(ii)
f ist auf U stetig total differenzierbar, d.h., f ist in jedem Punkt x ∈ U total differenzierbar, und die (matrixwertige) Funktion x 7→ f ′ (x) ist stetig.
f ist auf U stetig partiell differenzierbar, d.h., f ist in jedem Punkt x ∈ U partiell diffe∂f
(x) sind stetig.
renzierbar, und die Funktionen x 7→ ∂x
j
9.18 Satz (Kettenregel). Es seien U ⊆ Rn und V ⊆ Rk offen, f : U → Cm , g : V → Rn
Abbildungen mit g(V ) ⊆ U . Ist g differenzierbar in x ∈ V und f differenzierbar in g(x) ∈ U , so
ist f ◦ g : V → Cm differenzierbar in x, und es gilt
(f ◦ g)′ (x) = f ′ (g(x)) ◦ g ′ (x),
wobei ◦ auf der rechten Seite die Komposition von linearen Abbildungen/Matrizen bedeutet.
Insbesondere ergibt sich die Formel
n
X ∂fi
∂gk
∂
(g(x))
(f ◦ g)i (x) =
(x).
∂xj
∂xk
∂xj
k=1
Beweis. Für y = g(x) schreibe f (y + h) = f (y) + Ah + ϕ(h) und g(x + h) = g(x) + Bh + ψ(h)
mit A = f ′ (y), B = g′ (x). Dann ist
(f ◦ g)(x + h) = f (g(x + h)) = f (g(x) + Bh + ψ(h))
= f ◦ g(x) + ABh + Aψ(h) + ϕ(Bh + ψ(h)).
Zeige noch: Aψ(h) + ϕ(Bh + ψ(h)) = o(khk): Zunächst ist
ψ(h) kAψ(h)k ψ(h)
=
A khk ≤ kAk khk → 0.
khk
Nun zu ϕ(Bh + ψ(h)).
Für alle h 6= 0 mit Bh + ψ(h) = 0 ist nichts zu zeigen. Stets ist kBh + ψ(h)k ≤ kBkkhk +
ψ(h)
khk khk → 0. Es folgt:
kϕ(Bh + ψ(h))k kBh + ψ(h)k
kϕ(Bh + ψ(h))k
ψ(h)
kϕ(Bh + ψ(h))k
=
≤
kBk +
−→ 0.
khk
kBh + ψ(h)k
khk
kBh + ψ(h)k
khk
⊳
8
9.19 Folgerung. Es sei U ⊆ Rn offen, x ∈ U, v ∈ Rn und f : U → R(!) differenzierbar in x.
Dann gilt
∂f
(x) = hgrad f (x), vi.
∂v
Nach der Cauchy-Schwarzschen Ungleichung ist stets |hgrad f (x), vi| ≤ kgrad f (x)k kvk, wobei
Gleichheit nur bei linearer Abhängigkeit von grad f (x) und v gilt.
Es folgt: Unter allen v mit kvk = 1 wird ∂f
∂v (x) maximal für das (eindeutig bestimmte) v, das in
Richtung von grad f (x) zeigt. Der Gradient gibt daher die Richtung des steilsten Anstiegs von
f an.
Beweis. Definiere die Funktion g : R → Rn durch g(t) = x + tv. Sie ist differenzierbar in 0 mit
g′ (0) = v. Für hinreichend kleines ε > 0 ist x + tv ∈ U für alle |t| < ε. Nach 9.18 ist f ◦ g
differenzierbar in 0, und es gilt
f (x + tv) − f (x)
∂f
(x) = lim
= (f ◦ g)′ (0) = f ′ (g(0))g ′ (0) = f ′ (x) ◦ v = hgrad f (x), vi.
t→0
∂v
t
9.20 Die Tangentialfläche an den Funktionsgraphen. Es sei f : U → R total differenzierbar in x ∈ U . Der Graph von f ist die Menge
Gf = {(y, f (y)) : y ∈ U } ⊆ Rn+1 .
Die Identität
f (x + h) = f (x) + f ′ (x)h + ϕ(h)
können wir umschreiben (y = x + h)
f (y) = f (x) + f ′ (x)(y − x) + ϕ(y − x).
Da f Werte in R annimmt, kann man statt f ′ (x)(y − x) auch hgradf (x), y − xi schreiben. Dass
ϕ(h)/khk gegen 0 konvergiert, besagt, dass f nahe x gut durch die affin-lineare Funktion
l(y) = f (x) + hgradf (x), y − xi
genähert werden kann. Den Graphen Gl = {(y, l(y)) : y ∈ Rn } ⊆ Rn+1 von l nennt man die
n-dimensionale Tangentialfläche an den Graphen von u in x.
9.21 Satz (Hauptsatz der Differential- und Integralrechnung). Es sei U ⊆ Rn offen
und f : U → Rm stetig differenzierbar. Ferner sei x ∈ U und h ∈ Rn so klein, dass x + th ∈ U
für alle t ∈ [0, 1]. Dann gilt
Z 1
f ′ (x + th) dt · h.
(1)
f (x + h) − f (x) =
0
Beachte die Kurzschreibweise: f ′ (x) = (∂x1 f (x), . . . , ∂xn f (x)), und h = (h1 , . . . , hn ).
Beweis. Wir definieren die Funktion g : [0, 1] → Rm durch g(t) = f (x + th). Dann gilt nach der
Kettenregel g′ (t) = f ′ (x + th)h. Folglich
Z 1
Z 1
′
f ′ (x + th) dt · h.
g (t) dt =
f (x + h) − f (x) = g(1) − g(0) =
0
0
⊳
9
9.22 Folgerung (Schrankensatz). Unter den Voraussetzungen von Satz 9.21 sei zusätzlich
kf ′ (x + th)k ≤ M für alle 0 ≤ t ≤ 1. Dann folgt aus 9.21(1), dass kf (x + h) − f (x)k ≤ M khk.
9.23 Multi-Indizes. Es sei α = (α1 , . . . , αn ) ∈ Nn0 . Wir setzen |α| = α1 + α2 + . . . + αn : Länge
des Multi-Index, α! = α1 ! · . . . · αn !.
∂xα f = ∂xα11 . . . ∂xαnn f , falls f |α|-mal stetig differenzierbar ist. Für x ∈ Rn setze xα = xα1 1 ·. . .·xαnn .
9.24 Satz (Taylorformel mit Restglied). Es sei f : U → Rm N -mal stetig differenzierbar.
Dann gilt
f (x + h) =
N
−1
X
|α|=0
X NZ 1
∂ α f (x) α
h +
(1 − t)N −1 ∂ α f (x + th) dt · hα .
α!
α! 0
|α|=N
Beweis. Definiere g : [0, 1] → Rm durch g(t) = f (x + th). Nach der Taylorformel in R ist
g(1) =
N
−1
X
k=0
1
1 dk
g(0) +
k! dtk
(N − 1)!
Z
1
0
(1 − t)N −1
dN
g(t) dt.
dtN
Dann folgt die Behauptung aus der leicht zu zeigenden Formel
X k!
dk
∂ α f (x + th)hα .
g(t)
=
dtk
α!
|α|=k
⊳
9.25 Definition. Es sei f : U → R zweimal stetig differenzierbar. Dann setzt man
(Hess f )(x) = (∂xj ∂xk f (x))j,k=1,...,n
Hessesche Matrix von f in x“: Symmetrische n × n-Matrix nach dem Satz von Schwarz.
”
9.26 Lemma. Es sei f : U → R zweimal stetig differenzierbar und x ∈ U . Dann gilt
1
f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h),
2
(1)
wobei R3 (x, h)/khk2 → 0 für h → 0.
Beweis. Zunächst macht man sich klar, dass für reellwertige Funktionen (m = 1) gilt:
X ∂ α f (x)
hα = f (x)
α!
|α|=0
n
X
X ∂ α f (x)
α
∂xj f (x)hj = hgradf (x), hi
h =
α!
|α|=1
X ∂ α f (x)
hα =
α!
|α|=2
j=1
1
hHess f (x)h, hi
2
Dann schätzt man den Fehler ab.
⊳
10
9.27 Definition. Es sei U ⊆ Rn offen und f : U → R eine Funktion. Man nennt x ∈ U ein
lokales Maximum für f , falls
(1)
f (x) ≥ f (y) für alle y in einer Umgebung von x
Analog heißt x lokales Minimum, falls
(2)
f (x) ≤ f (y) für alle y in einer Umgebung von x.
Extremum ist der Oberbegriff für Maximum oder Minimum.
Man spricht von einem isolierten Maximum/Minimum/Extremum, falls Gleichheit in (1) bzw.
(2) nur für x = y gilt.
9.28 Satz. Es sei U ⊆ Rn offen, f : U → R partiell differenzierbar und x lokales Extremum
für f . Dann ist grad f (x) = 0.
Beweis. Für j = 1, . . . , n betrachte g(t) = f (x+tej ). Da U offen ist, ist g für −ε < t < ε definiert.
Die Funktion g ist differenzierbar nach der Kettenregel und hat in 0 ein lokales Extremum. Es
folgt: ∂xj f (x) = g ′ (0) = 0.
⊳
9.29 Definition. Es sei A selbstadjungierte Matrix. Dann ist hAx, xi = hx, Axi = hAx, xi,
somit hAx, xi ∈ R. Man nennt A
• positiv definit, falls hAx, xi > 0 ∀ x 6= 0
• negativ definit, falls hAx, xi < 0 ∀ x 6= 0
• indefinit, falls es sowohl ein x mit hAx, xi > 0 als auch ein y mit hAy, yi < 0 gibt.
Beispiel:
• A = Id positiv definit: hAx, xi = hx, xi = kxk2 > 0 ∀ x 6= 0
• A = −Id negativ definit: hAx, xi = h−x, xi = −kxk2 < 0 ∀ x 6= 0.
9.30 Definitheit und Eigenwerte. Eine selbstadjungierte Matrix ist diagonalisierbar mit
reellen Eigenwerten nach einem Satz der Linearen Algebra. Dann gilt:
• A positiv definit ⇔ alle Eigenwerte > 0.
• A negativ definit ⇔ alle Eigenwerte < 0.
• A indefinit ⇔ es gibt sowohl positive als auch negative Eigenwerte.
9.31 Hurwitz-Kriterium. Es sei A = (aij )i,j=1,...,n eine reelle, symmetrische n × n-Matrix.
Dann gilt:
A positiv definit ⇔ det (aij )1≤i,j≤k > 0, k = 1, . . . , n.
9.32 Satz. Es sei U ⊆ Rn offen, f : U → R zweimal stetig differenzierbar und x ∈ U mit
grad f (x) = 0.
11
(a)
(b)
Ist (Hess f )(x) positiv/negativ definit, so hat f in x ein isoliertes Minimum/Maximum.
Ist (Hess f )(x) indefinit, so hat f in x kein lokales Extremum.
Beweis. Nach 9.26 ist
1
f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h),
2
wobei
lim R3 (x, h)/khk2 = 0.
(1)
h→0
Hier ist grad f (x) = 0. Ist Hess f (x) positiv definiert und λ > 0 der kleinste Eigenwert, so ist
hHess f (x)h, hi ≥ λ khk2 .
Andererseits existiert wegen (1) ein δ > 0 mit
|R3 (x, h)| <
λ
khk2 ,
4
falls khk < δ. Es folgt:
f (x + h) > f (x) +
λ
khk2 > f (x),
4
khk < δ.
Analog schließen wir für negativ definites Hess f (x).
(b) Wähle eine Eigenvektor h+ zu einem positiven Eigenwert λ+ , und einen Eigenvektor h− zu
einem negativen Eigenwert λ− , von Hess f (x) mit kh± k = 1.
Dann ist hHess f (x)h+ , h+ i = λ+ kh+ k2 = λ+ und hHess f (x)h− , h− i = λ− .
Für t → 0 betrachte f (x + th+ ) und f (x + th− ). Es gilt
f (x + th± ) − f (x) = λ± t2 + o(t2 ).
Für kleines t ist dieser Ausdruck positiv bei “+” und negativ bei “–”.
⊳
Lokale Invertierbarkeit und Lösen von Gleichungen
9.33 Definition. Eine Abbildung f : U → V zwischen zwei offenen Teilmengen U, V ⊂ Rn
heißt (C 1 -)Diffeomorphismus, falls f bijektiv ist und sowohl f als auch die Umkehrabbildung
f −1 stetig differenzierbar sind.
9.34 Lemma. Ist f : U → V ein Diffeomorphismus, so ist f ′ (x) invertierbar für jedes x ∈ U
und
(f −1 )′ (f (x)) = (f ′ (x))−1 .
⊳
Beweis. Die Identität f −1 (f (x)) = x liefert beim Ableiten: (f −1 )′ (f (x)) ◦ f ′ (x) = Id.
9.35 Frage. Wäre es sinnvoll, den Begiff des Diffeomorphismus f : U → V für U ⊆ Rn und
V ⊆ Rk einzuführen?
Antwort: Nein, denn wie oben wäre f ′ (x) invertierbar. Dies geht nur für k = n.
⊳
12
9.36 Satz von der lokalen Invertierbarkeit. Es sei U ⊆ Rn offen und f : U → Rn stetig
differenzierbar. Ferner sei a ∈ U und f ′ (a) invertierbar. Dann gibt es offene Umgebungen V (⊆ U )
von a und V ′ von f (a) in Rn mit folgenden Eigenschaften
(i)
(ii)
f : V → V ′ ist bijektiv.
Die Umkehrabbildung g = f −1 : V ′ → V ist ebenfalls differenzierbar, und (vgl. Satz 6.7)
−1
g′ (f (a)) = f ′ (a)
.
(1)
Die Einschränkung von f auf V ist also ein Diffeomorphismus (‘f ist lokal ein Diffeomorphismus’).
Bemerkung: Zeigt man die Differenzierbarkeit von g, so folgt (1) sofort wie in 9.34.
9.37 Beispiel. Die Polarkoordinatenabbildung in R2 . Wir betrachten die Abbildung
f : R>0 × R → R2 ,
Hier ist
f ′ (r, ϕ) =
f (r, ϕ) = (r cos ϕ, r sin ϕ)
cos ϕ −r sin ϕ
sin ϕ
r cos ϕ
.
Die Matrix ist stets invertierbar, denn det f ′ (r, ϕ) = r > 0.
Also ist für jeden Wert von (r, ϕ) ∈ R>0 × R die Abbildung f lokal invertierbar; es ist
cos ϕ sin ϕ
−1 ′
′
−1
.
(1)
(f ) (f (r, ϕ)) = (f (r, ϕ)) =
− sinr ϕ cosr ϕ
p
Setzt man x = f1 (r, ϕ) = r cos ϕ, y = f2 (r, ϕ) = r sin ϕ, so ist f −1 (r, ϕ) = (x, y), r = x2 + y 2 ,
cos ϕ = xr , sin ϕ = yr und (1) schreibt sich
!
√ x
√ y
2
2
2
2
x +y
x +y
(f −1 )′ (x, y) =
.
y
x
− x2 +y
2
x2 +y 2
Beachte: Die Abbildung f ist jedoch nicht injektiv (also nicht überall invertierbar), da für alle
(r, ϕ) gilt: f (r, ϕ) = f (r, ϕ + 2π).
9.38 Implizite Funktionen. Viele Beziehungen zwischen Größen x und y in den Naturwissenschaften sind als explizite Funktionen gegeben, d.h. von der Form y = f (x). Manchmal hat
man jedoch lediglich eine Beziehung der Form F (x1 , . . . , xn ) = 0, wobei F : U ⊆ Rn → Rm eine
gegebene Funktion ist, m ≤ n, d.h. man hat m Gleichungen für die n Unbekannten x1 , . . . , xn .
Frage: Kann man m der Unbekannten daraus bestimmen? D.h., kann man die Menge L = {x ∈
U : F (x) = 0} darstellen in der Form L = {(y, g(y)) : y ∈ U ′ } für ein geeignetes U ′ ⊆ Rn−m ?
9.39 Beispiel. Global geht das in der Regel nicht. Für F (x, y) = x − y 2 ist die Menge L =
{(x, y) : F (x, y) = 0} eine (liegende) Parabel. Wir können x global als Funktion von y darstellen:
L = {(x, y) : y ∈ R, x = y 2 } = {(y 2 , y) : y ∈ R}, aber es gibt keine Funktion g : U ′ → R mit
L = {(x, g(x)) : x ∈ U ′ }, da wir zu x < 0 gar keine Lösung erhalten und zu x > 0 zwei:
√
L = {(x, y) : y = ± x, x ≥ 0}. Aber lokal, in der Umgebung V = V1 × V2 eines Punktes (x0 , y0 )
√
mit x0 > 0 auf L können wir L als Graph darstellen, entweder durch L ∩ V = {(x, x) : x ∈ V1 }
√
oder L ∩ V = {(x, − x) : x ∈ V1 }, je nachdem ob V2 ⊆ R>0 oder V2 ⊆ R<0 .
13
9.40 Satz (Satz über die implizite Funktion). Es sei U ⊆ Rk × Rm offen und F : U → Rm
stetig differenzierbar. Für einen Punkt (a, b) ∈ U sei F (a, b) = 0 und die m × m-Matrix ∂F
∂y (a, b)
k
m
invertierbar. Dann gibt es offene Umgebungen V1 ⊆ R von a und V2 ⊆ R von b sowie eine
stetig differenzierbare Abbildung g : V1 → V2 mit F (x, g(x)) = 0.
Ferner gilt: Ist (x, y) ∈ V1 × V2 mit F (x, y) = 0, so ist y = g(x) (d. h. die Gleichung ist eindeutig
nach y auflösbar). Es gilt
∂g
(x) = −
∂x
−1
∂F
∂F
(x, g(x))
(x, g(x)).
∂y
∂x
(1)
9.41 Beispiel. Wir betrachten die 2 Gleichungen mit 3 Unbekannten
x2 + y 2 + (z − 1)2 = 9
2
2
2
x + y + (z + 1)
= 9.
(1)
(2)
Sie beschreiben die Schnittmenge zweier Kugeln mit Radius 3 um (0, 0, 1) bzw. (0, 0, −1). Aus
(1) und (2) erhalten wir (Differenz) sofort z = 0 und dann x2 +y 2 = 8. Die Menge L =
√ {(x, y, z) :
F (x, y, z) = 0} ist also der Kreis um den Ursprung in der (x, y)-Ebene mit Radius 8.
√
√
Lokal können
wir√die Punkte aus L als Graph über x (für − 8 < x < 8) bzw. über y darstellen
√
(für − 8 < y < 8); nie als Funktion von z.
Was sagt der Satz von der impliziten Funktion? Hier ist
2
x + y 2 + (z − 1)2 − 9
F (x, y, z) =
x2 + y 2 + (z + 1)2 − 9
und
′
F (x, y, z) =
2x 2y 2(z − 1)
.
2x 2y 2(z + 1)
Die erste und die zweite Spalte von F ′ sind linear abhängig. Die zweite und die dritte Spalte sind
linear unabhängig, falls y 6= 0; die erste und dritte Spalte sind linear unabhängig, falls x 6= 0;
Nach dem Satz
√ können wir also lokal y und z als Funktion von x darstellen, sofern y 6= 0
(d.h. x 6= ± 8; das ist die Standard-Variante). Andererseits kommt es auf die Reihenfolge der
Variablen nicht an. Wir können alternativ x und z als Funktion von y darstellen, sofern x 6= 0.
9.42 Satz (Extrema unter Nebenbedingungen). Sei U ⊆ Rn offen, g : U → Rk stetig
differenzierbar,
M = {x ∈ U : g(x) = 0}
und a = (a1 , . . . , an ) ∈ M ein Punkt mit Rang(g ′ (a)) = k (also maximal). Ferner sei f : U → R
eine stetig differenzierbare Funktion, die in a ein lokales Extremum unter der Nebenbedingung
g(x) = 0 einnimmt.
(Das heißt, es gibt eine Umgebung U von a derart, dass entweder f (a) ≤ f (x) ∀x ∈ M ∩ U oder
f (a) ≥ f (x) ∀x ∈ M ∩ U .)
Dann existiert λ = (λ1 , . . . , λk ) (die λk heißen Lagrangesche Multiplikatoren) so, dass
grad f (a) = λ g′ (a).
14
9.43 Bemerkung. Wann sind wir sicher, dass f auf M ein Extremum hat?
In Analysis A hatten wir gesehen, dass eine stetige Funktion auf einem Intervall [a, b], a, b ∈ R,
ihr Maximum und ihr Minimum annimmt.
Die Verallgemeinerung für höhere Dimensionen lautet: Eine stetige Funktion auf einer kompakten Menge nimmt ihr Maximum und ihr Minimum an. Dabei ist eine Teilmenge des Rn kompakt,
wenn sie abgeschlossen und beschränkt ist.
Abgeschlossen nennt man eine Menge, wenn ihr Komplement offen ist. Eine Nullstellenmenge
einer stetigen Funktion wie in Satz 9.42 ist stets abgeschlossen. Ebenso ist eine Menge der Form
{x ∈ Rn : h(x) ≤ 0} mit stetigem h abgeschlossen.
Beschränkt heißt sie, wenn sie in einer großen Kugel B(0, R), R groß, enthalten ist.
Unter den Voraussetzungen von Satz 9.42 ist also nur noch Beschränktheit nachzuprüfen.
9.44 Beispiel. f : R3 → R, f (x, y, z) = x + y + z, g : R3 → R, g(x, y, z) = (x2 + y 2 − 1, z).
Klar: f, g sind stetig differenzierbar. Die Menge M = {(x, y, z) : g(x, y, z) = 0} ist gerade der
Einheitskreis in der (x, y)-Ebene, insbesondere also beschränkt. Ferner
2x 2y 0
′
g (x, y, z) =
.
0 0 1
Nach Bemerkung 9.43 wissen wir, dass f auf M ein Maximum und ein Minimum hat.
Auf M hat g ′ den Rang 2, da wegen x2 + y 2 = 1 stets x 6= 0 oder y 6= 0. Nach 9.42 existiert
λ = (λ1 , λ2 ) mit
grad f (a) = λ g′ (a)
also
(1, 1, 1) = (λ1 · 2x, λ1 · 2y, λ2 ).
Es folgt
2xλ1 = 1
(1)
2yλ1 = 1
(2)
λ2 = 1.
(3)
x2 + y 2 = 1
(4)
z = 0.
(5)
Ferner ist wegen der Nebenbedingung
√
Wegen (1) ist λ1 6= 0, (1) und (2) liefern dann x = y, (4) liefert dann x = y = ± 21 2, (5)
√
√
√
√
liefert z = 0. Wir haben also zwei Kandidaten: a1 = ( 21 2, 12 2, 0) und a2 = (− 21 2, − 12 2, 0).
√
√
Einsetzen liefert f (a1 ) = 2, f (a2 ) = − 2. Somit ist a1 das Maximum und a2 das Minmum
von f unter der Nebenbedingung g.
15
10
Kurven
Im Folgenden sei D ⊆ R ein Intervall.
10.1 Definition.
(a)
(b)
(c)
Eine stetige Abbildung f : D → Rn heißt auch Kurve in Rn .
Ist f in t ∈ D differenzierbar, so heißt f ′ (t) ∈ Rn Tangentialvektor an die Kurve f in t.
Ist f differenzierbar und f ′ (t0 ) = 0, so heißt t0 singulärer Punkt. Sind alle Punkte nichtsingulär, so heißt f reguläre Kurve.
10.2 Beispiele.
(a)
(b)
(c)
(d)
Seien a, b > 0. Definiere f : [0, 2π] → R2 , f (t) = (a cos t, b sin t) Ellipse mit Halbachsen a
und b. Tangentialvektor f ′ (t) = (−r sin t, r cos t). Regulär.
Sei a ∈ Rn , v ∈ Rn \ {0}. Definiere f : R → Rn , f (t) = a + vt. Gerade durch a mit
Richtungsvektor (=Tangentialvektor) v. Regulär.
Sei r > 0, c ∈ R \ {0}. Definiere f : R → R3 , f (t) = (r cos t, r sin t, ct) Schraubenlinie.
Regulär.
Sei ϕ : D → R stetig differenzierbare Funktion. Definiere f : D → R2 durch f (t) =
(t, ϕ(t)). Graph der Kurve. Regulär.
10.3 Schnittwinkel. Sind f : D1 → Rn , g : D2 → Rn zwei reguläre Kurven und ist f (t1 ) =
g(t2 ) für geeignete t1 ∈ D1 , t2 ∈ D2 , so heißt die Zahl
ϑ = arccos
(f ′ (t1 ), g′ (t2 ))
kf ′ (t1 )k kg ′ (t2 )k
der Schnittwinkel von f und g im Punkt f (t1 ) = g(t2 ).
10.4 Rektifizierbarkeit, Länge. Es sei f : [a, b] → Rn eine Kurve und
a = t0 < t1 < . . . < tN = b
eine Partition von [a, b]. Dann ist
Pol (f ; t0 , . . . , tN ) =
N
X
j=1
kf (tj ) − f (tj−1 )k
die Länge des Polygonzugs durch f (t0 ) . . . f (tk ). Man nennt f rektifizierbar mit Länge L = L(f ),
falls gilt: Zu jedem ε > 0 existiert ein δ > 0, so daß für jede Partition a = t0 < . . . < tk = b der
Feinheit < δ
|L(f ) − Pol (f ; t0 , . . . , tN )| < ε.
10.5 Satz. Ist f : [a, b] → Rn stetig differenzierbar, so ist f rektifizierbar mit der Länge
Z b
kf ′ (t)k dt.
L(f ) =
a
16
Beweisidee. Man zeigt (relativ einfach), dass
Z tj
kf ′ (t)k dt ≤ 2 sup{kf ′ (tj ) − f ′ (t)k : t ∈ [tj−1 , tj ]}(tj − tj−1 ).
kf (tj ) − f (tj−1 k −
tj−1
Das supremum liegt dabei beliebig nahe an Null, falls die Feinheit der Zerlegung hinreichend
klein ist.
⊳
10.6 Beispiel. Seien r, α > 0. Betrachte f : [0, α] → R2 , f (t) = (r cos t, r sin t). Dann ist
kf ′ (t)k = r für alle t nach 10.2(a), also
Z α
r dt = rα.
L(f ) =
0
Speziell: α ist Bogenlänge im Einheitskreis von dem Punkt (1, 0) zu dem Punkt (cos α, sin α),
bzw., komplex betrachtet, von 1 zu eiα .
10.7 Definition. Es sei f : [a, b] → Rn eine Kurve. Ist ϕ : [α, β] → [a, b] eine stetig differenzierbare Funktion und gilt
ϕ : [α, β] → [a, b]
−1
ϕ
ist bijektiv
: [a, b] → [α, β]
ist stetig differenzierbar,
so heißt ϕ Parametertransformation.
Beachte: Weil ϕ und ϕ−1 stetig differenzierbar sind, ist ϕ′ (t) 6= 0 ∀t.
Weil ϕ bijektiv ist, ist ϕ entweder monoton wachsend oder monoton fallend, also entweder
ϕ′ > 0 und ϕ(α) = a, ϕ(β) = b (orientierungserhaltend) oder ϕ′ < 0 und ϕ(α) = b, ϕ(β) = a
(orientierungsumkehrend).
10.8 Satz. Die Kurvenlänge ist von der Parametrisierung unabhängig, d. h., sind ϕ, f wie in
10.7 und F : [α, β] → Rn definiert durch F (t) = f (ϕ(t)), so gilt
L(f ) = L(F ).
Beweis. Nach der Kettenregel ist F ′ (t) = f ′ (ϕ(t)) ◦ ϕ′ (t), also für ϕ′ > 0:
L(F ) =
Z
β
α
′
kF (t)k dt =
Z
β
α
′
′
kf (t)kϕ (t) dt =
Für ϕ′ < 0 analog.
Z
a
b
kf ′ (t)k dt = L(f ).
⊳
10.9 Bemerkung. Tangentialvektor: Wegen (f ◦ ϕ)′ = (f ′ ◦ ϕ) · ϕ′ gilt: gleiche Richtung für
orientierungserhaltendes ϕ, entgegengesetzte für orientierungsumkehrendes ϕ.
Der Winkel zwischen zwei Kurven bleibt wegen obiger Identität gleich bei orientierungserhaltenden Parametertransformationen.
17
11
Kurvenintegrale, Vektorfelder und Potentiale
11.1 Definition/Erinnerung.
(a)
(b)
Eine Funktion F : U ⊆ Rn → Rn heißt ein Vektorfeld.
Eine Kurve γ : [a, b] → Rn heißt stückweise glatt, falls es eine Partition a = t0 < t1 . . . <
tN = b von [a, b] gibt mit der Eigenschaft, dass γ|]tj−1 ,tj [ , j = 1, . . . , N , zu einer stetig
differenzierbaren Funktion auf [tj−1 , tj ] fortsetzbar ist.
11.2 Definition. Es sei γ : [a, b] → Rn eine stückweise glatte Kurve mit Bild γ = Γ und
F : Γ → Rn ein stetiges Vektorfeld. Wir definieren das Kurvenintegral von F über γ
Z
hF, dxi
(1)
γ
durch
Z
γ
hF, dxi =
Dabei ist die Partition wie oben.
k Z
X
j=1
tj
tj−1
hF (γ(t)), γ ′ (t)i dt.
11.3 Bemerkung.
R
γ hF, dxi auch
PR
(a)
Manchmal schreibt man statt
(b)
Motivation aus Mechanik, wo Arbeit gegen ein Kraftfeld entlang der Kurve geleistet wird.
~
Auf kleinen Stücken gilt W = F~ · dx
γ
Fi dxi .
11.4 Beispiel. In R2 sei F (x, y) = (1, 1) und γ : [0, π] → R2 gegeben durch γ(t) = (cos t, sin t).
Dann ist
Z π
Z π
Z
− sin t + cos tdt = [cos t + sin t]|π0 = −2.
h((1, 1), (− sin t, cos t)idt =
hF, dxi =
γ
0
0
R
11.5 Lemma und Bemerkung. Das Integral γ hF, dxi ist von der Kurvenparametrisierung
unabhängig, solange die Orientierung erhalten bleibt.
R
R
Man schreibt daher in (1) oft Γ statt γ und spricht von der orientierten Kurve Γ. Die Parametrisierung muss sich der Leser selbst suchen; eine geschickte Wahl spart viel Arbeit.
Beweis. Ist ϕ : [c, d] → [a, b] bijektiv und differenzierbar mit ϕ(c) = a, ϕ(d) = b, so ist
Z d
Z d
hF (γ(ϕ(s)), γ ′ (ϕ(s))iϕ′ (s) ds
hF (γ · ϕ(s)), (γ ◦ ϕ)′ (s)i ds =
c
c
Z b
hF (γ(t)), γ ′ (t)i dt.
=
a
Ändern wir die Orientierung (d.h. ϕ(c) = b, ϕ(d) = a), so kehrt sich das Vorzeichen um.
⊳
11.6 Definition. Es sei U ⊆ Rn offen und F : U → Rn ein Vektorfeld. Man sagt, F habe das
Potential oder auch die Stammfunktion V auf U , falls V : U → R eine partiell differenzierbare
Funktion ist mit grad V = F .
18
11.7 Satz. Das Vektorfeld F : U → Rn habe das Potential V ∈ C 1 (U, R). Dann gilt für jede
stückweise glatte Kurve γ : [a, b] → Rn mit Bild γ = Γ ⊆ U
Z
hF, dxi = V (γ(b)) − V (γ(a))
Γ
(Potential am Endpunkt − Potential am Anfangspunkt).
Beweis. O.B.d.A. γ glatt
Z
a
Z
b
hF, dxi =
Z
=
Z
=
b
a
b
a
b
a
hF (γ(t)), γ ′ (t)i dt
hgrad V (γ(t)), γ ′ (t)i dt
(V ◦ γ)′ (t) dt
= V (γ(b)) − V (γ(a)).
⊳
11.8 Folgerung. Hat F ein Potential V ∈ C 1 (U, R), so gilt für jede geschlossene, stückweise
glatte Kurve, die in U verläuft,
Z
hF, dxi = 0.
Γ
R11.9 Beispiel. Das Vektorfeld F aus 11.4 hat das Potential V (x, y) = x + y. Es gilt also
γ hF, dxi = V (γ(π)) − V (γ(0)) = V (−1, 0) − V (1, 0) = −2.
Frage: Wann hat F ein Potential?
11.10 Notwendige Bedingung. Hat F ∈ C 1 (U, Rn ) ein Potential V ∈ C 2 (U, R), so ist
∂Fj
∂Fi
(x) =
(x)
∂xj
∂xi
nach dem Satz von Schwarz, da
∂Fi
∂xj
=
∂2V
∂xi ∂xj
Integrabilitätsbedingung“
”
=
∂2V
∂xi ∂xj
=
∂Fj
∂xi .
11.11 Beispiel. Die Integrabilitätsbedingung ist nicht hinreichend. Auf R2 \ {0} betrachte
F (x, y) =
(−y, x)
.
x2 + y 2
Eine kurze Rechnung zeigt: Dieses Vektorfeld ist stetig differenzierbar auf R2 \{0} und erfüllt die
Integrabilitätsbedingung. Als Kurve wählen wir γ : [0, 2π] → Rn , γ(t) = (cos t, sin t). Γ = Bild γ
ist eine geschlossene, glatte Kurve (der Einheitskreis), aber
Z 2π
Z
Z
(− sin t (− sin t) + cos t · cos t) dt = 2π.
(F1 dx + F2 dy) = (−y dx + x dy) =
γ
0
γ
Daher kann F nach 11.8 kein Potential haben.
19
11.12 Definition. Wir nennen eine offene Teilmenge U von Rn ein Gebiet, falls sich je zwei
Punkte aus U durch einen stückweise stetig differenzierbaren Weg in U verbinden lassen (‘wegzusammenhängend’).
11.13 Satz. Sei U ein Gebiet und V1 , V2 ∈ C 1 (U, R) mit
grad V1 = grad V2 .
Dann ist V1 − V2 = const. Genau dann liefern also zwei Potentiale dasselbe Gradientenfeld, wenn
sie bis auf eine Konstante übereinstimmen.
Beweis. Wähle einen festen Punkt y0 ∈ U . Nun sei y ein beliebiger Punkt in U , γ : [a, b] eine
stückweise glatte Kurve von y0 nach y. Dann gilt nach 11.7
Z
Z
V1 (y) − V1 (y0 ) = hgrad V1 , dxi = hgrad V2 , dxi = V2 (y) − V2 (y0 ).
γ
γ
Also V2 (y) − V1 (y) = V2 (y0 ) − V1 (y0 ) = const ∀y.
11.14 Satz. Es sei U ein Gebiet in Rn , F ein stetiges Vektorfeld auf U . Dann ist äquivalent
R
(i)
Für jede stückweise glatte, geschlossene Kurve ist γ hF, dxi = 0.
(ii)
F besitzt ein Potential V .
Man erhält V wie folgt: Man wählt einen festen Punkt x0 ∈ U . Zu x ∈ U wählt man einen
stückweise stetig differenzierbaren Weg γx von x0 nach x und setzt
Z
hF, dxi.
V (x) =
γx
wählt,
Beweisidee. Nach 11.8 ist nur (i)⇒(ii) zu zeigen.
Rechne nach, dass die Formel ein Potential definiert. Wegen (i) hängt es nicht von der Wahl des
Wegs ab.
⊳
11.15 Definition. U ⊆ Rn heißt sternförmig, falls es einen Punkt x0 ∈ U (den sogenannten
Sternpunkt) gibt, so dass für jedes x ∈ U die Strecke {x0 + t(x − x0 ) : 0 ≤ t ≤ 1} ganz in U
liegt.
11.16 Beispiel.
(a)
(b)
(c)
(d)
Kugeln sind sternförmig.
R2 \ {(x, 0) : x ≥ 0} ist sternförmig mit Sternpunkt (−1, 0).
R2 \ {0} ist nicht sternförmig.
(Zeichnung)
11.17 Lemma. Ist U offen und sternförmig und erfüllt F ∈ C 1 (U, Rn ) die Integrabilitätsbedingung, so hat F auf U eine Stammfunktion.
11.18 Bemerkung. Statt ‘sternförmig’ genügt, dass U Gebiet ist und man jede stetige geschlossene Kurve in U auf einen Punkt zusammenziehen kann (‘einfach zusammenhängend’).
Beispiel: R3 \ {0} ist nicht sternförmig, aber einfach zusammenhängend. R2 \ {0} ist weder
sternförmig noch einfach zusammenhängend.
20
12
Gewöhnliche Differentialgleichungen
12.1 Definition.
(a)
Eine gewöhnliche Differentialgleichung (im Gegensatz zur partiellen) ist eine Gleichung
der Form
F (t, x(t), . . . , x(k) (t)) = 0, t ∈ J,
für eine gesuchte Funktion x : J → Rn , J Interval. Dabei ist
F : U ⊆ J × Rn × . . . × Rn → Rm
(b)
(c)
(d)
eine Funktion, in die die Werte von x und seinen Ableitungen eingesetzt werden. F kann
Werte in Rm annehmen, d.h., man hat m Gleichungen.
Die Differentialgleichung (Dgl) heißt explizit, falls sie nach der höchsten Ableitung aufgelöst ist:
x(k) = f (t, x(t), . . . , x(k−1) (t)).
P
Eine Dgl der Form kj=0 Aj (t)x(j) + f (t) = 0 heißt linear; weiterhin heißt siey
homogen, falls f = 0
inhomogen, falls f 6= 0.
Ist x(k) = f (t, x, . . . , x(k−1) ) eine Dgl, t0 ∈ J, so besteht die Anfangswertaufgabe (AWA)
darin, eine Lösung x zu finden, deren erste k − 1 Ableitungen in t0 die vorgegebenen
Anfangswerte
x(t0 ) = c0 , . . . , x(k−1) (t0 ) = ck−1
annehmen.
12.2 Beispiel. Bewegung eines Massepunktes unter dem Einfluss der Schwerkraft:
x′′ (t) = −g,
Physik:
t ∈ R.
Es folgt für t0 ∈ R fest:
x′ (t) − x′ (t0 ) =
Z
t
t0
x′′ (s) ds = −
Z
t
t0
g ds = −g(t − t0 ).
Es folgt
x′ (t) = −gt + c,
c = gt0 + x′ (t0 )
und
x(t) − x(t0 ) =
Z
t
t0
′
x (s) ds = −
1
x(t) = − gt2 + ct + d
2
Z
t
1
(−gs + c) ds = − g(t2 − t20 ) + c(t − t0 )
2
t0
mit
1
1
d = x(t0 ) + gt20 − ct0 = x(t0 ) + gt20 − gt20 − x′ (t0 )t0 .
2
2
Also hat die Lösung der Differentialgleichung die Form x(t) = − 21 gt2 + ct + d, wobei c und d
sich aus den Startwerten x(t0 ) und x′ (t0 ) berechnen lassen. Zu jeder Wahl von x(t0 ) und x′ (t0 )
gibt es genau eine Lösung.
21
Einige Lösungsverfahren
12.3 Separation der Variablen/Trennung der Veränderlichen. Möglich für Differentialgleichungen der Form
x′ = f (t)g(x), x(t0 ) = x0 ,
mit stetigen Funktionen f, g.
Fall I: g(x0 ) = 0 ⇒ Mögliche Lösung ist x ≡ x0 .
Fall II: g(x0 ) 6= 0 ⇒ Falls eine Lösung existiert, so ist auch g(x(t)) 6= 0 für t nahe t0 wegen
Stetigkeit der Abbildung t 7→ g(x(t)).
Dann gilt dort
Z x(t)
Z t
Z t ′
dy
x (s)
ds =
.
(1)
f (s) ds =
g(x(s))
g(y)
x(t0 )
t0
t0
Dies liefert eine implizite Gleichung der Form G(t, x) = 0. Auflösbar nach x?
Z t
Z x
dy
∂
∂G
1
(t, x) =
6= 0,
f (s) ds −
=−
∂x
∂x t0
g(y)
g(x)
x0
folglich: ja.
12.4 Bemerkung. Ist g(x0 ) = 0, so kann es u.U. vorkommen, dass man Lösungen der Form I
und Lösungen der Form II oben zu einer Lösung zusammenstückeln kann.
12.5 Beispiel. x′ = xt , x(t0 ) = x0 6= 0. Wir verwenden die Methode der Trennung der Veränderlichen mit f (t) = t, g(x) = x1 . Damit lautet die Gleichung 12.3(1)
Z t
Z x
s ds =
y dy
t0
x0
Integration liefert die implizite Gleichung
1 2
(t − t20 ) =
2
1 2
(x − x20 )
2
Es folgt
x2 − t2 = x20 − t20 = c
und damit
x = ±
p
c + t2
falls t2 ≥ −c (explizite Lösung)
12.6 Rückführung auf Separation der Variablen.
(a)
(b)
x′ = f (at + bx + c). Setze u(t) = at + bx(t) + c. Dann folgt u′ = a + bx′ (t) = a + bf (u).
Finde u, liefert x.
x′ = f (x/t). Setze u = xt . Dann ist
u′ =
1 ′ x 1
x′ t − x
x −
= (f (u) − u).
=
t2
t
t
t
Finde u mit Separation der Variablen.
22
12.7 Lineare Differentialgleichung erster Ordnung.
x′ + a(t)x = f (t)
x(t0 ) = x0
(a)
f ≡0:
homogen, sonst inhomogen
Homogene Differentialgleichung. Ist x0 = 0, so ist x(t) ≡ 0 eine Lösung. Ist hingegen
x0 6= 0, so gilt (Stetigkeit) zumindest für t nahe t0 : x(t)/x0 > 0. Es folgt:
Z t
x
= −
a(s) ds,
also
ln
x0
t0
−
x(t) = x0 e
(b)
Rt
t0
a(s) ds
.
Somit existiert die Lösung für alle t ∈ R, und x(t) 6= 0 ∀ t ∈ R.
Inhomogene Differentialgleichung. Ansatz: Variation der Konstanten.
Setze
R
− t a(s) ds
.
F (t) = e t0
Dann ist F (t) 6= 0 für jedes t, F ′ (t) + a(t)F (t) = 0 und F (t0 ) = 1 .
Wir machen den Ansatz: x(t) = C(t)F (t).
Damit x(t0 = x0 ist, muss C(t0 ) = x(t0 ) = x0 gelten. Ferner erhalten wir:
f = x′ + ax = (CF )′ + aCF = C ′ F + CF ′ + aCF = C ′ F + C(F ′ + aF )
Somit ist
C ′ (t) =
Es folgt
C(t) =
und damit
x(t) =
Z
t
Z
F ′ +aF =0
=
C ′ F.
Rt
f (t)
a(s) ds
= f (t) e t0
.
F (t)
Rr
t
f (r) e
t0
a(s) ds
dr + C(t0 ).
t0
Rr
f (r) e
t0
a(s) ds
dr + x0
t0
−
e
Rt
t0
a(s) ds
12.8 Bemerkung. Verzichtet man auf das Stellen einer Anfangsbedingung, so ist x′ + a(t)x =
f (t) eine inhomogene lineare Gleichung für die Funktion x, und man erhält die Regel:
Allgemeine Lösung der inhomogenen Gleichung = allgemeine Lösung der homogenen
Gleichung + spezielle Lösung der inhomogenen Gleichung
12.9 Bernoullische Differentialgleichung.
x′ + a(t)x + b(t)xr = 0,
r ∈ R.
Spezialfälle:
• r=0
x′ + a(t)x + b(t) = 0
• r=1
x′ + (a(t) + b(t))x = 0
inhomogen linear.
homogen linear.
Also r 6= 0, 1. Wähle k = 1 − r, z := xk ⇒ x = z 1/k . Die Differentialgleichung wird dann zu
1 1/k−1 ′
z
z + a(t)z 1/k + b(t)z r/k = 0.
k
Multiplikation mit kz
k−1
k
liefert die leicht lösbare inhomogen lineare Dgl
z ′ + ka(t)z + kb(t) = 0.
23
Reduktion auf Systeme erster Ordnung
12.10 Lemma. Jede explizite Differentialgleichung k-ter Ordnung (ggf. mit Anfangswerten
x(t0 ) = c1 , . . . xk−1 (t0 ) = ck ) ist äquivalent zu einem System von k Differentialgleichungen
erster Ordnung (ggf. mit Anfangswert (x1 (t0 ), . . . , xk (t0 )) = (c1 , . . . , ck )). Die Standardform
einer expliziten Differentialgleichung ist also
x′ = f (t, x) (ggf. mit Anfangsbedingung x(t0 ) = x0 )
mit einer Funktion f : U ⊆ J × Rk → Rk und x0 ∈ Rk .
Beweis. Es sei x(k) = g(t, x, . . . , x(k−1) ) eine explizite Differentialgleichung. Wir setzen
x1 = x; x2 = x′ ;
. . . xk = x(k−1) .
Dann ist das Lösen von x(k) = g(t, x, . . . , x(k−1) ) mit den Anfangswerten x(t0 ) = c1 , . . . , x(k−1) (t0 ) =
ck äquivalent zum Lösen von
x′1 = x2 ; . . . x′k−1 = xk ; x′k = g(t, x1 , . . . , xk )
mit den Anfangswerten x1 (t0 ) = c0 , . . . , xk (t0 ) = ck−1 . Fasst man x1 , . . . , xk als Vektor x auf
und c1 , . . . , ck als Vektor c, so lautet das letzte System
x′ = f (t, x),
x(t0 ) = c,
mit f (t, x) = (x2 , . . . , xk , g(t, x1 , . . . , xk )) und c = (c0 , . . . , ck−1 ).
⊳
Visualisierung
12.11 Richtungsfeld. Eine Lösung der Differentialgleichung x′ = f (t, x), (t, x) ∈ U , hat in
t0 die Steigung f (t0 , x(t0 )). An jedem Punkt (t, x) heften wir das ‘Steigungselement’, ein Geradenstückchen mit der Steigung f (t, x) an und erhalten so das sog. Richtungsfeld. Die Lösungen
der Differentialgleichung sind genau diejenigen Kurven, die sich an das Richtungsfeld anschmiegen. Das folgende Diagramm zeigt das Richtungsfeld für x′ = 14 (−t − t2 + 4x)
Richtungsfeld
3
y(x)
2
1
0
-3
-2
-1
0
1
2
x
-1
24
3
Numerische Verfahren
Es gibt eine Reihe von Verfahren, die die Lösung einer Differentialgleichung der Form x′ = f (t, x)
liefern. (Bemerkung: Sie funktionieren nur dann richtig, wenn man sicher sein kann, dass eine
eindeutig bestimmte Lösung existiert.) Am bekanntesten ist das folgende
12.12 Runge-Kutta-Verfahren. Man unterteilt das Intervall [t0 , t0 + a] in n gleiche Teile
und setzt
tk = t0 + kh, h = a/n.
Bekannt ist der Startwert (t0 , x0 ).
Nun geht man induktiv wie folgt vor:
Ist (tk , xk ) gegeben, so setzt man
yk1 = f (tk , xk );
h
h
yk2 = f (tk + , xk + yk1 );
2
2
h
h
yk3 = f (tk + , xk + yk2 );
2
2
yk4 = f (tk + h, xk + hyk3 );
1
(yk1 + 2yk2 + 2yk3 + yk4 ) ;
yk =
6
xk+1 = xk + hyk .
Der Fehler ist dann von Ordung h4 (oder besser).
Zur Erklärung: Man bestimmt xk+1 aus xk , indem man zu xk die Intervalllänge h,
multipliziert mit einer gemittelten Steigung yk , addiert. In das Mittel gehen vier
Größen ein:
• yk1 ist die Steigung in tk ;
• yk2 ist die geschätzte Steigung in tk + h2 , mittels x(tk + h2 ) ≈ x(tk ) + h2 x′ (tk ) ≈
xk + h2 f (tk , xk ).
• yk3 ist ebenfalls geschätzte Steigung in tk + h2 , diesmal jedoch mittels x(tk + h2 ) ≈
x(tk ) + h2 yk2 .
• yk4 ist die mittels x(tk + h) ≈ xk + hyk3 geschätzte Steigung in tk + h.
Existenz- und Eindeutigkeitssätze
12.13 Satz. (Existenzsatz von Peano) Es sei (t0 , x0 ) ∈ R × Rn , a > 0, b > 0. Setze
D = {(t, x) ∈ R × Rn : |t − t0 | ≤ a, kx − x0 k ≤ b}.
Ist f = f (t, x) : D → Rn stetig, so hat die Anfangswertaufgabe
x′ = f (t, x),
x(t0 ) = x0
mindestens eine Lösung auf dem Intervall ]t0 − c, t0 + c[, wobei
b
} und A = sup{kf (t, x)k : (t, x) ∈ D}.
A
Beachte: Das sup existiert wegen Stetigkeit von f und Kompaktheit von D.
c = min{a,
25
Ohne Beweis.
12.14 Satz. (Existenz und Eindeutigkeitssatz von Picard-Lindelöf ). Bezeichungen und
Annahmen von Satz 12.13. Zusätzlich sei f lipschitzstetig in x in folgendem Sinn: Es gibt ein
L ≥ 0 mit
kf (t, x1 ) − f (t, x2 )k ≤ L kx1 − x2 k für alle (t, x1 ), (t, x2 ) ∈ D.
Dann hat die Anfangswertaufgabe eine eindeutige Lösung auf dem Intervall ]t0 − d, t0 + d[, wobei
d = min{a, Ab , L1 }.
12.15 Bemerkung. Die Bedingung aus 12.14(b) ist stets erfüllt, wenn die Funktion f auf
einer Umgebung von D nach x stetig differenzierbar ist; wegen der Kompaktheit von D ist dann
nämlich k∂x f (t, x)k beschränkt auf D und somit
kf (t, x1 ) − f (t, x2 )k ≤ sup{k∂x f (t, x)k} kx1 − x2 k.
Beweisidee von 12.14. Es sei J0 = [t0 − r, t0 + r] für ein 0 < r < d.
Schritt 1 Trick: Wir integrieren und sehen, dass x genau dann die AWA x′ = f (t, x), x(t0 ) = x0
auf J0 löst, wenn x auf J0 stetig ist und
Z t
x(t) = x0 +
f (s, x(s))ds, t ∈ J0
t0
gilt.
Schritt 2 Wir definieren die Folge von Funktionen (φ0 , φ1 , . . .) wie folgt:
φ0 ist die Funktion mit dem konstanten Wert x0 . Ist φk gegeben, so setzen wir
Z t
φk+1 = x0 +
f (s, φk (s))ds, t ∈ J0 .
t0
Man kann dann zeigen, dass diese Folge von Funktionen in dem Raum C([t0 , t0 + c]) gegen die
Lösung der AWA konvergiert.
⊳
12.16 Beispiel. Was schief gehen kann.
(a)
Verlust der Eindeutigkeit:
Wir betrachten die Anfangswertaufgabe
x′ = x2/3 ,
x(t0 ) = x0 auf R.
Problem: x 7→ x2/3 nicht lipschitzstetig in 0. Ist z.B. x0 = 0, so sieht man mit Separation
der Variablen, dass für jede Wahl von t1 und t2 mit t2 < t0 < t1 durch
 1
 ( 3 (t − t2 ))3 t < t2
xt1 ,t2 (t) =
0
t2 ≤ t ≤ t1
 1
3
( 3 (t − t1 )) t > t1
eine stetig differenzierbare (!) Funktion definieren, die die Differentialgleichung samt Anfangsbedingung erfüllt. Wir erhalten also unendlich viele Lösungen auf R.
Für x0 6= 0 analog.
26
(b)
Endliches Lösungsintervall. x′ = −x2 , x(t0 ) = x0 ist stetig auf R und lipschitzstetig auf
jedem Teilintervall [−R, R].
Für x0 6= 0 liefert Separation der Variablen
Z t
Z x
1
dy
=
1 ds,
−
2
t0
x0 y
also
1
x
−
1
x0
= t − t0 bzw.
x=
1
t − (t0 −
1 .
x0 )
Die Lösung ist also für x0 6= 0 in einer Umgebung von t = t0 eindeutig bestimmt. Für
t → t0 − x10 gilt |x(t)| → ∞, d. h. die Lösung explodiert“ bei Annäherung an t0 − x10 ( in
”
”
endlicher Zeit“).
Das folgende Lemma zeigt, dass man das Wachstum kontrollieren kann:
12.17 Lemma. (Gronwallsches Lemma) Es sei J ein Intervall, t0 ∈ J. Ferner sei g : J → R
stetig mit g ≥ 0, und es gelte
Z t
g(t) ≤ A g(s)ds + B, t ∈ J
t0
mit geeigneten A, B ≥ 0. Dann gilt für alle t ∈ J
g(t) ≤ BeA|t−t0 | .
Beweis. Zunächst sei t ≥ t0 . Wir betrachten die Funktion
Z t
G(t) = A
g(s)ds + B.
t0
Nach Annahme ist G′ (t) = Ag(t) ≤ AG(t). Die SdV-Technik liefert sofort:
G(t) ≤ G(t0 )eA(t−t0 ) .
Wegen g ≤ G folgt die Behauptung. Analog für t ≤ t0 .
⊳
12.18 Definition. Es sei f : U ⊆ Rn+1 → Rn stetig, J, J˜ Intervalle (nicht notwendig offen) und
x : J → Rn sowie x̃ : J → Rn in U verlaufende Lösungen der Differentialgleichung x′ = f (t, x).
Man nennt x̃ Fortsetzung von x, falls J ⊆ J˜ und x̃|J = x. Eine Lösung heißt maximal, falls sie
keine Fortsetzung auf ein echt größeres Intervall hat.
12.19 Definition. Es sei U ⊆ R × Rn offen. Wir sagen, f : U → Cm erfülle eine lokale
Lipschitzbedingung bezüglich x, falls zu jedem (t, x) ∈ U eine Umgebung U0 und eine Konstante
L existiert mit
kf (t, x1 ) − f (t, x2 )k ≤ Lkx1 − x2 k, (t, x1 ), (t, x2 ) ∈ V.
27
12.20 Satz. Es sei U ⊆ R × Rn offen, (t0 , x0 ) ∈ U , f : U → Rn sei stetig und erfülle eine lokale
Lipschitzbedingung bzgl. x.
Dann existiert eine eindeutige maximale Lösung xmax der Anfangswertaufgabe
x′ = f (t, x),
x(t0 ) = x0 .
Sie ist definiert auf einem offenen Intervall ]t− , t+ [. Nur dann ist t+ 6= +∞, wenn für x ր t+ die
Lösungskurve (t, x(t)) an den Rand des Gebiets U stößt oder wenn limt ր t+ kxmax (t)k = +∞
ist. Analog für t− .
Kurz: Die Lösungskurve t 7→ (t, xmax (t)) lässt sich solange fortsetzen, bis sie entweder explodiert oder an den Rand von U läuft. Oder: Die Lösungskurve verlässt (in jeder Richtung) jede
kompakte Teilmenge von U .
12.21 Bemerkung. Verzichtet man auf die Lipschitzbedingung, so gilt – bis auf die Eindeutigkeit der Lösung – die Aussage des obigen Satzes ebenfalls.
Kurvenscharen und Orthogonaltrajektorien
12.22 Kurvenscharen und Differentialgleichungen. Durch die Gleichung
F (t, x, c) = 0
(1)
sei eine Kurvenschar in R2 gegeben, die durch c parametrisiert ist, z.B. die Parabelschar x−ct2 =
0, c ∈ R. Gemeint: Für jedes c ist ein Kurve xc = xc (t) definiert, die (1) erfüllt, z.B. xc (t) = ct2 .
Wir lösen nach c auf:
x
(2)
c = f (x, t); im Beispiel: c = 2 für t 6= 0.
t
Ableiten nach t liefert die Differentialgleichung
0=
d
[f (x(t), t)] = ∂x f (x(t), t)x′ (t) + ∂t f (x(t), t);
dt
(3)
′
im Beispiel: 0 = xt2 − 2 tx3 bzw. x′ = 2x/t für t 6= 0.
Jede Lösung von (2) erfüllt dann (3) und umgekehrt.
12.23 Beispiel. Hyperbelschar F (t, x, c) = t2 − x2 − c = 0. Liefert die Dgl 2t − 2xx′ = 0, also
für x 6= 0 die Differentialgleichung x′ = t/x.
12.24 Orthogonaltrajektorien. Es seien F und f wie oben.
Eine Kurve, die jede der Kurven der Schar orthogonal schneidet, heißt Orthogonaltrajektorie.
Man findet eine solche Kurve (lokal) wie folgt. Wir beschreiben die Kurvenschar lokal durch die
Differentialgleichung 12.22(3). Diese sei von der Form x′ = h(t, x).
Die Kurve t 7→ (t, x(t)) hat die die Ableitung (1, x′ (t)) = (1, h(t, x)). Damit die Orthogonaltra1
) haben.
jektorie t 7→ (t, y(t)) darauf senkrecht steht, muss sie die Ableitung (1, y ′ ) = (1, − h(t,x)
Wir erhalten daher als Differentialgleichung der Orthogonaltrajektorie
y′ = −
1
.
h(t, y)
28
12.25 Beispiel.
(a)
Die Orthogonaltrajektorie zu der Hyperbelschar aus 12.23 hat die Differentialgleichung
x′ = −x/t. Für t0 6= 0, x0 6= 0 erhält man mit Separation der Variablen für t/t0 > 0 und
x/x0 > 0:
Z
x
dy
x0 y
x
⇒ ln
x0
= −
Z
t
t0
ds
s
t0
= ln
t
t 0 x0
⇒ x(t) =
.
t
(b)
t
. Separation
Die Orthogonaltrajektorie zur Parabelschar aus 12.23 hat die Dgl x′ = − 2x
der Variablen liefert für x0 , t0 6= 0
1
1
1
x(t)2 − x20 = (t20 − t2 ) bzw. x(t)2 + t2 = x20 + t20 (Ellipse).
2
2
2
12.26 Die Differentialgleichung x′′ = f (x). Motivation: Physik: Bewegung eines Teilchens
unter Kraft f , die nicht von t abhängt.
Sei f ∈ C(J, R), J ⊆ R Intervall, a ∈ J. Definiere
Z x
f (y) dy
U :J →R
U (x) = −
a
(Bedeutung: potentielle Energie). Dann haben wir die Differentialgleichung
x′′ (t) = −U ′ (x(t)).
Wir wissen nach Peano: Lokal existiert eine Lösung. Multipliziere mit x′ (t):
⇒
⇒
x′′ (t)x′ (t) = −U ′ (x(t)) x′ (t)
1 ′ 2 ′
= −(U (x))′
(x )
2
1 ′ 2
(x ) + U (x) = const = E
2
(Gesamt − Energie).
(1)
Speziell: Alle Bahnen laufen in Bereichen, wo U (x) ≤ E ist. Es gilt
p
x′ = ± 2(E − U (x))
(je nachdem, ob im Beobachtungsintervall x′ (t) ≥ 0 oder x′ (t) ≤ 0 ist). Separation der Variablen
für Startwert x(t0 ) = x0
Z x
1
p
dy = t − t0 .
2(E − U (y))
x0
Auflösen nach x liefert Lösung.
Nette Beobachtung: Das Integral links liefert die Zeit, die das Teilchen braucht, um von x(t0 )
nach x(t) zu kommen.
29
13
Norm von Matrizen. Exponentialabbildung
Norm von Matrizen
Erinnerung. Es sei K = R oder C. Die Norm kzk eines Vektors z = (z1 , . . . , zn ) ∈ Kn ist
definiert durch
v
uX
u n
|zj |2 .
kzk = t
j=1
Allgemein ist eine Norm auf einem K-Vektorraum X eine Abbildung x 7→ kxk mit
(N1) kxk ≥ 0 für alle x ∈ X; kxk = 0 genau dann, wenn kxk = 0.
(N2) kλxk = |λ| kxk,
x ∈ X, λ ∈ K..
(N3) kx + yk ≤ kxk + kyk,
x, y ∈ X.
13.1 Definition. Die Norm einer Matrix in Matmn (K) ist definiert durch:
kAxk
n
: x ∈ K \ {0} .
kAk := sup
kxk
Ohne Beweis: Das supremum ist stets < ∞. Es stimmt überein mit
sup{kAxk : kxk ≤ 1}
und
sup{kAxk : kxk = 1}.
Damit gilt automatisch: kAxk ≤ kAkkxk für alle x.
13.2 Lemma.
(a)
(b)
(c)
k · k ist Norm auf dem Vektorraum der m × n-Matrizen.
Für A ∈ Matmk (K) und B ∈ Matkn (K) ist kABk ≤ kAk kBk
Die Norm der Einheitsmatrix ist 1.
Beweis. (a)
(i)
kAk ≥ 0, kAk = 0 ⇔ A = 0 klar
!
(ii) k(λA)xk = |λ|kAxk, also kλAk = sup k(λA)xk/kxk = |λ| sup kAxk/kxk = |λ|kAk.
(iii) k(A + B)xk ≤ kAxk + kBxk, daher
kAxk kBxk
kBxk
kAxk
k(A + B)xk
≤ sup
+
+sup
= kAk+kBk.
≤ sup
kA+Bk = sup
kxk
kxk
kxk
kxk
kxk
def
(b) k(AB)xk = kA(Bx)k ≤ kAkkBxk ≤ kAkkBkkxk.
(c) Klar.
⊳
13.3 Satz. Der Vektorraum der m × n-Matrizen ist vollständig mit der obigen Norm, d.h. jede
Cauchyfolge bezüglich der Norm aus 13.1 hat einen Grenzwert.
Mit anderen Worten: Ist (Aj ) eine Folge von Matrizen mit kAj − Ak k → 0 für j, k → ∞, so
existiert eine Matrix A mit kAj − Ak → 0. Dabei ist (Aj ) genau dann eine Cauchy-Folge, wenn
an jeder Position (i, k) die Einträge eine Cauchy-Folge in K bilden.
(ohne Beweis)
Wir können nun mit n × n-Matrizen fast wie mit Zahlen operieren.
30
Exponentialfunktion von Operatoren
13.4 Satz. Es sei A ∈ Matnn (K). Wir setzen
etA :=
∞ k
X
t
k=0
Dann gilt:
(a)
(b)
(c)
k!
Ak ,
t ∈ R.
Die Reihe für etA konvergiert für jedes t ∈ R absolut in Matnn (K), d.h.
giert in R.
Die Funktion t 7→ etA ist differenzierbar (also auch stetig) auf R, und
(etA )′ = A etA = etA A.
Ist B ∈ Matnn (K) mit AB = BA, so ist etA etB = et(A+B) für alle t.
P k(tA)k k
k!
konver-
Beweis. Dies ist eine Potenzreihe mit Koeffizienten in Matn (K). Ihr Konvergenzradius ist unendlich: Wegen 13.2(b) ist kAk k ≤ kAkk und somit
q
p
lim k kAk k/k! ≤ kAk lim k 1/k! = 0.
Wir erhalten sofort (a).
(b) Wie in Kapitel 8: Potenzreihen sind (bel. oft) differenzierbar und können gliedweise abgeleitet
werden
∞
X
tk−1 k
tA ′
A = AetA = etA A.
(e ) =
k
k!
k=1
(c) Vertauschen A und B, so kann man etA etB wie im Fall komplexer Zahlen mit dem Cauchyprodukt und dem binomischen Lehrsatz berechnen, s. 4.18(b) aus Analysis A.
⊳
13.5 Frage. Wie berechnet man etA für ein A ∈ Matn (C)? Wichtigstes Hilfsmittel ist die
Jordan-Zerlegung:
Q
13.6 Erinnerung: Jordansche Normalform. Es sei A ∈ Matn (K) und fA = rj=1 (x− λj )nj
mit paarweise verschiedenen λj das charakteristische Polynom. Dann gibt es Basen Bj von
Kern (λj Id − A)nj so, dass für B = (B1 , . . . , Br ) gilt


J1


..
.
B AB = 
.
Jr
Dabei sind die Jj , j = 1, . . . , r obere Dreiecksmatrizen von folgender Gestalt:


Jj1


..
Jj = 

.
Jjkj
wobei die Jjk (die sog. Jordan-Kästchen) quadratische Matrizen von der Form


λj 1


..


.


Jjk = 

..

. 1 
λj
31
sind. Bis auf die Reihenfolge der Kästchen ist die Zerlegung eindeutig. Dann ist
J = B AB = T −1 AT
mit T = kanon. Basis (Id)B . Beachte: In T stehen die Basisvektoren von B als Spaltenvektoren.
13.7 Lemma. Sei A ∈ Matn (C). Wir bestimmen dann etJ mit folgenden Resultaten:
(a)
Seien J1 , . . . Jr quadratische Matrizen und

J1

A=
0
Dann ist
(b)
(c)

0 1
0
 
.
 
0 ..

exp 
t
  ..
..
  .
. 1
0
... 0
(d)
e(T
−1 AT )t
= T −1 etA T .
Jr
0
.
eJr t
0


.
.
..
et(λId+B) = etλId etB = etλ IdetB = etλ etB ,
 
..
eJ1 t

etA = 

0
λ∈C


 
 
 = 
 
 




.
1 t t2 /2 . . . tk /k!
..
..
.
0 1
t
.
..
. t2 /2
0 0
1
..
..
.
t
.
0
...
1









Beweis.
(a)
(b)
(c)
Kästchensatz
13.4(c).
Folgt weil

0 1
0

.

0 ..

 ..
..
 .
. 1
0
... 0
(d)
et(T
−1 AT )
=
∞ j
X
t
j=0
j!
2

0 0
1
0




 0 0 0 ...






.
 =
.
. 1 





 ..
..
 .
. 0 
0
...
0
(T −1 AT )j =
∞ j
X
t
j=0
j!
T −1 Aj T = T −1 etA T.
⊳
32
13.8 Folgerung. Es sei B = {w1 , . . . , wn } eine Jordanbasis für A ∈ Matn (C) und J =
die Jordan-Normalform. Dann ist
etA = T eJt T −1
B AB
mit T = kanon. Basis IdB = Spaltenmatrix (w1 , . . . , wn ).
Dies ist bereits ein einfach zu berechnender Ausdruck. Es geht aber noch besser:
Man berechnet leicht T etJ , weil für ein beliebiges k-Tupel von n-Vektoren gilt:


1 t t2 /2 . . . tk−1 /(k − 1)!


..
..

 0 1
.
.
t


tk−1


..
2
=
(v
,
tv
+
v
,
.
.
.
,
v1 + . . . + vk ) . (1)
(v1 , . . . , vk )  0 0

1
1
2
.
t /2
1

{z
}
|
(k − 1)!


.
{z
}
|
..
n×k

 ..
.
t
n×k
0
...
1
|
{z
}
k×k
Man erhält dann T eJt , indem man als v1 , . . . , vk den zu einem Jordankästchen Jjl gehörigen
Abschnitt aus der Basis B wählt und die Matrix auf der rechten Seite von (1) noch mit eλj t
multipliziert.
33
14
Lineare Differentialgleichungen
Im Folgenden sei
• J ⊆ R ein offenes Intervall,
• t0 ∈ J, x0 ∈ Kn , (K = R oder C)
• A : J → Matn (Kn ) stetig,
• f : J → Kn stetig.
14.1 Lemma. Unter den obigen Annahmen ist die Anfangswertaufgabe
x′ − A(t)x = f,
x(t0 ) = x0
auf ganz J eindeutig lösbar.
Beweis. Wir wenden zunächst den Satz von Picard-Lindelöf an: A(t)x und f sind stetig in t, x.
Lipschitzstetig in x? Ja, denn
k(f (t) + A(t)x1 ) − (f (t) + A(t)x2 )k = kA(t)(x1 − x2 )k ≤ kA(t)k kx1 − x2 k.
Also gibt es eine maximale Lösung, die wir bis zum Rand fortsetzen können, wenn sie nicht
explodiert. Da kx′ (t)k ≤ kf (t)k + kA(t)kkxk ist, kann das nicht passieren (Gronwall).
⊳
14.2 Lemma.
(a)
(b)
Die Menge aller Lösungen von x′ − A(t)x = 0 bildet einen n-dimensionalen Vektorraum,
NA .
Ist u ∈ NA und u(t) = 0 für ein t ∈ J, so ist u(t) = 0 für alle t.
Beweis. (a) Klar: Vektorraum. Nach 14.2 ist eine Lösung in NA durch den Vektor x(t0 ) ∈ Cn
eindeutig bestimmt, also ist x 7→ x(t0 ) ein Isomorphismus von NA nach Cn und dim NA =
dim Cn = n.
(b) folgt aus 14.1.
⊳
14.3 Definition. Eine Basis {x1 , . . . , xn } von NA nennen wir ein Fundamentalsystem für die
Dgl x′ = A(t)x. Die daraus gebildete Matrix
 1

x1 . . . xn1

.. 
Φ =  ...
. 
1
xn . . . xnn
heißt Fundamentalmatrix oder auch Fundamentalsystem. Im Allgemeinen ist ein FS nur schwer
zu finden.
14.4 Satz. Es sei Φ ein Fundamentalsystem für x′ = A(t)x.
(a)
x(t) = Φ(t)Φ(t0 )−1 x0 ist die Lösung der AWA x′ = A(t)x, x(t0 ) = x0 .
34
(b)
Die Lösung der inhomogenen Anfangswertaufgabe x′ = A(t)x + f , x(t0 ) = x0 ist
Z t
x(t) = Φ(t)Φ(t0 )−1 x0 +
Φ(t)Φ(s)−1 f (s)ds
t0
Z t
−1
−1
= Φ(t) Φ(t0 ) x0 +
Φ(s) f (s)ds .
t0
Beweis. (a) Es ist x′ (t) = Φ′ (t)Φ(t0 )−1 x0 = A(t)Φ(t)Φ(t0 )−1 x0 = A(t)x(t) und x(t0 ) = x0 .
(b) x′ (t) = A(t)Φ(t) [. . .] + Φ(t) 0 + Φ(t)−1 f (t) = A(t)x(t) + f (t); x(t0 ) = x0 .
⊳
Der Fall einer konstanten Matrix A
Nun sei zusätzlich A konstant in t.
14.5 Lemma. etA ist in Fundamentalsystem für die Dgl x′ = Ax. Ein weiteres ist durch T etJ
gegeben (Bezeichnungen von 13.8).
Beweis. etA ist eine invertierbare Matrix für jedes t ∈ R. Ferner ist (etA )′ = AetA nach 13.4.
Damit ist etA ein Fundamentalsystem.
Aus etA = T etJ T −1 folgt T etJ = etA T . Damit sind auch die Spaltenvektoren von T etJ linear
unabhängig. Da
′
T etJ = T JetJ = T (T −1 AT ) etJ = AT etJ
ist, bilden sie also ein Fundamentalsystem.
⊳
14.6 Explizit. Man löst die AWA x′ = Ax, x(t0 ) = x0 folgendermaßen: Man bestimmt T etJ
nach 13.8. Nun berechnet man (z. B. mit Gauß-Algorithmus) die Lösung c von T c = x0 (d. h.
c = T −1 x0 ). Dann ist
x(t) = etA (et0 A )−1 x0 = e(t−t0 )A x0 = T e(t−t0 )J T −1 x0 = T e(t−t0 )J c.
Auch die Lösung der inhomogenen Aufgabe vereinfacht sich:
Z t
J(t−t0 ) −1
x(t) = T e
T x0 +
T eJ(t−s) T −1 f (s)ds.
t0
Wieder kann man T −1 x0 bzw. T −1 f (s) mit dem Gauß-Algorithmus bestimmen.
14.7 Reelle Lösungen. Ist A eine reelle Matrix, so ist man auch an reellen Lösungen von
x′ = Ax interessiert.
Da A reell ist, hat das charakteristische Polynom reelle Koeffizienten. Also ist für jedes λ ∈ C \R
mit fA (λ) = 0 auch fA (λ) = 0.
Es genügt dann, für alle reellen und jeweils einen der konjugiert komplex auftretenden Eigenwerte die Konstuktion aus 13.8 durchzuführen. Anschließend ersetzt man die zu den konjugiert
komplexen Eigenwerten gehörigen Vektoren durch ihren Real- und ihren Imaginärteil und erhält
damit ein reelles Fundamentalsystem.
35
Die lineare Differentialgleichung n-ter Ordnung
Nun seien a0 , . . . , an−1 : J → K stetige Funktionen, f : J → K stetig.
Wir betrachten die Differentialgleichung
x(n) (t) +
n−1
X
aj (t)x(j) (t) = f (t)
(1)
j=0
mit den Anfangswerten
x(t0 ) = x0 , . . . , x(n−1) (t0 ) = xn−1 .
(2)
Wir wandeln um in ein System, indem wir
x1 = x, x2 = x′ , . . . , xn = x(n−1)
setzen. Wir erhalten als äquivalentes System


 
0
1
...
0
0
 0

0
1


0


 
..
.. ..
x′ = Ax + F mit A = 
 und F =  ..  .
.
.
.


.
 0
...
0
1 
f
−a0 −a1 . . .
−an−1
Anfangswert: X0 = (x0 , . . . , xn−1 ).
Aus der bisherigen Theorie erhalten wir dann folgenden Satz:
14.8 Satz.
(a)
(b)
Die AWA (1), (2) ist auf J eindeutig lösbar.
Die Lösungen der homogenen Gleichung ((1) mit f = 0) bilden einen n-dimensionalen
Vektorraum N .
Als Fundamentalsystem bezeichnet man eine Basis von N . Die Matrix


x1
...
xn
 x′1
x′n 


Φ =  ..
.. 
 .
. 
(n−1)
x1
(c)
(n−1)
. . . xn
heißt Fundamentalmatrix.
Die allgemeine Lösung von (1) (ohne Berücksichtigung von Anfangswerten) ist gegeben
durch
Z t
n
n
X
X
det Wj (s)
ds,
dj ∈ K beliebig.
xj (t)
dj xj (t) +
x(t) =
t0 det W (s)
j=1
j=1
Dabei ist det W die sog. Wronski-Determinante.




x1
...
xn
x1
... 0 ...
xn
..
..
..
..
..




W =
 und Wj = 
.
.
.
.
.
.
(n−1)
(n−1)
(n−1)
(n−1)
x1
. . . xn
x1
. . . f . . . xn
Die Lösung der AWA (1),(2) erhält man durch geeignete Wahl der dj .
36
Homogene lineare Differentialgleichungen mit konstanten Koeffizienten
Nun seien a0P
, . . . , an−1 ∈ K konstant. Wir können J = R wählen. Wir setzen zusätzlich an = 1
und nennen nj=0 aj λj das charakteristische Polynom für die homogene Differentialgleichung
n
X
aj x(j) = 0
j=0
(es ist tatsächlich das charakteristische Polynom für die Matrix A vor 14.8).
P
Q
14.9 Satz. Es sei nk=0 aj λj = rj=0 (λ − λj )nj mit paarweise verschiedenen λj ∈ C. Dann
bilden die Funktionen
xjk (t) = tk eλj t ,
j = 1, . . . , r, k = 0, . . . , nj − 1
P
ein Fundamentalsystem für die homogene Gleichung
aj x(j) = 0. Sind alle aj reell, so erhält
man ein reelles Fundamentalsystem, indem man für λj = α + iβ mit βj 6= 0 die Lösungen
tk e(α+iβ)t und tk e(α+iβ)t durch tk eαt cos βt und tk eαt sin βt ersetzt.
Die Lösungen der AWA erhält man als geeignete Linearkombination der xjk .
37
15
Riemann-Integral
15.1 Intervalle und Zerlegungen. Es seien a1 , . . . , an , b1 , . . . , bn ∈ R mit aj ≤ bj für j =
1, . . . , n. Wir nennen
I = [a1 , b1 ] × . . . × [an , bn ] = {x ∈ Rn : aj ≤ x ≤ bj , j = 1, . . . , n}
ein kompaktes n−dimensionales Intervall und
I ◦ = ]a1 , b1 [× . . . ×]an , bn [= {x ∈ Rn : aj < x < bj , j = 1, . . . , n}
sein Inneres.
Mit |I| oder vol I bezeichnen wir das n−dimensionale Volumen
|I| = (b1 − a1 ) · . . . · (bn − an ).
Erinnerung. Eine Zerlegung Z eines Intervalls [a, b] in R ist eine endliche Punktmenge {t0 , . . . , tN }
mit a = t0 < t1 < . . . tN = b. Die Feinheit |Z| dieser Zerlegung ist definiert durch |Z| =
max{tk − tk−1 : k = 1, . . . , N }.
Wir definieren nun die Zerlegung eines n−dimensionalen Intervalls I (wie oben) als ein Produkt
Z = Z1 ×. . .×Zn wobei Zj eine Zerlegung von [aj , bj ] ist. Die Zerlegung Z liefert eine Unterteilung
des Intervalls I in endlich viele Intervalle I1 , . . . , IK , die sich nur in den Seitenflächen schneiden.
Es gilt:
N
K
[
X
I=
Ik , Ij◦ ∩ Il◦ = ∅ (j 6= l), |I| =
|Ik |.
k=1
k=1
Die Feinheit |Z| von Z definiert man durch |Z| = max |Zj |.
15.2 Riemann-Integral. Es seien I, Z, Ij wie oben, s = (s1 , . . . , sK ) ∈ I1 × . . . × IK ein so
genannter Zwischenvektor. Ist f : I → K (K = R oder C eine beschränkte Funktion, so nennen
wir
K
X
f (sk ) |Ik |
S(f, Z, s) =
k=1
die Riemannsche Zwischensumme zur Zerlegung Z mit Zwischenvektor s.
Wir nennen f Riemann-integrierbar mit Riemann-Integral S, falls zu jedem ε > 0 ein δ > 0
existiert, so dass
|S − S(f, Z, s)| < ε, falls |Z| < δ, s beliebig.
In diesem Fall schreiben wir
S=
Z
f dx =
Z
f (x1 , . . . , xn ) d(x1 , . . . , xn ).
I
I
15.3 Satz. Es seien f, g : I → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf
Riemann-integrierbar, und
Z
Z
Z
Z
Z
cf dx = c f dx.
f + g dx = f dx + g dx und
I
I
I
I
Sind f und g reellwertig, und ist f ≤ g, so ist
Z
Z
f dx ≤ g dx.
I
I
38
I
Beweis. Klar.
⊳
15.4 Nullmengen. Eine Teilmenge N ⊆ Rn heißt Nullmenge oder Menge vom Maß Null, falls
man zu jedem ε > 0 höchstens abzählbar viele kompakte Intervalle I1 , I2 , . . . findet mit der
Eigenschaft dass
[
X
N⊆
Ij und
|Ij | < ε.
15.5 Lemma.
(a)
(b)
(c)
(d)
Abzählbare Vereinigungen von Nullmengen sind Nullmengen.
Teilmengen von Nullmengen sind Nullmengen.
Ein Punkt in Rn ist eine Nullmenge.
Eine Menge der Form {x ∈ Rn : xj = c} für ein festes j und c ∈ K ist eine Nullmenge.
Beweis.
(a)
Es seien N1 , N2 , . . . Nullmengen und ε > 0 vorgelegt. Zu jedem Nj finden wir abzählbar
(j)
viele kompakte Intervalle Ik , k = 1, 2, . . . , mit
Nj ⊆
Dann ist
∞
[
j=1
(b)
(c)
Nj ⊆
[
∞ [
[
(j)
Ik ,
X
und
k
(j)
Ik ,
k
und
j=1 k
∞ X
X
j=1 k
(j)
|Ik | < ε/2j+1 .
(j)
|Ik | <
∞
X
ε/2j+1 = ε.
j=1
Klar.
Sei y ∈ Rn und δ > 0 mit 2n δn < ε. Dann ist
y ∈ Iδ = [y1 − δ, y1 + δ] × . . . × [yn − δ, yn + δ]
(d)
und |Iδ | < ε.
Analog.
⊳
15.6 Definition. Wir sagen von einer Eigenschaft, sie gelte fast überall, falls sie außerhalb
einer Nullmenge gilt.
15.7 Lebesguesches Integrabilitätskriterium. Eine beschränkte Funktion f : I → K ist
genau dann Riemann-integrierbar, wenn sie fast überall stetig ist.
15.8 Folgerung. Stetige Funktionen sind Riemann-integrierbar.
39
15.9 Satz von Fubini. I1 ⊆ Rn1 und I2 ⊆ Rn2 seien kompakte Intervalle. Dann ist I = I1 × I2
kompaktes Intervall in Rn , n = n1 + n2 .
Ist f : I → K Riemann-integrierbar und existiert für jedes y ∈ I2 das Integral
Z
f (x, y) dx,
g(y) =
I1
so ist g auf I2 Riemann-integrierbar, und es gilt:
Z Z
Z
Z
f (x, y) dy dx
g(y) dy =
f (x, y) d(x, y) =
I2
I2
I
I1
15.10 Folgerung. Ist I wie in 15.1 und f : I → K stetig, so gilt
Z b1 Z bn
Z
f (x1 , . . . , xn ) dxn . . . dx1 .
...
f (x) d(x1 , . . . , fn ) =
I
an
a1
Ist f lediglich Riemann-integrierbar, so gilt diese Identität immer noch, sofern alle iterierten
Integrale existieren.
Beweisidee zu 15.9: Wir betrachten den einfachen Fall n1 = n2 = 1, n = 2.
Zu [a1 , b1 ] wählen wir die Zerlegung a = t0 < t1 < t2 = b und zu [a2 , b2 ] die Zerlegung a2 = u0 <
u1 < u2 = b2 Als Zwischenvektor wählen wir (x1 , y1 ), (x2 , y1 ), (x1 , y2 ), (x2 , y2 ). Dann berechnen
wir die Zwischensumme zu dieser Zerlegung. Wir erhalten für diesen einfachen Fall sofort die
Aussage des Satzes von Fubini aus dem Distributivgesetz. Im allgemeinen Fall genauso.
⊳
15.11 Definition.
(a)
Es sei B ⊆ Rn und f : B → K eine Funktion. Wir definieren die Funktion fB : Rn → K
durch
f (x), x ∈ B,
fB (x) =
0,
sonst
(b)
Es sei B ⊆ Rn beschränkt und I ein beschränktes Intervall, das B enthält. Wir nennen
f : B → K Riemann-integrierbar auf B, falls fB auf I Riemann-integrierbar ist. Man sieht
mit dem Lebesgue-Kriterium, dass dies nicht von der Wahl von I abhängt. In diesem Fall
setzen wir
Z
Z
f (x) dx = fB (x) dx.
I
B
(c)
Eine beschränkte Menge B heißt Jordan-messbar, falls ihre charakteristische Funktion χB ,
definiert durch
1, x ∈ B,
χB (x) =
0, sonst
Riemann-integrierbar ist. In diesem Fall bezeichnen wir mit |B| oder auch vol B das Volumen
Z
|B| = χB dx.
15.12 Definition. Es sei B ⊆ Rn . Der Rand ∂B von B ist die Menge aller Punkte x ∈ Rn
(nicht notwendig in B!), für die sich zu jedem ε > 0 Punkte x1 ∈ B und x2 ∈
/ B finden lassen
mit x1 , x2 ∈ B(x, ε).
40
15.13 Satz. Die beschränkte Menge J ist genau dann Jordan-messbar, falls ihr Rand eine
Nullmenge ist.
Beweis. B ist Jordan-messbar, wenn χB Riemann-integrierbar ist. Dies wiederum ist nach Lebesgue dazu äquivalent, dass sie fast überall stetig ist. Da die Unstetigkeitspunkte von χB gerade
die Randpunkte von B sind, folgt die Behauptung.
⊳
15.14 Satz. Genau dann ist die Funktion f : B → K auf der Jordan-messbaren Menge B
Riemann-integrierbar, wenn sie auf B fast überall stetig ist.
Beweis. Die Menge der Unstetigkeitspunkte von fB in Rn unterscheidet sich von der Menge der
Unstetigkeitspunkte von f auf B höchstens durch die Nullmenge ∂B.
⊳
15.15 Satz. Es seien f, g : B → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf
Riemann-integrierbar, und
Z
Z
Z
Z
Z
f dx.
cf dx = c
g dx und
f dx +
f + g dx =
B
Es ist
B
B
B
B
Z
Z
f dx ≤
|f | dx.
B
B
Sind f und g reellwertig, und ist f ≤ g, so ist
Z
Z
g dx.
f dx ≤
B
B
Beweis. Klar.
⊳
15.16 Lemma. Es seien A, B Jordan-messbar und f auf beiden Riemann-integrierbar.
(a)
(b)
(c)
Dann sind auch A ∪ B, A ∩ B und A \ B Jordan-messbar.
R
Es sei f : N → K Riemann-integrierbar und N eine Nullmenge. Dann ist N f dx = 0.
Ist zusätzlich A ∩ B eine Nullmenge, so ist
Z
Z
Z
f dx.
f dx +
f dx =
B
A
A∪B
Beweis. (a) Die Mengen ∂(A ∪ B), ∂(A ∩ B) und ∂(A \ B) sind Teilmengen von ∂A ∪ ∂B, also
nach 15.5/15.13 Nullmengen.
(b) Es sei |f | ≤ C. Dann ist
Z
Z
15.15
f dx ≤
C dx ≤ C |N | = 0.
N
N
(c) Folgt aus (a) und (b).
⊳
15.17 Satz. Es sei B ⊆ Rn beschränkt und f : B → R Riemann-integrierbar mit f ≥ 0. Dann
ist die Menge
M (f ) = {(x, y) ∈ Rn+1 : x ∈ B, 0 ≤ y ≤ f (x)}
eine Jordan-messbare Teilmenge des Rn , und
|M (f )| =
Z
41
f dx.
B
Beweis. Als Riemann-integrierbare Funktion ist f beschränkt: f ≤ C. Wähle ein kompaktes
Intervall I mit B ⊆ I. Dann ist M (f ) ⊆ J = I × [0, C], insbesondere also beschränkt.
Zeige nun dass M (f ) Jordan-messbar ist (weglassen).
Dann schließt man:
Z Z C
Z
Fubini
χM (f ) (x, y) dy dx
χM (f ) d(x, y) =
|M (f )|
=
I
0
J
!
Z
Z
Z Z
fB (x)
fB wie in 15.11
1 dy
=
I
f (x) dx.
fB (x) dx =
dx =
B
I
0
⊳
15.18 Beispiel. Es sei M ⊆ R2 ein Normalbereich, d.h. eine Menge der Form
M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)}
mit zwei Riemann-integrierbaren Funktionen f1 ≤ f2 . Dann ist M Jordan-messbar.
Ist g : M → K stetig, so ist
Z
g(x, y) d(x, y) =
Z bZ
a
M
f1 (x)
g(x, y) dx dy.
f2 (x)
Beweis. O.d.B.A. sei 0 ≤ f1 ≤ f2 ≤ C. Da M = M (f2 ) \ M (f1 ) ist, folgt die Jordan-Messbarkeit
aus 15.14. Mit I = [a, b] × [0, C] ist nach Definition:
Z
Z
g d(x, y) = gM (x, y) d(x, y).
I
M
Weil g stetig ist, existiert für jedes feste x ∈ [a, b] das Integral
Z
C
gM (x, y) dy =
0
Z
f2 (x)
RC
0
gM (x, y) dy und
g(x, y) dy
f1 (x)
Aus dem Satz von Fubini folgt dann die Behauptung.
⊳
15.19 Substitutionsregel. Es sei U ⊆ Rn offen und ψ : U → Rn stetig differenzierbar und
injektiv. Die Jacobi-Determinante det ψ ′ (x) sei für jedes x positiv (oder für jedes x negativ).
Ist T ⊆ U Jordan-messbar, so ist ψ(T ) Jordan-messbar. Ist ferner f : ψ(T ) → K stetig, so ist f
auch Riemann-integrierbar, und es gilt
Z
Z
f (ψ(x)) | det ψ ′ (x)| dx.
f (y) dy =
ψ(T )
T
(ohne Beweis)
42
15.20 Polarkoordinaten in R2 . Wir betrachten die Abbildung
ψ : U = [0, ∞[ ×]0, 2π[ → R2
r cos ϕ
ψ(r, ϕ) =
.
r sin ϕ
Sie bildet U bijektiv auf die Menge R2 \ {(x, 0) : x ≥ 0} ab. Die Jacobi-Determinante ist
cos ϕ −r sin ϕ
′
det ψ (r, ϕ) = det
= r > 0.
sin ϕ r cos ϕ
Die Menge {(x, 0) : x ≥ 0} ist eine Nullmenge. Sie spielt für die Integration keine Rolle.
Die Kreisscheibe vom Radius R, B(0, R) = {(x, y) : x2 + y 2 ≤ R2 } ist (bis auf eine Nullmenge)
das Bild von {(r, ϕ) : 0 < r ≤ R; 0 < ϕ < 2π}. Also ist
Z R Z 2π
Z R
Z
2πr dr = πR2 .
1 dx =
r dϕ dr =
vol B(0, R) =
0
B(0,R)
0
0
15.21 Polarkoordinaten in R3 (Kugelkoordinaten). Setze
= [0, ∞[ ×]0, 2π[ × ]0, π[ → R3


r cos ϕ sin ϑ
ψ(r, ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ:U
Dann ist

und

cos ϕ sin ϑ −r sin ϕ sin ϑ r cos ϕ cos ϑ
ψ ′ (r, ϕ, ϑ) =  sin ϕ sin ϑ r cos ϕ sin ϑ r sin ϕ cos ϑ 
cos ϑ
0
−r sin ϑ
det ψ ′ (r, ϕ, ϑ) = −r 2 sin ϑ > 0.
Das Bild von ψ ist R3 \ N , wobei
N = {(x, y, z) : x ≥ 0, y = 0}
eine Nullmenge ist.
Es folgt für die Vollkugel vom Radius R, B(0, R) = {(x, y, z) : x2 + y 2 + z 2 ≤ R2 }:
Z RZ 2πZ 0
Z
1 d(x, y, z) =
r 2 sin ϑ dϑ dϕ dr
|BR | =
0
BR
= 2π (sin ϑ)|π0
Z
R
0
r 2 dr =
0
π
4
π R3 .
3
15.22 Beispiel. Das Ellipsoid mit Halbachsen a, b und c (a, b, c > 0) ist
x2 y 2 z 2
E = x ∈ R3 : 2 + 2 + 2 ≤ 1 .
a
b
c
43
Durch die stetig differenzierbare Abbildung ψ(x, y, z) 
→ (ax, by,
cz) wird die Einheitskugel
a 0 0
B(0, 1) bijektiv auf E abgebildet. Die Jacobi-Matrix ist 0 b 0. Also ist
0 0 c
Z
Z
4
abc d(x, y, z) = abc |B(0, 1)| = πabc.
1 d(u, v, w) =
|E| =
3
B(0,1)
E
44
16
Integration über Flächen. Der Gaußsche Integralsatz
Der Gaußsche Satz in der Ebene
16.1 Orientierter Rand von Normalbereichen. Es sei [a, b] ein Intervall, und f1 und f2
seien stückweise stetig differenzierbare Funktionen auf [a, b] mit f1 ≤ f2 . Ferner sei
M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)}.
Der Rand von M besteht dann aus den beiden vertikalen Abschnitten in t = a zwischen f1 (a) und
f2 (a) und in t = b zwischen f1 (b) und f2 (b) sowie den Graphen von f1 und f2 . Wir beschreiben
ihn nun durch vier stückweise stetig differenzierbaren Kurven γ1 , γ2 , γ3 , γ4 , wobei
γ1 : [a, b] → R2 ;
γ1 (t) = (t, f1 (t))
2
γ2 : [f1 (b), f2 (b)] → R ;
γ2 (t) = (b, t)
2
γ3 : [a, b] → R ; γ3 (t) = (a + b − t, f2 (a + b − t))
γ4 (t) : [f1 (a), f2 (a)] → R2 ;
γ4 (t) = (a, f1 (b) + f2 (b) − t)
Die Kurve γ3 ist gerade die Kurve γ̃3 (t) = (t, f1 (t)), aber in umgekehrter Richtung durchlaufen.
Ähnliches gilt für γ4 . Die Durchlaufrichtung der Kurven ist dann so, dass M stets zur Linken
liegt (positiv orientiert).
16.2 Integral über Normalbereich. Bezeichnungen wie oben. Ferner sei Q stetig differenzierbare Funktion auf R2 . Dann ist nach Beispiel 15.18
!
Z b Z f2 (x)
Z b
Z
∂Q
∂Q
Q(x, f2 (x)) − Q(x, f1 (x)) dx
d(x, y) =
dy dx =
f1 (x) ∂y
a
a
M ∂y
Das letzte Integral können wir als Kurvenintegral auffassen. Wegen γ1′ (t) = (1, f1′ (t)) und γ3′ (t) =
(−1, f1′ (a + b − t)) ist es in der Schreibweise von 11.2:
Z
Z
Q dx.
Q dx −
−
γ1
γ3
Wir benutzen die Schreibweise
Z b
Z
Z
Z
hF (t), γ ′ (t)i dt
F1 dx1 + . . . Fn dxn = hF, dxi =
γ
γ
γ
a
Q
für F : [a, b] →
und (x = x1 , . . . , xn )) mit (x1 , x2 ) = (x, y) und F =
. Weil γ2′ (t) = (0, 1)
0
und γ4 (t) = (0, −1) ist, sind die entsprechenden Integrale über γ2 und γ4 beide Null.
Mit γ bezeichnen wir nun die aus γ1 , γ2 , γ3 und γ4 zusammengesetzte Kurve. Dann ist
Z
Z
∂Q
d(x, y) = − Q(x, y) dx.
M ∂y
γ
Rn
16.3 Normalbereiche in y-Richtung. Nun seien ϕ1 , ϕ2 : [a, b] → R2 stetig differenzierbar
mit ϕ1 ≤ ϕ2 und
M = {(x, y) : ϕ1 (y) ≤ x ≤ ϕ2 (y), a ≤ y ≤ b}.
45
Wir beschreiben den orientierten Rand durch
δ1 : [ϕ1 (a), ϕ2 (a)] → R2 ;
δ1 (t) = (t, a)
2
δ2 : [a, b] → R ;
δ2 (t) = (ϕ2 (t), t)
2
δ3 : [ϕ1 (b), ϕ2 (b)] → R ; δ3 (t) = (ϕ1 (b) + ϕ2 (b) − t, b)
δ4 (t) : [a, b] → R2 ;
δ4 (t) = (ϕ1 (t), a + b − t)
und bezeichnen mit δ die zusammengesetzte Kurve. Wieder sei G ⊆ R2 offen mit M ⊆ G, und
P stetig differenzierbare Funktionen auf G. Dann ist nach Satz 15.18
!
Z b Z ϕ2 (y)
Z
∂P
∂P
d(x, y) =
dx dy
ϕ1 (y) ∂x
a
M ∂x
Z
Z
Z
Z b
P dy = P dy
P dy +
P (ϕ2 (y), y) − P (ϕ1 (y), y) dy =
=
δ2
a
δ4
δ
Dabei gilt die letzte Identität, weil die Integrale über δ1 und δ3 Null sind. Beachte das im
Vergleich zu 16.2 verschiedene Vorzeichen
Der folgende Satz ist dann offensichtlich, wenn M sowohl bezüglich der x-Achse als auch
bezüglich der y-Achse ein Normalbereich ist. Er gilt jedoch allgemeiner durch Zerlegung:
16.4 Satz von Gauß/Greensche Formel in der Ebene. Es sei M eine beschränkte offene
Menge, deren Rand durch eine stückweise stetig differenzierbare Kurve γ positiv orientiert ist
(d.h. M liegt beim Durchlaufen von γ stets zur Linken). Ferner seien Q und P stetig differenzierbar auf R2 . Dann ist
Z Z
∂P
∂Q
+
d(x, y) = P dy − Q dx.
∂x
∂y
γ
Speziell ergibt sich:
Z
1
d(x, y) =
vol M =
2
M
Z
γ
x dy − y dx.
Integration über Flächen
16.5 Definition. Eine Teilmenge M von Rn heißt eine k-dimensionale Mannigfaltigkeit (k ≤
n), falls zu jedem Punkt m ∈ M eine Abbildung ψ : T ⊂ Rk → M existiert mit folgenden
Eigenschaften:
(i)
Für eine (hinreichend kleine) offene Umgebung U von m in Rn gilt:
M ∩ U = ψ(T )
(ii) Rang(ψ ′ (t)) = k (d.h. maximal) für jedes t ∈ T
(iii) Sind ψ1 : T1 → Rn und ψ2 : T2 → Rn zwei solcher Abbildungen mit U = ψ1 (T1 )∩ψ2 (T2 ) 6=
∅, dann ist die Komposition ψ2−1 ψ1 : ψ1−1 (U ) → Rk stetig differenzierbar.
46
Bedingung (i) besagt. dass in der Nähe jedes Punktes m die Mannigfaltigkeit M durch k freie
Parameter beschrieben wird. (ii) stellt sicher, dass die k Variablen tatsächlich unabhängige
Richtungen liefern. Man hat viel Freiheit bei den obigen Wahlen. Bedingung (iii) sorgt dafür,
dass alle, die denselben Bereich von M beschreiben, verträglich“ sind.
”
Man nennt eine solche Abbildung eine lokale Kartenabbildung.
Mannigfaltigkeiten der Dimension 2 nennt man Flächen.
16.6 Beispiel: Die Sphäre Sr vom Radius r in R3 . Dies ist eine Fläche. Wir betrachten
die Abbildung
= ]0, 2π[ × ]0, π[ → R3


r cos ϕ sin ϑ
ψ1 (ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ1 : T
Ihr Bild enthält alle Punkte der Sphäre mit Ausnahme des Halbkreises {(x, y, z) ∈ Sr : x ≥
0, y = 0}. Wir nehmen die Abbildung
] − π, π[×]0, π[→ R3


r cos ϕ sin ϑ
ψ2 (ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ2
:
hinzu, und erhalten als Bild alle Punkte der Sphäre außer {(x, y, z) ∈ Sr : x ≤ 0, y = 0}.
Die Kartenwechselabbildung ψ2−1 ψ1 ordnet hier (ϕ, θ) ∈ ]0, 2π[ × ]0, π[ das Paar (ϕ, θ) zu, falls
0 < ϕ < π und (ϕ − 2π, θ), falls π < ϕ < 2π. Nun fehlen uns nur noch der Nordpol und der
Südpol. Dazu können wir in beiden Abbildungen θ von −π/2 bis π/2 laufen lassen.
16.7 Integration über Mannigfaltigkeiten. Es sei M eine Mannigfaltigkeit der Dimension
k und f : M → K eine stetige Funktion. Ist ψ : T → M eine lokale Kartenabbildung, so definiert
man das Integral von f über den Bildbereich von T unter ψ durch
Z
q
f (ψ(t)) det(ψ ′ (t)T ψ ′ (t)) dt.
ψ(T )
Dabei ist ψ ′ (t) ∈ Matnk (R) die Ableitung von ψ und ψ ′ (t)T ∈ Matkn (R) ihre Adjungierte. Es
zeigt sich, dass das Produkt ψ ′ (t)T ψ ′ (t) eine invertierbare k × k-Matrix ist, deren Determinante
überall positiv ist. Man kann ferner nachrechnen, dass das Ergebnis unabhängig von der Kartendarstellung ist. Die Matrix ψ ′ (t)T ψ ′ (t) wird als Maßtensor bezeichtnet, ihre Determinante als
Gramsche Determinante.
Das Integral einer stetigen Funktion f über ganz M erhält man, indem man die Mannigfaltigkeit
durch mehrere Karten überdeckt, die Funktion entsprechend zerlegt und dann integriert. Dabei
ist es so, dass Integrale über die Bilder von Nullmengen unter einer Kartenabbildung Null sind.
16.8 Beispiel. Wir betrachten die Sphäre Sr vom Radius r in R3 . Wir haben die Karte (vgl.
16.6)
]0, 2π[×]0, π[ → R3


r cos ϕ sin θ
ψ(ϕ, θ) =  r sin ϕ sin θ  .
r cos θ
ψ
:
47
Der Maßtensor bzw. die Gramsche Determinante sind
2 2
r sin θ 0
g(ϕ, θ) =
bzw. det g(ϕ, θ) = r 4 sin2 θ.
0
r2
Das Bild von ψ ist die Sphäre ohne den Nullmeridian. Da er eine Nullmenge ist, spielt er für die
Integration keine Rolle. Für f : Sr → C ist also
Z 2π Z π
Z
f (ψ(ϕ, θ))r 2 sin θ dθ dϕ.
f (x) dS(x) =
0
Sr
0
Insbesondere erhalten wir für die Oberfläche der Kugel vom Radius r
Z 2π Z π
Z
1 dx =
r 2 sin θ dθ dϕ = 4πr 2 .
vol(Sr ) =
0
Sr
0
16.9 Rotationsflächen. Es sei I ein Intervall in R und f : I → R>0 stetig differenzierbar und
strikt positiv. Dann ist die Rotationsfläche des Graphen von f um die z−Achse
M = {(x, y, z) ∈ R3 : z ∈ I, x2 + y 2 = f (z)}
eine zweidimensionale Mannigfaltigkeit: Bis auf eine Nullmenge ist sie durch die Karte
I × ]0, 2π[ → R3


f (t) cos ϕ
ψ(t, ϕ) =  f (t) sin ϕ 
t
ψ
gegeben.
Hier ist
:
 ′

f (t) cos ϕ −f (t) sin ϕ
ψ ′ (t) =  f ′ (t) sin ϕ f (t) cos ϕ 
1
0
(Rang 2).
und Maßtensor bzw. Gramsche Determinante sind von der Form
1 + f ′ (t)2
0
g(t, ϕ) =
und det g(t, ϕ) = f (t)2 (1 + f ′ (t)2 ).
0
f (t)2
Das Volumen der Rotationsfläche ist daher – sofern das Integral existiert –
Z
Z 2π Z
p
p
′
2
f (t) 1 + f (t) dt dϕ = 2π f (t) 1 + f ′ (t)2 dt.
vol (M ) =
0
I
I
16.10 Der Gaußsche Integralsatz in R3 . Es sei U eine offene und beschränkte Menge in R3 .
Der Rand von U sei eine 2-dimensionale Mannigfaltigkeit ∂U = M .
Der äußere Einheitsnormalenvektor. Es sei x0 ein Randpunkt von U . In einer Umgebung von
x0 sei der Rand gegeben durch die Abbildung ψ : T ⊂ R2 → R3 mit ψ(t0 ) = x0 für ein t0 ∈ T .
Die Spaltenvektoren von ψ ′ (t0 ) spannen nach Annahme (ii) in 16.5 einen zweidimensionalen
Teilraum von R3 auf. Es gibt also einen eindimensionalen Unterraum von R3 aus dazu senkrecht
stehenden Vektoren. Wir wählen einen davon aus, der Norm = 1 hat (es gibt genau zwei!) und
48
nennen ihn ν. Nun gelte: Für jedes hinreichend kleine ε > 0 liege der Punkt x + εν außerhalb
von U und der Punkt x − εν in U . Mit anderen Worten: ν zeigt stets nach außen. Wir nennen
ν, genauer ν(x), den äußeren Einheitsnormalenvektor in x. Wir nehmen an, dass wir diese Wahl
auf dem Rand stetig treffen können.
Divergenz von Vektorfeldern. Es sei F : V → R3 ein stetig differenzierbares Vektorfeld, das auf
einer Umgebung V von U ∪ M definiert ist. Die Divergenz von F ist die Funktion
divF (x) =
3
X
∂xj Fj (x).
j=1
Mit hF, νi bezeichnen wir das Skalarprodukt des Vektors F (x) mit dem äußeren Einheitsnormalenvektor ν(x) in x.
Der Satz von Gauß besagt nun, dass
Z
Z
hF (x), ν(x)i dS(x).
div F (x)dx =
∂U
U
16.11 Archimedisches Prinzip. Ein fester Körper A sei eingetaucht in eine Flüssigkeit der
konstanten Dichte c > 0, deren Oberfläche mit der Ebene x3 = 0 in R3 zusammenfalle. Die
Physik sagt uns, dass im Punkt x ∈ ∂A die Flüssigkeit einen Druck der Stärke cx3 ν(x) ausübt,
wobei ν die äußere Normale ist (man beachte, dass x3 negativ ist und der Druck nach innen
gerichtet ist). Die Gesamtauftriebskraft ist
Z
cx3 ν(x) dS(x);
F =
∂A
für jede Komponente Fj von F gilt also nach Gauß
Z
Z
∂x3
dx.
cx3 νj (x) dS(x) = c
Fj =
A ∂xj
∂A
Damit ist F1 = F2 = 0, während
F3 = c
Z
1 dx = c vol(A)
A
ist. Der Körper erfährt also eine nach oben gerichtete Auftriebskraft, die gleich dem Gewicht
der verdrängten Flüssigkeit ist.
49

Zugehörige Unterlagen

Ubungen zur Vorlesung ,,MMP II - Physik

Skript - Institut für Analysis

Zugehörige Unterlagen

Produkte

Unterstützung

Skript - Institut für Analysis

Zugehörige Unterlagen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können