Skript - Institut für Analysis

Werbung
Analysis B
Vorlesung an der Leibniz Universität Hannover
Sommersemester 2011
Elmar Schrohe
Institut für Analysis
Leibniz Universität Hannover
Welfengarten 1
30167 Hannover
Inhaltsverzeichnis
9 Differentialrechnung im Rn
3
10 Kurven
16
11 Kurvenintegrale, Vektorfelder und Potentiale
18
12 Gewöhnliche Differentialgleichungen
21
13 Norm von Matrizen. Exponentialabbildung
30
14 Lineare Differentialgleichungen
34
15 Riemann-Integral
38
16 Integration über Flächen. Der Gaußsche Integralsatz
45
2
9
Differentialrechnung im Rn
Normen
Es seien (x1 , x2 , x3 ) und (y1 , y2 , y3 ) zwei Punkte in R3 . Dann ist ihr Abstand nach dem Satz des
Pythagoras
p
(x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 .
p
Insbesondere ist der Abstand des Punktes (x1 , x2 , x3 ) zum Ursprung (0, 0, 0) gerade x21 + x22 + x23 .
9.1 Definition. Es sei x = (x1 , . . . , xn ) ∈ Rn . Wir nennen
q
kxk = x21 + . . . + x2n die (euklidische) Norm von x.
Der Abstand zweier Punkte x = (x1 , . . . , xn ) und y = (y1 , . . . , yn ) ist dann gerade kx − yk.
Die euklidische Norm hat folgende Eigenschaften
(N1) Es ist kxk ≥ 0 für jedes x. Ferner ist kxk = 0 ⇔ x = 0.
(N2) kcxk = |c|kxk für x ∈ Rn und c ∈ R.
(N3) kx + yk ≤ kxk + kyk für alle x, y.
Allgemeiner: Eine Norm auf einem K-Vektorraum V (K = R oder C) ist eine
Abbildung V ∋ v 7→ kvk ∈ R≥0 mit den Eigenschaften (N1), (N2), (N3).
Für die Euklidische Norm gilt
|xj | ≤ kxk ≤ |x1 | + . . . + |xn |,
j = 1, . . . , n.
(1)
Das Skalarprodukt hx, yi der Vektoren x und y in Rn ist gegeben durch
hx, yi =
n
X
xj y j .
j=1
Hier gilt:
(SP1) hcx + dy, zi = chx, zi + dhy, zi, c, d ∈ R, x, y, z ∈ Rn .
(SP2) hx, yi = hy, xi
(SP3) hx, xi ist reell und ≥ 0; hx, xi = 0 ⇔ x = 0.
Es gilt
kxk =
p
hx, xi.
Auch den Begriff des Skalarprodukts kann man auf K-Vektorräume verallgemeinern.
Man fordert dann im Fall K = R die Eigenschaften (SP1), (SP2), (SP3). Für K = C
ersetzt man (SP2) durch
hx, yi = hy, xi
(konjugiert komplex).
Ein Beispiel ist dann gegeben durch
hz, wi =
X
3
zj wj .
(2)
Folgen in Rn
9.2 Grenzwerte. Es sei a ∈ Rn und (ak ) eine Folge in Rn , d.h. jedes ak ist ein n-Vektor
ak = (ak1 , . . . , akn ). Wir schreiben lim ak = a oder ak → a, falls gilt:
Zu jedem ε > 0 existiert ein n0 mit kak − ak ≤ ε für alle k ≥ n0 .
9.3 Satz. Mit obigen Bezeichnungen ist äquivalent
(i)
(ii)
ak → a
Für j = 1, . . . , n gilt akj → aj .
In diesem Fall ist lim ak = (lim ak1 , . . . , lim akn ).
Beweis. Folgt aus 9.1(1).
⊳
9.4 Definition. Es sei U ⊆ Rn , r > 0 und x ∈ Rn .
(a)
(b)
Mit B(x, r) = {y ∈ Rn : kx − yk < r} bezeichnen wir die offene Kugel mit Radius r um x.
Wir nennen eine Teilmenge U von Rn offen, falls zu jedem x ∈ U ein ε > 0 existiert so
dass B(x, ε) ⊆ U gilt. (Intuitiv: Wir können von x aus in jeder Richtung ein kleines Stück
weitergehen, ohne U zu verlassen.)
Beachte: Die offene Kugel B(x, r) ist offen.
Partielle Ableitungen
Im Folgenden sei U ⊆ Rn offen und f : U → Rm eine Funktion. Sie ordnet jedem x ∈ U ein
m−Tupel
f (x) = (f1 (x), . . . , fm (x))
zu. Durch x 7→ f1 (x), . . . , x 7→ fm (x) werden dann m Funktionen f1 , . . . , fm von U nach R
definiert, die sogenannten Komponentenfunktionen von f .
9.5 Beispiel. Es sei f : R3 → R2 definiert durch
f (x1 , x2 , x3 ) = (sin(x1 + x2 ), x1 + 2x3 ).
Dann hat f die Komponentenfunktionen f1 , f2 : R3 → R gegeben durch
f1 (x) = sin(x1 + x2 )
f2 (x) = x1 + 2x3 .
Es ist eigentlich besser (aber oft unpraktisch), die Vektoren vertikal zu schreiben, also
 
x1
sin(x1 + x2 )


f x2 =
.
x1 + 2x3
x3
4
(1)
9.6 Partielle Ableitung. Es sei x ∈ U und ej = (0, . . . , 0, 1, 0, . . . , 0) der j−te Einheitsvektor.
Wir nennen f in x in die j-te Koordinatenrichtung differenzierbar“ oder nach xj partiell
”
”
differenzierbar“, falls der Grenzwert
f (x + hej ) − f (x)
h
f (x1 , . . . , xj−1 , xj + h, xj+1 , . . . , xn ) − f (x1 , . . . , xn )
= lim
h→0
h
∂f
(x) =
∂xj
lim
h→0
( partielle Ableitung von f nach xj in x“) existiert. Man schreibt auch ∂xj f (x), manchmal sogar
”
fxj (x).
Ist f in jedem Punkt partiell nach xj differenzierbar, so heißt f auf U partiell nach xj differenzierbar.
Ist f in alle Koordinatenrichtungen (j = 1, . . . , n) partiell differenzierbar, so heißt f partiell
differenzierbar in x bzw. in U . Sind die partiellen Ableitungen stetig, so heißt f stetig partiell
2f
differenzierbar. Ebenso definiert man k-fache partielle Differenzierbarkeit z.B. ∂x∂2 ∂x
(x).
1
9.7 Satz. Genau dann ist f in x nach xj differenzierbar, wenn jede Komponentenfunktion
fi , i = 1 . . . m, in x nach xj differenzierbar ist. In diesem Fall ist
 ∂f 
1
 ∂x. j 
∂f
. 
=
 . 
∂xj
∂f
m
∂xj
Beweis. Folgt aus Satz 9.3.
⊳
9.8 Bemerkung. Es sei fi eine Komponentenfunktion von f. Wählt man die xk , k 6= j fest
und betrachtet die Funktion
g(t) = fi (x1 , . . . , xj−1 , t, xj+1 , . . . , xn )
die für t nahe bei xj definiert ist, so gilt – falls der Grenzwert existiert –
∂fi
(x) = g ′ (xj ).
∂xj
Die partielle Ableitung einer Komponentenfunktion ist also eine gewöhnliche Ableitung bei festgehaltenen anderen Variablen.
9.9 Beispiel. Für die Funktion aus Beispiel 9.5 ist
∂f
cos(x1 + x2 )
(x) =
1
∂x1
∂f
cos(x1 + x2 )
(x) =
0
∂x2
∂f
0
(x) =
.
2
∂x3
5
Sofort sehen wir, dass die partiellen Ableitungen selbst wieder partiell differenzierbar sind (sogar
beliebig oft). Wir haben z.B.
∂f
∂f
∂
∂
(x) = 0 =
(x).
∂x1 ∂x3
∂x3 ∂x1
P
9.10 Beispiel. r : Rn → R, r(x) = ( nk=1 x2k )1/2 = kxk. Dann ist r auf Rn \ {0} stetig partiell
differenzierbar, mit
xj
1 X 2 −1/2
∂r
· 2xj = .
= (
xk )
∂xj
2
r
9.11 Gradient, Divergenz, Rotation, Laplaceoperator, Wärmeleitung, Wellen.
(a)
(b)
Es sei f : U → R (m = 1!) partiell differenzierbar. Dann heißt
∂f
∂f
(x) . . .
(x) ∈ Rn
grad f (x) =
∂x1
∂xn
der Gradient von f . Manchmal schreibt man auch ∇f (x) Nabla f“. Die Funktion grad f :
”
U → R ordnet jedem Punkt x ∈ U ⊆ Rn den Vektor grad f (x) ∈ Rn zu.
Ganz allgemein nennt man eine Funktion g : U ⊆ Rn → Rn ein Vektorfeld.
Ist g : U ⊆ Rn → Rn (m = n!) ein partiell differenzierbares Vektorfeld, so heißt div g =
Pn ∂gj
j=1 ∂xj die Divergenz von g in x.
Formal ist
div g = h∇, gi,
(c)
wobei ∇ als der Vektor“ ( ∂x∂ 1 , . . . , ∂x∂ n ) interpretiert wird.
”
Ist g : U ⊆ R3 → R3 ein partiell differenzierbares Vektorfeld, so heißt
∂g2 ∂g1
∂g3 ∂g2
∂g1
∂g3
−
,
−
,
−
rot g =
∂x2 ∂x3 ∂x3 ∂x1 ∂x1 ∂x2
die Rotation von g in x (Englisch: curl g). Formal ist
rot g = ∇ × g.
(d)
Für f : U → R (oder C) zweimal stetig partiell differenzierbar setzt man
∆f =
n
X
∂2f
j=1
und nennt ∆ =
(e)
Pn
∂2
j=1 ∂x2j
∂x2j
den Laplace-Operator. Wichtigster Operator der Math. Physik.
Beachte: ∆ = div grad.
Die Gleichung ∆f = 0 heißt Laplacegleichung; ihre Lösungen harmonische Funktionen.
Die inhomogene Gleichung ∆f = g (bei gegebenem g und gesuchtem f heißt meist Potentialgleichung.
Beispiel: ∆E = 4πρ (E elektrisches Potential, ρ Ladungsdichte) ist die Gleichung für das
elektrische Feld bei gegebener Ladungsverteilung.
6
(f)
Weiterhin sei I ⊆ R ein Intervall. Für Funktionen f : U × I → R heißt
1 ∂f
− ∆x f = 0
k ∂t
P
die Wärmeleitungsgleichung; hier bedeutet ∆x = nj=1
∂2
∂x2j
und k ≥ 0 ist die Leitfähigkeit.
1 ∂2f
− ∆x f = 0
c2 ∂t2
ist die Wellengleichung; c ist die Ausbreitungsgeschwindigkeit.
WARNUNG: Sind die Variablen x und t, und kommt ein ∆ vor, so versteht man die
Gleichung meist so, dass ∆ nur bzgl. der x-Variablen wirkt.
9.12 Satz. (Satz von Schwarz). Ist f : U ⊆ Rn → Cm zweimal stetig partiell differenzierbar,
so ist
∂xj ∂xk f (x) = ∂xk ∂xj f (x), x ∈ U ;
man kann also die Reihenfolge der partiellen Ableitungen vertauschen.
Mehrfache Anwendung des Satzes zeigt, dass man für eine ℓ-mal stetig partiell differenzierbare
Funktionen die Reihenfolge für ℓ partielle Ableitungen vertauschen kann.
9.13 Richtungsableitung. Ist v ein beliebiger Vektor in Rn , so ist die partielle Ableitung von
f nach v in x
f (x + hv) − f (x)
∂f
(x) = lim
,
h→0
∂v
h
sofern der Limes existiert.
9.14 Schwäche der partiellen Ableitung. Auf D ⊆ R differenzierbare Funktionen sind
stetig (Folgerung 6.3). Partiell differenzierbare Funktionen sind jedoch u.U. nicht stetig. Man
führt daher einen stärkeren Ableitungsbegriff ein.
Totale Differenzierbarkeit
9.15 Definition. Es sei U ⊂ Rn offen. Eine Funktion f : U ⊂ Rn → Rm heißt in x ∈ U total
differenzierbar, falls eine (von x abhängige) lineare Abbildung
A : Rn → Rm
existiert, so dass für alle h mit khk < ε (ε wie in 9.4) gilt:
f (x + h) = f (x) + Ah + ϕ(h),
wobei ϕ : {h : khk < ε} → Rm eine Funktion ist mit
ϕ(h)
= 0.
khk→0 khk
lim
(1)
Die lineare Abbildung A ist die Ableitung von f in x. Schreibe A = f ′ (x).
Man nennt f (total) differenzierbar auf U , falls f in jedem Punkt x ∈ U (total) differenzierbar
ist.
Klar: A ist gegeben durch Matrix in Matmn (R) “Jacobi-Matrix”. Wie sieht diese Matrix aus?
7
9.16 Satz. Für f : U → Rm und x ∈ U ist äquivalent
(i)
(ii)
f total differenzierbar in x;
alle Komponentenfunktionen fi , i = 1, . . . , m, sind total differenzierbar
In diesem Fall ist f stetig. Ferner ist f in alle Koordinatenrichtungen partiell differenzierbar,
und für die Jacobi-Matrix A = (aij ), die f ′ (x) darstellt, gilt
aij =
∂fi
(x).
∂xj
Beweis. –
⊳
Nicht jede partiell differenzierbare Funktion ist auch total differenzierbar. Es gilt jedoch folgender
Satz:
9.17 Satz. Folgendes ist äquivalent:
(i)
(ii)
f ist auf U stetig total differenzierbar, d.h., f ist in jedem Punkt x ∈ U total differenzierbar, und die (matrixwertige) Funktion x 7→ f ′ (x) ist stetig.
f ist auf U stetig partiell differenzierbar, d.h., f ist in jedem Punkt x ∈ U partiell diffe∂f
(x) sind stetig.
renzierbar, und die Funktionen x 7→ ∂x
j
9.18 Satz (Kettenregel). Es seien U ⊆ Rn und V ⊆ Rk offen, f : U → Cm , g : V → Rn
Abbildungen mit g(V ) ⊆ U . Ist g differenzierbar in x ∈ V und f differenzierbar in g(x) ∈ U , so
ist f ◦ g : V → Cm differenzierbar in x, und es gilt
(f ◦ g)′ (x) = f ′ (g(x)) ◦ g ′ (x),
wobei ◦ auf der rechten Seite die Komposition von linearen Abbildungen/Matrizen bedeutet.
Insbesondere ergibt sich die Formel
n
X ∂fi
∂gk
∂
(g(x))
(f ◦ g)i (x) =
(x).
∂xj
∂xk
∂xj
k=1
Beweis. Für y = g(x) schreibe f (y + h) = f (y) + Ah + ϕ(h) und g(x + h) = g(x) + Bh + ψ(h)
mit A = f ′ (y), B = g′ (x). Dann ist
(f ◦ g)(x + h) = f (g(x + h)) = f (g(x) + Bh + ψ(h))
= f ◦ g(x) + ABh + Aψ(h) + ϕ(Bh + ψ(h)).
Zeige noch: Aψ(h) + ϕ(Bh + ψ(h)) = o(khk): Zunächst ist
ψ(h) kAψ(h)k ψ(h)
=
A khk ≤ kAk khk → 0.
khk
Nun zu ϕ(Bh + ψ(h)).
Für alle h 6= 0 mit Bh + ψ(h) = 0 ist nichts zu zeigen. Stets ist kBh + ψ(h)k ≤ kBkkhk +
ψ(h)
khk khk → 0. Es folgt:
kϕ(Bh + ψ(h))k kBh + ψ(h)k
kϕ(Bh + ψ(h))k
ψ(h)
kϕ(Bh + ψ(h))k
=
≤
kBk +
−→ 0.
khk
kBh + ψ(h)k
khk
kBh + ψ(h)k
khk
⊳
8
9.19 Folgerung. Es sei U ⊆ Rn offen, x ∈ U, v ∈ Rn und f : U → R(!) differenzierbar in x.
Dann gilt
∂f
(x) = hgrad f (x), vi.
∂v
Nach der Cauchy-Schwarzschen Ungleichung ist stets |hgrad f (x), vi| ≤ kgrad f (x)k kvk, wobei
Gleichheit nur bei linearer Abhängigkeit von grad f (x) und v gilt.
Es folgt: Unter allen v mit kvk = 1 wird ∂f
∂v (x) maximal für das (eindeutig bestimmte) v, das in
Richtung von grad f (x) zeigt. Der Gradient gibt daher die Richtung des steilsten Anstiegs von
f an.
Beweis. Definiere die Funktion g : R → Rn durch g(t) = x + tv. Sie ist differenzierbar in 0 mit
g′ (0) = v. Für hinreichend kleines ε > 0 ist x + tv ∈ U für alle |t| < ε. Nach 9.18 ist f ◦ g
differenzierbar in 0, und es gilt
f (x + tv) − f (x)
∂f
(x) = lim
= (f ◦ g)′ (0) = f ′ (g(0))g ′ (0) = f ′ (x) ◦ v = hgrad f (x), vi.
t→0
∂v
t
9.20 Die Tangentialfläche an den Funktionsgraphen. Es sei f : U → R total differenzierbar in x ∈ U . Der Graph von f ist die Menge
Gf = {(y, f (y)) : y ∈ U } ⊆ Rn+1 .
Die Identität
f (x + h) = f (x) + f ′ (x)h + ϕ(h)
können wir umschreiben (y = x + h)
f (y) = f (x) + f ′ (x)(y − x) + ϕ(y − x).
Da f Werte in R annimmt, kann man statt f ′ (x)(y − x) auch hgradf (x), y − xi schreiben. Dass
ϕ(h)/khk gegen 0 konvergiert, besagt, dass f nahe x gut durch die affin-lineare Funktion
l(y) = f (x) + hgradf (x), y − xi
genähert werden kann. Den Graphen Gl = {(y, l(y)) : y ∈ Rn } ⊆ Rn+1 von l nennt man die
n-dimensionale Tangentialfläche an den Graphen von u in x.
9.21 Satz (Hauptsatz der Differential- und Integralrechnung). Es sei U ⊆ Rn offen
und f : U → Rm stetig differenzierbar. Ferner sei x ∈ U und h ∈ Rn so klein, dass x + th ∈ U
für alle t ∈ [0, 1]. Dann gilt
Z 1
f ′ (x + th) dt · h.
(1)
f (x + h) − f (x) =
0
Beachte die Kurzschreibweise: f ′ (x) = (∂x1 f (x), . . . , ∂xn f (x)), und h = (h1 , . . . , hn ).
Beweis. Wir definieren die Funktion g : [0, 1] → Rm durch g(t) = f (x + th). Dann gilt nach der
Kettenregel g′ (t) = f ′ (x + th)h. Folglich
Z 1
Z 1
′
f ′ (x + th) dt · h.
g (t) dt =
f (x + h) − f (x) = g(1) − g(0) =
0
0
⊳
9
9.22 Folgerung (Schrankensatz). Unter den Voraussetzungen von Satz 9.21 sei zusätzlich
kf ′ (x + th)k ≤ M für alle 0 ≤ t ≤ 1. Dann folgt aus 9.21(1), dass kf (x + h) − f (x)k ≤ M khk.
9.23 Multi-Indizes. Es sei α = (α1 , . . . , αn ) ∈ Nn0 . Wir setzen |α| = α1 + α2 + . . . + αn : Länge
des Multi-Index, α! = α1 ! · . . . · αn !.
∂xα f = ∂xα11 . . . ∂xαnn f , falls f |α|-mal stetig differenzierbar ist. Für x ∈ Rn setze xα = xα1 1 ·. . .·xαnn .
9.24 Satz (Taylorformel mit Restglied). Es sei f : U → Rm N -mal stetig differenzierbar.
Dann gilt
f (x + h) =
N
−1
X
|α|=0
X NZ 1
∂ α f (x) α
h +
(1 − t)N −1 ∂ α f (x + th) dt · hα .
α!
α! 0
|α|=N
Beweis. Definiere g : [0, 1] → Rm durch g(t) = f (x + th). Nach der Taylorformel in R ist
g(1) =
N
−1
X
k=0
1
1 dk
g(0) +
k! dtk
(N − 1)!
Z
1
0
(1 − t)N −1
dN
g(t) dt.
dtN
Dann folgt die Behauptung aus der leicht zu zeigenden Formel
X k!
dk
∂ α f (x + th)hα .
g(t)
=
dtk
α!
|α|=k
⊳
9.25 Definition. Es sei f : U → R zweimal stetig differenzierbar. Dann setzt man
(Hess f )(x) = (∂xj ∂xk f (x))j,k=1,...,n
Hessesche Matrix von f in x“: Symmetrische n × n-Matrix nach dem Satz von Schwarz.
”
9.26 Lemma. Es sei f : U → R zweimal stetig differenzierbar und x ∈ U . Dann gilt
1
f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h),
2
(1)
wobei R3 (x, h)/khk2 → 0 für h → 0.
Beweis. Zunächst macht man sich klar, dass für reellwertige Funktionen (m = 1) gilt:
X ∂ α f (x)
hα = f (x)
α!
|α|=0
n
X
X ∂ α f (x)
α
∂xj f (x)hj = hgradf (x), hi
h =
α!
|α|=1
X ∂ α f (x)
hα =
α!
|α|=2
j=1
1
hHess f (x)h, hi
2
Dann schätzt man den Fehler ab.
⊳
10
9.27 Definition. Es sei U ⊆ Rn offen und f : U → R eine Funktion. Man nennt x ∈ U ein
lokales Maximum für f , falls
(1)
f (x) ≥ f (y) für alle y in einer Umgebung von x
Analog heißt x lokales Minimum, falls
(2)
f (x) ≤ f (y) für alle y in einer Umgebung von x.
Extremum ist der Oberbegriff für Maximum oder Minimum.
Man spricht von einem isolierten Maximum/Minimum/Extremum, falls Gleichheit in (1) bzw.
(2) nur für x = y gilt.
9.28 Satz. Es sei U ⊆ Rn offen, f : U → R partiell differenzierbar und x lokales Extremum
für f . Dann ist grad f (x) = 0.
Beweis. Für j = 1, . . . , n betrachte g(t) = f (x+tej ). Da U offen ist, ist g für −ε < t < ε definiert.
Die Funktion g ist differenzierbar nach der Kettenregel und hat in 0 ein lokales Extremum. Es
folgt: ∂xj f (x) = g ′ (0) = 0.
⊳
9.29 Definition. Es sei A selbstadjungierte Matrix. Dann ist hAx, xi = hx, Axi = hAx, xi,
somit hAx, xi ∈ R. Man nennt A
• positiv definit, falls hAx, xi > 0 ∀ x 6= 0
• negativ definit, falls hAx, xi < 0 ∀ x 6= 0
• indefinit, falls es sowohl ein x mit hAx, xi > 0 als auch ein y mit hAy, yi < 0 gibt.
Beispiel:
• A = Id positiv definit: hAx, xi = hx, xi = kxk2 > 0 ∀ x 6= 0
• A = −Id negativ definit: hAx, xi = h−x, xi = −kxk2 < 0 ∀ x 6= 0.
9.30 Definitheit und Eigenwerte. Eine selbstadjungierte Matrix ist diagonalisierbar mit
reellen Eigenwerten nach einem Satz der Linearen Algebra. Dann gilt:
• A positiv definit ⇔ alle Eigenwerte > 0.
• A negativ definit ⇔ alle Eigenwerte < 0.
• A indefinit ⇔ es gibt sowohl positive als auch negative Eigenwerte.
9.31 Hurwitz-Kriterium. Es sei A = (aij )i,j=1,...,n eine reelle, symmetrische n × n-Matrix.
Dann gilt:
A positiv definit ⇔ det (aij )1≤i,j≤k > 0, k = 1, . . . , n.
9.32 Satz. Es sei U ⊆ Rn offen, f : U → R zweimal stetig differenzierbar und x ∈ U mit
grad f (x) = 0.
11
(a)
(b)
Ist (Hess f )(x) positiv/negativ definit, so hat f in x ein isoliertes Minimum/Maximum.
Ist (Hess f )(x) indefinit, so hat f in x kein lokales Extremum.
Beweis. Nach 9.26 ist
1
f (x + h) = f (x) + hgrad f (x), hi + hHess f (x)h, hi + R3 (x, h),
2
wobei
lim R3 (x, h)/khk2 = 0.
(1)
h→0
Hier ist grad f (x) = 0. Ist Hess f (x) positiv definiert und λ > 0 der kleinste Eigenwert, so ist
hHess f (x)h, hi ≥ λ khk2 .
Andererseits existiert wegen (1) ein δ > 0 mit
|R3 (x, h)| <
λ
khk2 ,
4
falls khk < δ. Es folgt:
f (x + h) > f (x) +
λ
khk2 > f (x),
4
khk < δ.
Analog schließen wir für negativ definites Hess f (x).
(b) Wähle eine Eigenvektor h+ zu einem positiven Eigenwert λ+ , und einen Eigenvektor h− zu
einem negativen Eigenwert λ− , von Hess f (x) mit kh± k = 1.
Dann ist hHess f (x)h+ , h+ i = λ+ kh+ k2 = λ+ und hHess f (x)h− , h− i = λ− .
Für t → 0 betrachte f (x + th+ ) und f (x + th− ). Es gilt
f (x + th± ) − f (x) = λ± t2 + o(t2 ).
Für kleines t ist dieser Ausdruck positiv bei “+” und negativ bei “–”.
⊳
Lokale Invertierbarkeit und Lösen von Gleichungen
9.33 Definition. Eine Abbildung f : U → V zwischen zwei offenen Teilmengen U, V ⊂ Rn
heißt (C 1 -)Diffeomorphismus, falls f bijektiv ist und sowohl f als auch die Umkehrabbildung
f −1 stetig differenzierbar sind.
9.34 Lemma. Ist f : U → V ein Diffeomorphismus, so ist f ′ (x) invertierbar für jedes x ∈ U
und
(f −1 )′ (f (x)) = (f ′ (x))−1 .
⊳
Beweis. Die Identität f −1 (f (x)) = x liefert beim Ableiten: (f −1 )′ (f (x)) ◦ f ′ (x) = Id.
9.35 Frage. Wäre es sinnvoll, den Begiff des Diffeomorphismus f : U → V für U ⊆ Rn und
V ⊆ Rk einzuführen?
Antwort: Nein, denn wie oben wäre f ′ (x) invertierbar. Dies geht nur für k = n.
⊳
12
9.36 Satz von der lokalen Invertierbarkeit. Es sei U ⊆ Rn offen und f : U → Rn stetig
differenzierbar. Ferner sei a ∈ U und f ′ (a) invertierbar. Dann gibt es offene Umgebungen V (⊆ U )
von a und V ′ von f (a) in Rn mit folgenden Eigenschaften
(i)
(ii)
f : V → V ′ ist bijektiv.
Die Umkehrabbildung g = f −1 : V ′ → V ist ebenfalls differenzierbar, und (vgl. Satz 6.7)
−1
g′ (f (a)) = f ′ (a)
.
(1)
Die Einschränkung von f auf V ist also ein Diffeomorphismus (‘f ist lokal ein Diffeomorphismus’).
Bemerkung: Zeigt man die Differenzierbarkeit von g, so folgt (1) sofort wie in 9.34.
9.37 Beispiel. Die Polarkoordinatenabbildung in R2 . Wir betrachten die Abbildung
f : R>0 × R → R2 ,
Hier ist
f ′ (r, ϕ) =
f (r, ϕ) = (r cos ϕ, r sin ϕ)
cos ϕ −r sin ϕ
sin ϕ
r cos ϕ
.
Die Matrix ist stets invertierbar, denn det f ′ (r, ϕ) = r > 0.
Also ist für jeden Wert von (r, ϕ) ∈ R>0 × R die Abbildung f lokal invertierbar; es ist
cos ϕ sin ϕ
−1 ′
′
−1
.
(1)
(f ) (f (r, ϕ)) = (f (r, ϕ)) =
− sinr ϕ cosr ϕ
p
Setzt man x = f1 (r, ϕ) = r cos ϕ, y = f2 (r, ϕ) = r sin ϕ, so ist f −1 (r, ϕ) = (x, y), r = x2 + y 2 ,
cos ϕ = xr , sin ϕ = yr und (1) schreibt sich
!
√ x
√ y
2
2
2
2
x +y
x +y
(f −1 )′ (x, y) =
.
y
x
− x2 +y
2
x2 +y 2
Beachte: Die Abbildung f ist jedoch nicht injektiv (also nicht überall invertierbar), da für alle
(r, ϕ) gilt: f (r, ϕ) = f (r, ϕ + 2π).
9.38 Implizite Funktionen. Viele Beziehungen zwischen Größen x und y in den Naturwissenschaften sind als explizite Funktionen gegeben, d.h. von der Form y = f (x). Manchmal hat
man jedoch lediglich eine Beziehung der Form F (x1 , . . . , xn ) = 0, wobei F : U ⊆ Rn → Rm eine
gegebene Funktion ist, m ≤ n, d.h. man hat m Gleichungen für die n Unbekannten x1 , . . . , xn .
Frage: Kann man m der Unbekannten daraus bestimmen? D.h., kann man die Menge L = {x ∈
U : F (x) = 0} darstellen in der Form L = {(y, g(y)) : y ∈ U ′ } für ein geeignetes U ′ ⊆ Rn−m ?
9.39 Beispiel. Global geht das in der Regel nicht. Für F (x, y) = x − y 2 ist die Menge L =
{(x, y) : F (x, y) = 0} eine (liegende) Parabel. Wir können x global als Funktion von y darstellen:
L = {(x, y) : y ∈ R, x = y 2 } = {(y 2 , y) : y ∈ R}, aber es gibt keine Funktion g : U ′ → R mit
L = {(x, g(x)) : x ∈ U ′ }, da wir zu x < 0 gar keine Lösung erhalten und zu x > 0 zwei:
√
L = {(x, y) : y = ± x, x ≥ 0}. Aber lokal, in der Umgebung V = V1 × V2 eines Punktes (x0 , y0 )
√
mit x0 > 0 auf L können wir L als Graph darstellen, entweder durch L ∩ V = {(x, x) : x ∈ V1 }
√
oder L ∩ V = {(x, − x) : x ∈ V1 }, je nachdem ob V2 ⊆ R>0 oder V2 ⊆ R<0 .
13
9.40 Satz (Satz über die implizite Funktion). Es sei U ⊆ Rk × Rm offen und F : U → Rm
stetig differenzierbar. Für einen Punkt (a, b) ∈ U sei F (a, b) = 0 und die m × m-Matrix ∂F
∂y (a, b)
k
m
invertierbar. Dann gibt es offene Umgebungen V1 ⊆ R von a und V2 ⊆ R von b sowie eine
stetig differenzierbare Abbildung g : V1 → V2 mit F (x, g(x)) = 0.
Ferner gilt: Ist (x, y) ∈ V1 × V2 mit F (x, y) = 0, so ist y = g(x) (d. h. die Gleichung ist eindeutig
nach y auflösbar). Es gilt
∂g
(x) = −
∂x
−1
∂F
∂F
(x, g(x))
(x, g(x)).
∂y
∂x
(1)
9.41 Beispiel. Wir betrachten die 2 Gleichungen mit 3 Unbekannten
x2 + y 2 + (z − 1)2 = 9
2
2
2
x + y + (z + 1)
= 9.
(1)
(2)
Sie beschreiben die Schnittmenge zweier Kugeln mit Radius 3 um (0, 0, 1) bzw. (0, 0, −1). Aus
(1) und (2) erhalten wir (Differenz) sofort z = 0 und dann x2 +y 2 = 8. Die Menge L =
√ {(x, y, z) :
F (x, y, z) = 0} ist also der Kreis um den Ursprung in der (x, y)-Ebene mit Radius 8.
√
√
Lokal können
wir√die Punkte aus L als Graph über x (für − 8 < x < 8) bzw. über y darstellen
√
(für − 8 < y < 8); nie als Funktion von z.
Was sagt der Satz von der impliziten Funktion? Hier ist
2
x + y 2 + (z − 1)2 − 9
F (x, y, z) =
x2 + y 2 + (z + 1)2 − 9
und
′
F (x, y, z) =
2x 2y 2(z − 1)
.
2x 2y 2(z + 1)
Die erste und die zweite Spalte von F ′ sind linear abhängig. Die zweite und die dritte Spalte sind
linear unabhängig, falls y 6= 0; die erste und dritte Spalte sind linear unabhängig, falls x 6= 0;
Nach dem Satz
√ können wir also lokal y und z als Funktion von x darstellen, sofern y 6= 0
(d.h. x 6= ± 8; das ist die Standard-Variante). Andererseits kommt es auf die Reihenfolge der
Variablen nicht an. Wir können alternativ x und z als Funktion von y darstellen, sofern x 6= 0.
9.42 Satz (Extrema unter Nebenbedingungen). Sei U ⊆ Rn offen, g : U → Rk stetig
differenzierbar,
M = {x ∈ U : g(x) = 0}
und a = (a1 , . . . , an ) ∈ M ein Punkt mit Rang(g ′ (a)) = k (also maximal). Ferner sei f : U → R
eine stetig differenzierbare Funktion, die in a ein lokales Extremum unter der Nebenbedingung
g(x) = 0 einnimmt.
(Das heißt, es gibt eine Umgebung U von a derart, dass entweder f (a) ≤ f (x) ∀x ∈ M ∩ U oder
f (a) ≥ f (x) ∀x ∈ M ∩ U .)
Dann existiert λ = (λ1 , . . . , λk ) (die λk heißen Lagrangesche Multiplikatoren) so, dass
grad f (a) = λ g′ (a).
14
9.43 Bemerkung. Wann sind wir sicher, dass f auf M ein Extremum hat?
In Analysis A hatten wir gesehen, dass eine stetige Funktion auf einem Intervall [a, b], a, b ∈ R,
ihr Maximum und ihr Minimum annimmt.
Die Verallgemeinerung für höhere Dimensionen lautet: Eine stetige Funktion auf einer kompakten Menge nimmt ihr Maximum und ihr Minimum an. Dabei ist eine Teilmenge des Rn kompakt,
wenn sie abgeschlossen und beschränkt ist.
Abgeschlossen nennt man eine Menge, wenn ihr Komplement offen ist. Eine Nullstellenmenge
einer stetigen Funktion wie in Satz 9.42 ist stets abgeschlossen. Ebenso ist eine Menge der Form
{x ∈ Rn : h(x) ≤ 0} mit stetigem h abgeschlossen.
Beschränkt heißt sie, wenn sie in einer großen Kugel B(0, R), R groß, enthalten ist.
Unter den Voraussetzungen von Satz 9.42 ist also nur noch Beschränktheit nachzuprüfen.
9.44 Beispiel. f : R3 → R, f (x, y, z) = x + y + z, g : R3 → R, g(x, y, z) = (x2 + y 2 − 1, z).
Klar: f, g sind stetig differenzierbar. Die Menge M = {(x, y, z) : g(x, y, z) = 0} ist gerade der
Einheitskreis in der (x, y)-Ebene, insbesondere also beschränkt. Ferner
2x 2y 0
′
g (x, y, z) =
.
0 0 1
Nach Bemerkung 9.43 wissen wir, dass f auf M ein Maximum und ein Minimum hat.
Auf M hat g ′ den Rang 2, da wegen x2 + y 2 = 1 stets x 6= 0 oder y 6= 0. Nach 9.42 existiert
λ = (λ1 , λ2 ) mit
grad f (a) = λ g′ (a)
also
(1, 1, 1) = (λ1 · 2x, λ1 · 2y, λ2 ).
Es folgt
2xλ1 = 1
(1)
2yλ1 = 1
(2)
λ2 = 1.
(3)
x2 + y 2 = 1
(4)
z = 0.
(5)
Ferner ist wegen der Nebenbedingung
√
Wegen (1) ist λ1 6= 0, (1) und (2) liefern dann x = y, (4) liefert dann x = y = ± 21 2, (5)
√
√
√
√
liefert z = 0. Wir haben also zwei Kandidaten: a1 = ( 21 2, 12 2, 0) und a2 = (− 21 2, − 12 2, 0).
√
√
Einsetzen liefert f (a1 ) = 2, f (a2 ) = − 2. Somit ist a1 das Maximum und a2 das Minmum
von f unter der Nebenbedingung g.
15
10
Kurven
Im Folgenden sei D ⊆ R ein Intervall.
10.1 Definition.
(a)
(b)
(c)
Eine stetige Abbildung f : D → Rn heißt auch Kurve in Rn .
Ist f in t ∈ D differenzierbar, so heißt f ′ (t) ∈ Rn Tangentialvektor an die Kurve f in t.
Ist f differenzierbar und f ′ (t0 ) = 0, so heißt t0 singulärer Punkt. Sind alle Punkte nichtsingulär, so heißt f reguläre Kurve.
10.2 Beispiele.
(a)
(b)
(c)
(d)
Seien a, b > 0. Definiere f : [0, 2π] → R2 , f (t) = (a cos t, b sin t) Ellipse mit Halbachsen a
und b. Tangentialvektor f ′ (t) = (−r sin t, r cos t). Regulär.
Sei a ∈ Rn , v ∈ Rn \ {0}. Definiere f : R → Rn , f (t) = a + vt. Gerade durch a mit
Richtungsvektor (=Tangentialvektor) v. Regulär.
Sei r > 0, c ∈ R \ {0}. Definiere f : R → R3 , f (t) = (r cos t, r sin t, ct) Schraubenlinie.
Regulär.
Sei ϕ : D → R stetig differenzierbare Funktion. Definiere f : D → R2 durch f (t) =
(t, ϕ(t)). Graph der Kurve. Regulär.
10.3 Schnittwinkel. Sind f : D1 → Rn , g : D2 → Rn zwei reguläre Kurven und ist f (t1 ) =
g(t2 ) für geeignete t1 ∈ D1 , t2 ∈ D2 , so heißt die Zahl
ϑ = arccos
(f ′ (t1 ), g′ (t2 ))
kf ′ (t1 )k kg ′ (t2 )k
der Schnittwinkel von f und g im Punkt f (t1 ) = g(t2 ).
10.4 Rektifizierbarkeit, Länge. Es sei f : [a, b] → Rn eine Kurve und
a = t0 < t1 < . . . < tN = b
eine Partition von [a, b]. Dann ist
Pol (f ; t0 , . . . , tN ) =
N
X
j=1
kf (tj ) − f (tj−1 )k
die Länge des Polygonzugs durch f (t0 ) . . . f (tk ). Man nennt f rektifizierbar mit Länge L = L(f ),
falls gilt: Zu jedem ε > 0 existiert ein δ > 0, so daß für jede Partition a = t0 < . . . < tk = b der
Feinheit < δ
|L(f ) − Pol (f ; t0 , . . . , tN )| < ε.
10.5 Satz. Ist f : [a, b] → Rn stetig differenzierbar, so ist f rektifizierbar mit der Länge
Z b
kf ′ (t)k dt.
L(f ) =
a
16
Beweisidee. Man zeigt (relativ einfach), dass
Z tj
kf ′ (t)k dt ≤ 2 sup{kf ′ (tj ) − f ′ (t)k : t ∈ [tj−1 , tj ]}(tj − tj−1 ).
kf (tj ) − f (tj−1 k −
tj−1
Das supremum liegt dabei beliebig nahe an Null, falls die Feinheit der Zerlegung hinreichend
klein ist.
⊳
10.6 Beispiel. Seien r, α > 0. Betrachte f : [0, α] → R2 , f (t) = (r cos t, r sin t). Dann ist
kf ′ (t)k = r für alle t nach 10.2(a), also
Z α
r dt = rα.
L(f ) =
0
Speziell: α ist Bogenlänge im Einheitskreis von dem Punkt (1, 0) zu dem Punkt (cos α, sin α),
bzw., komplex betrachtet, von 1 zu eiα .
10.7 Definition. Es sei f : [a, b] → Rn eine Kurve. Ist ϕ : [α, β] → [a, b] eine stetig differenzierbare Funktion und gilt
ϕ : [α, β] → [a, b]
−1
ϕ
ist bijektiv
: [a, b] → [α, β]
ist stetig differenzierbar,
so heißt ϕ Parametertransformation.
Beachte: Weil ϕ und ϕ−1 stetig differenzierbar sind, ist ϕ′ (t) 6= 0 ∀t.
Weil ϕ bijektiv ist, ist ϕ entweder monoton wachsend oder monoton fallend, also entweder
ϕ′ > 0 und ϕ(α) = a, ϕ(β) = b (orientierungserhaltend) oder ϕ′ < 0 und ϕ(α) = b, ϕ(β) = a
(orientierungsumkehrend).
10.8 Satz. Die Kurvenlänge ist von der Parametrisierung unabhängig, d. h., sind ϕ, f wie in
10.7 und F : [α, β] → Rn definiert durch F (t) = f (ϕ(t)), so gilt
L(f ) = L(F ).
Beweis. Nach der Kettenregel ist F ′ (t) = f ′ (ϕ(t)) ◦ ϕ′ (t), also für ϕ′ > 0:
L(F ) =
Z
β
α
′
kF (t)k dt =
Z
β
α
′
′
kf (t)kϕ (t) dt =
Für ϕ′ < 0 analog.
Z
a
b
kf ′ (t)k dt = L(f ).
⊳
10.9 Bemerkung. Tangentialvektor: Wegen (f ◦ ϕ)′ = (f ′ ◦ ϕ) · ϕ′ gilt: gleiche Richtung für
orientierungserhaltendes ϕ, entgegengesetzte für orientierungsumkehrendes ϕ.
Der Winkel zwischen zwei Kurven bleibt wegen obiger Identität gleich bei orientierungserhaltenden Parametertransformationen.
17
11
Kurvenintegrale, Vektorfelder und Potentiale
11.1 Definition/Erinnerung.
(a)
(b)
Eine Funktion F : U ⊆ Rn → Rn heißt ein Vektorfeld.
Eine Kurve γ : [a, b] → Rn heißt stückweise glatt, falls es eine Partition a = t0 < t1 . . . <
tN = b von [a, b] gibt mit der Eigenschaft, dass γ|]tj−1 ,tj [ , j = 1, . . . , N , zu einer stetig
differenzierbaren Funktion auf [tj−1 , tj ] fortsetzbar ist.
11.2 Definition. Es sei γ : [a, b] → Rn eine stückweise glatte Kurve mit Bild γ = Γ und
F : Γ → Rn ein stetiges Vektorfeld. Wir definieren das Kurvenintegral von F über γ
Z
hF, dxi
(1)
γ
durch
Z
γ
hF, dxi =
Dabei ist die Partition wie oben.
k Z
X
j=1
tj
tj−1
hF (γ(t)), γ ′ (t)i dt.
11.3 Bemerkung.
R
γ hF, dxi auch
PR
(a)
Manchmal schreibt man statt
(b)
Motivation aus Mechanik, wo Arbeit gegen ein Kraftfeld entlang der Kurve geleistet wird.
~
Auf kleinen Stücken gilt W = F~ · dx
γ
Fi dxi .
11.4 Beispiel. In R2 sei F (x, y) = (1, 1) und γ : [0, π] → R2 gegeben durch γ(t) = (cos t, sin t).
Dann ist
Z π
Z π
Z
− sin t + cos tdt = [cos t + sin t]|π0 = −2.
h((1, 1), (− sin t, cos t)idt =
hF, dxi =
γ
0
0
R
11.5 Lemma und Bemerkung. Das Integral γ hF, dxi ist von der Kurvenparametrisierung
unabhängig, solange die Orientierung erhalten bleibt.
R
R
Man schreibt daher in (1) oft Γ statt γ und spricht von der orientierten Kurve Γ. Die Parametrisierung muss sich der Leser selbst suchen; eine geschickte Wahl spart viel Arbeit.
Beweis. Ist ϕ : [c, d] → [a, b] bijektiv und differenzierbar mit ϕ(c) = a, ϕ(d) = b, so ist
Z d
Z d
hF (γ(ϕ(s)), γ ′ (ϕ(s))iϕ′ (s) ds
hF (γ · ϕ(s)), (γ ◦ ϕ)′ (s)i ds =
c
c
Z b
hF (γ(t)), γ ′ (t)i dt.
=
a
Ändern wir die Orientierung (d.h. ϕ(c) = b, ϕ(d) = a), so kehrt sich das Vorzeichen um.
⊳
11.6 Definition. Es sei U ⊆ Rn offen und F : U → Rn ein Vektorfeld. Man sagt, F habe das
Potential oder auch die Stammfunktion V auf U , falls V : U → R eine partiell differenzierbare
Funktion ist mit grad V = F .
18
11.7 Satz. Das Vektorfeld F : U → Rn habe das Potential V ∈ C 1 (U, R). Dann gilt für jede
stückweise glatte Kurve γ : [a, b] → Rn mit Bild γ = Γ ⊆ U
Z
hF, dxi = V (γ(b)) − V (γ(a))
Γ
(Potential am Endpunkt − Potential am Anfangspunkt).
Beweis. O.B.d.A. γ glatt
Z
a
Z
b
hF, dxi =
Z
=
Z
=
b
a
b
a
b
a
hF (γ(t)), γ ′ (t)i dt
hgrad V (γ(t)), γ ′ (t)i dt
(V ◦ γ)′ (t) dt
= V (γ(b)) − V (γ(a)).
⊳
11.8 Folgerung. Hat F ein Potential V ∈ C 1 (U, R), so gilt für jede geschlossene, stückweise
glatte Kurve, die in U verläuft,
Z
hF, dxi = 0.
Γ
R11.9 Beispiel. Das Vektorfeld F aus 11.4 hat das Potential V (x, y) = x + y. Es gilt also
γ hF, dxi = V (γ(π)) − V (γ(0)) = V (−1, 0) − V (1, 0) = −2.
Frage: Wann hat F ein Potential?
11.10 Notwendige Bedingung. Hat F ∈ C 1 (U, Rn ) ein Potential V ∈ C 2 (U, R), so ist
∂Fj
∂Fi
(x) =
(x)
∂xj
∂xi
nach dem Satz von Schwarz, da
∂Fi
∂xj
=
∂2V
∂xi ∂xj
Integrabilitätsbedingung“
”
=
∂2V
∂xi ∂xj
=
∂Fj
∂xi .
11.11 Beispiel. Die Integrabilitätsbedingung ist nicht hinreichend. Auf R2 \ {0} betrachte
F (x, y) =
(−y, x)
.
x2 + y 2
Eine kurze Rechnung zeigt: Dieses Vektorfeld ist stetig differenzierbar auf R2 \{0} und erfüllt die
Integrabilitätsbedingung. Als Kurve wählen wir γ : [0, 2π] → Rn , γ(t) = (cos t, sin t). Γ = Bild γ
ist eine geschlossene, glatte Kurve (der Einheitskreis), aber
Z 2π
Z
Z
(− sin t (− sin t) + cos t · cos t) dt = 2π.
(F1 dx + F2 dy) = (−y dx + x dy) =
γ
0
γ
Daher kann F nach 11.8 kein Potential haben.
19
11.12 Definition. Wir nennen eine offene Teilmenge U von Rn ein Gebiet, falls sich je zwei
Punkte aus U durch einen stückweise stetig differenzierbaren Weg in U verbinden lassen (‘wegzusammenhängend’).
11.13 Satz. Sei U ein Gebiet und V1 , V2 ∈ C 1 (U, R) mit
grad V1 = grad V2 .
Dann ist V1 − V2 = const. Genau dann liefern also zwei Potentiale dasselbe Gradientenfeld, wenn
sie bis auf eine Konstante übereinstimmen.
Beweis. Wähle einen festen Punkt y0 ∈ U . Nun sei y ein beliebiger Punkt in U , γ : [a, b] eine
stückweise glatte Kurve von y0 nach y. Dann gilt nach 11.7
Z
Z
V1 (y) − V1 (y0 ) = hgrad V1 , dxi = hgrad V2 , dxi = V2 (y) − V2 (y0 ).
γ
γ
Also V2 (y) − V1 (y) = V2 (y0 ) − V1 (y0 ) = const ∀y.
11.14 Satz. Es sei U ein Gebiet in Rn , F ein stetiges Vektorfeld auf U . Dann ist äquivalent
R
(i)
Für jede stückweise glatte, geschlossene Kurve ist γ hF, dxi = 0.
(ii)
F besitzt ein Potential V .
Man erhält V wie folgt: Man wählt einen festen Punkt x0 ∈ U . Zu x ∈ U wählt man einen
stückweise stetig differenzierbaren Weg γx von x0 nach x und setzt
Z
hF, dxi.
V (x) =
γx
wählt,
Beweisidee. Nach 11.8 ist nur (i)⇒(ii) zu zeigen.
Rechne nach, dass die Formel ein Potential definiert. Wegen (i) hängt es nicht von der Wahl des
Wegs ab.
⊳
11.15 Definition. U ⊆ Rn heißt sternförmig, falls es einen Punkt x0 ∈ U (den sogenannten
Sternpunkt) gibt, so dass für jedes x ∈ U die Strecke {x0 + t(x − x0 ) : 0 ≤ t ≤ 1} ganz in U
liegt.
11.16 Beispiel.
(a)
(b)
(c)
(d)
Kugeln sind sternförmig.
R2 \ {(x, 0) : x ≥ 0} ist sternförmig mit Sternpunkt (−1, 0).
R2 \ {0} ist nicht sternförmig.
(Zeichnung)
11.17 Lemma. Ist U offen und sternförmig und erfüllt F ∈ C 1 (U, Rn ) die Integrabilitätsbedingung, so hat F auf U eine Stammfunktion.
11.18 Bemerkung. Statt ‘sternförmig’ genügt, dass U Gebiet ist und man jede stetige geschlossene Kurve in U auf einen Punkt zusammenziehen kann (‘einfach zusammenhängend’).
Beispiel: R3 \ {0} ist nicht sternförmig, aber einfach zusammenhängend. R2 \ {0} ist weder
sternförmig noch einfach zusammenhängend.
20
12
Gewöhnliche Differentialgleichungen
12.1 Definition.
(a)
Eine gewöhnliche Differentialgleichung (im Gegensatz zur partiellen) ist eine Gleichung
der Form
F (t, x(t), . . . , x(k) (t)) = 0, t ∈ J,
für eine gesuchte Funktion x : J → Rn , J Interval. Dabei ist
F : U ⊆ J × Rn × . . . × Rn → Rm
(b)
(c)
(d)
eine Funktion, in die die Werte von x und seinen Ableitungen eingesetzt werden. F kann
Werte in Rm annehmen, d.h., man hat m Gleichungen.
Die Differentialgleichung (Dgl) heißt explizit, falls sie nach der höchsten Ableitung aufgelöst ist:
x(k) = f (t, x(t), . . . , x(k−1) (t)).
P
Eine Dgl der Form kj=0 Aj (t)x(j) + f (t) = 0 heißt linear; weiterhin heißt siey
homogen, falls f = 0
inhomogen, falls f 6= 0.
Ist x(k) = f (t, x, . . . , x(k−1) ) eine Dgl, t0 ∈ J, so besteht die Anfangswertaufgabe (AWA)
darin, eine Lösung x zu finden, deren erste k − 1 Ableitungen in t0 die vorgegebenen
Anfangswerte
x(t0 ) = c0 , . . . , x(k−1) (t0 ) = ck−1
annehmen.
12.2 Beispiel. Bewegung eines Massepunktes unter dem Einfluss der Schwerkraft:
x′′ (t) = −g,
Physik:
t ∈ R.
Es folgt für t0 ∈ R fest:
x′ (t) − x′ (t0 ) =
Z
t
t0
x′′ (s) ds = −
Z
t
t0
g ds = −g(t − t0 ).
Es folgt
x′ (t) = −gt + c,
c = gt0 + x′ (t0 )
und
x(t) − x(t0 ) =
Z
t
t0
′
x (s) ds = −
1
x(t) = − gt2 + ct + d
2
Z
t
1
(−gs + c) ds = − g(t2 − t20 ) + c(t − t0 )
2
t0
mit
1
1
d = x(t0 ) + gt20 − ct0 = x(t0 ) + gt20 − gt20 − x′ (t0 )t0 .
2
2
Also hat die Lösung der Differentialgleichung die Form x(t) = − 21 gt2 + ct + d, wobei c und d
sich aus den Startwerten x(t0 ) und x′ (t0 ) berechnen lassen. Zu jeder Wahl von x(t0 ) und x′ (t0 )
gibt es genau eine Lösung.
21
Einige Lösungsverfahren
12.3 Separation der Variablen/Trennung der Veränderlichen. Möglich für Differentialgleichungen der Form
x′ = f (t)g(x), x(t0 ) = x0 ,
mit stetigen Funktionen f, g.
Fall I: g(x0 ) = 0 ⇒ Mögliche Lösung ist x ≡ x0 .
Fall II: g(x0 ) 6= 0 ⇒ Falls eine Lösung existiert, so ist auch g(x(t)) 6= 0 für t nahe t0 wegen
Stetigkeit der Abbildung t 7→ g(x(t)).
Dann gilt dort
Z x(t)
Z t
Z t ′
dy
x (s)
ds =
.
(1)
f (s) ds =
g(x(s))
g(y)
x(t0 )
t0
t0
Dies liefert eine implizite Gleichung der Form G(t, x) = 0. Auflösbar nach x?
Z t
Z x
dy
∂
∂G
1
(t, x) =
6= 0,
f (s) ds −
=−
∂x
∂x t0
g(y)
g(x)
x0
folglich: ja.
12.4 Bemerkung. Ist g(x0 ) = 0, so kann es u.U. vorkommen, dass man Lösungen der Form I
und Lösungen der Form II oben zu einer Lösung zusammenstückeln kann.
12.5 Beispiel. x′ = xt , x(t0 ) = x0 6= 0. Wir verwenden die Methode der Trennung der Veränderlichen mit f (t) = t, g(x) = x1 . Damit lautet die Gleichung 12.3(1)
Z t
Z x
s ds =
y dy
t0
x0
Integration liefert die implizite Gleichung
1 2
(t − t20 ) =
2
1 2
(x − x20 )
2
Es folgt
x2 − t2 = x20 − t20 = c
und damit
x = ±
p
c + t2
falls t2 ≥ −c (explizite Lösung)
12.6 Rückführung auf Separation der Variablen.
(a)
(b)
x′ = f (at + bx + c). Setze u(t) = at + bx(t) + c. Dann folgt u′ = a + bx′ (t) = a + bf (u).
Finde u, liefert x.
x′ = f (x/t). Setze u = xt . Dann ist
u′ =
1 ′ x 1
x′ t − x
x −
= (f (u) − u).
=
t2
t
t
t
Finde u mit Separation der Variablen.
22
12.7 Lineare Differentialgleichung erster Ordnung.
x′ + a(t)x = f (t)
x(t0 ) = x0
(a)
f ≡0:
homogen, sonst inhomogen
Homogene Differentialgleichung. Ist x0 = 0, so ist x(t) ≡ 0 eine Lösung. Ist hingegen
x0 6= 0, so gilt (Stetigkeit) zumindest für t nahe t0 : x(t)/x0 > 0. Es folgt:
Z t
x
= −
a(s) ds,
also
ln
x0
t0
−
x(t) = x0 e
(b)
Rt
t0
a(s) ds
.
Somit existiert die Lösung für alle t ∈ R, und x(t) 6= 0 ∀ t ∈ R.
Inhomogene Differentialgleichung. Ansatz: Variation der Konstanten.
Setze
R
− t a(s) ds
.
F (t) = e t0
Dann ist F (t) 6= 0 für jedes t, F ′ (t) + a(t)F (t) = 0 und F (t0 ) = 1 .
Wir machen den Ansatz: x(t) = C(t)F (t).
Damit x(t0 = x0 ist, muss C(t0 ) = x(t0 ) = x0 gelten. Ferner erhalten wir:
f = x′ + ax = (CF )′ + aCF = C ′ F + CF ′ + aCF = C ′ F + C(F ′ + aF )
Somit ist
C ′ (t) =
Es folgt
C(t) =
und damit
x(t) =
Z
t
Z
F ′ +aF =0
=
C ′ F.
Rt
f (t)
a(s) ds
= f (t) e t0
.
F (t)
Rr
t
f (r) e
t0
a(s) ds
dr + C(t0 ).
t0
Rr
f (r) e
t0
a(s) ds
dr + x0
t0
−
e
Rt
t0
a(s) ds
12.8 Bemerkung. Verzichtet man auf das Stellen einer Anfangsbedingung, so ist x′ + a(t)x =
f (t) eine inhomogene lineare Gleichung für die Funktion x, und man erhält die Regel:
Allgemeine Lösung der inhomogenen Gleichung = allgemeine Lösung der homogenen
Gleichung + spezielle Lösung der inhomogenen Gleichung
12.9 Bernoullische Differentialgleichung.
x′ + a(t)x + b(t)xr = 0,
r ∈ R.
Spezialfälle:
• r=0
x′ + a(t)x + b(t) = 0
• r=1
x′ + (a(t) + b(t))x = 0
inhomogen linear.
homogen linear.
Also r 6= 0, 1. Wähle k = 1 − r, z := xk ⇒ x = z 1/k . Die Differentialgleichung wird dann zu
1 1/k−1 ′
z
z + a(t)z 1/k + b(t)z r/k = 0.
k
Multiplikation mit kz
k−1
k
liefert die leicht lösbare inhomogen lineare Dgl
z ′ + ka(t)z + kb(t) = 0.
23
Reduktion auf Systeme erster Ordnung
12.10 Lemma. Jede explizite Differentialgleichung k-ter Ordnung (ggf. mit Anfangswerten
x(t0 ) = c1 , . . . xk−1 (t0 ) = ck ) ist äquivalent zu einem System von k Differentialgleichungen
erster Ordnung (ggf. mit Anfangswert (x1 (t0 ), . . . , xk (t0 )) = (c1 , . . . , ck )). Die Standardform
einer expliziten Differentialgleichung ist also
x′ = f (t, x) (ggf. mit Anfangsbedingung x(t0 ) = x0 )
mit einer Funktion f : U ⊆ J × Rk → Rk und x0 ∈ Rk .
Beweis. Es sei x(k) = g(t, x, . . . , x(k−1) ) eine explizite Differentialgleichung. Wir setzen
x1 = x; x2 = x′ ;
. . . xk = x(k−1) .
Dann ist das Lösen von x(k) = g(t, x, . . . , x(k−1) ) mit den Anfangswerten x(t0 ) = c1 , . . . , x(k−1) (t0 ) =
ck äquivalent zum Lösen von
x′1 = x2 ; . . . x′k−1 = xk ; x′k = g(t, x1 , . . . , xk )
mit den Anfangswerten x1 (t0 ) = c0 , . . . , xk (t0 ) = ck−1 . Fasst man x1 , . . . , xk als Vektor x auf
und c1 , . . . , ck als Vektor c, so lautet das letzte System
x′ = f (t, x),
x(t0 ) = c,
mit f (t, x) = (x2 , . . . , xk , g(t, x1 , . . . , xk )) und c = (c0 , . . . , ck−1 ).
⊳
Visualisierung
12.11 Richtungsfeld. Eine Lösung der Differentialgleichung x′ = f (t, x), (t, x) ∈ U , hat in
t0 die Steigung f (t0 , x(t0 )). An jedem Punkt (t, x) heften wir das ‘Steigungselement’, ein Geradenstückchen mit der Steigung f (t, x) an und erhalten so das sog. Richtungsfeld. Die Lösungen
der Differentialgleichung sind genau diejenigen Kurven, die sich an das Richtungsfeld anschmiegen. Das folgende Diagramm zeigt das Richtungsfeld für x′ = 14 (−t − t2 + 4x)
Richtungsfeld
3
y(x)
2
1
0
-3
-2
-1
0
1
2
x
-1
24
3
Numerische Verfahren
Es gibt eine Reihe von Verfahren, die die Lösung einer Differentialgleichung der Form x′ = f (t, x)
liefern. (Bemerkung: Sie funktionieren nur dann richtig, wenn man sicher sein kann, dass eine
eindeutig bestimmte Lösung existiert.) Am bekanntesten ist das folgende
12.12 Runge-Kutta-Verfahren. Man unterteilt das Intervall [t0 , t0 + a] in n gleiche Teile
und setzt
tk = t0 + kh, h = a/n.
Bekannt ist der Startwert (t0 , x0 ).
Nun geht man induktiv wie folgt vor:
Ist (tk , xk ) gegeben, so setzt man
yk1 = f (tk , xk );
h
h
yk2 = f (tk + , xk + yk1 );
2
2
h
h
yk3 = f (tk + , xk + yk2 );
2
2
yk4 = f (tk + h, xk + hyk3 );
1
(yk1 + 2yk2 + 2yk3 + yk4 ) ;
yk =
6
xk+1 = xk + hyk .
Der Fehler ist dann von Ordung h4 (oder besser).
Zur Erklärung: Man bestimmt xk+1 aus xk , indem man zu xk die Intervalllänge h,
multipliziert mit einer gemittelten Steigung yk , addiert. In das Mittel gehen vier
Größen ein:
• yk1 ist die Steigung in tk ;
• yk2 ist die geschätzte Steigung in tk + h2 , mittels x(tk + h2 ) ≈ x(tk ) + h2 x′ (tk ) ≈
xk + h2 f (tk , xk ).
• yk3 ist ebenfalls geschätzte Steigung in tk + h2 , diesmal jedoch mittels x(tk + h2 ) ≈
x(tk ) + h2 yk2 .
• yk4 ist die mittels x(tk + h) ≈ xk + hyk3 geschätzte Steigung in tk + h.
Existenz- und Eindeutigkeitssätze
12.13 Satz. (Existenzsatz von Peano) Es sei (t0 , x0 ) ∈ R × Rn , a > 0, b > 0. Setze
D = {(t, x) ∈ R × Rn : |t − t0 | ≤ a, kx − x0 k ≤ b}.
Ist f = f (t, x) : D → Rn stetig, so hat die Anfangswertaufgabe
x′ = f (t, x),
x(t0 ) = x0
mindestens eine Lösung auf dem Intervall ]t0 − c, t0 + c[, wobei
b
} und A = sup{kf (t, x)k : (t, x) ∈ D}.
A
Beachte: Das sup existiert wegen Stetigkeit von f und Kompaktheit von D.
c = min{a,
25
Ohne Beweis.
12.14 Satz. (Existenz und Eindeutigkeitssatz von Picard-Lindelöf ). Bezeichungen und
Annahmen von Satz 12.13. Zusätzlich sei f lipschitzstetig in x in folgendem Sinn: Es gibt ein
L ≥ 0 mit
kf (t, x1 ) − f (t, x2 )k ≤ L kx1 − x2 k für alle (t, x1 ), (t, x2 ) ∈ D.
Dann hat die Anfangswertaufgabe eine eindeutige Lösung auf dem Intervall ]t0 − d, t0 + d[, wobei
d = min{a, Ab , L1 }.
12.15 Bemerkung. Die Bedingung aus 12.14(b) ist stets erfüllt, wenn die Funktion f auf
einer Umgebung von D nach x stetig differenzierbar ist; wegen der Kompaktheit von D ist dann
nämlich k∂x f (t, x)k beschränkt auf D und somit
kf (t, x1 ) − f (t, x2 )k ≤ sup{k∂x f (t, x)k} kx1 − x2 k.
Beweisidee von 12.14. Es sei J0 = [t0 − r, t0 + r] für ein 0 < r < d.
Schritt 1 Trick: Wir integrieren und sehen, dass x genau dann die AWA x′ = f (t, x), x(t0 ) = x0
auf J0 löst, wenn x auf J0 stetig ist und
Z t
x(t) = x0 +
f (s, x(s))ds, t ∈ J0
t0
gilt.
Schritt 2 Wir definieren die Folge von Funktionen (φ0 , φ1 , . . .) wie folgt:
φ0 ist die Funktion mit dem konstanten Wert x0 . Ist φk gegeben, so setzen wir
Z t
φk+1 = x0 +
f (s, φk (s))ds, t ∈ J0 .
t0
Man kann dann zeigen, dass diese Folge von Funktionen in dem Raum C([t0 , t0 + c]) gegen die
Lösung der AWA konvergiert.
⊳
12.16 Beispiel. Was schief gehen kann.
(a)
Verlust der Eindeutigkeit:
Wir betrachten die Anfangswertaufgabe
x′ = x2/3 ,
x(t0 ) = x0 auf R.
Problem: x 7→ x2/3 nicht lipschitzstetig in 0. Ist z.B. x0 = 0, so sieht man mit Separation
der Variablen, dass für jede Wahl von t1 und t2 mit t2 < t0 < t1 durch
 1
 ( 3 (t − t2 ))3 t < t2
xt1 ,t2 (t) =
0
t2 ≤ t ≤ t1
 1
3
( 3 (t − t1 )) t > t1
eine stetig differenzierbare (!) Funktion definieren, die die Differentialgleichung samt Anfangsbedingung erfüllt. Wir erhalten also unendlich viele Lösungen auf R.
Für x0 6= 0 analog.
26
(b)
Endliches Lösungsintervall. x′ = −x2 , x(t0 ) = x0 ist stetig auf R und lipschitzstetig auf
jedem Teilintervall [−R, R].
Für x0 6= 0 liefert Separation der Variablen
Z t
Z x
1
dy
=
1 ds,
−
2
t0
x0 y
also
1
x
−
1
x0
= t − t0 bzw.
x=
1
t − (t0 −
1 .
x0 )
Die Lösung ist also für x0 6= 0 in einer Umgebung von t = t0 eindeutig bestimmt. Für
t → t0 − x10 gilt |x(t)| → ∞, d. h. die Lösung explodiert“ bei Annäherung an t0 − x10 ( in
”
”
endlicher Zeit“).
Das folgende Lemma zeigt, dass man das Wachstum kontrollieren kann:
12.17 Lemma. (Gronwallsches Lemma) Es sei J ein Intervall, t0 ∈ J. Ferner sei g : J → R
stetig mit g ≥ 0, und es gelte
Z t
g(t) ≤ A g(s)ds + B, t ∈ J
t0
mit geeigneten A, B ≥ 0. Dann gilt für alle t ∈ J
g(t) ≤ BeA|t−t0 | .
Beweis. Zunächst sei t ≥ t0 . Wir betrachten die Funktion
Z t
G(t) = A
g(s)ds + B.
t0
Nach Annahme ist G′ (t) = Ag(t) ≤ AG(t). Die SdV-Technik liefert sofort:
G(t) ≤ G(t0 )eA(t−t0 ) .
Wegen g ≤ G folgt die Behauptung. Analog für t ≤ t0 .
⊳
12.18 Definition. Es sei f : U ⊆ Rn+1 → Rn stetig, J, J˜ Intervalle (nicht notwendig offen) und
x : J → Rn sowie x̃ : J → Rn in U verlaufende Lösungen der Differentialgleichung x′ = f (t, x).
Man nennt x̃ Fortsetzung von x, falls J ⊆ J˜ und x̃|J = x. Eine Lösung heißt maximal, falls sie
keine Fortsetzung auf ein echt größeres Intervall hat.
12.19 Definition. Es sei U ⊆ R × Rn offen. Wir sagen, f : U → Cm erfülle eine lokale
Lipschitzbedingung bezüglich x, falls zu jedem (t, x) ∈ U eine Umgebung U0 und eine Konstante
L existiert mit
kf (t, x1 ) − f (t, x2 )k ≤ Lkx1 − x2 k, (t, x1 ), (t, x2 ) ∈ V.
27
12.20 Satz. Es sei U ⊆ R × Rn offen, (t0 , x0 ) ∈ U , f : U → Rn sei stetig und erfülle eine lokale
Lipschitzbedingung bzgl. x.
Dann existiert eine eindeutige maximale Lösung xmax der Anfangswertaufgabe
x′ = f (t, x),
x(t0 ) = x0 .
Sie ist definiert auf einem offenen Intervall ]t− , t+ [. Nur dann ist t+ 6= +∞, wenn für x ր t+ die
Lösungskurve (t, x(t)) an den Rand des Gebiets U stößt oder wenn limt ր t+ kxmax (t)k = +∞
ist. Analog für t− .
Kurz: Die Lösungskurve t 7→ (t, xmax (t)) lässt sich solange fortsetzen, bis sie entweder explodiert oder an den Rand von U läuft. Oder: Die Lösungskurve verlässt (in jeder Richtung) jede
kompakte Teilmenge von U .
12.21 Bemerkung. Verzichtet man auf die Lipschitzbedingung, so gilt – bis auf die Eindeutigkeit der Lösung – die Aussage des obigen Satzes ebenfalls.
Kurvenscharen und Orthogonaltrajektorien
12.22 Kurvenscharen und Differentialgleichungen. Durch die Gleichung
F (t, x, c) = 0
(1)
sei eine Kurvenschar in R2 gegeben, die durch c parametrisiert ist, z.B. die Parabelschar x−ct2 =
0, c ∈ R. Gemeint: Für jedes c ist ein Kurve xc = xc (t) definiert, die (1) erfüllt, z.B. xc (t) = ct2 .
Wir lösen nach c auf:
x
(2)
c = f (x, t); im Beispiel: c = 2 für t 6= 0.
t
Ableiten nach t liefert die Differentialgleichung
0=
d
[f (x(t), t)] = ∂x f (x(t), t)x′ (t) + ∂t f (x(t), t);
dt
(3)
′
im Beispiel: 0 = xt2 − 2 tx3 bzw. x′ = 2x/t für t 6= 0.
Jede Lösung von (2) erfüllt dann (3) und umgekehrt.
12.23 Beispiel. Hyperbelschar F (t, x, c) = t2 − x2 − c = 0. Liefert die Dgl 2t − 2xx′ = 0, also
für x 6= 0 die Differentialgleichung x′ = t/x.
12.24 Orthogonaltrajektorien. Es seien F und f wie oben.
Eine Kurve, die jede der Kurven der Schar orthogonal schneidet, heißt Orthogonaltrajektorie.
Man findet eine solche Kurve (lokal) wie folgt. Wir beschreiben die Kurvenschar lokal durch die
Differentialgleichung 12.22(3). Diese sei von der Form x′ = h(t, x).
Die Kurve t 7→ (t, x(t)) hat die die Ableitung (1, x′ (t)) = (1, h(t, x)). Damit die Orthogonaltra1
) haben.
jektorie t 7→ (t, y(t)) darauf senkrecht steht, muss sie die Ableitung (1, y ′ ) = (1, − h(t,x)
Wir erhalten daher als Differentialgleichung der Orthogonaltrajektorie
y′ = −
1
.
h(t, y)
28
12.25 Beispiel.
(a)
Die Orthogonaltrajektorie zu der Hyperbelschar aus 12.23 hat die Differentialgleichung
x′ = −x/t. Für t0 6= 0, x0 6= 0 erhält man mit Separation der Variablen für t/t0 > 0 und
x/x0 > 0:
Z
x
dy
x0 y
x
⇒ ln
x0
= −
Z
t
t0
ds
s
t0
= ln
t
t 0 x0
⇒ x(t) =
.
t
(b)
t
. Separation
Die Orthogonaltrajektorie zur Parabelschar aus 12.23 hat die Dgl x′ = − 2x
der Variablen liefert für x0 , t0 6= 0
1
1
1
x(t)2 − x20 = (t20 − t2 ) bzw. x(t)2 + t2 = x20 + t20 (Ellipse).
2
2
2
12.26 Die Differentialgleichung x′′ = f (x). Motivation: Physik: Bewegung eines Teilchens
unter Kraft f , die nicht von t abhängt.
Sei f ∈ C(J, R), J ⊆ R Intervall, a ∈ J. Definiere
Z x
f (y) dy
U :J →R
U (x) = −
a
(Bedeutung: potentielle Energie). Dann haben wir die Differentialgleichung
x′′ (t) = −U ′ (x(t)).
Wir wissen nach Peano: Lokal existiert eine Lösung. Multipliziere mit x′ (t):
⇒
⇒
x′′ (t)x′ (t) = −U ′ (x(t)) x′ (t)
1 ′ 2 ′
= −(U (x))′
(x )
2
1 ′ 2
(x ) + U (x) = const = E
2
(Gesamt − Energie).
(1)
Speziell: Alle Bahnen laufen in Bereichen, wo U (x) ≤ E ist. Es gilt
p
x′ = ± 2(E − U (x))
(je nachdem, ob im Beobachtungsintervall x′ (t) ≥ 0 oder x′ (t) ≤ 0 ist). Separation der Variablen
für Startwert x(t0 ) = x0
Z x
1
p
dy = t − t0 .
2(E − U (y))
x0
Auflösen nach x liefert Lösung.
Nette Beobachtung: Das Integral links liefert die Zeit, die das Teilchen braucht, um von x(t0 )
nach x(t) zu kommen.
29
13
Norm von Matrizen. Exponentialabbildung
Norm von Matrizen
Erinnerung. Es sei K = R oder C. Die Norm kzk eines Vektors z = (z1 , . . . , zn ) ∈ Kn ist
definiert durch
v
uX
u n
|zj |2 .
kzk = t
j=1
Allgemein ist eine Norm auf einem K-Vektorraum X eine Abbildung x 7→ kxk mit
(N1) kxk ≥ 0 für alle x ∈ X; kxk = 0 genau dann, wenn kxk = 0.
(N2) kλxk = |λ| kxk,
x ∈ X, λ ∈ K..
(N3) kx + yk ≤ kxk + kyk,
x, y ∈ X.
13.1 Definition. Die Norm einer Matrix in Matmn (K) ist definiert durch:
kAxk
n
: x ∈ K \ {0} .
kAk := sup
kxk
Ohne Beweis: Das supremum ist stets < ∞. Es stimmt überein mit
sup{kAxk : kxk ≤ 1}
und
sup{kAxk : kxk = 1}.
Damit gilt automatisch: kAxk ≤ kAkkxk für alle x.
13.2 Lemma.
(a)
(b)
(c)
k · k ist Norm auf dem Vektorraum der m × n-Matrizen.
Für A ∈ Matmk (K) und B ∈ Matkn (K) ist kABk ≤ kAk kBk
Die Norm der Einheitsmatrix ist 1.
Beweis. (a)
(i)
kAk ≥ 0, kAk = 0 ⇔ A = 0 klar
!
(ii) k(λA)xk = |λ|kAxk, also kλAk = sup k(λA)xk/kxk = |λ| sup kAxk/kxk = |λ|kAk.
(iii) k(A + B)xk ≤ kAxk + kBxk, daher
kAxk kBxk
kBxk
kAxk
k(A + B)xk
≤ sup
+
+sup
= kAk+kBk.
≤ sup
kA+Bk = sup
kxk
kxk
kxk
kxk
kxk
def
(b) k(AB)xk = kA(Bx)k ≤ kAkkBxk ≤ kAkkBkkxk.
(c) Klar.
⊳
13.3 Satz. Der Vektorraum der m × n-Matrizen ist vollständig mit der obigen Norm, d.h. jede
Cauchyfolge bezüglich der Norm aus 13.1 hat einen Grenzwert.
Mit anderen Worten: Ist (Aj ) eine Folge von Matrizen mit kAj − Ak k → 0 für j, k → ∞, so
existiert eine Matrix A mit kAj − Ak → 0. Dabei ist (Aj ) genau dann eine Cauchy-Folge, wenn
an jeder Position (i, k) die Einträge eine Cauchy-Folge in K bilden.
(ohne Beweis)
Wir können nun mit n × n-Matrizen fast wie mit Zahlen operieren.
30
Exponentialfunktion von Operatoren
13.4 Satz. Es sei A ∈ Matnn (K). Wir setzen
etA :=
∞ k
X
t
k=0
Dann gilt:
(a)
(b)
(c)
k!
Ak ,
t ∈ R.
Die Reihe für etA konvergiert für jedes t ∈ R absolut in Matnn (K), d.h.
giert in R.
Die Funktion t 7→ etA ist differenzierbar (also auch stetig) auf R, und
(etA )′ = A etA = etA A.
Ist B ∈ Matnn (K) mit AB = BA, so ist etA etB = et(A+B) für alle t.
P k(tA)k k
k!
konver-
Beweis. Dies ist eine Potenzreihe mit Koeffizienten in Matn (K). Ihr Konvergenzradius ist unendlich: Wegen 13.2(b) ist kAk k ≤ kAkk und somit
q
p
lim k kAk k/k! ≤ kAk lim k 1/k! = 0.
Wir erhalten sofort (a).
(b) Wie in Kapitel 8: Potenzreihen sind (bel. oft) differenzierbar und können gliedweise abgeleitet
werden
∞
X
tk−1 k
tA ′
A = AetA = etA A.
(e ) =
k
k!
k=1
(c) Vertauschen A und B, so kann man etA etB wie im Fall komplexer Zahlen mit dem Cauchyprodukt und dem binomischen Lehrsatz berechnen, s. 4.18(b) aus Analysis A.
⊳
13.5 Frage. Wie berechnet man etA für ein A ∈ Matn (C)? Wichtigstes Hilfsmittel ist die
Jordan-Zerlegung:
Q
13.6 Erinnerung: Jordansche Normalform. Es sei A ∈ Matn (K) und fA = rj=1 (x− λj )nj
mit paarweise verschiedenen λj das charakteristische Polynom. Dann gibt es Basen Bj von
Kern (λj Id − A)nj so, dass für B = (B1 , . . . , Br ) gilt


J1


..
.
B AB = 
.
Jr
Dabei sind die Jj , j = 1, . . . , r obere Dreiecksmatrizen von folgender Gestalt:


Jj1


..
Jj = 

.
Jjkj
wobei die Jjk (die sog. Jordan-Kästchen) quadratische Matrizen von der Form


λj 1


..


.


Jjk = 

..

. 1 
λj
31
sind. Bis auf die Reihenfolge der Kästchen ist die Zerlegung eindeutig. Dann ist
J = B AB = T −1 AT
mit T = kanon. Basis (Id)B . Beachte: In T stehen die Basisvektoren von B als Spaltenvektoren.
13.7 Lemma. Sei A ∈ Matn (C). Wir bestimmen dann etJ mit folgenden Resultaten:
(a)
Seien J1 , . . . Jr quadratische Matrizen und

J1

A=
0
Dann ist
(b)
(c)

0 1
0
 
.
 
0 ..

exp 
t
  ..
..
  .
. 1
0
... 0
(d)
e(T
−1 AT )t
= T −1 etA T .
Jr
0
.
eJr t
0


.
.
..
et(λId+B) = etλId etB = etλ IdetB = etλ etB ,
 
..
eJ1 t

etA = 

0
λ∈C


 
 
 = 
 
 




.
1 t t2 /2 . . . tk /k!
..
..
.
0 1
t
.
..
. t2 /2
0 0
1
..
..
.
t
.
0
...
1









Beweis.
(a)
(b)
(c)
Kästchensatz
13.4(c).
Folgt weil

0 1
0

.

0 ..

 ..
..
 .
. 1
0
... 0
(d)
et(T
−1 AT )
=
∞ j
X
t
j=0
j!
2

0 0
1
0




 0 0 0 ...






.
 =
.
. 1 





 ..
..
 .
. 0 
0
...
0
(T −1 AT )j =
∞ j
X
t
j=0
j!
T −1 Aj T = T −1 etA T.
⊳
32
13.8 Folgerung. Es sei B = {w1 , . . . , wn } eine Jordanbasis für A ∈ Matn (C) und J =
die Jordan-Normalform. Dann ist
etA = T eJt T −1
B AB
mit T = kanon. Basis IdB = Spaltenmatrix (w1 , . . . , wn ).
Dies ist bereits ein einfach zu berechnender Ausdruck. Es geht aber noch besser:
Man berechnet leicht T etJ , weil für ein beliebiges k-Tupel von n-Vektoren gilt:


1 t t2 /2 . . . tk−1 /(k − 1)!


..
..

 0 1
.
.
t


tk−1


..
2
=
(v
,
tv
+
v
,
.
.
.
,
v1 + . . . + vk ) . (1)
(v1 , . . . , vk )  0 0

1
1
2
.
t /2
1

{z
}
|
(k − 1)!


.
{z
}
|
..
n×k

 ..
.
t
n×k
0
...
1
|
{z
}
k×k
Man erhält dann T eJt , indem man als v1 , . . . , vk den zu einem Jordankästchen Jjl gehörigen
Abschnitt aus der Basis B wählt und die Matrix auf der rechten Seite von (1) noch mit eλj t
multipliziert.
33
14
Lineare Differentialgleichungen
Im Folgenden sei
• J ⊆ R ein offenes Intervall,
• t0 ∈ J, x0 ∈ Kn , (K = R oder C)
• A : J → Matn (Kn ) stetig,
• f : J → Kn stetig.
14.1 Lemma. Unter den obigen Annahmen ist die Anfangswertaufgabe
x′ − A(t)x = f,
x(t0 ) = x0
auf ganz J eindeutig lösbar.
Beweis. Wir wenden zunächst den Satz von Picard-Lindelöf an: A(t)x und f sind stetig in t, x.
Lipschitzstetig in x? Ja, denn
k(f (t) + A(t)x1 ) − (f (t) + A(t)x2 )k = kA(t)(x1 − x2 )k ≤ kA(t)k kx1 − x2 k.
Also gibt es eine maximale Lösung, die wir bis zum Rand fortsetzen können, wenn sie nicht
explodiert. Da kx′ (t)k ≤ kf (t)k + kA(t)kkxk ist, kann das nicht passieren (Gronwall).
⊳
14.2 Lemma.
(a)
(b)
Die Menge aller Lösungen von x′ − A(t)x = 0 bildet einen n-dimensionalen Vektorraum,
NA .
Ist u ∈ NA und u(t) = 0 für ein t ∈ J, so ist u(t) = 0 für alle t.
Beweis. (a) Klar: Vektorraum. Nach 14.2 ist eine Lösung in NA durch den Vektor x(t0 ) ∈ Cn
eindeutig bestimmt, also ist x 7→ x(t0 ) ein Isomorphismus von NA nach Cn und dim NA =
dim Cn = n.
(b) folgt aus 14.1.
⊳
14.3 Definition. Eine Basis {x1 , . . . , xn } von NA nennen wir ein Fundamentalsystem für die
Dgl x′ = A(t)x. Die daraus gebildete Matrix
 1

x1 . . . xn1

.. 
Φ =  ...
. 
1
xn . . . xnn
heißt Fundamentalmatrix oder auch Fundamentalsystem. Im Allgemeinen ist ein FS nur schwer
zu finden.
14.4 Satz. Es sei Φ ein Fundamentalsystem für x′ = A(t)x.
(a)
x(t) = Φ(t)Φ(t0 )−1 x0 ist die Lösung der AWA x′ = A(t)x, x(t0 ) = x0 .
34
(b)
Die Lösung der inhomogenen Anfangswertaufgabe x′ = A(t)x + f , x(t0 ) = x0 ist
Z t
x(t) = Φ(t)Φ(t0 )−1 x0 +
Φ(t)Φ(s)−1 f (s)ds
t0
Z t
−1
−1
= Φ(t) Φ(t0 ) x0 +
Φ(s) f (s)ds .
t0
Beweis. (a) Es ist x′ (t) = Φ′ (t)Φ(t0 )−1 x0 = A(t)Φ(t)Φ(t0 )−1 x0 = A(t)x(t) und x(t0 ) = x0 .
(b) x′ (t) = A(t)Φ(t) [. . .] + Φ(t) 0 + Φ(t)−1 f (t) = A(t)x(t) + f (t); x(t0 ) = x0 .
⊳
Der Fall einer konstanten Matrix A
Nun sei zusätzlich A konstant in t.
14.5 Lemma. etA ist in Fundamentalsystem für die Dgl x′ = Ax. Ein weiteres ist durch T etJ
gegeben (Bezeichnungen von 13.8).
Beweis. etA ist eine invertierbare Matrix für jedes t ∈ R. Ferner ist (etA )′ = AetA nach 13.4.
Damit ist etA ein Fundamentalsystem.
Aus etA = T etJ T −1 folgt T etJ = etA T . Damit sind auch die Spaltenvektoren von T etJ linear
unabhängig. Da
′
T etJ = T JetJ = T (T −1 AT ) etJ = AT etJ
ist, bilden sie also ein Fundamentalsystem.
⊳
14.6 Explizit. Man löst die AWA x′ = Ax, x(t0 ) = x0 folgendermaßen: Man bestimmt T etJ
nach 13.8. Nun berechnet man (z. B. mit Gauß-Algorithmus) die Lösung c von T c = x0 (d. h.
c = T −1 x0 ). Dann ist
x(t) = etA (et0 A )−1 x0 = e(t−t0 )A x0 = T e(t−t0 )J T −1 x0 = T e(t−t0 )J c.
Auch die Lösung der inhomogenen Aufgabe vereinfacht sich:
Z t
J(t−t0 ) −1
x(t) = T e
T x0 +
T eJ(t−s) T −1 f (s)ds.
t0
Wieder kann man T −1 x0 bzw. T −1 f (s) mit dem Gauß-Algorithmus bestimmen.
14.7 Reelle Lösungen. Ist A eine reelle Matrix, so ist man auch an reellen Lösungen von
x′ = Ax interessiert.
Da A reell ist, hat das charakteristische Polynom reelle Koeffizienten. Also ist für jedes λ ∈ C \R
mit fA (λ) = 0 auch fA (λ) = 0.
Es genügt dann, für alle reellen und jeweils einen der konjugiert komplex auftretenden Eigenwerte die Konstuktion aus 13.8 durchzuführen. Anschließend ersetzt man die zu den konjugiert
komplexen Eigenwerten gehörigen Vektoren durch ihren Real- und ihren Imaginärteil und erhält
damit ein reelles Fundamentalsystem.
35
Die lineare Differentialgleichung n-ter Ordnung
Nun seien a0 , . . . , an−1 : J → K stetige Funktionen, f : J → K stetig.
Wir betrachten die Differentialgleichung
x(n) (t) +
n−1
X
aj (t)x(j) (t) = f (t)
(1)
j=0
mit den Anfangswerten
x(t0 ) = x0 , . . . , x(n−1) (t0 ) = xn−1 .
(2)
Wir wandeln um in ein System, indem wir
x1 = x, x2 = x′ , . . . , xn = x(n−1)
setzen. Wir erhalten als äquivalentes System


 
0
1
...
0
0
 0

0
1


0


 
..
.. ..
x′ = Ax + F mit A = 
 und F =  ..  .
.
.
.


.
 0
...
0
1 
f
−a0 −a1 . . .
−an−1
Anfangswert: X0 = (x0 , . . . , xn−1 ).
Aus der bisherigen Theorie erhalten wir dann folgenden Satz:
14.8 Satz.
(a)
(b)
Die AWA (1), (2) ist auf J eindeutig lösbar.
Die Lösungen der homogenen Gleichung ((1) mit f = 0) bilden einen n-dimensionalen
Vektorraum N .
Als Fundamentalsystem bezeichnet man eine Basis von N . Die Matrix


x1
...
xn
 x′1
x′n 


Φ =  ..
.. 
 .
. 
(n−1)
x1
(c)
(n−1)
. . . xn
heißt Fundamentalmatrix.
Die allgemeine Lösung von (1) (ohne Berücksichtigung von Anfangswerten) ist gegeben
durch
Z t
n
n
X
X
det Wj (s)
ds,
dj ∈ K beliebig.
xj (t)
dj xj (t) +
x(t) =
t0 det W (s)
j=1
j=1
Dabei ist det W die sog. Wronski-Determinante.




x1
...
xn
x1
... 0 ...
xn
..
..
..
..
..




W =
 und Wj = 
.
.
.
.
.
.
(n−1)
(n−1)
(n−1)
(n−1)
x1
. . . xn
x1
. . . f . . . xn
Die Lösung der AWA (1),(2) erhält man durch geeignete Wahl der dj .
36
Homogene lineare Differentialgleichungen mit konstanten Koeffizienten
Nun seien a0P
, . . . , an−1 ∈ K konstant. Wir können J = R wählen. Wir setzen zusätzlich an = 1
und nennen nj=0 aj λj das charakteristische Polynom für die homogene Differentialgleichung
n
X
aj x(j) = 0
j=0
(es ist tatsächlich das charakteristische Polynom für die Matrix A vor 14.8).
P
Q
14.9 Satz. Es sei nk=0 aj λj = rj=0 (λ − λj )nj mit paarweise verschiedenen λj ∈ C. Dann
bilden die Funktionen
xjk (t) = tk eλj t ,
j = 1, . . . , r, k = 0, . . . , nj − 1
P
ein Fundamentalsystem für die homogene Gleichung
aj x(j) = 0. Sind alle aj reell, so erhält
man ein reelles Fundamentalsystem, indem man für λj = α + iβ mit βj 6= 0 die Lösungen
tk e(α+iβ)t und tk e(α+iβ)t durch tk eαt cos βt und tk eαt sin βt ersetzt.
Die Lösungen der AWA erhält man als geeignete Linearkombination der xjk .
37
15
Riemann-Integral
15.1 Intervalle und Zerlegungen. Es seien a1 , . . . , an , b1 , . . . , bn ∈ R mit aj ≤ bj für j =
1, . . . , n. Wir nennen
I = [a1 , b1 ] × . . . × [an , bn ] = {x ∈ Rn : aj ≤ x ≤ bj , j = 1, . . . , n}
ein kompaktes n−dimensionales Intervall und
I ◦ = ]a1 , b1 [× . . . ×]an , bn [= {x ∈ Rn : aj < x < bj , j = 1, . . . , n}
sein Inneres.
Mit |I| oder vol I bezeichnen wir das n−dimensionale Volumen
|I| = (b1 − a1 ) · . . . · (bn − an ).
Erinnerung. Eine Zerlegung Z eines Intervalls [a, b] in R ist eine endliche Punktmenge {t0 , . . . , tN }
mit a = t0 < t1 < . . . tN = b. Die Feinheit |Z| dieser Zerlegung ist definiert durch |Z| =
max{tk − tk−1 : k = 1, . . . , N }.
Wir definieren nun die Zerlegung eines n−dimensionalen Intervalls I (wie oben) als ein Produkt
Z = Z1 ×. . .×Zn wobei Zj eine Zerlegung von [aj , bj ] ist. Die Zerlegung Z liefert eine Unterteilung
des Intervalls I in endlich viele Intervalle I1 , . . . , IK , die sich nur in den Seitenflächen schneiden.
Es gilt:
N
K
[
X
I=
Ik , Ij◦ ∩ Il◦ = ∅ (j 6= l), |I| =
|Ik |.
k=1
k=1
Die Feinheit |Z| von Z definiert man durch |Z| = max |Zj |.
15.2 Riemann-Integral. Es seien I, Z, Ij wie oben, s = (s1 , . . . , sK ) ∈ I1 × . . . × IK ein so
genannter Zwischenvektor. Ist f : I → K (K = R oder C eine beschränkte Funktion, so nennen
wir
K
X
f (sk ) |Ik |
S(f, Z, s) =
k=1
die Riemannsche Zwischensumme zur Zerlegung Z mit Zwischenvektor s.
Wir nennen f Riemann-integrierbar mit Riemann-Integral S, falls zu jedem ε > 0 ein δ > 0
existiert, so dass
|S − S(f, Z, s)| < ε, falls |Z| < δ, s beliebig.
In diesem Fall schreiben wir
S=
Z
f dx =
Z
f (x1 , . . . , xn ) d(x1 , . . . , xn ).
I
I
15.3 Satz. Es seien f, g : I → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf
Riemann-integrierbar, und
Z
Z
Z
Z
Z
cf dx = c f dx.
f + g dx = f dx + g dx und
I
I
I
I
Sind f und g reellwertig, und ist f ≤ g, so ist
Z
Z
f dx ≤ g dx.
I
I
38
I
Beweis. Klar.
⊳
15.4 Nullmengen. Eine Teilmenge N ⊆ Rn heißt Nullmenge oder Menge vom Maß Null, falls
man zu jedem ε > 0 höchstens abzählbar viele kompakte Intervalle I1 , I2 , . . . findet mit der
Eigenschaft dass
[
X
N⊆
Ij und
|Ij | < ε.
15.5 Lemma.
(a)
(b)
(c)
(d)
Abzählbare Vereinigungen von Nullmengen sind Nullmengen.
Teilmengen von Nullmengen sind Nullmengen.
Ein Punkt in Rn ist eine Nullmenge.
Eine Menge der Form {x ∈ Rn : xj = c} für ein festes j und c ∈ K ist eine Nullmenge.
Beweis.
(a)
Es seien N1 , N2 , . . . Nullmengen und ε > 0 vorgelegt. Zu jedem Nj finden wir abzählbar
(j)
viele kompakte Intervalle Ik , k = 1, 2, . . . , mit
Nj ⊆
Dann ist
∞
[
j=1
(b)
(c)
Nj ⊆
[
∞ [
[
(j)
Ik ,
X
und
k
(j)
Ik ,
k
und
j=1 k
∞ X
X
j=1 k
(j)
|Ik | < ε/2j+1 .
(j)
|Ik | <
∞
X
ε/2j+1 = ε.
j=1
Klar.
Sei y ∈ Rn und δ > 0 mit 2n δn < ε. Dann ist
y ∈ Iδ = [y1 − δ, y1 + δ] × . . . × [yn − δ, yn + δ]
(d)
und |Iδ | < ε.
Analog.
⊳
15.6 Definition. Wir sagen von einer Eigenschaft, sie gelte fast überall, falls sie außerhalb
einer Nullmenge gilt.
15.7 Lebesguesches Integrabilitätskriterium. Eine beschränkte Funktion f : I → K ist
genau dann Riemann-integrierbar, wenn sie fast überall stetig ist.
15.8 Folgerung. Stetige Funktionen sind Riemann-integrierbar.
39
15.9 Satz von Fubini. I1 ⊆ Rn1 und I2 ⊆ Rn2 seien kompakte Intervalle. Dann ist I = I1 × I2
kompaktes Intervall in Rn , n = n1 + n2 .
Ist f : I → K Riemann-integrierbar und existiert für jedes y ∈ I2 das Integral
Z
f (x, y) dx,
g(y) =
I1
so ist g auf I2 Riemann-integrierbar, und es gilt:
Z Z
Z
Z
f (x, y) dy dx
g(y) dy =
f (x, y) d(x, y) =
I2
I2
I
I1
15.10 Folgerung. Ist I wie in 15.1 und f : I → K stetig, so gilt
Z b1 Z bn
Z
f (x1 , . . . , xn ) dxn . . . dx1 .
...
f (x) d(x1 , . . . , fn ) =
I
an
a1
Ist f lediglich Riemann-integrierbar, so gilt diese Identität immer noch, sofern alle iterierten
Integrale existieren.
Beweisidee zu 15.9: Wir betrachten den einfachen Fall n1 = n2 = 1, n = 2.
Zu [a1 , b1 ] wählen wir die Zerlegung a = t0 < t1 < t2 = b und zu [a2 , b2 ] die Zerlegung a2 = u0 <
u1 < u2 = b2 Als Zwischenvektor wählen wir (x1 , y1 ), (x2 , y1 ), (x1 , y2 ), (x2 , y2 ). Dann berechnen
wir die Zwischensumme zu dieser Zerlegung. Wir erhalten für diesen einfachen Fall sofort die
Aussage des Satzes von Fubini aus dem Distributivgesetz. Im allgemeinen Fall genauso.
⊳
15.11 Definition.
(a)
Es sei B ⊆ Rn und f : B → K eine Funktion. Wir definieren die Funktion fB : Rn → K
durch
f (x), x ∈ B,
fB (x) =
0,
sonst
(b)
Es sei B ⊆ Rn beschränkt und I ein beschränktes Intervall, das B enthält. Wir nennen
f : B → K Riemann-integrierbar auf B, falls fB auf I Riemann-integrierbar ist. Man sieht
mit dem Lebesgue-Kriterium, dass dies nicht von der Wahl von I abhängt. In diesem Fall
setzen wir
Z
Z
f (x) dx = fB (x) dx.
I
B
(c)
Eine beschränkte Menge B heißt Jordan-messbar, falls ihre charakteristische Funktion χB ,
definiert durch
1, x ∈ B,
χB (x) =
0, sonst
Riemann-integrierbar ist. In diesem Fall bezeichnen wir mit |B| oder auch vol B das Volumen
Z
|B| = χB dx.
15.12 Definition. Es sei B ⊆ Rn . Der Rand ∂B von B ist die Menge aller Punkte x ∈ Rn
(nicht notwendig in B!), für die sich zu jedem ε > 0 Punkte x1 ∈ B und x2 ∈
/ B finden lassen
mit x1 , x2 ∈ B(x, ε).
40
15.13 Satz. Die beschränkte Menge J ist genau dann Jordan-messbar, falls ihr Rand eine
Nullmenge ist.
Beweis. B ist Jordan-messbar, wenn χB Riemann-integrierbar ist. Dies wiederum ist nach Lebesgue dazu äquivalent, dass sie fast überall stetig ist. Da die Unstetigkeitspunkte von χB gerade
die Randpunkte von B sind, folgt die Behauptung.
⊳
15.14 Satz. Genau dann ist die Funktion f : B → K auf der Jordan-messbaren Menge B
Riemann-integrierbar, wenn sie auf B fast überall stetig ist.
Beweis. Die Menge der Unstetigkeitspunkte von fB in Rn unterscheidet sich von der Menge der
Unstetigkeitspunkte von f auf B höchstens durch die Nullmenge ∂B.
⊳
15.15 Satz. Es seien f, g : B → K Riemann-integrierbar und c ∈ K. Dann sind f + g und cf
Riemann-integrierbar, und
Z
Z
Z
Z
Z
f dx.
cf dx = c
g dx und
f dx +
f + g dx =
B
Es ist
B
B
B
B
Z
Z
f dx ≤
|f | dx.
B
B
Sind f und g reellwertig, und ist f ≤ g, so ist
Z
Z
g dx.
f dx ≤
B
B
Beweis. Klar.
⊳
15.16 Lemma. Es seien A, B Jordan-messbar und f auf beiden Riemann-integrierbar.
(a)
(b)
(c)
Dann sind auch A ∪ B, A ∩ B und A \ B Jordan-messbar.
R
Es sei f : N → K Riemann-integrierbar und N eine Nullmenge. Dann ist N f dx = 0.
Ist zusätzlich A ∩ B eine Nullmenge, so ist
Z
Z
Z
f dx.
f dx +
f dx =
B
A
A∪B
Beweis. (a) Die Mengen ∂(A ∪ B), ∂(A ∩ B) und ∂(A \ B) sind Teilmengen von ∂A ∪ ∂B, also
nach 15.5/15.13 Nullmengen.
(b) Es sei |f | ≤ C. Dann ist
Z
Z
15.15
f dx ≤
C dx ≤ C |N | = 0.
N
N
(c) Folgt aus (a) und (b).
⊳
15.17 Satz. Es sei B ⊆ Rn beschränkt und f : B → R Riemann-integrierbar mit f ≥ 0. Dann
ist die Menge
M (f ) = {(x, y) ∈ Rn+1 : x ∈ B, 0 ≤ y ≤ f (x)}
eine Jordan-messbare Teilmenge des Rn , und
|M (f )| =
Z
41
f dx.
B
Beweis. Als Riemann-integrierbare Funktion ist f beschränkt: f ≤ C. Wähle ein kompaktes
Intervall I mit B ⊆ I. Dann ist M (f ) ⊆ J = I × [0, C], insbesondere also beschränkt.
Zeige nun dass M (f ) Jordan-messbar ist (weglassen).
Dann schließt man:
Z Z C
Z
Fubini
χM (f ) (x, y) dy dx
χM (f ) d(x, y) =
|M (f )|
=
I
0
J
!
Z
Z
Z Z
fB (x)
fB wie in 15.11
1 dy
=
I
f (x) dx.
fB (x) dx =
dx =
B
I
0
⊳
15.18 Beispiel. Es sei M ⊆ R2 ein Normalbereich, d.h. eine Menge der Form
M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)}
mit zwei Riemann-integrierbaren Funktionen f1 ≤ f2 . Dann ist M Jordan-messbar.
Ist g : M → K stetig, so ist
Z
g(x, y) d(x, y) =
Z bZ
a
M
f1 (x)
g(x, y) dx dy.
f2 (x)
Beweis. O.d.B.A. sei 0 ≤ f1 ≤ f2 ≤ C. Da M = M (f2 ) \ M (f1 ) ist, folgt die Jordan-Messbarkeit
aus 15.14. Mit I = [a, b] × [0, C] ist nach Definition:
Z
Z
g d(x, y) = gM (x, y) d(x, y).
I
M
Weil g stetig ist, existiert für jedes feste x ∈ [a, b] das Integral
Z
C
gM (x, y) dy =
0
Z
f2 (x)
RC
0
gM (x, y) dy und
g(x, y) dy
f1 (x)
Aus dem Satz von Fubini folgt dann die Behauptung.
⊳
15.19 Substitutionsregel. Es sei U ⊆ Rn offen und ψ : U → Rn stetig differenzierbar und
injektiv. Die Jacobi-Determinante det ψ ′ (x) sei für jedes x positiv (oder für jedes x negativ).
Ist T ⊆ U Jordan-messbar, so ist ψ(T ) Jordan-messbar. Ist ferner f : ψ(T ) → K stetig, so ist f
auch Riemann-integrierbar, und es gilt
Z
Z
f (ψ(x)) | det ψ ′ (x)| dx.
f (y) dy =
ψ(T )
T
(ohne Beweis)
42
15.20 Polarkoordinaten in R2 . Wir betrachten die Abbildung
ψ : U = [0, ∞[ ×]0, 2π[ → R2
r cos ϕ
ψ(r, ϕ) =
.
r sin ϕ
Sie bildet U bijektiv auf die Menge R2 \ {(x, 0) : x ≥ 0} ab. Die Jacobi-Determinante ist
cos ϕ −r sin ϕ
′
det ψ (r, ϕ) = det
= r > 0.
sin ϕ r cos ϕ
Die Menge {(x, 0) : x ≥ 0} ist eine Nullmenge. Sie spielt für die Integration keine Rolle.
Die Kreisscheibe vom Radius R, B(0, R) = {(x, y) : x2 + y 2 ≤ R2 } ist (bis auf eine Nullmenge)
das Bild von {(r, ϕ) : 0 < r ≤ R; 0 < ϕ < 2π}. Also ist
Z R Z 2π
Z R
Z
2πr dr = πR2 .
1 dx =
r dϕ dr =
vol B(0, R) =
0
B(0,R)
0
0
15.21 Polarkoordinaten in R3 (Kugelkoordinaten). Setze
= [0, ∞[ ×]0, 2π[ × ]0, π[ → R3


r cos ϕ sin ϑ
ψ(r, ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ:U
Dann ist

und

cos ϕ sin ϑ −r sin ϕ sin ϑ r cos ϕ cos ϑ
ψ ′ (r, ϕ, ϑ) =  sin ϕ sin ϑ r cos ϕ sin ϑ r sin ϕ cos ϑ 
cos ϑ
0
−r sin ϑ
det ψ ′ (r, ϕ, ϑ) = −r 2 sin ϑ > 0.
Das Bild von ψ ist R3 \ N , wobei
N = {(x, y, z) : x ≥ 0, y = 0}
eine Nullmenge ist.
Es folgt für die Vollkugel vom Radius R, B(0, R) = {(x, y, z) : x2 + y 2 + z 2 ≤ R2 }:
Z RZ 2πZ 0
Z
1 d(x, y, z) =
r 2 sin ϑ dϑ dϕ dr
|BR | =
0
BR
= 2π (sin ϑ)|π0
Z
R
0
r 2 dr =
0
π
4
π R3 .
3
15.22 Beispiel. Das Ellipsoid mit Halbachsen a, b und c (a, b, c > 0) ist
x2 y 2 z 2
E = x ∈ R3 : 2 + 2 + 2 ≤ 1 .
a
b
c
43
Durch die stetig differenzierbare Abbildung ψ(x, y, z) 
→ (ax, by,
cz) wird die Einheitskugel
a 0 0
B(0, 1) bijektiv auf E abgebildet. Die Jacobi-Matrix ist 0 b 0. Also ist
0 0 c
Z
Z
4
abc d(x, y, z) = abc |B(0, 1)| = πabc.
1 d(u, v, w) =
|E| =
3
B(0,1)
E
44
16
Integration über Flächen. Der Gaußsche Integralsatz
Der Gaußsche Satz in der Ebene
16.1 Orientierter Rand von Normalbereichen. Es sei [a, b] ein Intervall, und f1 und f2
seien stückweise stetig differenzierbare Funktionen auf [a, b] mit f1 ≤ f2 . Ferner sei
M = {(x, y) ∈ R2 : x ∈ [a, b], f1 (x) ≤ y ≤ f2 (x)}.
Der Rand von M besteht dann aus den beiden vertikalen Abschnitten in t = a zwischen f1 (a) und
f2 (a) und in t = b zwischen f1 (b) und f2 (b) sowie den Graphen von f1 und f2 . Wir beschreiben
ihn nun durch vier stückweise stetig differenzierbaren Kurven γ1 , γ2 , γ3 , γ4 , wobei
γ1 : [a, b] → R2 ;
γ1 (t) = (t, f1 (t))
2
γ2 : [f1 (b), f2 (b)] → R ;
γ2 (t) = (b, t)
2
γ3 : [a, b] → R ; γ3 (t) = (a + b − t, f2 (a + b − t))
γ4 (t) : [f1 (a), f2 (a)] → R2 ;
γ4 (t) = (a, f1 (b) + f2 (b) − t)
Die Kurve γ3 ist gerade die Kurve γ̃3 (t) = (t, f1 (t)), aber in umgekehrter Richtung durchlaufen.
Ähnliches gilt für γ4 . Die Durchlaufrichtung der Kurven ist dann so, dass M stets zur Linken
liegt (positiv orientiert).
16.2 Integral über Normalbereich. Bezeichnungen wie oben. Ferner sei Q stetig differenzierbare Funktion auf R2 . Dann ist nach Beispiel 15.18
!
Z b Z f2 (x)
Z b
Z
∂Q
∂Q
Q(x, f2 (x)) − Q(x, f1 (x)) dx
d(x, y) =
dy dx =
f1 (x) ∂y
a
a
M ∂y
Das letzte Integral können wir als Kurvenintegral auffassen. Wegen γ1′ (t) = (1, f1′ (t)) und γ3′ (t) =
(−1, f1′ (a + b − t)) ist es in der Schreibweise von 11.2:
Z
Z
Q dx.
Q dx −
−
γ1
γ3
Wir benutzen die Schreibweise
Z b
Z
Z
Z
hF (t), γ ′ (t)i dt
F1 dx1 + . . . Fn dxn = hF, dxi =
γ
γ
γ
a
Q
für F : [a, b] →
und (x = x1 , . . . , xn )) mit (x1 , x2 ) = (x, y) und F =
. Weil γ2′ (t) = (0, 1)
0
und γ4 (t) = (0, −1) ist, sind die entsprechenden Integrale über γ2 und γ4 beide Null.
Mit γ bezeichnen wir nun die aus γ1 , γ2 , γ3 und γ4 zusammengesetzte Kurve. Dann ist
Z
Z
∂Q
d(x, y) = − Q(x, y) dx.
M ∂y
γ
Rn
16.3 Normalbereiche in y-Richtung. Nun seien ϕ1 , ϕ2 : [a, b] → R2 stetig differenzierbar
mit ϕ1 ≤ ϕ2 und
M = {(x, y) : ϕ1 (y) ≤ x ≤ ϕ2 (y), a ≤ y ≤ b}.
45
Wir beschreiben den orientierten Rand durch
δ1 : [ϕ1 (a), ϕ2 (a)] → R2 ;
δ1 (t) = (t, a)
2
δ2 : [a, b] → R ;
δ2 (t) = (ϕ2 (t), t)
2
δ3 : [ϕ1 (b), ϕ2 (b)] → R ; δ3 (t) = (ϕ1 (b) + ϕ2 (b) − t, b)
δ4 (t) : [a, b] → R2 ;
δ4 (t) = (ϕ1 (t), a + b − t)
und bezeichnen mit δ die zusammengesetzte Kurve. Wieder sei G ⊆ R2 offen mit M ⊆ G, und
P stetig differenzierbare Funktionen auf G. Dann ist nach Satz 15.18
!
Z b Z ϕ2 (y)
Z
∂P
∂P
d(x, y) =
dx dy
ϕ1 (y) ∂x
a
M ∂x
Z
Z
Z
Z b
P dy = P dy
P dy +
P (ϕ2 (y), y) − P (ϕ1 (y), y) dy =
=
δ2
a
δ4
δ
Dabei gilt die letzte Identität, weil die Integrale über δ1 und δ3 Null sind. Beachte das im
Vergleich zu 16.2 verschiedene Vorzeichen
Der folgende Satz ist dann offensichtlich, wenn M sowohl bezüglich der x-Achse als auch
bezüglich der y-Achse ein Normalbereich ist. Er gilt jedoch allgemeiner durch Zerlegung:
16.4 Satz von Gauß/Greensche Formel in der Ebene. Es sei M eine beschränkte offene
Menge, deren Rand durch eine stückweise stetig differenzierbare Kurve γ positiv orientiert ist
(d.h. M liegt beim Durchlaufen von γ stets zur Linken). Ferner seien Q und P stetig differenzierbar auf R2 . Dann ist
Z Z
∂P
∂Q
+
d(x, y) = P dy − Q dx.
∂x
∂y
γ
Speziell ergibt sich:
Z
1
d(x, y) =
vol M =
2
M
Z
γ
x dy − y dx.
Integration über Flächen
16.5 Definition. Eine Teilmenge M von Rn heißt eine k-dimensionale Mannigfaltigkeit (k ≤
n), falls zu jedem Punkt m ∈ M eine Abbildung ψ : T ⊂ Rk → M existiert mit folgenden
Eigenschaften:
(i)
Für eine (hinreichend kleine) offene Umgebung U von m in Rn gilt:
M ∩ U = ψ(T )
(ii) Rang(ψ ′ (t)) = k (d.h. maximal) für jedes t ∈ T
(iii) Sind ψ1 : T1 → Rn und ψ2 : T2 → Rn zwei solcher Abbildungen mit U = ψ1 (T1 )∩ψ2 (T2 ) 6=
∅, dann ist die Komposition ψ2−1 ψ1 : ψ1−1 (U ) → Rk stetig differenzierbar.
46
Bedingung (i) besagt. dass in der Nähe jedes Punktes m die Mannigfaltigkeit M durch k freie
Parameter beschrieben wird. (ii) stellt sicher, dass die k Variablen tatsächlich unabhängige
Richtungen liefern. Man hat viel Freiheit bei den obigen Wahlen. Bedingung (iii) sorgt dafür,
dass alle, die denselben Bereich von M beschreiben, verträglich“ sind.
”
Man nennt eine solche Abbildung eine lokale Kartenabbildung.
Mannigfaltigkeiten der Dimension 2 nennt man Flächen.
16.6 Beispiel: Die Sphäre Sr vom Radius r in R3 . Dies ist eine Fläche. Wir betrachten
die Abbildung
= ]0, 2π[ × ]0, π[ → R3


r cos ϕ sin ϑ
ψ1 (ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ1 : T
Ihr Bild enthält alle Punkte der Sphäre mit Ausnahme des Halbkreises {(x, y, z) ∈ Sr : x ≥
0, y = 0}. Wir nehmen die Abbildung
] − π, π[×]0, π[→ R3


r cos ϕ sin ϑ
ψ2 (ϕ, ϑ) =  r sin ϕ sin ϑ 
r cos ϑ
ψ2
:
hinzu, und erhalten als Bild alle Punkte der Sphäre außer {(x, y, z) ∈ Sr : x ≤ 0, y = 0}.
Die Kartenwechselabbildung ψ2−1 ψ1 ordnet hier (ϕ, θ) ∈ ]0, 2π[ × ]0, π[ das Paar (ϕ, θ) zu, falls
0 < ϕ < π und (ϕ − 2π, θ), falls π < ϕ < 2π. Nun fehlen uns nur noch der Nordpol und der
Südpol. Dazu können wir in beiden Abbildungen θ von −π/2 bis π/2 laufen lassen.
16.7 Integration über Mannigfaltigkeiten. Es sei M eine Mannigfaltigkeit der Dimension
k und f : M → K eine stetige Funktion. Ist ψ : T → M eine lokale Kartenabbildung, so definiert
man das Integral von f über den Bildbereich von T unter ψ durch
Z
q
f (ψ(t)) det(ψ ′ (t)T ψ ′ (t)) dt.
ψ(T )
Dabei ist ψ ′ (t) ∈ Matnk (R) die Ableitung von ψ und ψ ′ (t)T ∈ Matkn (R) ihre Adjungierte. Es
zeigt sich, dass das Produkt ψ ′ (t)T ψ ′ (t) eine invertierbare k × k-Matrix ist, deren Determinante
überall positiv ist. Man kann ferner nachrechnen, dass das Ergebnis unabhängig von der Kartendarstellung ist. Die Matrix ψ ′ (t)T ψ ′ (t) wird als Maßtensor bezeichtnet, ihre Determinante als
Gramsche Determinante.
Das Integral einer stetigen Funktion f über ganz M erhält man, indem man die Mannigfaltigkeit
durch mehrere Karten überdeckt, die Funktion entsprechend zerlegt und dann integriert. Dabei
ist es so, dass Integrale über die Bilder von Nullmengen unter einer Kartenabbildung Null sind.
16.8 Beispiel. Wir betrachten die Sphäre Sr vom Radius r in R3 . Wir haben die Karte (vgl.
16.6)
]0, 2π[×]0, π[ → R3


r cos ϕ sin θ
ψ(ϕ, θ) =  r sin ϕ sin θ  .
r cos θ
ψ
:
47
Der Maßtensor bzw. die Gramsche Determinante sind
2 2
r sin θ 0
g(ϕ, θ) =
bzw. det g(ϕ, θ) = r 4 sin2 θ.
0
r2
Das Bild von ψ ist die Sphäre ohne den Nullmeridian. Da er eine Nullmenge ist, spielt er für die
Integration keine Rolle. Für f : Sr → C ist also
Z 2π Z π
Z
f (ψ(ϕ, θ))r 2 sin θ dθ dϕ.
f (x) dS(x) =
0
Sr
0
Insbesondere erhalten wir für die Oberfläche der Kugel vom Radius r
Z 2π Z π
Z
1 dx =
r 2 sin θ dθ dϕ = 4πr 2 .
vol(Sr ) =
0
Sr
0
16.9 Rotationsflächen. Es sei I ein Intervall in R und f : I → R>0 stetig differenzierbar und
strikt positiv. Dann ist die Rotationsfläche des Graphen von f um die z−Achse
M = {(x, y, z) ∈ R3 : z ∈ I, x2 + y 2 = f (z)}
eine zweidimensionale Mannigfaltigkeit: Bis auf eine Nullmenge ist sie durch die Karte
I × ]0, 2π[ → R3


f (t) cos ϕ
ψ(t, ϕ) =  f (t) sin ϕ 
t
ψ
gegeben.
Hier ist
:
 ′

f (t) cos ϕ −f (t) sin ϕ
ψ ′ (t) =  f ′ (t) sin ϕ f (t) cos ϕ 
1
0
(Rang 2).
und Maßtensor bzw. Gramsche Determinante sind von der Form
1 + f ′ (t)2
0
g(t, ϕ) =
und det g(t, ϕ) = f (t)2 (1 + f ′ (t)2 ).
0
f (t)2
Das Volumen der Rotationsfläche ist daher – sofern das Integral existiert –
Z
Z 2π Z
p
p
′
2
f (t) 1 + f (t) dt dϕ = 2π f (t) 1 + f ′ (t)2 dt.
vol (M ) =
0
I
I
16.10 Der Gaußsche Integralsatz in R3 . Es sei U eine offene und beschränkte Menge in R3 .
Der Rand von U sei eine 2-dimensionale Mannigfaltigkeit ∂U = M .
Der äußere Einheitsnormalenvektor. Es sei x0 ein Randpunkt von U . In einer Umgebung von
x0 sei der Rand gegeben durch die Abbildung ψ : T ⊂ R2 → R3 mit ψ(t0 ) = x0 für ein t0 ∈ T .
Die Spaltenvektoren von ψ ′ (t0 ) spannen nach Annahme (ii) in 16.5 einen zweidimensionalen
Teilraum von R3 auf. Es gibt also einen eindimensionalen Unterraum von R3 aus dazu senkrecht
stehenden Vektoren. Wir wählen einen davon aus, der Norm = 1 hat (es gibt genau zwei!) und
48
nennen ihn ν. Nun gelte: Für jedes hinreichend kleine ε > 0 liege der Punkt x + εν außerhalb
von U und der Punkt x − εν in U . Mit anderen Worten: ν zeigt stets nach außen. Wir nennen
ν, genauer ν(x), den äußeren Einheitsnormalenvektor in x. Wir nehmen an, dass wir diese Wahl
auf dem Rand stetig treffen können.
Divergenz von Vektorfeldern. Es sei F : V → R3 ein stetig differenzierbares Vektorfeld, das auf
einer Umgebung V von U ∪ M definiert ist. Die Divergenz von F ist die Funktion
divF (x) =
3
X
∂xj Fj (x).
j=1
Mit hF, νi bezeichnen wir das Skalarprodukt des Vektors F (x) mit dem äußeren Einheitsnormalenvektor ν(x) in x.
Der Satz von Gauß besagt nun, dass
Z
Z
hF (x), ν(x)i dS(x).
div F (x)dx =
∂U
U
16.11 Archimedisches Prinzip. Ein fester Körper A sei eingetaucht in eine Flüssigkeit der
konstanten Dichte c > 0, deren Oberfläche mit der Ebene x3 = 0 in R3 zusammenfalle. Die
Physik sagt uns, dass im Punkt x ∈ ∂A die Flüssigkeit einen Druck der Stärke cx3 ν(x) ausübt,
wobei ν die äußere Normale ist (man beachte, dass x3 negativ ist und der Druck nach innen
gerichtet ist). Die Gesamtauftriebskraft ist
Z
cx3 ν(x) dS(x);
F =
∂A
für jede Komponente Fj von F gilt also nach Gauß
Z
Z
∂x3
dx.
cx3 νj (x) dS(x) = c
Fj =
A ∂xj
∂A
Damit ist F1 = F2 = 0, während
F3 = c
Z
1 dx = c vol(A)
A
ist. Der Körper erfährt also eine nach oben gerichtete Auftriebskraft, die gleich dem Gewicht
der verdrängten Flüssigkeit ist.
49
Herunterladen