§ 49 Differenzierbarkeit, Richtungsableitung und partielle

Werbung
§ 49
Differenzierbarkeit, Richtungsableitung
und partielle Differenzierbarkeit
49.1
49.2
Differenzierbarkeit
Eindeutigkeit des Differentials; Unabhängigkeit der Differenzierbarkeit
von den gewählten Normen
49.4 Differenzierbarkeit impliziert Stetigkeit
49.9 Kettenregel für differenzierbare Funktionen
49.10 Geometrische Deutung des Differentials
49.13 Differenzierbarkeit und partielle Differenzierbarkeit
49.14 Die Funktionalmatrix oder Jacobi-Matrix einer differenzierbaren Abbildung
In diesem Paragraphen seien V, W 6= {0} zwei endlich-dimensionale R-Vektorräume. Es seien (v1 , . . . , vn ) eine beliebige Basis von V und (w1 , . . . , wm ) eine
beliebige Basis von W. Ferner sei k k := k kV eine beliebige Norm für V und
k k := k kW eine beliebige Norm für W.
Wir betrachten in diesem Paragraphen Funktionen
f : D → W mit ∅ 6= D ⊂ V.
Sei p ein innerer Punkt von D. Wir wollen untersuchen, wie sich die Funktion
f bei einer Änderung des Arguments p verhält. Man betrachte zunächst das
Beispiel
½
1
für q1 = 0 oder q2 = 0,
p = (p1 , p2 ) := (0, 0), f (q1 , q2 ) :=
beliebig sonst.
Dann gilt
∂f
∂x (0, 0)
=0=
∂f
∂y (0, 0).
Dennoch können wir keine Aussage darüber machen, wie sich f verhält, wenn
(q1 , q2 ) nicht auf einer der Koordinatenachsen liegt.
Bei einer Funktion wird man aber nicht nur daran interessiert sein, ihr Verhalten auf den Koordinatenachsen zu durchschauen, sondern man wird wissen
wollen, wie sich f (p1 , p2 ) ändert, wenn man p1 und p2 gleichzeitig ändert. In
unserem Beispiel wird man wissen wollen, wie stark sich f (q1 , q2 ) von f (0, 0)
unterscheidet, wenn q1 und q2 nahe bei Null liegen, jedoch 6= 0 sind.
Allein die Existenz der partiellen Ableitungen im Punkte p reicht jedoch — wie
obiges Beispiel zeigt — zur Beantwortung dieser Frage nicht aus. Eine Antwort
wird aber für differenzierbare“ Funktionen möglich sein.
”
C1
[49]–1
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
Der Grundgedanke der Differenzierbarkeit ist, den Zuwachs f (q) − f (p) der
Funktion f für q in der Nähe von p mittels einer linearen Abbildung A : V → W
vermöge A(q − p) zu approximieren. Der Zuwachs soll also lokal mit Hilfe der
linearen Algebra berechenbar sein. Hierbei soll der Fehler der Approximation,
also f (q) − f (p) − A(q − p), schneller gegen Null gehen als der Abstand kq − pk
des Punktes q vom Punkt p, d.h. es soll gelten
f (q)−f (p)−A(q−p)
−→ 0.
kq−pk
q→p
Wir hatten in 18.9 gesehen, daß sich auch die Differenzierbarkeit von f : D → R
mit D ⊂ R in dieser Weise formulieren ließ.
49.1
Differenzierbarkeit
Seien D ⊂ V und f : D → W.
(i)
f heißt in p differenzierbar , wenn gilt:
(1) p ist ein innerer Punkt von D.
(2) Es gibt ein A ∈ HomR (V, W ) mit
f (q)−f (p)−A(q−p)
−→ 0.
kq−pk
q→p
(ii) Ist D offen, so heißt f differenzierbar , wenn f in jedem p ∈ D
differenzierbar ist.
Die Definition der Differenzierbarkeit ist unabhängig von den in V und W
gewählten Basen. Wir wollen nun zeigen, daß
1) die Differenzierbarkeit wegen der endlichen Dimension von V und W auch
nicht von den für V und W gewählten Normen abhängt;
2) die lineare Abbildung A aus 49.1 für eine im Punkt p differenzierbare Funktion f eindeutig bestimmt ist.
49.2
Eindeutigkeit des Differentials; Unabhängigkeit der Differenzierbarkeit von den gewählten Normen
Seien D ⊂ V und f : D → W.
(i)
Die Differenzierbarkeit von f in p hängt nicht von den für V und
W gewählten Normen ab.
(ii) Ist f in p differenzierbar, so ist ein A ∈ HomR (V, W ), welches
49.1(2) erfüllt, eindeutig bestimmt. Es heißt das Differential (oder
die Ableitung) von f an der Stelle p und wird mit Dp f bezeichnet.
Beweis. (i) Da V und W endlich-dimensional sind, liefern je zwei Normen für
V bzw. W die gleiche Topologie für V bzw. W (siehe 34.6). Also hängt 49.1(1)
nicht von den gewählten Normen ab und 49.1(2) nicht von der gewählten Norm
in W. Sei nun k kW irgendeine Norm für W, dann hängt 49.1(2) auch nicht von
der gewählten Norm in V ab:
[49]–2
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
Seien hierzu k k1 und k k2 zwei Normen für V. Dann gibt es c1 , c2 ∈ R+ mit
1
kvk1
1
1
≤ c1 kvk
, 1 ≤ c2 kvk
für v ∈ V \ {0}
2 kvk2
1
(siehe 34.4). Also gilt für q ∈ D \ {p}
(p)−A(q−p)
≤ c1 k f (q)−fkq−pk
kW
2
(p)−A(q−p)
kW
k f (q)−fkq−pk
1
(p)−A(q−p)
≤ c1 c2 k f (q)−fkq−pk
kW ,
1
und daher
f (q)−f (p)−A(q−p)
−→ 0
kq−pk1
q→p
⇐⇒
(ii) Seien A1 , A2 ∈ HomR (V, W ) mit
f (q)−f (p)−A(q−p)
−→ 0.
kq−pk2
q→p
f (q)−f (p)−Ai (q−p)
−→ 0
kq−pk
q→p
für i = 1, 2
gegeben. Dann gilt (benutze 36.65(ii)):
(A1 −A2 )(q−p)
−→ 0.
kq−pk
q→p
(1)
Sei nun v ∈ V \ {0} beliebig, aber fest gewählt. Wegen qn := p + n1 v → p und
qn ∈ D \ {p} für genügend großes n (benutze 49.1(1)) gilt dann nach (1):
(A1 −A2 )( n1 v)
−→ 0.
k n1 vk
n→∞
(2)
Wegen
(A1 −A2 )(v)
kvk
=
(A1 −A2 )(n−1 v)
kn−1 vk
folgt A1 (v) = A2 (v) mit (2).
Also ist A1 = A2 .
Der folgende Satz liefert äquivalente Bedingungen zur Differenzierbarkeit, die
manchmal zum Nachweis der Differenzierbarkeit besser geeignet sind, als die
ursprüngliche Definition.
49.3
Kriterien für die Differenzierbarkeit
Seien D ⊂ V und f : D → W. Für einen inneren Punkt p ∈ D sind
äquivalent:
(i)
f ist in p differenzierbar.
(ii)
Es gibt ein A ∈ HomR (V, W ) mit limh→0
(iii)
Es gibt ein A ∈ HomR (V, W ) und eine im Nullpunkt stetige Funktion ε : {h ∈ V : p + h ∈ D} → W mit ε(0) = 0 und
f (p+h)−f (p)−A(h)
khk
= 0.
f (p + h) = f (p) + A(h) + khkε(h).
Gilt eine dieser drei äquivalenten Bedingungen, so ist das A aus (ii)
bzw. (iii) gleich Dp f.
Beweis. (i)⇒(ii) Wegen {p + h ∈ D : 0 < khk < δ} = {q ∈ D : 0 <
kq − pk < δ} für δ ∈ R+ folgt aus 49.1(2) und 49.2
0 = limq→p
f (q)−f (p)−Dp f (q−p)
kq−pk
mit A = Dp f ∈ HomR (V, W ).
C1
= limh→0
f (p+h)−f (p)−Dp f (h)
khk
[49]–3
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
(ii)⇒(i) Umgekehrt folgt aus (ii) offensichtlich wieder 49.1(2) und somit nach
49.2 auch zusätzlich A = Dp f.
(ii)⇒(iii) Setze ε(0) := 0 und
(1)
ε(h) :=
f (p+h)−f (p)−A(h)
khk
für h ∈ {h ∈ V : p + h ∈ D} \ {0}.
Nach (ii) gilt dann limh6=0, h→0 ε(h) = 0, also ist ε im Nullpunkt stetig, und
aus (1) folgt
f (p + h) = f (p) + A(h) + khkε(h)
zunächst für h 6= 0 und dann auch für h = 0. Also gilt (iii).
(iii)⇒(ii) Aus (iii) folgt umgekehrt offensichtlich
0 = limh6=0, h→0 ε(h) = limh→0
f (p+h)−f (p)−A(h)
,
khk
also gilt (ii) und A = Dp f (siehe (ii)⇒(i)).
Damit ist die Äquivalenz von (i) bis (iii) sowie der Zusatz über A bewiesen.
49.4
Differenzierbarkeit impliziert Stetigkeit
Seien D ⊂ V und f : D → W in p differenzierbar. Dann ist f in p stetig.
Beweis. Da Dp f eine lineare Abbildung eines endlich-dimensionalen Raumes
V in W ist, ist Dp f : V → W stetig. Also folgt Dp f (h) → 0 für h → 0. Da
f in p differenzierbar ist, gilt nach 49.3(iii):
f (p + h) = f (p) + Dp f (h) + khkε(h) mit ε(h) → 0 für h → 0.
Also folgt f (p + h) → f (p) für h → 0 (benutze 36.65), d.h. f ist in p stetig.
Die Differenzierbarkeit impliziert also die Stetigkeit, im Gegensatz zur partiellen
Differenzierbarkeit, die nicht notwendig die Stetigkeit der Funktion nach sich
zieht (siehe hierzu Aufgabe 56 oder das einleitende Beispiel dieses Paragraphen).
49.5
Differenzierbare Funktionen sind in jeder Richtung ableitbar
Seien D ⊂ V und f : D → W.
(i)
Ist f in p differenzierbar, so gilt für jedes v ∈ V :
Dp f (v) = limt→0
Sind v ∈ V mit kvk = 1 und p ∈
∂f
∂v (p)
:= limt→0
f (p+tv)−f (p)
.
t
◦
D und existiert
f (p+tv)−f (p)
,
t
so heißt ∂f
∂v (p) die Richtungsableitung von f im Punkte p in Richtung v.
Dabei heißt jedes v ∈ V mit kvk = 1 eine Richtung.
[49]–4
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
(ii)
Ist f in p differenzierbar, so besitzt f in p eine Richtungsableitung
in Richtung v und man erhält diese, indem man die Ableitung
Dp f auf die Richtung v anwendet, genauer:
∂f
∂v (p)
= Dp f (v).
Beweis. (ii) ist eine Spezialisierung von (i).
(i) Für v = 0 ist die Aussage wegen Dp f (0) = 0 trivial. Sei also v ∈ V \ {0}
und seien tn ∈ R \ {0} mit tn → 0 und p + tn v ∈ D gewählt. Dann ist zu zeigen:
f (p+tn v)−f (p)
tn
Wegen tn v → 0 folgt dies aus
→ Dp f (v).
f (p+tn v)−f (p)−Dp f (tn v)
k
tn
f (p+tn v)−f (p)−Dp f (tn v)
k −→ 0.
kvk k
ktn vk
49.3(ii)
(p)
k f (p+tntv)−f
− Dp f (v)k = k
n
=
Der folgende Satz zeigt, daß der Differenzierbarkeitsbegriff für Abbildungen von
endlich-dimensionalen Vektorräumen in endlich-dimensionale Vektorräume als
Spezialfall den Differenzierbarkeitsbegriff für Wege enthält.
49.6
Für Wege c ist Dt0 c(1) = c0 (t0 )
Seien D ⊂ R und c : D → V. Dann ist c genau dann in t0 differenzierbar
im Sinne von 49.1, wenn c im Sinne von 37.1 differenzierbar ist.
Im Differenzierbarkeitsfall gilt:
Dt0 c(1) = c0 (t0 ).
Beweis. ⇒“ Sei c im Sinne von 49.1 in t0 differenzierbar. Dann ist t0 ein
”
innerer Punkt von D und nach 49.5, angewandt auf
f := c, V := R, W := V, p := t0 , v := 1
gilt:
c(t0 +h)−c(t0 )
= Dt0 c(1),
h
mit c0 (t0 ) = Dt0 c(1).
limh→0
d.h. c ist in t0 differenzierbar
⇐“ Sei c im Sinne von 37.1 differenzierbar. Dann ist A ∈ HomR (R, V ) für
”
A(h) := hc0 (t0 ), und es gilt
0
=
37.1
=
0)
− c0 (t0 )k
limh→0 k c(t0 +h)−c(t
h
0
0 )−hc (t0 )
limh→0 k c(t0 +h)−c(t
k
h
Somit ist c in t0 differenzierbar.
0 )−A(h)
= limh→0 k c(t0 +h)−c(t
k.
|h|
Der Zusatz ist schon in ⇒“ mitbewiesen.
”
C1
[49]–5
Kapitel XI
49.7
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
Elementare Rechenregeln für differenzierbare Funktionen
Seien D, E ⊂ V . Sind dann f : D → W und g : E → W in p differenzierbare Funktionen, so ist
(i)
f + g in p differenzierbar mit Dp (f + g) = Dp f + Dp g;
(ii)
f − g in p differenzierbar mit Dp (f − g) = Dp f − Dp g;
(iii)
für α ∈ R auch α · f in p differenzierbar mit Dp (αf ) = αDp f.
Ferner gilt:
(iv)
Ist f : D → W konstant, so ist für jedes p ∈ D◦
f in p differenzierbar mit Dp f = 0 .
(v)
Ist f ∈ HomR (V, W ), so ist f differenzierbar mit
Dp f = f für jedes p ∈ V .
Beweis. (i) Zunächst ist p innerer Punkt des Definitionsbereiches D ∩ E
von f + g. Seien ε1 , ε2 die nach 49.3(iii) im Nullpunkt stetigen Funktionen mit
ε1 (0) = ε2 (0) = 0 und
(1)
f (p + h) = f (p) + Dp f (h) + khkε1 (h),
(2)
g(p + h) = g(p) + Dp g(h) + khkε2 (h).
Nun ist ε := ε1 + ε2 eine im Nullpunkt stetige Funktion mit ε(0) = 0, und durch
Addition von (1) und (2) erhalten wir (für p + h ∈ D ∩ E):
(f + g)(p + h) = (f + g)(p) + (Dp f + Dp g)(h) + khkε(h).
Da Dp f + Dp g ∈ HomR (V, W ) ist, ist f + g in p differenzierbar und es gilt
(benutze 49.3):
Dp (f + g) = Dp f + Dp g.
(ii) folgt aus (i) und (iii).
(iii) Da f in p differenzierbar ist, ist p innerer Punkt des Definitionsbereiches
von f und somit auch des Definitionsbereiches von αf. Es gibt nun nach 49.3
eine in 0 stetige Funktion ε mit ε(0) = 0 und
f (p + h) = f (p) + Dp f (h) + khkε(h);
also gilt auch mit der in 0 stetigen Funktion α · ε, daß
(αf )(p + h) = (αf )(p) + (αDp f )(h) + khkαε(h).
Da αDp f ∈ HomR (V, W ) ist, folgt aus der letzten Darstellung die Differenzierbarkeit von αf in p mit Dp (αf ) = αDp f (benutze 49.3).
(iv) Die Behauptung folgt aus
f (q)−f (p)−0(q−p)
kq−pk
= 0 für q 6= p,
f (q)−f (p)−f (q−p)
kq−pk
= 0 für q 6= p.
mit der Nullabbildung 0 von V nach W.
(v) Da f linear ist, folgt f (q) − f (p) = f (q − p) und somit
Also ist f in p differenzierbar mit Dp f = f.
[49]–6
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
49.8
Das Differential von f
Seien D ⊂ V und f : D → W . Setze
Dann heißt
definiert durch
D(1) := {p ∈ D : f ist in p differenzierbar}.
Df : D(1) → HomR (V, W ),
D(1) 3 p → Dp f ∈ HomR (V, W ),
das Differential von f oder auch die Ableitung von f.
In dieser Sprechweise besagt 49.7(v), daß das Differential einer linearen Abbildung f : V → W die konstante Abbildung Df : V → HomR (V, W ) ist, die für
jeden Punkt p ∈ V denselben Wert f hat.
Ist also insbesondere V := W := R und f : V → W die lineare Abbildung f = αx, so ist nach Analysis I zunächst f 0 (p) = α. Nach 49.7(v) ist
Dp f : R → HomR (R, R) die konstante Abbildung, die jedem p ∈ R dieselbe
durch α bestimmte lineare Abbildung R 3 h → αh zuordnet. Ferner ist, wie es
49.6 entspricht,
Dp f (1) = α · 1 = f 0 (p).
Wegen 49.6 ist für Dp f auch die Schreibweise f 0 (p) üblich. Andere Schreibweisen
für Dp f sind:
dp f, df (p), Df (p), df (p, v), Df (p, v).
Die letzten beiden Bezeichnungen sollen die Abhängigkeit des Differentials von
p und von v ∈ V zum Ausdruck bringen. Wir werden jedoch (bis auf eventuell ganz wenige Ausnahmen) für das Differential einer in p differenzierbaren
Funktion f nur die Schreibweise Dp f verwenden.
Eine der wichtigsten Regeln der Differentialrechnung in Vektorräumen ist die
Kettenregel.
49.9
Kettenregel für differenzierbare Funktionen
Seien {0} 6= V1 , V2 , V3 drei endlich-dimensionale R-Vektorräume sowie
D1 ⊂ V1 , D2 ⊂ V2 . Seien f : D1 → V2 in p und g : D2 → V3 in f (p)
differenzierbar. Dann ist g ◦ f in p differenzierbar, und es gilt:
Dp (g ◦ f ) = (Df (p) g) ◦ (Dp f ).
Beweis. Es ist Dp f ∈ HomR (V1 , V2 ) und Df (p) g ∈ HomR (V2 , V3 ). Also ist
(Df (p) g) ◦ (Dp f ) ∈ HomR (V1 , V3 ), und es besagt
daß
(0)
Dp (g ◦ f ) = (Df (p) g) ◦ (Dp f ),
Dp (g ◦ f )(v1 ) = (Df (p) g)(Dp f (v1 )) für alle v1 ∈ V1 .
Es seien nun beliebige Normen auf V1 , V2 , V3 gewählt, die — ohne Verwechslungen befürchten zu müssen — alle mit k k bezeichnet werden.
C1
[49]–7
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
Es ist g ◦ f : f −1 (D2 ) → V3 . Wir zeigen zunächst (vgl. mit dem Beweis in 18.6):
(1)
p ist innerer Punkt des Definitionsbereiches f −1 (D2 ) von g ◦ f.
Wegen der Differenzierbarkeit von f in p ist p innerer Punkt von D1 und f (p)
innerer Punkt von D2 . Sei jetzt U2 ⊂ D2 eine Umgebung von f (p) in V2 . Dann
gibt es, da f als in p differenzierbare Funktion in p stetig ist, eine Umgebung
U1 von p mit
f (U1 ∩ D1 ) ⊂ U2 ⊂ D2 .
(2)
Da p innerer Punkt von D1 ist, gibt es eine Umgebung U10 von p mit U10 ⊂ D1 .
Also ist U1 ∩ U10 eine Umgebung von p mit U1 ∩ U10 ⊂ U1 ∩ D1 und
f (U1 ∩ U10 ) ⊂ D2 .
(3)
(2)
Nach (3) ist g ◦ f zumindestens auf der Umgebung U1 ∩ U10 definiert, d.h. es
gilt (1).
Da f in p und g in f (p) differenzierbar ist, gilt nach 49.3 für zwei in 0 stetige
Funktionen ε1 , ε2 mit ε1 (0) = 0, ε2 (0) = 0:
f (p + h) = f (p) + Dp f (h) + khkε1 (h),
(4)
(5)
g(f (p) + k) = g(f (p)) + Df (p) g(k) + kkkε2 (k).
Nun liegt f (p + h) ∈ D2 nach (3) für alle h mit p + h ∈ U1 ∩ U10 . Also gilt für
alle h aus einer Umgebung von 0, wenn man k := f (p + h) − f (p) setzt:
(g ◦ f )(p + h) = g(f (p + h))
= g(f (p)) + Df (p) g(f (p + h) − f (p)) + kf (p + h) − f (p)kε2 (f (p + h) − f (p))
(5)
= (g ◦ f )(p) + (Df (p) g)(Dp f (h)) + khkDf (p) g(ε1 (h))
(4)
+ kf (p + h) − f (p)k ε2 (f (p + h) − f (p)).
Zu zeigen bleibt:
(6)
Df (p) g(ε1 (h)) +
1
0.
khk kf (p + h) − f (p)kε2 (f (p + h) − f (p)) −→
h→0
(6) folgt nun aus
kDf (p) g(ε1 (h))k ≤ kDf (p) gkkε1 (h)k −→ 0,
h→0
1
khk kf (p + h) − f (p)k
≤ kDp f k + kε1 (h)k,
(4)
ε2 (f (p + h) − f (p)) −→ 0 wegen f (p + h) → f (p) für h → 0.
h→0
Die Kettenregel bei Parametertransformationen eines Weges (siehe 37.11) erhält
man für offene Intervalle I und J durch Spezialisierung aus 49.9:
(c ◦ ϕ)0 (t) = Dt (c ◦ ϕ)(1) = (Dϕ(t) c)(Dt ϕ(1))
49.6
= (Dϕ(t)
49.6
[49]–8
49.9
c)(ϕ0 (t))
=
ϕ0 (t) · Dϕ(t) c(1)
= ϕ0 (t) · c0 (ϕ(t)).
49.6
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
49.10 Geometrische Deutung des Differentials
Seien D ⊂ V und f : D → W in p differenzierbar. Sei c : I → V ein Weg
mit c(t0 ) = p sowie c0 (t0 ) = v für ein t0 ∈ I ◦ . Dann ist
(f ◦ c)0 (t0 ) = Dp f (v).
Besitzt also c zum Zeitpunkt t0 den Tangentialvektor (c0 (t0 ) =) v, so
besitzt f ◦ c zum Zeitpunkt t0 den Tangentialvektor Dp f (v).
Beweis. Nach der Kettenregel 49.9 ist f ◦ c in t0 differenzierbar und es gilt:
(f ◦ c)0 (t0 )
=
49.6
=
49.6
Dt0 (f ◦ c)(1)
Dp f (c0 (t0 ))
=
Dc(t0 ) f (Dt0 c(1))
=
Dp f (v).
49.9
Veranschaulichung von 49.10:
p = c(t0 )
v = c0 (t0 )
(f ◦ c)0 (t0 ) = Dp f (v)
f (p)
c
f ◦c
c : [0, 23 ] → R2 : t → (t, 3t2 − 2t3 ), f (x, y) := (x − 2y 2 , x + y),
t0 := 1, p := (1, 1), v = (1, 0), Dp f (v) = (1, 1).
v = c0 (t0 )
(f ◦ c)0 (t0 ) = Dp f (v)
f (p)
p = c(t0 )
c
f ◦c
c : [0, 2π] → R2 : t → (cos(t), sin(t)), f (x, y) := (x − 2y 2 , x + y),
t0 := π/4, p := ( √12 , √12 ), v = (− √12 , √12 ), Dp f (v) = (−2 −
C1
√1 , 0).
2
[49]–9
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
49.11 Differenzierbarkeit von Funktionen mit Werten in einem endlich-dimensionalen Vektorraum ist Differenzierbarkeit der Koordinatenfunktionen
P
Seien D ⊂ V und f : D → W. Dann ist f = m
i=1 fi wi mit eindeutig
bestimmten Funktionen fi : D → R, und es sind äquivalent:
(i)
f ist in p differenzierbar.
(ii) l ◦ f ist in p differenzierbar für jede R-lineare Abbildung l : W → R.
(iii) f1 , . . . , fm sind in p differenzierbar.
Gilt eine dieser drei äquivalenten Aussagen, so ist
P
Dp f = m
i=1 (Dp fi )wi , und Dp (l ◦ f ) = l ◦ Dp f für l ∈ HomR (W, R).
Insbesondere ist für W := Rm und f := (f1 , . . . , fm )
Dp f = (Dp f1 , . . . , Dp fm ).
Beweis. (i)⇒(ii) Nach 49.7(v) ist l differenzierbar mit Df (p) l = l. Also folgt
nach Kettenregel 49.9 die Differenzierbarkeit von l ◦ f , und es gilt
Dp (l ◦ f ) = (Df (p) l) ◦ Dp f = l ◦ Dp f.
(1)
(ii)⇒(iii) wegen fj = lj ◦ f mit lj ∈ HomR (W, R) gemäß 37.2.
(iii)⇒(i) Wegen 49.7(i) reicht es zu zeigen, daß fi wi differenzierbar ist. Dies
folgt aus
f (p+h)−fi (p)−Dp fi (h)
f (p+h)wi −fi (p)wi −[Dp fi (h)]·wi
k=| i
|kwi k −→ 0.
k i
khk
khk
h→0
Ferner erhalten wir Dp (fi wi ) = (Dp fi ) · wi und somit
Pm
Pm
(2)
Dp f =
D
(f
w
)
=
p
i
i
i=1
i=1 (Dp fi ) · wi .
49.7(i)
Somit sind die Äquivalenz von (i)–(iii) und nach (1) und (2) auch die beiden
ersten Zusätze gezeigt.
P
Für W := RmPwähle die Basis (e1 , . . . , em ). Dann ist f = m
i=1 fi ei und aus (2)
m
folgt Dp f = i=1 (Dp fi ) · ei = (Dp f1 , . . . , Dp fm ).
Wir betrachten im Rest dieses Paragraphen den Spezialfall V := Rn , um den
Zusammenhang zwischen Differenzierbarkeit und partieller Differenzierbarkeit
aufzudecken. In 49.13 werden wir sehen, daß Differenzierbarkeit partielle Differenzierbarkeit nach sich zieht und daß unter einer Zusatzvoraussetzung auch
die Umkehrung gilt.
49.12 Richtungsableitung und partielle Ableitung
Seien D ⊂ Rn und f : D → W. Dann besitzt f in p genau dann eine Richtungsableitung in Richtung ei , wenn f in p partiell nach xi differenzierbar
∂f
∂f
(p) = ∂x
(p).
ist, und es gilt dann ∂e
i
i
Beweis. Vergleiche die Definition der Richtungsableitung von f im Punkte p
in Richtung ei mit 48.2.
[49]–10
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
49.13 Differenzierbarkeit und partielle Differenzierbarkeit
Seien D ⊂ Rn und f : D → W.
(i) Ist f in p differenzierbar, dann ist f in p partiell differenzierbar,
und es gilt
∂f
∂xi (p) = Dp f (ei ) für i = 1, . . . , n.
(ii) Ist f für alle Punkte einer Umgebung U von p partiell differenzier∂f
für i = 1, . . . , n stetig in p, so ist f differenzierbar
bar und sind ∂x
i
in p.
Beweis. (i) Nach 49.5 besitzt f in p die Richtungsableitungen
∂f
∂ei (p) = Dp f (ei ) für i = 1, . . . , n.
Die Behauptung folgt daher aus 49.12.
(ii) Sei zunächst W := R.
Man betrachte den Rn mit der Norm k k∞ . Dann gibt es ein ε ∈ R+ mit
Uε (p) = {q ∈ Rn : kq − pk∞ < ε} = ]p1 − ε, p1 + ε[ × . . . × ]pn − ε, pn + ε[ ⊂ U.
Wir zeigen später:
Zu jedem q ∈ Uε (p) existieren ξ (1) , . . . , ξ (n) ∈ Uε (p) mit
(1)
P
∂f
(ξ (i) )(qi − pi ), kξ (i) − pk∞ ≤ kq − pk∞ .
f (q) − f (p) = ni=1 ∂x
i
Bezeichnet wieder xi : Rn → R die Abbildung xi (q1 , . . . , qn ) := qi , so ist
xi ∈ HomR (Rn , R) und somit
P
∂f
(p)xi ∈ HomR (Rn , R).
(2)
l := ni=1 ∂x
i
Aus (1) und (2) folgt wegen xi (q − p) = qi − pi :
P
P
∂f
∂f
∂f
f (q) = f (p) + ni=1 ∂x
(p)(qi − pi ) + ni=1 ( ∂x
(ξ (i) ) − ∂x
(p))(qi − pi )
i
i
i
(1)
P
∂f
∂f
= f (p) + l(q − p) + ni=1 ( ∂x
(ξ (i) ) − ∂x
(p))(qi − pi ).
i
i
(2)
Die Differenzierbarkeit von f in p ergibt sich daher aus der letzten Gleichung
wegen
Pn ∂f (i)
Pn ∂f (i)
|qi −pi |
∂f
∂f
1
|
(
(ξ
(p))(q
)
−
−
p
)|
≤
i
i
i=1
i=1 | ∂xi (ξ ) − ∂xi (p)| kq−pk∞
∂x
∂x
kq−pk∞
i
i
P
∂f
∂f
≤ ni=1 | ∂x
0 für q → p.
(ξ (i) ) − ∂x
(p)|
−−−−→
i
i
(1),
∂f
∂xi
in p stetig
Zu (1): Sei q = (q1 , . . . , qn ) ∈ Uε (p). Dann gilt:
f (q) − f (p) = f (q1 , . . . , qn ) − f (p1 , q2 , . . . , qn )
+ f (p1 , q2 , . . . , qn ) − f (p1 , p2 , q3 , . . . , qn )
...
+ f (p1 , . . . , pn−1 , qn ) − f (p1 , . . . , pn )
Pn
= i=1 (f (p1 , . . . , pi−1 , qi , qi+1 , . . . , qn ) − f (p1 , . . . , pi−1 , pi , qi+1 , . . . , qn ))
P
= ni=1 (gi (qi ) − gi (pi )),
wobei gi : ]pi − ε, pi + ε[→ R definiert ist durch
gi (t) := f (p1 , . . . , pi−1 , t, qi+1 , . . . , qn ).
C1
[49]–11
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
Nun ist gi differenzierbar, da f partiell nach xi differenzierbar für alle Punkte
von U (⊃ Uε (p)) ist. Also ist nach dem Mittelwertsatz der Differentialrechnung
gi (qi ) − gi (pi ) = gi0 (ri )(qi − pi ) mit |ri − pi | ≤ |qi − pi |.
(3)
Ferner ist mit ξ (i) := (p1 , . . . , pi−1 , ri , qi+1 , . . . , qn ):
gi0 (ri ) =
(4)
∂f
∂xi (p1 , . . . , pi−1 , ri , qi+1 , . . . , qn )
=
∂f
(i)
∂xi (ξ ).
Also erhalten wir aus der Summendarstellung von f (q) − f (p):
Pn
Pn 0
f (q) − f (p) =
i=1 (gi (qi ) − gi (pi )) =
i=1 gi (ri )(qi − pi )
(3)
Pn ∂f (i)
=
i=1 ∂xi (ξ )(qi − pi ).
(4)
Damit ist der erste Teil von (1) bewiesen. kξ (i) − pk∞ ≤ kq − pk∞ folgt aus:


0
für j < i 

(i)
|ξj − pj | = |rj − pj | für j = i ≤ |qj − pj |.


|qj − pj | für j > i (3)
Wir betrachten nun den allgemeinen Fall, in dem W ein m-dimensionaler R-Vektorraum mit Basis (w1 , . . . , wm ) ist. Dann ist
P
f= m
j=1 fj wj mit fj : D → R.
Nach 49.11 reicht es zu zeigen, daß f1 , . . . , fm in p differenzierbar sind. Da alle
∂fj
∂xi für i = 1, . . . , n in U existieren, und da gilt (benutze 37.2):
Pm ∂fj
∂f
j=1 ∂xi (q)wj für q ∈ U,
∂xi (q) =
∂f
sind auch ∂xji in p stetig (benutze 34.14). Also folgt nach dem ersten Teil, daß
fj in p differenzierbar ist.
49.14 Die Funktionalmatrix oder Jacobi-Matrix einer differenzierbaren Abbildung
Seien D ⊂ Rn und f : D → Rm in p differenzierbar. Dann ist die Matrix
von Dp f bzgl. der kanonischen Basen des Rn und Rm gegeben durch
 ∂f1

∂f1
(p)
.
.
.
(p)
∂x1
∂xn
 ..
.. .
.
.
 .
.
. 
∂fm
∂x1 (p)
...
∂fm
∂xn (p)
Diese Matrix heißt die Fundamentalmatrix (oder Jacobi-Matrix ) von f
in p und wird mit Jp f bezeichnet.
Insbesondere ist also für v = (v1 , . . . , vn ) ∈ Rn
 
v1
..  und D f (v) = v(J f )T .
T

(Dp f (v)) = Jp f
p
p
.
vn
[49]–12
C1
Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit
Beweis. Die Dp f zugeordnete Matrix (αij ) erfüllt nach Definition
P
(1)
Dp f (ej ) = m
i=1 αij ei .
Nun ist
(2)
Dp f (ej ) =
49.11
Aus (1) und (2) folgt αij =
Pm
=
i=1 Dp fi (ej )ei 49.13
∂fi
∂xj (p),
Pm
∂fi
i=1 ∂xj (p)ei .
also die Behauptung.
Als Anwendung von 49.14 erhalten wir insbesondere:
49.15 Richtungsableitung und Gradient
Seien D ⊂ Rn und f : D → R in p differenzierbar.
Dann gilt für v ∈ Rn mit kvk = 1:
(i)
∂f
∂v (p) = hgradp f, vi.
grad f
Ist gradp f 6= 0, so gibt kgradpp f k die eindeutig bestimmte Richtung
grad f
des größten und − kgradpp f k die eindeutig bestimmte Richtung des
kleinsten Anstiegs ∂f
∂v (p) von f in Richtung v an.
(ii)
kgradp f k gibt den größten und −kgradp f k den kleinsten Anstieg
der Funktion f im Punkte p in einer Richtung an.
Beweis. (i) Es gilt für v = (v1 , . . . , vn ) ∈ Rn mit kvk = 1:
Pn ∂f
∂f
i=1 ∂xi (p)vi = hgradp f, vi.
∂v (p) = Dp f (v) = Jp f (v) =
49.5
49.14
(ii) Wir zeigen, daß für v ∈ Rn mit kvk = 1 gilt:
−kgradp f k ≤
(1)
∂f
∂v (p)
(2)
∂f
∂v (p)
(3)
Nun ist
(4)
∂f
∂v (p)
∂f
∂v (p)
≤ kgradp f k,
= kgradp f k ⇐⇒ v =
gradp f
kgradp f k ,
grad f
= −kgradp f k ⇐⇒ v = − kgradpp f k .
= hgradp f, vi = kgradp f k cos(^ (gradp f, v))
mit ^ (gradp f, v) ∈ [0, π].
Es folgt nun (1) unmittelbar aus (4). Ferner gilt nach (4):
∂f
∂v (p)
= kgradp f k ⇐⇒ ^ (gradp f, v) = 0 ⇐⇒ v = λ gradp f mit λ ∈ R+
(4)
⇐⇒ v =
∂f
∂v (p)
kvk=1
gradp f
kgradp f k
,
= −kgradp f k ⇐⇒ ^ (gradp f, v) = π ⇐⇒ v = −λ gradp f mit λ ∈ R+
(4)
grad f
⇐⇒ v = − kgradpp f k .
kvk=1
C1
[49]–13
Kapitel XI
Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen
49.16 Die Kettenregel in Matrizenform
Seien D1 ⊂ Rn und D2 ⊂ Rm . Sind f : D1 → Rm in p und g : D2 → Rq
in f (p) differenzierbar, dann ist g ◦ f in p differenzierbar, und es gilt:
Jp (g ◦ f ) = (Jf (p) g) · (Jp f ).
Beweis. Nach 49.9 ist g ◦ f in p differenzierbar, und es gilt
Dp (g ◦ f ) = Df (p) g ◦ Dp f.
(1)
Wir betrachten im Rn , Rm , Rq die kanonischen Basen
A := (e1 , . . . , en ), B = (e1 , . . . , em ) und C := (e1 , . . . , eq ).
Nach Definition der Jacobi-Matrizen gilt dann mit den Bezeichnungen der Linearen Algebra
Jp (g ◦ f ) = MCA (Dp (g ◦ f )), Jf (p) g = MCB (Df (p) g), Jp f = MBA (Dp f ).
(2)
Nach Linearer Algebra (siehe 15.6(1)) ist nun
MCA (Df (p) g ◦ Dp f ) = MCB (Df (p) g) · MBA (Dp f ).
(3)
Aus (1), (2) und (3) erhalten wir nun die Behauptung:
Jp (g ◦ f )
=
(2)
=
(3)
MCA (Dp (g ◦ f )) = MCA (Df (p) g ◦ Dp f )
(1)
B
MC (Df (p) g) · MBA (Dp f )
= (Jf (p) g) · (Jp f ).
(2)
Als Anwendung von 49.16 erhalten wir für die partielle Differenzierbarkeit:
49.17 Kettenregel für partielle Differenzierbarkeit
Seien D1 ⊂ Rn und D2 ⊂ Rm . Sind f : D1 → Rm in p und g : D2 → R,
definiert durch y → g(y), in f (p) differenzierbar, so gilt für die partiellen
Ableitungen von g ◦ f :
Pm ∂g
∂fj
∂(g◦f )
∂f
j=1 ∂yj (f1 (p), . . . , fm (p)) ∂xi (p) = hgradf (p) g, ∂xi (p)i
∂xi (p) =
für i = 1, . . . , n.
Beweis. Wende 49.16 mit q := 1 an. Dann gilt:
)
∂(g◦f )
( ∂(g◦f
∂x1 (p), . . . , ∂xn (p))


∂g
∂g
(f1 (p), . . . , fm (p)), . . . , ∂y
(f1 (p), . . . , fm (p))) 
= ( ∂y
m
1
∂f1
∂x1 (p)
..
.
...
...
∂f1
∂xn (p)
∂fm
∂x1 (p)
...
∂fm
∂xn (p)
..
.


.
Hieraus folgt nach Definition der Matrizenmultiplikation die Behauptung.
[49]–14
C1
Herunterladen