§ 49 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit 49.1 49.2 Differenzierbarkeit Eindeutigkeit des Differentials; Unabhängigkeit der Differenzierbarkeit von den gewählten Normen 49.4 Differenzierbarkeit impliziert Stetigkeit 49.9 Kettenregel für differenzierbare Funktionen 49.10 Geometrische Deutung des Differentials 49.13 Differenzierbarkeit und partielle Differenzierbarkeit 49.14 Die Funktionalmatrix oder Jacobi-Matrix einer differenzierbaren Abbildung In diesem Paragraphen seien V, W 6= {0} zwei endlich-dimensionale R-Vektorräume. Es seien (v1 , . . . , vn ) eine beliebige Basis von V und (w1 , . . . , wm ) eine beliebige Basis von W. Ferner sei k k := k kV eine beliebige Norm für V und k k := k kW eine beliebige Norm für W. Wir betrachten in diesem Paragraphen Funktionen f : D → W mit ∅ 6= D ⊂ V. Sei p ein innerer Punkt von D. Wir wollen untersuchen, wie sich die Funktion f bei einer Änderung des Arguments p verhält. Man betrachte zunächst das Beispiel ½ 1 für q1 = 0 oder q2 = 0, p = (p1 , p2 ) := (0, 0), f (q1 , q2 ) := beliebig sonst. Dann gilt ∂f ∂x (0, 0) =0= ∂f ∂y (0, 0). Dennoch können wir keine Aussage darüber machen, wie sich f verhält, wenn (q1 , q2 ) nicht auf einer der Koordinatenachsen liegt. Bei einer Funktion wird man aber nicht nur daran interessiert sein, ihr Verhalten auf den Koordinatenachsen zu durchschauen, sondern man wird wissen wollen, wie sich f (p1 , p2 ) ändert, wenn man p1 und p2 gleichzeitig ändert. In unserem Beispiel wird man wissen wollen, wie stark sich f (q1 , q2 ) von f (0, 0) unterscheidet, wenn q1 und q2 nahe bei Null liegen, jedoch 6= 0 sind. Allein die Existenz der partiellen Ableitungen im Punkte p reicht jedoch — wie obiges Beispiel zeigt — zur Beantwortung dieser Frage nicht aus. Eine Antwort wird aber für differenzierbare“ Funktionen möglich sein. ” C1 [49]–1 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen Der Grundgedanke der Differenzierbarkeit ist, den Zuwachs f (q) − f (p) der Funktion f für q in der Nähe von p mittels einer linearen Abbildung A : V → W vermöge A(q − p) zu approximieren. Der Zuwachs soll also lokal mit Hilfe der linearen Algebra berechenbar sein. Hierbei soll der Fehler der Approximation, also f (q) − f (p) − A(q − p), schneller gegen Null gehen als der Abstand kq − pk des Punktes q vom Punkt p, d.h. es soll gelten f (q)−f (p)−A(q−p) −→ 0. kq−pk q→p Wir hatten in 18.9 gesehen, daß sich auch die Differenzierbarkeit von f : D → R mit D ⊂ R in dieser Weise formulieren ließ. 49.1 Differenzierbarkeit Seien D ⊂ V und f : D → W. (i) f heißt in p differenzierbar , wenn gilt: (1) p ist ein innerer Punkt von D. (2) Es gibt ein A ∈ HomR (V, W ) mit f (q)−f (p)−A(q−p) −→ 0. kq−pk q→p (ii) Ist D offen, so heißt f differenzierbar , wenn f in jedem p ∈ D differenzierbar ist. Die Definition der Differenzierbarkeit ist unabhängig von den in V und W gewählten Basen. Wir wollen nun zeigen, daß 1) die Differenzierbarkeit wegen der endlichen Dimension von V und W auch nicht von den für V und W gewählten Normen abhängt; 2) die lineare Abbildung A aus 49.1 für eine im Punkt p differenzierbare Funktion f eindeutig bestimmt ist. 49.2 Eindeutigkeit des Differentials; Unabhängigkeit der Differenzierbarkeit von den gewählten Normen Seien D ⊂ V und f : D → W. (i) Die Differenzierbarkeit von f in p hängt nicht von den für V und W gewählten Normen ab. (ii) Ist f in p differenzierbar, so ist ein A ∈ HomR (V, W ), welches 49.1(2) erfüllt, eindeutig bestimmt. Es heißt das Differential (oder die Ableitung) von f an der Stelle p und wird mit Dp f bezeichnet. Beweis. (i) Da V und W endlich-dimensional sind, liefern je zwei Normen für V bzw. W die gleiche Topologie für V bzw. W (siehe 34.6). Also hängt 49.1(1) nicht von den gewählten Normen ab und 49.1(2) nicht von der gewählten Norm in W. Sei nun k kW irgendeine Norm für W, dann hängt 49.1(2) auch nicht von der gewählten Norm in V ab: [49]–2 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit Seien hierzu k k1 und k k2 zwei Normen für V. Dann gibt es c1 , c2 ∈ R+ mit 1 kvk1 1 1 ≤ c1 kvk , 1 ≤ c2 kvk für v ∈ V \ {0} 2 kvk2 1 (siehe 34.4). Also gilt für q ∈ D \ {p} (p)−A(q−p) ≤ c1 k f (q)−fkq−pk kW 2 (p)−A(q−p) kW k f (q)−fkq−pk 1 (p)−A(q−p) ≤ c1 c2 k f (q)−fkq−pk kW , 1 und daher f (q)−f (p)−A(q−p) −→ 0 kq−pk1 q→p ⇐⇒ (ii) Seien A1 , A2 ∈ HomR (V, W ) mit f (q)−f (p)−A(q−p) −→ 0. kq−pk2 q→p f (q)−f (p)−Ai (q−p) −→ 0 kq−pk q→p für i = 1, 2 gegeben. Dann gilt (benutze 36.65(ii)): (A1 −A2 )(q−p) −→ 0. kq−pk q→p (1) Sei nun v ∈ V \ {0} beliebig, aber fest gewählt. Wegen qn := p + n1 v → p und qn ∈ D \ {p} für genügend großes n (benutze 49.1(1)) gilt dann nach (1): (A1 −A2 )( n1 v) −→ 0. k n1 vk n→∞ (2) Wegen (A1 −A2 )(v) kvk = (A1 −A2 )(n−1 v) kn−1 vk folgt A1 (v) = A2 (v) mit (2). Also ist A1 = A2 . Der folgende Satz liefert äquivalente Bedingungen zur Differenzierbarkeit, die manchmal zum Nachweis der Differenzierbarkeit besser geeignet sind, als die ursprüngliche Definition. 49.3 Kriterien für die Differenzierbarkeit Seien D ⊂ V und f : D → W. Für einen inneren Punkt p ∈ D sind äquivalent: (i) f ist in p differenzierbar. (ii) Es gibt ein A ∈ HomR (V, W ) mit limh→0 (iii) Es gibt ein A ∈ HomR (V, W ) und eine im Nullpunkt stetige Funktion ε : {h ∈ V : p + h ∈ D} → W mit ε(0) = 0 und f (p+h)−f (p)−A(h) khk = 0. f (p + h) = f (p) + A(h) + khkε(h). Gilt eine dieser drei äquivalenten Bedingungen, so ist das A aus (ii) bzw. (iii) gleich Dp f. Beweis. (i)⇒(ii) Wegen {p + h ∈ D : 0 < khk < δ} = {q ∈ D : 0 < kq − pk < δ} für δ ∈ R+ folgt aus 49.1(2) und 49.2 0 = limq→p f (q)−f (p)−Dp f (q−p) kq−pk mit A = Dp f ∈ HomR (V, W ). C1 = limh→0 f (p+h)−f (p)−Dp f (h) khk [49]–3 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen (ii)⇒(i) Umgekehrt folgt aus (ii) offensichtlich wieder 49.1(2) und somit nach 49.2 auch zusätzlich A = Dp f. (ii)⇒(iii) Setze ε(0) := 0 und (1) ε(h) := f (p+h)−f (p)−A(h) khk für h ∈ {h ∈ V : p + h ∈ D} \ {0}. Nach (ii) gilt dann limh6=0, h→0 ε(h) = 0, also ist ε im Nullpunkt stetig, und aus (1) folgt f (p + h) = f (p) + A(h) + khkε(h) zunächst für h 6= 0 und dann auch für h = 0. Also gilt (iii). (iii)⇒(ii) Aus (iii) folgt umgekehrt offensichtlich 0 = limh6=0, h→0 ε(h) = limh→0 f (p+h)−f (p)−A(h) , khk also gilt (ii) und A = Dp f (siehe (ii)⇒(i)). Damit ist die Äquivalenz von (i) bis (iii) sowie der Zusatz über A bewiesen. 49.4 Differenzierbarkeit impliziert Stetigkeit Seien D ⊂ V und f : D → W in p differenzierbar. Dann ist f in p stetig. Beweis. Da Dp f eine lineare Abbildung eines endlich-dimensionalen Raumes V in W ist, ist Dp f : V → W stetig. Also folgt Dp f (h) → 0 für h → 0. Da f in p differenzierbar ist, gilt nach 49.3(iii): f (p + h) = f (p) + Dp f (h) + khkε(h) mit ε(h) → 0 für h → 0. Also folgt f (p + h) → f (p) für h → 0 (benutze 36.65), d.h. f ist in p stetig. Die Differenzierbarkeit impliziert also die Stetigkeit, im Gegensatz zur partiellen Differenzierbarkeit, die nicht notwendig die Stetigkeit der Funktion nach sich zieht (siehe hierzu Aufgabe 56 oder das einleitende Beispiel dieses Paragraphen). 49.5 Differenzierbare Funktionen sind in jeder Richtung ableitbar Seien D ⊂ V und f : D → W. (i) Ist f in p differenzierbar, so gilt für jedes v ∈ V : Dp f (v) = limt→0 Sind v ∈ V mit kvk = 1 und p ∈ ∂f ∂v (p) := limt→0 f (p+tv)−f (p) . t ◦ D und existiert f (p+tv)−f (p) , t so heißt ∂f ∂v (p) die Richtungsableitung von f im Punkte p in Richtung v. Dabei heißt jedes v ∈ V mit kvk = 1 eine Richtung. [49]–4 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit (ii) Ist f in p differenzierbar, so besitzt f in p eine Richtungsableitung in Richtung v und man erhält diese, indem man die Ableitung Dp f auf die Richtung v anwendet, genauer: ∂f ∂v (p) = Dp f (v). Beweis. (ii) ist eine Spezialisierung von (i). (i) Für v = 0 ist die Aussage wegen Dp f (0) = 0 trivial. Sei also v ∈ V \ {0} und seien tn ∈ R \ {0} mit tn → 0 und p + tn v ∈ D gewählt. Dann ist zu zeigen: f (p+tn v)−f (p) tn Wegen tn v → 0 folgt dies aus → Dp f (v). f (p+tn v)−f (p)−Dp f (tn v) k tn f (p+tn v)−f (p)−Dp f (tn v) k −→ 0. kvk k ktn vk 49.3(ii) (p) k f (p+tntv)−f − Dp f (v)k = k n = Der folgende Satz zeigt, daß der Differenzierbarkeitsbegriff für Abbildungen von endlich-dimensionalen Vektorräumen in endlich-dimensionale Vektorräume als Spezialfall den Differenzierbarkeitsbegriff für Wege enthält. 49.6 Für Wege c ist Dt0 c(1) = c0 (t0 ) Seien D ⊂ R und c : D → V. Dann ist c genau dann in t0 differenzierbar im Sinne von 49.1, wenn c im Sinne von 37.1 differenzierbar ist. Im Differenzierbarkeitsfall gilt: Dt0 c(1) = c0 (t0 ). Beweis. ⇒“ Sei c im Sinne von 49.1 in t0 differenzierbar. Dann ist t0 ein ” innerer Punkt von D und nach 49.5, angewandt auf f := c, V := R, W := V, p := t0 , v := 1 gilt: c(t0 +h)−c(t0 ) = Dt0 c(1), h mit c0 (t0 ) = Dt0 c(1). limh→0 d.h. c ist in t0 differenzierbar ⇐“ Sei c im Sinne von 37.1 differenzierbar. Dann ist A ∈ HomR (R, V ) für ” A(h) := hc0 (t0 ), und es gilt 0 = 37.1 = 0) − c0 (t0 )k limh→0 k c(t0 +h)−c(t h 0 0 )−hc (t0 ) limh→0 k c(t0 +h)−c(t k h Somit ist c in t0 differenzierbar. 0 )−A(h) = limh→0 k c(t0 +h)−c(t k. |h| Der Zusatz ist schon in ⇒“ mitbewiesen. ” C1 [49]–5 Kapitel XI 49.7 Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen Elementare Rechenregeln für differenzierbare Funktionen Seien D, E ⊂ V . Sind dann f : D → W und g : E → W in p differenzierbare Funktionen, so ist (i) f + g in p differenzierbar mit Dp (f + g) = Dp f + Dp g; (ii) f − g in p differenzierbar mit Dp (f − g) = Dp f − Dp g; (iii) für α ∈ R auch α · f in p differenzierbar mit Dp (αf ) = αDp f. Ferner gilt: (iv) Ist f : D → W konstant, so ist für jedes p ∈ D◦ f in p differenzierbar mit Dp f = 0 . (v) Ist f ∈ HomR (V, W ), so ist f differenzierbar mit Dp f = f für jedes p ∈ V . Beweis. (i) Zunächst ist p innerer Punkt des Definitionsbereiches D ∩ E von f + g. Seien ε1 , ε2 die nach 49.3(iii) im Nullpunkt stetigen Funktionen mit ε1 (0) = ε2 (0) = 0 und (1) f (p + h) = f (p) + Dp f (h) + khkε1 (h), (2) g(p + h) = g(p) + Dp g(h) + khkε2 (h). Nun ist ε := ε1 + ε2 eine im Nullpunkt stetige Funktion mit ε(0) = 0, und durch Addition von (1) und (2) erhalten wir (für p + h ∈ D ∩ E): (f + g)(p + h) = (f + g)(p) + (Dp f + Dp g)(h) + khkε(h). Da Dp f + Dp g ∈ HomR (V, W ) ist, ist f + g in p differenzierbar und es gilt (benutze 49.3): Dp (f + g) = Dp f + Dp g. (ii) folgt aus (i) und (iii). (iii) Da f in p differenzierbar ist, ist p innerer Punkt des Definitionsbereiches von f und somit auch des Definitionsbereiches von αf. Es gibt nun nach 49.3 eine in 0 stetige Funktion ε mit ε(0) = 0 und f (p + h) = f (p) + Dp f (h) + khkε(h); also gilt auch mit der in 0 stetigen Funktion α · ε, daß (αf )(p + h) = (αf )(p) + (αDp f )(h) + khkαε(h). Da αDp f ∈ HomR (V, W ) ist, folgt aus der letzten Darstellung die Differenzierbarkeit von αf in p mit Dp (αf ) = αDp f (benutze 49.3). (iv) Die Behauptung folgt aus f (q)−f (p)−0(q−p) kq−pk = 0 für q 6= p, f (q)−f (p)−f (q−p) kq−pk = 0 für q 6= p. mit der Nullabbildung 0 von V nach W. (v) Da f linear ist, folgt f (q) − f (p) = f (q − p) und somit Also ist f in p differenzierbar mit Dp f = f. [49]–6 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit 49.8 Das Differential von f Seien D ⊂ V und f : D → W . Setze Dann heißt definiert durch D(1) := {p ∈ D : f ist in p differenzierbar}. Df : D(1) → HomR (V, W ), D(1) 3 p → Dp f ∈ HomR (V, W ), das Differential von f oder auch die Ableitung von f. In dieser Sprechweise besagt 49.7(v), daß das Differential einer linearen Abbildung f : V → W die konstante Abbildung Df : V → HomR (V, W ) ist, die für jeden Punkt p ∈ V denselben Wert f hat. Ist also insbesondere V := W := R und f : V → W die lineare Abbildung f = αx, so ist nach Analysis I zunächst f 0 (p) = α. Nach 49.7(v) ist Dp f : R → HomR (R, R) die konstante Abbildung, die jedem p ∈ R dieselbe durch α bestimmte lineare Abbildung R 3 h → αh zuordnet. Ferner ist, wie es 49.6 entspricht, Dp f (1) = α · 1 = f 0 (p). Wegen 49.6 ist für Dp f auch die Schreibweise f 0 (p) üblich. Andere Schreibweisen für Dp f sind: dp f, df (p), Df (p), df (p, v), Df (p, v). Die letzten beiden Bezeichnungen sollen die Abhängigkeit des Differentials von p und von v ∈ V zum Ausdruck bringen. Wir werden jedoch (bis auf eventuell ganz wenige Ausnahmen) für das Differential einer in p differenzierbaren Funktion f nur die Schreibweise Dp f verwenden. Eine der wichtigsten Regeln der Differentialrechnung in Vektorräumen ist die Kettenregel. 49.9 Kettenregel für differenzierbare Funktionen Seien {0} 6= V1 , V2 , V3 drei endlich-dimensionale R-Vektorräume sowie D1 ⊂ V1 , D2 ⊂ V2 . Seien f : D1 → V2 in p und g : D2 → V3 in f (p) differenzierbar. Dann ist g ◦ f in p differenzierbar, und es gilt: Dp (g ◦ f ) = (Df (p) g) ◦ (Dp f ). Beweis. Es ist Dp f ∈ HomR (V1 , V2 ) und Df (p) g ∈ HomR (V2 , V3 ). Also ist (Df (p) g) ◦ (Dp f ) ∈ HomR (V1 , V3 ), und es besagt daß (0) Dp (g ◦ f ) = (Df (p) g) ◦ (Dp f ), Dp (g ◦ f )(v1 ) = (Df (p) g)(Dp f (v1 )) für alle v1 ∈ V1 . Es seien nun beliebige Normen auf V1 , V2 , V3 gewählt, die — ohne Verwechslungen befürchten zu müssen — alle mit k k bezeichnet werden. C1 [49]–7 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen Es ist g ◦ f : f −1 (D2 ) → V3 . Wir zeigen zunächst (vgl. mit dem Beweis in 18.6): (1) p ist innerer Punkt des Definitionsbereiches f −1 (D2 ) von g ◦ f. Wegen der Differenzierbarkeit von f in p ist p innerer Punkt von D1 und f (p) innerer Punkt von D2 . Sei jetzt U2 ⊂ D2 eine Umgebung von f (p) in V2 . Dann gibt es, da f als in p differenzierbare Funktion in p stetig ist, eine Umgebung U1 von p mit f (U1 ∩ D1 ) ⊂ U2 ⊂ D2 . (2) Da p innerer Punkt von D1 ist, gibt es eine Umgebung U10 von p mit U10 ⊂ D1 . Also ist U1 ∩ U10 eine Umgebung von p mit U1 ∩ U10 ⊂ U1 ∩ D1 und f (U1 ∩ U10 ) ⊂ D2 . (3) (2) Nach (3) ist g ◦ f zumindestens auf der Umgebung U1 ∩ U10 definiert, d.h. es gilt (1). Da f in p und g in f (p) differenzierbar ist, gilt nach 49.3 für zwei in 0 stetige Funktionen ε1 , ε2 mit ε1 (0) = 0, ε2 (0) = 0: f (p + h) = f (p) + Dp f (h) + khkε1 (h), (4) (5) g(f (p) + k) = g(f (p)) + Df (p) g(k) + kkkε2 (k). Nun liegt f (p + h) ∈ D2 nach (3) für alle h mit p + h ∈ U1 ∩ U10 . Also gilt für alle h aus einer Umgebung von 0, wenn man k := f (p + h) − f (p) setzt: (g ◦ f )(p + h) = g(f (p + h)) = g(f (p)) + Df (p) g(f (p + h) − f (p)) + kf (p + h) − f (p)kε2 (f (p + h) − f (p)) (5) = (g ◦ f )(p) + (Df (p) g)(Dp f (h)) + khkDf (p) g(ε1 (h)) (4) + kf (p + h) − f (p)k ε2 (f (p + h) − f (p)). Zu zeigen bleibt: (6) Df (p) g(ε1 (h)) + 1 0. khk kf (p + h) − f (p)kε2 (f (p + h) − f (p)) −→ h→0 (6) folgt nun aus kDf (p) g(ε1 (h))k ≤ kDf (p) gkkε1 (h)k −→ 0, h→0 1 khk kf (p + h) − f (p)k ≤ kDp f k + kε1 (h)k, (4) ε2 (f (p + h) − f (p)) −→ 0 wegen f (p + h) → f (p) für h → 0. h→0 Die Kettenregel bei Parametertransformationen eines Weges (siehe 37.11) erhält man für offene Intervalle I und J durch Spezialisierung aus 49.9: (c ◦ ϕ)0 (t) = Dt (c ◦ ϕ)(1) = (Dϕ(t) c)(Dt ϕ(1)) 49.6 = (Dϕ(t) 49.6 [49]–8 49.9 c)(ϕ0 (t)) = ϕ0 (t) · Dϕ(t) c(1) = ϕ0 (t) · c0 (ϕ(t)). 49.6 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit 49.10 Geometrische Deutung des Differentials Seien D ⊂ V und f : D → W in p differenzierbar. Sei c : I → V ein Weg mit c(t0 ) = p sowie c0 (t0 ) = v für ein t0 ∈ I ◦ . Dann ist (f ◦ c)0 (t0 ) = Dp f (v). Besitzt also c zum Zeitpunkt t0 den Tangentialvektor (c0 (t0 ) =) v, so besitzt f ◦ c zum Zeitpunkt t0 den Tangentialvektor Dp f (v). Beweis. Nach der Kettenregel 49.9 ist f ◦ c in t0 differenzierbar und es gilt: (f ◦ c)0 (t0 ) = 49.6 = 49.6 Dt0 (f ◦ c)(1) Dp f (c0 (t0 )) = Dc(t0 ) f (Dt0 c(1)) = Dp f (v). 49.9 Veranschaulichung von 49.10: p = c(t0 ) v = c0 (t0 ) (f ◦ c)0 (t0 ) = Dp f (v) f (p) c f ◦c c : [0, 23 ] → R2 : t → (t, 3t2 − 2t3 ), f (x, y) := (x − 2y 2 , x + y), t0 := 1, p := (1, 1), v = (1, 0), Dp f (v) = (1, 1). v = c0 (t0 ) (f ◦ c)0 (t0 ) = Dp f (v) f (p) p = c(t0 ) c f ◦c c : [0, 2π] → R2 : t → (cos(t), sin(t)), f (x, y) := (x − 2y 2 , x + y), t0 := π/4, p := ( √12 , √12 ), v = (− √12 , √12 ), Dp f (v) = (−2 − C1 √1 , 0). 2 [49]–9 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen 49.11 Differenzierbarkeit von Funktionen mit Werten in einem endlich-dimensionalen Vektorraum ist Differenzierbarkeit der Koordinatenfunktionen P Seien D ⊂ V und f : D → W. Dann ist f = m i=1 fi wi mit eindeutig bestimmten Funktionen fi : D → R, und es sind äquivalent: (i) f ist in p differenzierbar. (ii) l ◦ f ist in p differenzierbar für jede R-lineare Abbildung l : W → R. (iii) f1 , . . . , fm sind in p differenzierbar. Gilt eine dieser drei äquivalenten Aussagen, so ist P Dp f = m i=1 (Dp fi )wi , und Dp (l ◦ f ) = l ◦ Dp f für l ∈ HomR (W, R). Insbesondere ist für W := Rm und f := (f1 , . . . , fm ) Dp f = (Dp f1 , . . . , Dp fm ). Beweis. (i)⇒(ii) Nach 49.7(v) ist l differenzierbar mit Df (p) l = l. Also folgt nach Kettenregel 49.9 die Differenzierbarkeit von l ◦ f , und es gilt Dp (l ◦ f ) = (Df (p) l) ◦ Dp f = l ◦ Dp f. (1) (ii)⇒(iii) wegen fj = lj ◦ f mit lj ∈ HomR (W, R) gemäß 37.2. (iii)⇒(i) Wegen 49.7(i) reicht es zu zeigen, daß fi wi differenzierbar ist. Dies folgt aus f (p+h)−fi (p)−Dp fi (h) f (p+h)wi −fi (p)wi −[Dp fi (h)]·wi k=| i |kwi k −→ 0. k i khk khk h→0 Ferner erhalten wir Dp (fi wi ) = (Dp fi ) · wi und somit Pm Pm (2) Dp f = D (f w ) = p i i i=1 i=1 (Dp fi ) · wi . 49.7(i) Somit sind die Äquivalenz von (i)–(iii) und nach (1) und (2) auch die beiden ersten Zusätze gezeigt. P Für W := RmPwähle die Basis (e1 , . . . , em ). Dann ist f = m i=1 fi ei und aus (2) m folgt Dp f = i=1 (Dp fi ) · ei = (Dp f1 , . . . , Dp fm ). Wir betrachten im Rest dieses Paragraphen den Spezialfall V := Rn , um den Zusammenhang zwischen Differenzierbarkeit und partieller Differenzierbarkeit aufzudecken. In 49.13 werden wir sehen, daß Differenzierbarkeit partielle Differenzierbarkeit nach sich zieht und daß unter einer Zusatzvoraussetzung auch die Umkehrung gilt. 49.12 Richtungsableitung und partielle Ableitung Seien D ⊂ Rn und f : D → W. Dann besitzt f in p genau dann eine Richtungsableitung in Richtung ei , wenn f in p partiell nach xi differenzierbar ∂f ∂f (p) = ∂x (p). ist, und es gilt dann ∂e i i Beweis. Vergleiche die Definition der Richtungsableitung von f im Punkte p in Richtung ei mit 48.2. [49]–10 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit 49.13 Differenzierbarkeit und partielle Differenzierbarkeit Seien D ⊂ Rn und f : D → W. (i) Ist f in p differenzierbar, dann ist f in p partiell differenzierbar, und es gilt ∂f ∂xi (p) = Dp f (ei ) für i = 1, . . . , n. (ii) Ist f für alle Punkte einer Umgebung U von p partiell differenzier∂f für i = 1, . . . , n stetig in p, so ist f differenzierbar bar und sind ∂x i in p. Beweis. (i) Nach 49.5 besitzt f in p die Richtungsableitungen ∂f ∂ei (p) = Dp f (ei ) für i = 1, . . . , n. Die Behauptung folgt daher aus 49.12. (ii) Sei zunächst W := R. Man betrachte den Rn mit der Norm k k∞ . Dann gibt es ein ε ∈ R+ mit Uε (p) = {q ∈ Rn : kq − pk∞ < ε} = ]p1 − ε, p1 + ε[ × . . . × ]pn − ε, pn + ε[ ⊂ U. Wir zeigen später: Zu jedem q ∈ Uε (p) existieren ξ (1) , . . . , ξ (n) ∈ Uε (p) mit (1) P ∂f (ξ (i) )(qi − pi ), kξ (i) − pk∞ ≤ kq − pk∞ . f (q) − f (p) = ni=1 ∂x i Bezeichnet wieder xi : Rn → R die Abbildung xi (q1 , . . . , qn ) := qi , so ist xi ∈ HomR (Rn , R) und somit P ∂f (p)xi ∈ HomR (Rn , R). (2) l := ni=1 ∂x i Aus (1) und (2) folgt wegen xi (q − p) = qi − pi : P P ∂f ∂f ∂f f (q) = f (p) + ni=1 ∂x (p)(qi − pi ) + ni=1 ( ∂x (ξ (i) ) − ∂x (p))(qi − pi ) i i i (1) P ∂f ∂f = f (p) + l(q − p) + ni=1 ( ∂x (ξ (i) ) − ∂x (p))(qi − pi ). i i (2) Die Differenzierbarkeit von f in p ergibt sich daher aus der letzten Gleichung wegen Pn ∂f (i) Pn ∂f (i) |qi −pi | ∂f ∂f 1 | ( (ξ (p))(q ) − − p )| ≤ i i i=1 i=1 | ∂xi (ξ ) − ∂xi (p)| kq−pk∞ ∂x ∂x kq−pk∞ i i P ∂f ∂f ≤ ni=1 | ∂x 0 für q → p. (ξ (i) ) − ∂x (p)| −−−−→ i i (1), ∂f ∂xi in p stetig Zu (1): Sei q = (q1 , . . . , qn ) ∈ Uε (p). Dann gilt: f (q) − f (p) = f (q1 , . . . , qn ) − f (p1 , q2 , . . . , qn ) + f (p1 , q2 , . . . , qn ) − f (p1 , p2 , q3 , . . . , qn ) ... + f (p1 , . . . , pn−1 , qn ) − f (p1 , . . . , pn ) Pn = i=1 (f (p1 , . . . , pi−1 , qi , qi+1 , . . . , qn ) − f (p1 , . . . , pi−1 , pi , qi+1 , . . . , qn )) P = ni=1 (gi (qi ) − gi (pi )), wobei gi : ]pi − ε, pi + ε[→ R definiert ist durch gi (t) := f (p1 , . . . , pi−1 , t, qi+1 , . . . , qn ). C1 [49]–11 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen Nun ist gi differenzierbar, da f partiell nach xi differenzierbar für alle Punkte von U (⊃ Uε (p)) ist. Also ist nach dem Mittelwertsatz der Differentialrechnung gi (qi ) − gi (pi ) = gi0 (ri )(qi − pi ) mit |ri − pi | ≤ |qi − pi |. (3) Ferner ist mit ξ (i) := (p1 , . . . , pi−1 , ri , qi+1 , . . . , qn ): gi0 (ri ) = (4) ∂f ∂xi (p1 , . . . , pi−1 , ri , qi+1 , . . . , qn ) = ∂f (i) ∂xi (ξ ). Also erhalten wir aus der Summendarstellung von f (q) − f (p): Pn Pn 0 f (q) − f (p) = i=1 (gi (qi ) − gi (pi )) = i=1 gi (ri )(qi − pi ) (3) Pn ∂f (i) = i=1 ∂xi (ξ )(qi − pi ). (4) Damit ist der erste Teil von (1) bewiesen. kξ (i) − pk∞ ≤ kq − pk∞ folgt aus: 0 für j < i (i) |ξj − pj | = |rj − pj | für j = i ≤ |qj − pj |. |qj − pj | für j > i (3) Wir betrachten nun den allgemeinen Fall, in dem W ein m-dimensionaler R-Vektorraum mit Basis (w1 , . . . , wm ) ist. Dann ist P f= m j=1 fj wj mit fj : D → R. Nach 49.11 reicht es zu zeigen, daß f1 , . . . , fm in p differenzierbar sind. Da alle ∂fj ∂xi für i = 1, . . . , n in U existieren, und da gilt (benutze 37.2): Pm ∂fj ∂f j=1 ∂xi (q)wj für q ∈ U, ∂xi (q) = ∂f sind auch ∂xji in p stetig (benutze 34.14). Also folgt nach dem ersten Teil, daß fj in p differenzierbar ist. 49.14 Die Funktionalmatrix oder Jacobi-Matrix einer differenzierbaren Abbildung Seien D ⊂ Rn und f : D → Rm in p differenzierbar. Dann ist die Matrix von Dp f bzgl. der kanonischen Basen des Rn und Rm gegeben durch ∂f1 ∂f1 (p) . . . (p) ∂x1 ∂xn .. .. . . . . . . ∂fm ∂x1 (p) ... ∂fm ∂xn (p) Diese Matrix heißt die Fundamentalmatrix (oder Jacobi-Matrix ) von f in p und wird mit Jp f bezeichnet. Insbesondere ist also für v = (v1 , . . . , vn ) ∈ Rn v1 .. und D f (v) = v(J f )T . T (Dp f (v)) = Jp f p p . vn [49]–12 C1 Differenzierbarkeit, Richtungsableitung und partielle Differenzierbarkeit Beweis. Die Dp f zugeordnete Matrix (αij ) erfüllt nach Definition P (1) Dp f (ej ) = m i=1 αij ei . Nun ist (2) Dp f (ej ) = 49.11 Aus (1) und (2) folgt αij = Pm = i=1 Dp fi (ej )ei 49.13 ∂fi ∂xj (p), Pm ∂fi i=1 ∂xj (p)ei . also die Behauptung. Als Anwendung von 49.14 erhalten wir insbesondere: 49.15 Richtungsableitung und Gradient Seien D ⊂ Rn und f : D → R in p differenzierbar. Dann gilt für v ∈ Rn mit kvk = 1: (i) ∂f ∂v (p) = hgradp f, vi. grad f Ist gradp f 6= 0, so gibt kgradpp f k die eindeutig bestimmte Richtung grad f des größten und − kgradpp f k die eindeutig bestimmte Richtung des kleinsten Anstiegs ∂f ∂v (p) von f in Richtung v an. (ii) kgradp f k gibt den größten und −kgradp f k den kleinsten Anstieg der Funktion f im Punkte p in einer Richtung an. Beweis. (i) Es gilt für v = (v1 , . . . , vn ) ∈ Rn mit kvk = 1: Pn ∂f ∂f i=1 ∂xi (p)vi = hgradp f, vi. ∂v (p) = Dp f (v) = Jp f (v) = 49.5 49.14 (ii) Wir zeigen, daß für v ∈ Rn mit kvk = 1 gilt: −kgradp f k ≤ (1) ∂f ∂v (p) (2) ∂f ∂v (p) (3) Nun ist (4) ∂f ∂v (p) ∂f ∂v (p) ≤ kgradp f k, = kgradp f k ⇐⇒ v = gradp f kgradp f k , grad f = −kgradp f k ⇐⇒ v = − kgradpp f k . = hgradp f, vi = kgradp f k cos(^ (gradp f, v)) mit ^ (gradp f, v) ∈ [0, π]. Es folgt nun (1) unmittelbar aus (4). Ferner gilt nach (4): ∂f ∂v (p) = kgradp f k ⇐⇒ ^ (gradp f, v) = 0 ⇐⇒ v = λ gradp f mit λ ∈ R+ (4) ⇐⇒ v = ∂f ∂v (p) kvk=1 gradp f kgradp f k , = −kgradp f k ⇐⇒ ^ (gradp f, v) = π ⇐⇒ v = −λ gradp f mit λ ∈ R+ (4) grad f ⇐⇒ v = − kgradpp f k . kvk=1 C1 [49]–13 Kapitel XI Differenzierbarkeit in endlich-dimensionalen R-Vektorräumen 49.16 Die Kettenregel in Matrizenform Seien D1 ⊂ Rn und D2 ⊂ Rm . Sind f : D1 → Rm in p und g : D2 → Rq in f (p) differenzierbar, dann ist g ◦ f in p differenzierbar, und es gilt: Jp (g ◦ f ) = (Jf (p) g) · (Jp f ). Beweis. Nach 49.9 ist g ◦ f in p differenzierbar, und es gilt Dp (g ◦ f ) = Df (p) g ◦ Dp f. (1) Wir betrachten im Rn , Rm , Rq die kanonischen Basen A := (e1 , . . . , en ), B = (e1 , . . . , em ) und C := (e1 , . . . , eq ). Nach Definition der Jacobi-Matrizen gilt dann mit den Bezeichnungen der Linearen Algebra Jp (g ◦ f ) = MCA (Dp (g ◦ f )), Jf (p) g = MCB (Df (p) g), Jp f = MBA (Dp f ). (2) Nach Linearer Algebra (siehe 15.6(1)) ist nun MCA (Df (p) g ◦ Dp f ) = MCB (Df (p) g) · MBA (Dp f ). (3) Aus (1), (2) und (3) erhalten wir nun die Behauptung: Jp (g ◦ f ) = (2) = (3) MCA (Dp (g ◦ f )) = MCA (Df (p) g ◦ Dp f ) (1) B MC (Df (p) g) · MBA (Dp f ) = (Jf (p) g) · (Jp f ). (2) Als Anwendung von 49.16 erhalten wir für die partielle Differenzierbarkeit: 49.17 Kettenregel für partielle Differenzierbarkeit Seien D1 ⊂ Rn und D2 ⊂ Rm . Sind f : D1 → Rm in p und g : D2 → R, definiert durch y → g(y), in f (p) differenzierbar, so gilt für die partiellen Ableitungen von g ◦ f : Pm ∂g ∂fj ∂(g◦f ) ∂f j=1 ∂yj (f1 (p), . . . , fm (p)) ∂xi (p) = hgradf (p) g, ∂xi (p)i ∂xi (p) = für i = 1, . . . , n. Beweis. Wende 49.16 mit q := 1 an. Dann gilt: ) ∂(g◦f ) ( ∂(g◦f ∂x1 (p), . . . , ∂xn (p)) ∂g ∂g (f1 (p), . . . , fm (p)), . . . , ∂y (f1 (p), . . . , fm (p))) = ( ∂y m 1 ∂f1 ∂x1 (p) .. . ... ... ∂f1 ∂xn (p) ∂fm ∂x1 (p) ... ∂fm ∂xn (p) .. . . Hieraus folgt nach Definition der Matrizenmultiplikation die Behauptung. [49]–14 C1