Folgerungen aus dem Auflösungsatz Wir haben in der Vorlesung den Satz über implizite Funktionen (Auflösungssatz) kennen gelernt. In unserer Formulierung lauten die Resultate: Seien x0 ∈ Rm , y 0 ∈ Rn und die Abbildungen fi : Uδ (x0 ) × Uδ (y 0 ) ⊆ Rm × Rn → R seien für jedes i = 1, . . . , n stetig mit fi (x0 , y 0 ) = 0, i = 1, . . . , n. Weiter sollen für jedes i = 1, . . . n und j = 1, . . . , n die partiellen Ableitungen ∂fi 0 0 ∂yj : Uδ (x ) × Uδ (y ) → R existieren und dort stetig sein. Schließlich gelte noch D(f1 , . . . , fn ) 0 0 (x , y ) 6= 0 D(y1 , . . . , yn ) Dann gilt: 1. Es existieren ein a0 > 0 und ein δ1 > 0, so dass es zu jedem x ∈ Ua0 (x0 ) genau ein y ∈ Uδ1 (y 0 ) gibt mit fi (x, y) = 0 für jedes i = 1, . . . , n. Die so definierte Abbildung bezeichnen wir mit g : Ua0 (x0 ) ⊆ Rm → Uδ1 (y 0 ) ⊆ Rn . Es gilt dann für alle x ∈ Ua0 (x0 ) die Gleichung fi (x, g(x)) = 0, für i = 1, . . . n. Seien die Koordinatenfunktionen von g gegeben durch g = (g1 , . . . , gn ) mit gi : Ua0 → R. 2. Die so definierte Abbildung g ist stetig über Ua0 (x0 ). 3. Sind f1 , . . . , fn auch partiell differenzierbar nach x1 , . . . , xm und sind ∂fi die partiellen Ableitungen ∂x : Uδ (x0 ) × Uδ (y 0 ) → R für alle i = j 1, . . . n, j = 1, . . . , m stetig, dann sind auch die Funktionen gi über Ua0 stetig differenzierbar für i = 1, . . . , n. 4. Gilt fi ∈ C r (Uδ (x0 ) × Uδ (y 0 ), R) mit r ∈ N, so ist auch g ∈ C r (Ua0 (x0 ), Uδ1 (y 0 )) . 5. Weiß man bereits, dass g stetig differenzierbar ist, so kann man die Ableitungen der gi wie folgt nach der Kettenregel berechnen: fi (x1 , . . . , xm , g1 (x1 , . . . xm ), . . . , gn (x1 , . . . , xm )) = 0, i = 1, . . . , n ergibt bei partieller Differentiation nach xj , da alle Voraussetzungen der Kettenregel erfüllt sind n X ∂fi ∂gl ∂fi (x, g(x)) + (x, g(x)) · (x) = 0 ∂xj ∂yl ∂xj l=1 1 für i = 1, . . . n. Dies ist ein inhomogenes lineares Gleichungssystem mit ∂gl n Gleichungen zur Bestimmung der n unbekannten Ableitungen ∂x j im Punkt x mit f (x, g(x)) = 0. (Die Lösung ist eindeutig bestimmt, da die Determinante der Koeffizientenmatrix verschieden von Null ist. Denn dies ist gerade die oben in den Voraussetzungen angegebene Dterminante.) Es folgt z.B. im Fall n = m = 1: Ist f (x, g(x)) = 0 und f stetig differenzierbar, so wird fx (x, g(x)) + fy (x, g(x))g 0 (x) = 0 und g 0 (x) = − fx (x, g(x)) . fy (x, g(x)) In analoger Weise kann man auch höhere Ableitungen bestimmen. Beispiele: a) Wir betrachten die Funktion 3 2 f : R → R , f (x, y, z) := x2 − y 2 + 1 x2 − z 2 − 2 Die Funktionalmatrix (Jacobimatrix) von f lautet ∂(f1 , f2 ) 2x −2y 0 = 2x 0 −2z ∂(x, y, z) Für y0 z0 6= 0 ist der Rang dieser Funktionalmatrix gleich zwei. Es gibt dann offene Umgebungen U von x0 ∈ R und V von (y0 , z0 ) ∈ R2 sowie eine Abbildung g : U → R2 , so dass für (x, y, z) ∈ U × V die Gleichung f (x, y, z) = f (x0 , y0 , z0 ) genau dann erfüllt ist, wenn gilt g(x) = (y, z), wenn also der Punkt (x, y, z) auf dem Graphen der Kurve g liegt. b) Wir betrachten die Abbildung f : Rn × R → R, mit f (x, t) := tn + n X j=1 2 xj tn−j Es ist f (x, t) = 0 genau dann, wenn t eine Nullstelle des Polynoms fx (t) := f (x, t) ist. Sei t0 ∈ R eine einfache Nullstelle von fx0 . Weil es eine einfache Nullstelle ist, gilt fx0 0 (t) 6= 0. Dann ist ∂f 0 (x , t0 ) = fx0 0 (t0 ) 6= 0. ∂t Also sind die Voraussetzungen des Satzes über implizite Funktionen erfüllt. Es gibt daher eine Umgebung U von x0 = (x01 , . . . , x0n ) und eine beliebig oft diferenzierbare Funktion g ∈ C ∞ (U ) mit f (x, g(x)) = 0 für alle x ∈ U mit g(x0 ) = t0 . Somit hängen die einfachen Nullstellen eines Polynoms lokal beliebig oft differenzierbar von seinen Koeffizienten ab. Eine wichtige Folgerung ist der Satz über die Umkehrfunktion Definition Seien U ⊆ Rm und V ⊆ Rn offene Mengen. Eine Abbildung f : U → V heißt C k -Diffeomorphismus, wenn f eine C k -Abbildung und bijektiv ist und die Umkehrabbildung f −1 : V → U ebenfalls von der Klasse C k ist. Hilfssatz: Seien U ⊆ Rm und V ⊆ Rn offene Mengen und f : U → V ein C 1 -Diffeomorphismus mit f ∈ C k (U, Rn ). Dann gilt 1. Für jedes u ∈ U ist das Differential f 0 (u) ∈ L(Rm , Rn ) invertierbar mit (f 0 (u))−1 = (f −1 )0 (f (u)). 2. m = n. 3. Die Abbildung f −1 : V → U ist k-mal stetig differenzierbar. Beweis: 1. Sei u ∈ U und v = f (u). Dann folgt aus f −1 ◦ f = idU und f ◦ f −1 = idV mittels der Kettenregel (f −1 )0 (f (u)) ◦ f 0 (u) = idRm , f 0 (f −1 (v)) ◦ (f −1 )0 (v) = idRn und dies zeigt die erste Behauptung. 2. Folgt sofort aus 1. weil ja f 0 (u) invertierbar ist. 3. Die Abbildung g 7→ g −1 von GL (Rm ) → GL (Rm ) ist beliebig oft differenzierbar (Vorlesung). Ist also f in C k und f −1 in C l mit 0 ≤ l ≤ k − 1, so gilt nach 1. auch (f −1 )0 = f 0−1 ◦ f −1 . 3 Die rechte Seite ist mindestens l-mal stetig differenzierbar, also gilt dies auch 0 für die linke Seite, d.h. f −1 ist eine mindestens l-mal stetig differenzierbare Abbildung. Somit muss f −1 mindestens l + 1-mal stetig differenzierbar sein. Mittels Induktion nach l ∈ N beweist man nun die Behauptung. Definition Eine C k -Abbildung f : U → Rn heißt lokal um u ∈ U invertierbar, wenn es offene Umgebungen U1 von u und V1 um f (u) gibt, so dass die Einschränkung von f auf U1 , also f|U1 : U1 → V1 ein Diffeomorphismus ist. Die Abbildung (f|U1 )−1 : V1 → U1 heißt dann lokale Umkehrfunktion von f . Ist f in jedem Punkt u ∈ U lokal invertierbar, so heißt f lokaler Diffeomorphismus. Satz über die Umkehrfunktion Sei U ⊆ Rn eine offene Menge und f : U → Rn eine C k -Abbildung, k ≥ 1. Genau dann ist f um u lokal invertierbar, wenn f 0 (u) invertierbar ist. Die lokale Umkehrabbildung ist dann ebenfalls von der Klasse C k . Beweis: Sei zunächst f 0 (u) invertierbar. Wir betrachten die Abbildung h(x, y) = f (x) − y und wollen die Gleichung h(x, y) = 0 in einer Umgebung von f (u) nach x auflösen. (Achtung: Vertauschung der Rollen von x und y im Auflösungssatz!) Weil f 0 (u) invertierbar ist, sind die Voraussetzungen des Auflösungsatzes erfüllt und es gibt eine Umgebung V von f (u) und eine Umgebung U von u so dass eine C k -Abbildung g : V → U existiert mit h(g(y), y) = 0 für alle y ∈ V . Dies bedeutet f (g(y)) = y für alle y ∈ V . Sei U 0 ⊆ U das Bild g(V ). Dann ist g : V → U 0 surjektiv. Wegen f (g(y)) = y ist g auch injektiv. Somit ist g bijektiv und von der Klasse C k . Schließlich ist noch f (g(V )) = V bzw. g(V ) = f −1 (V ) und f ist injektiv über U 0 : Seien x1 , x2 ∈ U 0 und f (x1 ) = f (x2 ). Dann folgt wegen x1 = g(y1 ), x2 = g(y2 ) zunächst y1 = f (g(y1 )) = f (g(y2 )) = y2 und dies gibt unmittelbar x1 = x2 . Also besitzt f über U 0 eine inverse Abbildung (f|U 0 )−1 : V → U 0 und es ist (f|U 0 )−1 = g von der Klasse C k , d.h. f ist in Umgebung von u lokal invertierbar. Ebenfalls nach dem Hilfssatz ist dann die lokale Umkehrfunktion von der Klasse C k . Sei nun f um u ∈ U lokal invertierbar. Dann ist nach dem Hilfssatz f 0 (u) invertierbar. Folgerung: Sei k ∈ N, U ⊆ Rn und U offen sowie f ∈ C K (U, Rn ) eine injektive Abbildung. Dann ist f (U ) ⊆ Rn eine offene Menge und f −1 ∈ C k (f (U ), Rn ). 4 Beweis: Sei y ∈ f (U ). Nach dem Satz über die Umkehrfunktion gibt es eine offene Umgebung V von y = f (u) und eine offene Umgebung U 0 von u so dass f : U 0 → V ein lokaler Diffeomorphismus ist. Also ist V ⊆ f (U ) offen, da jedes y ∈ f (U ) innerer Punkt von f (U ) ist. Die Ausage über die C k Eigenschaft folgt ebenfalls sofort aus dem Satz über die Umkehrfunktion. Eine weitere wichtige Folgerung aus dem Auflösungsatz ist eine notwendige Bedingung für Extremwertaufgaben mit Nebenbedingungen. (Lagrangesche Multiplikatoren) 5 Lagrangesche Multiplikatoren Satz: Sei U eine offene Menge des Rn sowie f ∈ C 1 (U, R), g ∈ C 1 (U, Rm ) mit m < n. Seien die Koordinatenfunktionen von g gegeben durch g(x) = (g1 (x), . . . , gm (x))T ∈ Rm . Sei x0 ∈ U ∩ {x ∈ Rn | g(x) = 0} eine lokale Extremstelle von f unter den Nebenbedingungen g(x) = 0. Schließlich sei der Rang von g 0 (x0 ) naximal, also Rang (g 0 (x0 )) = m. Dann folgt: Es gibt ein λ ∈ Rm , λ := (λ1 , . . . , λm )T (Lagrangesche Multiplikatoren), so dass gilt f 0 (x0 ) + λT g 0 (x0 ) = 0 Die letzte Bedingung ist äquivalent zu ∇f (x0 ) + m X λj ∇gj (x0 ) = 0. j=1 Beweis: Nach Voraussetzung ist ∂g (x0 ) 1 ∂x1 Rang g 0 (x0 ) = Rang .. . ∂gm (x0 ) ∂x1 ... .. . ... ∂g1 (x0 ) ∂xm .. . ∂gm (x0 ) ∂xm ∂g1 (x0 ) ∂xm+1 .. . ∂gm (x0 ) ∂xm+1 ... .. . ... ∂g1 (x0 ) ∂xn .. . ∂gm (x0 ) ∂xn . Mittels evtl. Umnummerierung der Koordinaten kann man immer erreichen, dass gilt ∂gi (x0 ) det 6= 0. ∂xj 1≤i≤m,1≤j≤m (D.h. der m × m-Block oben links besitzt eine nichtverschwindende Determinante.) Um die Verwendung des Auflösungssatzes besser demonstrieren zu können, führen wir neue Variablen ein, die der Determinantenbedingung angepasst sind: u := (x1 , . . . xm ), t := (xm+1 , . . . , xn ), x = (u, t) u0 = (x01 , . . . , x0m ), t0 = (x0m+1 , . . . x0n ), x0 = (u0 , t0 ) f (x) = f (u, t), g(x) = g(u, t) Wegen g(x0 ) = 0 gilt dann g(u0 , t0 ) = 0. Mit gu (u0 , t0 ) bezeichnen wir die Matrix ∂gi (x0 , t0 ) 0 0 gu (u , t ) = ∂xj 1≤i≤m,1≤j≤m 6 Nach Voraussetzung ist deren Determinante verschieden von Null, daher existiert die inverse Matrix (gu (u0 , t0 ))−1 . Damit erfüllt die Funktion g(u, t) die Voraussetzungen des Auflösungsatzes d.h. die Gleichung g(u, t) = 0 ist in einer kleinen Umgebung von t0 nach u auflösbar, d.h. es existiert eine δ > 0-Umgebung Uδ (t0 ) ⊆ Rn−m und eine stetig differenzierbare Abbildung u : Uδ (t0 ) → Rm , t 7→ u(t) mit u(t0 ) = u0 , g(u(t), t) = 0 für alle t ∈ Uδ (t0 ). Wir betrachten nun die Funktion ϕ : Uδ (t0 ) → R, ϕ(t) := f (u(t), t). Weil x0 = (u(t0 ), t0 ) eine lokales Extremum von f unter den Nebenbedingungen g(x) = 0 ist und g(u(t), t) = 0 für alle t ∈ Uδ (t0 ) gilt, ist t0 ein lokales Extremum von ϕ ohne Nebenbedingungen. Nach den Voraussetzungen ist ϕ über Uδ (t0 ) differenzierbar, es gilt also ϕ(t0 ) = 0. Andererseits folgt aus der Definition von ϕ mittels der Kettenregel m X ∂f ∂uj ∂f ∂ϕ (t) = (u(t), t) · (t) + (u(t), t). ∂ti ∂uj ∂ti ∂ti j=1 Wegen ϕ0 (t0 ) = 0 folgt hieraus für alle i = 1, . . . , n − m: 0= m X ∂uj 0 ∂f ∂f (u(t0 ), t0 ) · (t ) + (u(t0 ), t0 ). ∂uj ∂ti ∂ti j=1 Oder in Matrizenschreibweise fu (u(t0 ), t0 )u0 (t) + ft (u(t0 ), t0 ) = 0 Jetzt differenzieren wir g(u(t), t) = 0 nach t. In Matrizenschreibweise folgt gu (u(t), t)u0 (t) + gt (u(t), t) = 0. Dies zeigt u0 (t0 ) = −(gu (u0 , t0 ))−1 gt (u0 , t0 ) Substituiert man in diese Gleichung die Gleichung davor, so folgt −fu (u0 , t0 )(gu (u0 , t0 ))−1 gt (u0 , t0 ) + ft (u(t0 ), t0 ) = 0. Setzt man nun λT := (λ1 , . . . , λm ) := −fu (u(t0 ), t0 )(gu (u0 , t0 ))−1 , 7 so folgt fu (u0 , t0 ) + λT gu (u0 , t0 ) = 0 Substituiert man nun noch λ in die Gleichung vor der Definition von λ, so folgt ft (u0 , t0 ) + λT gt (u0 , t0 ) = 0 Die letzten beiden Gleichungen zusammen ergeben f 0 (x0 ) + λT g 0 (x0 ) = 0 und dies ist unsere Behauptung. Dieser Satz ermöglicht die Bestimmung der lokalen Extrema in vielen Fällen, obwohl es sich nur um eine notwendige Bedingung handelt. 1. Man bildet die Lagrangesche Hilfsfunktion von n + m-Variablen L(x1 , . . . xn , λ) := f (x1 , . . . , xn ) + λg(x1 , . . . , xn ), wobei das Produkt für mehr als eine Nebenbedingung als euklidisches Skalarprodukt zu lesen ist. 2. Jetzt berehnet man ∇L(x1 , . . . , xn , λ1 , . . . , λm ). 3. Man bestimmt alle Lösungen (x1 , . . . , xn , λ1 , . . . , λm ) des Gleichungssystems ∇L(x1 , . . . , xn , λ1 , . . . , λm ) = 0. Dies sind genau n + m Gleichungen. 4. Hat man in Schritt 3 die Lösung (x1 , . . . , xn , λ1 , . . . , λm ) gefunden, so untersucht amn, ob (x1 , . . . , xn ) wirklich ein lokales Extremum der ursprünglichen Aufgabe ist. Dabei kann man manchmal wie folgt vorgehen: Ist die Menge G := {x | g(x) = 0} kompakt, so besitzt f|N weil es ja stetig ist, über G einabsolutes Maximum und absolutes Minimum. Diese Punkte sind natürlich auch lokale Extremwerte, finden sich also unter den Lösungen des Gleichungssystems. Der größte Wert von f unter diesen Lösungen ist dann ein absolutes Extrema, der kleinste Wert von f über diesen Lösungen ist dann ein absolutes Minimum von f unter diesen Nebenbedingungen. √ Beispiel: Aus einem kreisförmigen Blech vom Radius 2 soll ein Rechteck maximalen Flächeninhalts ausgeschnitten werden. Sind x, y die Seitenlängen des Rechtecks, so soll also die Funktion f (x, y) = x · y maximiert werden. Da die Eckpunkte des gesuchten Rechtecks offenbar auf dem Rand des Bleches liegen müssen (sonst könnte man das Rechteck immer etwas vergrößern), lautet die Nebenbedingung nach dem Satz des Thales g(x, y) = x2 + y 2 − 2 = 0. 8 1. Schritt: L(x, y, λ) = x · y + λ(x2 + y 2 − 2) 2. Schritt: ∇L(x, y, λ) = (y + 2λx, x + 2λy, x2 + y 2 − 2 3. Schritt: Da der Gradient Null werden muss, erhält man folgendes Gleichungssystem: y + 2λx = 0 x + 2λy = 0 x2 + y 2 − 2 = 0 Dieses Gleichungssystem muss gelöst werden. Aus den beiden ersten Gleichungen folgt (indem man y in die 2. Gleichung einsetzt): x = 4λ2 x Diese Gleichung kann gelöst werden durch x = 0 oder λ = ± 12 . Die Lösung x = 0 scheidet aus, denn dann wäre auch y = 0 wegen der ersten Gleichung und dies widerspricht der dritten Gleichung. Also folgt x 6= 0 und λ = ± 12 . Dies gibt x = ±y. Somit folgt aus der dritten Gleichung x2 = y 2 = 1. Damit erhält man folgende Lösungen des Gleichungssystems (ohne Angabe der λ-Werte): −1 −1 1 1 4 3 2 1 , x = , x = , x = x = −1 1 −1 1 4. Schritt: Wir berechnen die Funktionswerte in diesen Punkten. Es folgt f (x1 ) = 1, f (x2 ) = −1, f (x3 ) = −1, f (x4 ) = 1. Da f auf der kompakten Kreislinie sein Maximum und sein Minimum annehmen muss, existieren das Maximum und das Minimum von f auf dem Kreis, 2 3 somit stellen x1 , x4 Maximalpunkte √ von f dar und x , x Minimalpunkte von f auf dem Kreis vom Radius 2. Allerdings sind x, y Seitenlängen eines Rechtecks, daher ist nur x1 die Lösung der Aufgabe. 9