Folgerungen aus dem Auflösungsatz Wir haben in der Vorlesung

Werbung
Folgerungen aus dem Auflösungsatz
Wir haben in der Vorlesung den Satz über implizite Funktionen (Auflösungssatz) kennen gelernt. In unserer Formulierung lauten die Resultate:
Seien x0 ∈ Rm , y 0 ∈ Rn und die Abbildungen
fi : Uδ (x0 ) × Uδ (y 0 ) ⊆ Rm × Rn → R
seien für jedes i = 1, . . . , n stetig mit fi (x0 , y 0 ) = 0, i = 1, . . . , n. Weiter
sollen für jedes i = 1, . . . n und j = 1, . . . , n die partiellen Ableitungen
∂fi
0
0
∂yj : Uδ (x ) × Uδ (y ) → R existieren und dort stetig sein. Schließlich gelte
noch
D(f1 , . . . , fn ) 0 0
(x , y ) 6= 0
D(y1 , . . . , yn )
Dann gilt:
1. Es existieren ein a0 > 0 und ein δ1 > 0, so dass es zu jedem x ∈
Ua0 (x0 ) genau ein y ∈ Uδ1 (y 0 ) gibt mit fi (x, y) = 0 für jedes i =
1, . . . , n. Die so definierte Abbildung bezeichnen wir mit g : Ua0 (x0 ) ⊆
Rm → Uδ1 (y 0 ) ⊆ Rn . Es gilt dann für alle x ∈ Ua0 (x0 ) die Gleichung
fi (x, g(x)) = 0, für i = 1, . . . n. Seien die Koordinatenfunktionen von
g gegeben durch g = (g1 , . . . , gn ) mit gi : Ua0 → R.
2. Die so definierte Abbildung g ist stetig über Ua0 (x0 ).
3. Sind f1 , . . . , fn auch partiell differenzierbar nach x1 , . . . , xm und sind
∂fi
die partiellen Ableitungen ∂x
: Uδ (x0 ) × Uδ (y 0 ) → R für alle i =
j
1, . . . n, j = 1, . . . , m stetig, dann sind auch die Funktionen gi über Ua0
stetig differenzierbar für i = 1, . . . , n.
4. Gilt fi ∈ C r (Uδ (x0 ) × Uδ (y 0 ), R) mit r ∈ N, so ist auch
g ∈ C r (Ua0 (x0 ), Uδ1 (y 0 ))
.
5. Weiß man bereits, dass g stetig differenzierbar ist, so kann man die
Ableitungen der gi wie folgt nach der Kettenregel berechnen:
fi (x1 , . . . , xm , g1 (x1 , . . . xm ), . . . , gn (x1 , . . . , xm )) = 0, i = 1, . . . , n
ergibt bei partieller Differentiation nach xj , da alle Voraussetzungen
der Kettenregel erfüllt sind
n
X ∂fi
∂gl
∂fi
(x, g(x)) +
(x, g(x)) ·
(x) = 0
∂xj
∂yl
∂xj
l=1
1
für i = 1, . . . n. Dies ist ein inhomogenes lineares Gleichungssystem mit
∂gl
n Gleichungen zur Bestimmung der n unbekannten Ableitungen ∂x
j
im Punkt x mit f (x, g(x)) = 0. (Die Lösung ist eindeutig bestimmt,
da die Determinante der Koeffizientenmatrix verschieden von Null ist.
Denn dies ist gerade die oben in den Voraussetzungen angegebene
Dterminante.)
Es folgt z.B. im Fall n = m = 1: Ist f (x, g(x)) = 0 und f stetig
differenzierbar, so wird
fx (x, g(x)) + fy (x, g(x))g 0 (x) = 0
und
g 0 (x) = −
fx (x, g(x))
.
fy (x, g(x))
In analoger Weise kann man auch höhere Ableitungen bestimmen.
Beispiele:
a) Wir betrachten die Funktion
3
2
f : R → R , f (x, y, z) :=
x2 − y 2 + 1
x2 − z 2 − 2
Die Funktionalmatrix (Jacobimatrix) von f lautet
∂(f1 , f2 )
2x −2y
0
=
2x
0
−2z
∂(x, y, z)
Für y0 z0 6= 0 ist der Rang dieser Funktionalmatrix gleich zwei. Es gibt
dann offene Umgebungen U von x0 ∈ R und V von (y0 , z0 ) ∈ R2 sowie
eine Abbildung g : U → R2 , so dass für (x, y, z) ∈ U × V die Gleichung
f (x, y, z) = f (x0 , y0 , z0 )
genau dann erfüllt ist, wenn gilt g(x) = (y, z), wenn also der Punkt
(x, y, z) auf dem Graphen der Kurve g liegt.
b) Wir betrachten die Abbildung
f : Rn × R → R, mit
f (x, t) := tn +
n
X
j=1
2
xj tn−j
Es ist f (x, t) = 0 genau dann, wenn t eine Nullstelle des Polynoms
fx (t) := f (x, t) ist. Sei t0 ∈ R eine einfache Nullstelle von fx0 . Weil
es eine einfache Nullstelle ist, gilt fx0 0 (t) 6= 0. Dann ist
∂f 0
(x , t0 ) = fx0 0 (t0 ) 6= 0.
∂t
Also sind die Voraussetzungen des Satzes über implizite Funktionen
erfüllt. Es gibt daher eine Umgebung U von x0 = (x01 , . . . , x0n ) und eine
beliebig oft diferenzierbare Funktion g ∈ C ∞ (U ) mit f (x, g(x)) = 0 für
alle x ∈ U mit g(x0 ) = t0 . Somit hängen die einfachen Nullstellen eines
Polynoms lokal beliebig oft differenzierbar von seinen Koeffizienten ab.
Eine wichtige Folgerung ist der
Satz über die Umkehrfunktion
Definition Seien U ⊆ Rm und V ⊆ Rn offene Mengen. Eine Abbildung
f : U → V heißt C k -Diffeomorphismus, wenn f eine C k -Abbildung und
bijektiv ist und die Umkehrabbildung f −1 : V → U ebenfalls von der
Klasse C k ist.
Hilfssatz: Seien U ⊆ Rm und V ⊆ Rn offene Mengen und f : U → V ein
C 1 -Diffeomorphismus mit f ∈ C k (U, Rn ). Dann gilt
1. Für jedes u ∈ U ist das Differential f 0 (u) ∈ L(Rm , Rn ) invertierbar
mit
(f 0 (u))−1 = (f −1 )0 (f (u)).
2. m = n.
3. Die Abbildung f −1 : V → U ist k-mal stetig differenzierbar.
Beweis: 1. Sei u ∈ U und v = f (u). Dann folgt aus f −1 ◦ f = idU und
f ◦ f −1 = idV mittels der Kettenregel
(f −1 )0 (f (u)) ◦ f 0 (u) = idRm ,
f 0 (f −1 (v)) ◦ (f −1 )0 (v) = idRn
und dies zeigt die erste Behauptung.
2. Folgt sofort aus 1. weil ja f 0 (u) invertierbar ist.
3. Die Abbildung g 7→ g −1 von GL (Rm ) → GL (Rm ) ist beliebig oft differenzierbar (Vorlesung). Ist also f in C k und f −1 in C l mit 0 ≤ l ≤ k − 1, so
gilt nach 1. auch
(f −1 )0 = f 0−1 ◦ f −1 .
3
Die rechte Seite ist mindestens l-mal stetig differenzierbar, also gilt dies auch
0
für die linke Seite, d.h. f −1 ist eine mindestens l-mal stetig differenzierbare
Abbildung. Somit muss f −1 mindestens l + 1-mal stetig differenzierbar sein.
Mittels Induktion nach l ∈ N beweist man nun die Behauptung.
Definition Eine C k -Abbildung f : U → Rn heißt lokal um u ∈ U invertierbar, wenn es offene Umgebungen U1 von u und V1 um f (u) gibt, so dass
die Einschränkung von f auf U1 , also f|U1 : U1 → V1 ein Diffeomorphismus
ist. Die Abbildung
(f|U1 )−1 : V1 → U1
heißt dann lokale Umkehrfunktion von f . Ist f in jedem Punkt u ∈ U lokal
invertierbar, so heißt f lokaler Diffeomorphismus.
Satz über die Umkehrfunktion Sei U ⊆ Rn eine offene Menge und
f : U → Rn eine C k -Abbildung, k ≥ 1. Genau dann ist f um u lokal
invertierbar, wenn f 0 (u) invertierbar ist. Die lokale Umkehrabbildung ist
dann ebenfalls von der Klasse C k .
Beweis: Sei zunächst f 0 (u) invertierbar. Wir betrachten die Abbildung
h(x, y) = f (x) − y
und wollen die Gleichung h(x, y) = 0 in einer Umgebung von f (u) nach x
auflösen. (Achtung: Vertauschung der Rollen von x und y im Auflösungssatz!) Weil f 0 (u) invertierbar ist, sind die Voraussetzungen des Auflösungsatzes erfüllt und es gibt eine Umgebung V von f (u) und eine Umgebung
U von u so dass eine C k -Abbildung g : V → U existiert mit h(g(y), y) = 0
für alle y ∈ V . Dies bedeutet f (g(y)) = y für alle y ∈ V . Sei U 0 ⊆ U
das Bild g(V ). Dann ist g : V → U 0 surjektiv. Wegen f (g(y)) = y ist g
auch injektiv. Somit ist g bijektiv und von der Klasse C k . Schließlich ist
noch f (g(V )) = V bzw. g(V ) = f −1 (V ) und f ist injektiv über U 0 : Seien
x1 , x2 ∈ U 0 und f (x1 ) = f (x2 ). Dann folgt wegen x1 = g(y1 ), x2 = g(y2 )
zunächst y1 = f (g(y1 )) = f (g(y2 )) = y2 und dies gibt unmittelbar x1 = x2 .
Also besitzt f über U 0 eine inverse Abbildung (f|U 0 )−1 : V → U 0 und es
ist (f|U 0 )−1 = g von der Klasse C k , d.h. f ist in Umgebung von u lokal invertierbar. Ebenfalls nach dem Hilfssatz ist dann die lokale Umkehrfunktion
von der Klasse C k .
Sei nun f um u ∈ U lokal invertierbar. Dann ist nach dem Hilfssatz f 0 (u)
invertierbar.
Folgerung: Sei k ∈ N, U ⊆ Rn und U offen sowie f ∈ C K (U, Rn ) eine
injektive Abbildung. Dann ist f (U ) ⊆ Rn eine offene Menge und f −1 ∈
C k (f (U ), Rn ).
4
Beweis: Sei y ∈ f (U ). Nach dem Satz über die Umkehrfunktion gibt es eine
offene Umgebung V von y = f (u) und eine offene Umgebung U 0 von u so
dass f : U 0 → V ein lokaler Diffeomorphismus ist. Also ist V ⊆ f (U ) offen,
da jedes y ∈ f (U ) innerer Punkt von f (U ) ist. Die Ausage über die C k Eigenschaft folgt ebenfalls sofort aus dem Satz über die Umkehrfunktion.
Eine weitere wichtige Folgerung aus dem Auflösungsatz ist eine notwendige
Bedingung für Extremwertaufgaben mit Nebenbedingungen. (Lagrangesche
Multiplikatoren)
5
Lagrangesche Multiplikatoren
Satz: Sei U eine offene Menge des Rn sowie f ∈ C 1 (U, R), g ∈ C 1 (U, Rm )
mit m < n. Seien die Koordinatenfunktionen von g gegeben durch g(x) =
(g1 (x), . . . , gm (x))T ∈ Rm . Sei x0 ∈ U ∩ {x ∈ Rn | g(x) = 0} eine lokale
Extremstelle von f unter den Nebenbedingungen g(x) = 0. Schließlich sei
der Rang von g 0 (x0 ) naximal, also
Rang (g 0 (x0 )) = m.
Dann folgt: Es gibt ein λ ∈ Rm , λ := (λ1 , . . . , λm )T (Lagrangesche Multiplikatoren), so dass gilt
f 0 (x0 ) + λT g 0 (x0 ) = 0
Die letzte Bedingung ist äquivalent zu
∇f (x0 ) +
m
X
λj ∇gj (x0 ) = 0.
j=1
Beweis: Nach Voraussetzung ist
 ∂g (x0 )
1
∂x1

Rang g 0 (x0 ) = Rang 

..
.
∂gm (x0 )
∂x1
...
..
.
...
∂g1 (x0 )
∂xm
..
.
∂gm (x0 )
∂xm
∂g1 (x0 )
∂xm+1
..
.
∂gm (x0 )
∂xm+1
...
..
.
...
∂g1 (x0 )
∂xn
..
.
∂gm (x0 )
∂xn .




Mittels evtl. Umnummerierung der Koordinaten kann man immer erreichen,
dass gilt
∂gi (x0 )
det
6= 0.
∂xj
1≤i≤m,1≤j≤m
(D.h. der m × m-Block oben links besitzt eine nichtverschwindende Determinante.) Um die Verwendung des Auflösungssatzes besser demonstrieren
zu können, führen wir neue Variablen ein, die der Determinantenbedingung
angepasst sind:
u := (x1 , . . . xm ), t := (xm+1 , . . . , xn ), x = (u, t)
u0 = (x01 , . . . , x0m ), t0 = (x0m+1 , . . . x0n ), x0 = (u0 , t0 )
f (x) = f (u, t), g(x) = g(u, t)
Wegen g(x0 ) = 0 gilt dann g(u0 , t0 ) = 0.
Mit gu (u0 , t0 ) bezeichnen wir die Matrix
∂gi (x0 , t0 )
0 0
gu (u , t ) =
∂xj
1≤i≤m,1≤j≤m
6
Nach Voraussetzung ist deren Determinante verschieden von Null, daher
existiert die inverse Matrix (gu (u0 , t0 ))−1 . Damit erfüllt die Funktion g(u, t)
die Voraussetzungen des Auflösungsatzes d.h. die Gleichung g(u, t) = 0 ist
in einer kleinen Umgebung von t0 nach u auflösbar, d.h. es existiert eine
δ > 0-Umgebung Uδ (t0 ) ⊆ Rn−m und eine stetig differenzierbare Abbildung
u : Uδ (t0 ) → Rm , t 7→ u(t) mit
u(t0 ) = u0 , g(u(t), t) = 0 für alle t ∈ Uδ (t0 ).
Wir betrachten nun die Funktion
ϕ : Uδ (t0 ) → R, ϕ(t) := f (u(t), t).
Weil x0 = (u(t0 ), t0 ) eine lokales Extremum von f unter den Nebenbedingungen g(x) = 0 ist und g(u(t), t) = 0 für alle t ∈ Uδ (t0 ) gilt, ist t0 ein lokales
Extremum von ϕ ohne Nebenbedingungen. Nach den Voraussetzungen ist ϕ
über Uδ (t0 ) differenzierbar, es gilt also
ϕ(t0 ) = 0.
Andererseits folgt aus der Definition von ϕ mittels der Kettenregel
m
X ∂f
∂uj
∂f
∂ϕ
(t) =
(u(t), t) ·
(t) +
(u(t), t).
∂ti
∂uj
∂ti
∂ti
j=1
Wegen ϕ0 (t0 ) = 0 folgt hieraus für alle i = 1, . . . , n − m:
0=
m
X
∂uj 0
∂f
∂f
(u(t0 ), t0 ) ·
(t ) +
(u(t0 ), t0 ).
∂uj
∂ti
∂ti
j=1
Oder in Matrizenschreibweise
fu (u(t0 ), t0 )u0 (t) + ft (u(t0 ), t0 ) = 0
Jetzt differenzieren wir g(u(t), t) = 0 nach t. In Matrizenschreibweise folgt
gu (u(t), t)u0 (t) + gt (u(t), t) = 0.
Dies zeigt
u0 (t0 ) = −(gu (u0 , t0 ))−1 gt (u0 , t0 )
Substituiert man in diese Gleichung die Gleichung davor, so folgt
−fu (u0 , t0 )(gu (u0 , t0 ))−1 gt (u0 , t0 ) + ft (u(t0 ), t0 ) = 0.
Setzt man nun
λT := (λ1 , . . . , λm ) := −fu (u(t0 ), t0 )(gu (u0 , t0 ))−1 ,
7
so folgt
fu (u0 , t0 ) + λT gu (u0 , t0 ) = 0
Substituiert man nun noch λ in die Gleichung vor der Definition von λ, so
folgt
ft (u0 , t0 ) + λT gt (u0 , t0 ) = 0
Die letzten beiden Gleichungen zusammen ergeben
f 0 (x0 ) + λT g 0 (x0 ) = 0
und dies ist unsere Behauptung.
Dieser Satz ermöglicht die Bestimmung der lokalen Extrema in vielen Fällen,
obwohl es sich nur um eine notwendige Bedingung handelt.
1. Man bildet die Lagrangesche Hilfsfunktion von n + m-Variablen
L(x1 , . . . xn , λ) := f (x1 , . . . , xn ) + λg(x1 , . . . , xn ),
wobei das Produkt für mehr als eine Nebenbedingung als euklidisches
Skalarprodukt zu lesen ist.
2. Jetzt berehnet man ∇L(x1 , . . . , xn , λ1 , . . . , λm ).
3. Man bestimmt alle Lösungen (x1 , . . . , xn , λ1 , . . . , λm ) des Gleichungssystems
∇L(x1 , . . . , xn , λ1 , . . . , λm ) = 0.
Dies sind genau n + m Gleichungen.
4. Hat man in Schritt 3 die Lösung (x1 , . . . , xn , λ1 , . . . , λm ) gefunden,
so untersucht amn, ob (x1 , . . . , xn ) wirklich ein lokales Extremum der
ursprünglichen Aufgabe ist. Dabei kann man manchmal wie folgt vorgehen: Ist die Menge G := {x | g(x) = 0} kompakt, so besitzt f|N weil
es ja stetig ist, über G einabsolutes Maximum und absolutes Minimum.
Diese Punkte sind natürlich auch lokale Extremwerte, finden sich also unter den Lösungen des Gleichungssystems. Der größte Wert von
f unter diesen Lösungen ist dann ein absolutes Extrema, der kleinste
Wert von f über diesen Lösungen ist dann ein absolutes Minimum von
f unter diesen Nebenbedingungen.
√
Beispiel: Aus einem kreisförmigen Blech vom Radius 2 soll ein Rechteck
maximalen Flächeninhalts ausgeschnitten werden.
Sind x, y die Seitenlängen des Rechtecks, so soll also die Funktion f (x, y) =
x · y maximiert werden. Da die Eckpunkte des gesuchten Rechtecks offenbar
auf dem Rand des Bleches liegen müssen (sonst könnte man das Rechteck
immer etwas vergrößern), lautet die Nebenbedingung nach dem Satz des
Thales g(x, y) = x2 + y 2 − 2 = 0.
8
1. Schritt:
L(x, y, λ) = x · y + λ(x2 + y 2 − 2)
2. Schritt:
∇L(x, y, λ) = (y + 2λx, x + 2λy, x2 + y 2 − 2
3. Schritt: Da der Gradient Null werden muss, erhält man folgendes Gleichungssystem:
y + 2λx = 0
x + 2λy = 0
x2 + y 2 − 2 = 0
Dieses Gleichungssystem muss gelöst werden.
Aus den beiden ersten Gleichungen folgt (indem man y in die 2. Gleichung
einsetzt):
x = 4λ2 x
Diese Gleichung kann gelöst werden durch x = 0 oder λ = ± 12 . Die Lösung
x = 0 scheidet aus, denn dann wäre auch y = 0 wegen der ersten Gleichung
und dies widerspricht der dritten Gleichung. Also folgt x 6= 0 und λ = ± 12 .
Dies gibt x = ±y. Somit folgt aus der dritten Gleichung x2 = y 2 = 1.
Damit erhält man folgende Lösungen des Gleichungssystems (ohne Angabe
der λ-Werte):
−1
−1
1
1
4
3
2
1
, x =
, x =
, x =
x =
−1
1
−1
1
4. Schritt: Wir berechnen die Funktionswerte in diesen Punkten. Es folgt
f (x1 ) = 1, f (x2 ) = −1, f (x3 ) = −1, f (x4 ) = 1.
Da f auf der kompakten Kreislinie sein Maximum und sein Minimum annehmen muss, existieren das Maximum und das Minimum von f auf dem Kreis,
2 3
somit stellen x1 , x4 Maximalpunkte
√ von f dar und x , x Minimalpunkte
von f auf dem Kreis vom Radius 2. Allerdings sind x, y Seitenlängen eines
Rechtecks, daher ist nur x1 die Lösung der Aufgabe.
9
Herunterladen