40 Lokale Extrema und Taylor-Formel

Werbung
198
VI. Differentialrechnung in mehreren Veränderlichen
40
Lokale Extrema und Taylor-Formel
Lernziele:
• Resultate: Satz von Taylor und Kriterien für lokale Extrema
• Methoden aus der linearen Algebra
• Kompetenzen: Bestimmung kritischer Punkte und lokaler Extrema
Frage: Für gegebene Punkte a1 , . . . , ar ∈ Rn versuche man, das Minimum der Funktion
f (x) :=
r
P
| x − ak |2 auf Rn zu bestimmen.
k=1
40.1 Definition. Es sei X ein metrischer Raum. Eine Funktion f : X 7→ R besitzt
ein lokales Maximum [Minimum] in einem Punkt a ∈ X , falls es eine Umgebung V
von a mit
f (x) ≤ f (a) [f (x) ≥ f (a)]
für alle x ∈ V
(1)
gibt. In diesem Fall heißt a lokale Maximalstelle bzw. Minimalstelle von f . Diese
heißt isoliert, falls in (1) für x 6= a stets f (x) 6= f (a) gilt.
In diesem Abschnitt wird X = D stets eine offene Menge in Rn sein.
40.2 Satz. Es seien D ⊆ Rn offen und a ∈ D eine lokale Extremalstelle von
f : D 7→ R . Ist f in a total differenzierbar, so folgt df (a) = 0 und grad f (a) = 0 .
Beweis. Die für h ∈ Rn = Ta (Rn ) nahe 0 ∈ R definierte Funktion
t 7→ φ(t) := φh (t) := f (a + th)
(2)
der einen reellen Veränderlichen t besitzt ein lokales Extremum in 0 , und aus Satz
10.3 folgt φ′h (0) = 0 . Mit h = ej ergibt sich daraus ∂j f (a) = 0 für j = 1, . . . , n .
40.3 Kritische Punkte. a) Ein Punkt a ∈ D heißt kritischer Punkt von f , falls
df (a) = 0 ist. Wie bei Funktionen von einer Veränderlichen müssen kritische Punkte
von f nicht unbedingt Extremalstellen sein.
b) Es sei f : R2 7→ R durch f (x, y) = 2y 2 − x(x − 1)2 definiert. Man berechnet sofort
Df (x, y) = (−3x2 + 4x − 1, 4y) . Aus Df (x, y) = 0 folgt y = 0 und
−3x2 + 4x − 1 = 0 ⇔ x =
1
3
oder x = 1 .
Eine Abbildung suggeriert, daß in ( 13 , 0) ein lokales Extremum vorliegen sollte, in dem
kritischen Punkt (1, 0) aber nicht. Diese Aussagen werden in Beispiel 40.8 a) in der
Tat bewiesen.
40 Lokale Extrema und Taylor-Formel
199
Für C 2 -Funktionen ergibt sich eine hinreichende Bedingung für das Vorliegen eines
lokalen Extremums mittels
40.4 Hesse-Matrix und Taylor-Formel. a) Es seien D ⊆ Rn offen und
f ∈ C 2 (D, R) . Für die Hilfsfunktionen φh aus (2) gilt
φ′h (t) = Df (a + th) h =
φ′′h (t) =
n
P
i,j=1
n
P
j=1
∂j f (a + th) hj
und
∂i ∂j f (a + th) hi hj
(3)
(4)
aufgrund der Kettenregel. Der letzte Ausdruck ähnelt einer quadratischen Form in h
(vgl. Beispiel 39.4 b)); allerdings hängen die Koeffizienten von h (und t ) ab.
b) Für x ∈ D heißt Hf (x) := (∂i ∂j f (x))i,j=1...n ∈ MR (n) die Hesse-Matrix von f
in x , die durch Hf (x) definierte quadratische Form
QHf (x) : h 7→ h h , Hf (x) h i =
n
P
i,j=1
∂i ∂j f (x) hi hj
(5)
die Hesse-Form von f in x . Wegen f ∈ C 2 (D) und des Satzes von Schwarz sind die
Hesse-Matrizen Hf (x) symmetrisch.
c) Aus der Taylor-Formel mit Lagrange-Restglied (vgl. (??.14))
φh (1) = φh (0) + φ′h (0) + 21 φ′′h (θ) ,
θ = θ(h) ∈ [0, 1] ,
(6)
ergibt sich nun mittels (3)–(5) sofort
f (a + h) = f (a) + Df (a) h + 12 h h , Hf (a + θh) h i
(7)
für kleine | h | und geeignete θ = θ(h) ∈ [0, 1] . Ist speziell a ein kritischer Punkt von
f , so gilt
f (a + h) − f (a) =
1
2
h h , Hf (a + θh) h i ,
θ ∈ [0, 1] .
(8)
Die Frage nach lokalen Extrema von f ∈ C 2 (D) hängt also eng mit den Vorzeichen
der Hesse-Formen QHf (x) für x nahe a zusammen.
40.5 Definition. Es sei A ∈ MR (n) eine symmetrische Matrix mit assoziierter quadratischer Form QA . Dann heißen A (und QA )
a) positiv definit, falls QA (h) > 0 für h 6= 0 gilt (Notation: A > 0 ),
b) positiv semidefinit, falls stets QA (h) ≥ 0 gilt (Notation: A ≥ 0 ),
c) negativ [semi]definit, falls −A positiv [semi]definit ist (Notation: A < 0 [A ≤ 0] ),
d) indefinit, falls es h, k ∈ Rn mit QA (h) > 0 und QA (k) < 0 gibt.
Die Menge SR (n) = S(n) der symmetrischen Matrizen in MR (n) ist offenbar ein
Unterraum von MR (n) .
200
VI. Differentialrechnung in mehreren Veränderlichen
40.6 Lemma. a) Für h ∈ Rn sind die Mengen {A ∈ S(n) | QA (h) > 0} und {A ∈
S(n) | QA (h) < 0} offen in S(n) .
b) Ist A ∈ S(n) positiv definit, so gibt es δ > 0 und α > 0 , so daß für alle C ∈ S(n)
mit k C − A k < δ und alle h ∈ Rn gilt: QC (h) ≥ αk h k2 .
Beweise findet man in [A2], Abschnitt 20.
40.7 Satz. Es seien D ⊆ Rn offen, f ∈ C 2 (D, R) , a ∈ D ein kritischer Punkt von f
und A = Hf (a) die Hesse-Matrix von f in a . Dann gilt:
a) A > 0 ⇒ f hat ein isoliertes lokales Minimum in a ,
b) f hat ein lokales Minimum in a ⇒ A ≥ 0 ,
c) A < 0 ⇒ f hat ein isoliertes lokales Maximum in a ,
d) f hat ein lokales Maximum in a ⇒ A ≤ 0 ,
e) A indefinit ⇒ f hat kein lokales Extremum in a .
40.8 Beispiele. a) Für die Funktion
f (x, y) = 2y 2 − x(x − 1)2 aus Beispiel 40.3
!
4 − 6x 0
. Im kritischen Punkt ( 13 , 0) ist A = Hf ( 31 , 0) =
gilt Hf (x, y) =
0
4
!
2 0
, also QA (h1 , h2 ) = 2h21 + 4h22 , und man hat Hf ( 31 , 0) > 0 . Somit besitzt
0 4
!
−2
0
f in ( 31 , 0) ein isoliertes lokales Minimum. Für A = Hf (1, 0) =
gilt
0 4
QA (h1 , h2 ) = −2h21 + 4h22 . Offenbar ist QA (1, 0)⊤ < 0 und QA (0, 1)⊤ > 0 , also
Hf (1, 0) indefinit; folglich hat f in (1, 0) kein lokales Extremum.
b) Es werden die folgenden Funktionen fj : R2 7→ R betrachtet :
f1 (x, y) = x2 + y 4 , f2 (x, y) = x2 , f3 (x, y) = x2 − y 3 .
!
2 0
. Wegen
In allen drei Fällen ist 0 ein kritischer Punkt und A = Hfj (0) =
0 0
QA (h) = 2h21 ist A positiv semidefinit, aber nicht definit. Analog zum Fall f ′′ (a) = 0
bei Funktionen von einer Veränderlichen ist Satz 40.7 nicht anwendbar, und in der
Tat hat f1 ein isoliertes lokales Minimum, f2 ein nicht isoliertes lokales Minimum, f3
aber kein lokales Extremum in 0 .
40.9 Funktionen
von zwei Veränderlichen. a) Für eine symmetrische Matrix
!
a b
∈ SR (2) und einen Vektor h = (x, y)⊤ ∈ R2 hat man
A=
b d
QA (h) = h
x
y
!
,
ax + by
bx + dy
!
i = ax2 + 2bxy + dy 2 .
40 Lokale Extrema und Taylor-Formel
201
Für a = 0 und b = 0 ist QA semidefinit, aber nicht definit; für a = 0 und b 6= 0 ist
QA indefinit.
b) Nun sei a 6= 0 und ∆ := det A = ad − b2 . Dann gilt
xy + ad y 2 ) = a ((x + ab y)2 + ( ad −
QA (h) = a (x2 + 2b
a
= a ((x + ab y)2 + a∆2 y 2 ) .
b2
) y 2)
a2
Folglich ist QA genau dann definit, wenn ∆ > 0 gilt und genau dann indefinit, wenn
∆ < 0 ist. Im Fall ∆ > 0 ist QA genau dann positiv definit, wenn a > 0 gilt und
genau dann negativ definit, wenn a < 0 ist.
40.10 Eigenwerte und Eigenvektoren. a) Es sei A ∈ MK (n) . Gilt Ax = λx für
λ ∈ K und 0 6= x ∈ Kn , so heißt x Eigenvektor zum Eigenwert λ von A .
b) Es ist λ ∈ K genau dann Eigenwert von A , wenn λI − A 6∈ GL(n) gilt; die
Eigenwerte von A sind also genau die Nullstellen des charakteristischen Polynoms
χA (λ) := det(λI − A) von A . Aufgrund des Fundamentalsatzes der Algebra (Theorem
29.10) besitzt somit jede Matrix A ∈ MC (n) (höchstens n verschiedene) Eigenwerte
in C .
c) Wie in a) lassen sich auch Eigenwerte und Eigenvektoren linearer Operatoren definieren.
Ein wichtiges Resultat der Linearen Algebra ist der folgende Spektralsatz für symmetrische Matrizen :
40.11 Theorem. Alle Eigenwerte {λj } einer reellen symmetrischen Matrix
A ∈ SR (n) sind reell. Es gibt eine Orthonormalbasis {v1 , . . . , vn } von Rn , die aus
Eigenvektoren von A besteht: Avj = λj vj , j = 1, . . . , n .
In 42.7 wird ein analytischer“ Beweis dieser Aussage angegeben. Die Geraden
”
sp{vj } sind die Hauptachsen der quadratischen Form QA ; für Vektoren
h=
n
P
j=1
cj vj ∈ Rn gilt nämlich
QA (h) = h h, Ah i = h
n
P
j=1
cj vj ,
n
P
j=1
cj λj vj i =
n
P
j=1
λj c2j .
Daraus ergibt sich unmittelbar:
40.12 Folgerung. Eine reelle symmetrische Matrix A ∈ SR (n) ist
a) genau dann positiv definit, wenn alle ihre Eigenwerte positiv sind,
b) genau dann negativ definit, wenn alle ihre Eigenwerte negativ sind,
c) genau dann indefinit, wenn sie positive und negative Eigenwerte besitzt.
(9)
202
VI. Differentialrechnung in mehreren Veränderlichen
40.13 Satz (Hurwitz). Für eine symmetrische Martrix A = (aij ) ∈ S(n) und 1 ≤
k ≤ n sei Ak := (aij )i,j=1...k ∈ S(k) die k -te Abschnittsmatrix. Dann gilt:
a) ( ∀ k = 1, . . . , n : det Ak > 0 ) ⇔ A > 0 ,
b) ( ∀ k = 1, . . . , n : (−1)k det Ak > 0 ) ⇔ A < 0 ,
c) ( ∃ 1 ≤ k ≤
n
2
: det A2k < 0 ) ⇒ A indefinit.
40.14 Beispiele und Bemerkungen. a) Es ist A ∈ SR (n) auch dann indefinit,
wenn irgendeine Unterdeterminante gerader Ordnung negativ ist; dies folgt aus Satz
40.13 c) durch eine geeignete Vertauschung der Koordinaten.
b) Es werden alle lokalen Extrema der folgenden Funktion bestimmt:
f : R3 7→ R ,
f (x, y, z) : = 6xy − 3y 2 − 2x3 − yz 2 .
Herunterladen