198 VI. Differentialrechnung in mehreren Veränderlichen 40 Lokale Extrema und Taylor-Formel Lernziele: • Resultate: Satz von Taylor und Kriterien für lokale Extrema • Methoden aus der linearen Algebra • Kompetenzen: Bestimmung kritischer Punkte und lokaler Extrema Frage: Für gegebene Punkte a1 , . . . , ar ∈ Rn versuche man, das Minimum der Funktion f (x) := r P | x − ak |2 auf Rn zu bestimmen. k=1 40.1 Definition. Es sei X ein metrischer Raum. Eine Funktion f : X 7→ R besitzt ein lokales Maximum [Minimum] in einem Punkt a ∈ X , falls es eine Umgebung V von a mit f (x) ≤ f (a) [f (x) ≥ f (a)] für alle x ∈ V (1) gibt. In diesem Fall heißt a lokale Maximalstelle bzw. Minimalstelle von f . Diese heißt isoliert, falls in (1) für x 6= a stets f (x) 6= f (a) gilt. In diesem Abschnitt wird X = D stets eine offene Menge in Rn sein. 40.2 Satz. Es seien D ⊆ Rn offen und a ∈ D eine lokale Extremalstelle von f : D 7→ R . Ist f in a total differenzierbar, so folgt df (a) = 0 und grad f (a) = 0 . Beweis. Die für h ∈ Rn = Ta (Rn ) nahe 0 ∈ R definierte Funktion t 7→ φ(t) := φh (t) := f (a + th) (2) der einen reellen Veränderlichen t besitzt ein lokales Extremum in 0 , und aus Satz 10.3 folgt φ′h (0) = 0 . Mit h = ej ergibt sich daraus ∂j f (a) = 0 für j = 1, . . . , n . 40.3 Kritische Punkte. a) Ein Punkt a ∈ D heißt kritischer Punkt von f , falls df (a) = 0 ist. Wie bei Funktionen von einer Veränderlichen müssen kritische Punkte von f nicht unbedingt Extremalstellen sein. b) Es sei f : R2 7→ R durch f (x, y) = 2y 2 − x(x − 1)2 definiert. Man berechnet sofort Df (x, y) = (−3x2 + 4x − 1, 4y) . Aus Df (x, y) = 0 folgt y = 0 und −3x2 + 4x − 1 = 0 ⇔ x = 1 3 oder x = 1 . Eine Abbildung suggeriert, daß in ( 13 , 0) ein lokales Extremum vorliegen sollte, in dem kritischen Punkt (1, 0) aber nicht. Diese Aussagen werden in Beispiel 40.8 a) in der Tat bewiesen. 40 Lokale Extrema und Taylor-Formel 199 Für C 2 -Funktionen ergibt sich eine hinreichende Bedingung für das Vorliegen eines lokalen Extremums mittels 40.4 Hesse-Matrix und Taylor-Formel. a) Es seien D ⊆ Rn offen und f ∈ C 2 (D, R) . Für die Hilfsfunktionen φh aus (2) gilt φ′h (t) = Df (a + th) h = φ′′h (t) = n P i,j=1 n P j=1 ∂j f (a + th) hj und ∂i ∂j f (a + th) hi hj (3) (4) aufgrund der Kettenregel. Der letzte Ausdruck ähnelt einer quadratischen Form in h (vgl. Beispiel 39.4 b)); allerdings hängen die Koeffizienten von h (und t ) ab. b) Für x ∈ D heißt Hf (x) := (∂i ∂j f (x))i,j=1...n ∈ MR (n) die Hesse-Matrix von f in x , die durch Hf (x) definierte quadratische Form QHf (x) : h 7→ h h , Hf (x) h i = n P i,j=1 ∂i ∂j f (x) hi hj (5) die Hesse-Form von f in x . Wegen f ∈ C 2 (D) und des Satzes von Schwarz sind die Hesse-Matrizen Hf (x) symmetrisch. c) Aus der Taylor-Formel mit Lagrange-Restglied (vgl. (??.14)) φh (1) = φh (0) + φ′h (0) + 21 φ′′h (θ) , θ = θ(h) ∈ [0, 1] , (6) ergibt sich nun mittels (3)–(5) sofort f (a + h) = f (a) + Df (a) h + 12 h h , Hf (a + θh) h i (7) für kleine | h | und geeignete θ = θ(h) ∈ [0, 1] . Ist speziell a ein kritischer Punkt von f , so gilt f (a + h) − f (a) = 1 2 h h , Hf (a + θh) h i , θ ∈ [0, 1] . (8) Die Frage nach lokalen Extrema von f ∈ C 2 (D) hängt also eng mit den Vorzeichen der Hesse-Formen QHf (x) für x nahe a zusammen. 40.5 Definition. Es sei A ∈ MR (n) eine symmetrische Matrix mit assoziierter quadratischer Form QA . Dann heißen A (und QA ) a) positiv definit, falls QA (h) > 0 für h 6= 0 gilt (Notation: A > 0 ), b) positiv semidefinit, falls stets QA (h) ≥ 0 gilt (Notation: A ≥ 0 ), c) negativ [semi]definit, falls −A positiv [semi]definit ist (Notation: A < 0 [A ≤ 0] ), d) indefinit, falls es h, k ∈ Rn mit QA (h) > 0 und QA (k) < 0 gibt. Die Menge SR (n) = S(n) der symmetrischen Matrizen in MR (n) ist offenbar ein Unterraum von MR (n) . 200 VI. Differentialrechnung in mehreren Veränderlichen 40.6 Lemma. a) Für h ∈ Rn sind die Mengen {A ∈ S(n) | QA (h) > 0} und {A ∈ S(n) | QA (h) < 0} offen in S(n) . b) Ist A ∈ S(n) positiv definit, so gibt es δ > 0 und α > 0 , so daß für alle C ∈ S(n) mit k C − A k < δ und alle h ∈ Rn gilt: QC (h) ≥ αk h k2 . Beweise findet man in [A2], Abschnitt 20. 40.7 Satz. Es seien D ⊆ Rn offen, f ∈ C 2 (D, R) , a ∈ D ein kritischer Punkt von f und A = Hf (a) die Hesse-Matrix von f in a . Dann gilt: a) A > 0 ⇒ f hat ein isoliertes lokales Minimum in a , b) f hat ein lokales Minimum in a ⇒ A ≥ 0 , c) A < 0 ⇒ f hat ein isoliertes lokales Maximum in a , d) f hat ein lokales Maximum in a ⇒ A ≤ 0 , e) A indefinit ⇒ f hat kein lokales Extremum in a . 40.8 Beispiele. a) Für die Funktion f (x, y) = 2y 2 − x(x − 1)2 aus Beispiel 40.3 ! 4 − 6x 0 . Im kritischen Punkt ( 13 , 0) ist A = Hf ( 31 , 0) = gilt Hf (x, y) = 0 4 ! 2 0 , also QA (h1 , h2 ) = 2h21 + 4h22 , und man hat Hf ( 31 , 0) > 0 . Somit besitzt 0 4 ! −2 0 f in ( 31 , 0) ein isoliertes lokales Minimum. Für A = Hf (1, 0) = gilt 0 4 QA (h1 , h2 ) = −2h21 + 4h22 . Offenbar ist QA (1, 0)⊤ < 0 und QA (0, 1)⊤ > 0 , also Hf (1, 0) indefinit; folglich hat f in (1, 0) kein lokales Extremum. b) Es werden die folgenden Funktionen fj : R2 7→ R betrachtet : f1 (x, y) = x2 + y 4 , f2 (x, y) = x2 , f3 (x, y) = x2 − y 3 . ! 2 0 . Wegen In allen drei Fällen ist 0 ein kritischer Punkt und A = Hfj (0) = 0 0 QA (h) = 2h21 ist A positiv semidefinit, aber nicht definit. Analog zum Fall f ′′ (a) = 0 bei Funktionen von einer Veränderlichen ist Satz 40.7 nicht anwendbar, und in der Tat hat f1 ein isoliertes lokales Minimum, f2 ein nicht isoliertes lokales Minimum, f3 aber kein lokales Extremum in 0 . 40.9 Funktionen von zwei Veränderlichen. a) Für eine symmetrische Matrix ! a b ∈ SR (2) und einen Vektor h = (x, y)⊤ ∈ R2 hat man A= b d QA (h) = h x y ! , ax + by bx + dy ! i = ax2 + 2bxy + dy 2 . 40 Lokale Extrema und Taylor-Formel 201 Für a = 0 und b = 0 ist QA semidefinit, aber nicht definit; für a = 0 und b 6= 0 ist QA indefinit. b) Nun sei a 6= 0 und ∆ := det A = ad − b2 . Dann gilt xy + ad y 2 ) = a ((x + ab y)2 + ( ad − QA (h) = a (x2 + 2b a = a ((x + ab y)2 + a∆2 y 2 ) . b2 ) y 2) a2 Folglich ist QA genau dann definit, wenn ∆ > 0 gilt und genau dann indefinit, wenn ∆ < 0 ist. Im Fall ∆ > 0 ist QA genau dann positiv definit, wenn a > 0 gilt und genau dann negativ definit, wenn a < 0 ist. 40.10 Eigenwerte und Eigenvektoren. a) Es sei A ∈ MK (n) . Gilt Ax = λx für λ ∈ K und 0 6= x ∈ Kn , so heißt x Eigenvektor zum Eigenwert λ von A . b) Es ist λ ∈ K genau dann Eigenwert von A , wenn λI − A 6∈ GL(n) gilt; die Eigenwerte von A sind also genau die Nullstellen des charakteristischen Polynoms χA (λ) := det(λI − A) von A . Aufgrund des Fundamentalsatzes der Algebra (Theorem 29.10) besitzt somit jede Matrix A ∈ MC (n) (höchstens n verschiedene) Eigenwerte in C . c) Wie in a) lassen sich auch Eigenwerte und Eigenvektoren linearer Operatoren definieren. Ein wichtiges Resultat der Linearen Algebra ist der folgende Spektralsatz für symmetrische Matrizen : 40.11 Theorem. Alle Eigenwerte {λj } einer reellen symmetrischen Matrix A ∈ SR (n) sind reell. Es gibt eine Orthonormalbasis {v1 , . . . , vn } von Rn , die aus Eigenvektoren von A besteht: Avj = λj vj , j = 1, . . . , n . In 42.7 wird ein analytischer“ Beweis dieser Aussage angegeben. Die Geraden ” sp{vj } sind die Hauptachsen der quadratischen Form QA ; für Vektoren h= n P j=1 cj vj ∈ Rn gilt nämlich QA (h) = h h, Ah i = h n P j=1 cj vj , n P j=1 cj λj vj i = n P j=1 λj c2j . Daraus ergibt sich unmittelbar: 40.12 Folgerung. Eine reelle symmetrische Matrix A ∈ SR (n) ist a) genau dann positiv definit, wenn alle ihre Eigenwerte positiv sind, b) genau dann negativ definit, wenn alle ihre Eigenwerte negativ sind, c) genau dann indefinit, wenn sie positive und negative Eigenwerte besitzt. (9) 202 VI. Differentialrechnung in mehreren Veränderlichen 40.13 Satz (Hurwitz). Für eine symmetrische Martrix A = (aij ) ∈ S(n) und 1 ≤ k ≤ n sei Ak := (aij )i,j=1...k ∈ S(k) die k -te Abschnittsmatrix. Dann gilt: a) ( ∀ k = 1, . . . , n : det Ak > 0 ) ⇔ A > 0 , b) ( ∀ k = 1, . . . , n : (−1)k det Ak > 0 ) ⇔ A < 0 , c) ( ∃ 1 ≤ k ≤ n 2 : det A2k < 0 ) ⇒ A indefinit. 40.14 Beispiele und Bemerkungen. a) Es ist A ∈ SR (n) auch dann indefinit, wenn irgendeine Unterdeterminante gerader Ordnung negativ ist; dies folgt aus Satz 40.13 c) durch eine geeignete Vertauschung der Koordinaten. b) Es werden alle lokalen Extrema der folgenden Funktion bestimmt: f : R3 7→ R , f (x, y, z) : = 6xy − 3y 2 − 2x3 − yz 2 .