7 Anwendungen der Linearen Algebra 7.1 Extremwertaufgaben mit Nebenbedingungen Bemerkung 7.1. Wir behandeln das Problem: Gegeben ist eine zweimal stetig differenzierbare Funktion f : Rn → R und ein stetig differenzierbares Vektorfeld g : Rn → Rm , wobei m < n. Gesucht sind Maximal-/Minimalstellen x von f , wobei g(x) = 0 (Maximierungs-/Minimierungsproblem mit Nebenbedingungen): Minimiere/Maximiere f (x) wobei g(x) = 0. (O) In MaI, Kap. 8.4 wurden Extremwertaufgaben ohne Nebenbedingungen behandelt. In den Übungen traten auch Ungleichungsnebenbedingungen auf, wenn die Menge, über die man minimiert oder maximiert hat, abgeschlossen war (z.B. Aufgabe 12.2). In diesem Abschnitt sind nur Gleichheitsnebenbedingungen g(x) = 0 erlaubt. In MaI, Satz 8.24 steht die notwendige Bedingung für eine Extremalstelle: Wenn x0 ∈ Rn eine lokale Extremalstelle von f ist, dann ist ∇f (x0 ) = 0 (alle Punkte x mit ∇f (x) = 0 heißen kritische Punkte). In MaI, Satz 8.26 wurden im Fall n = 1 oder n = 2 hinreichende Bedingungen zweiter Ordnung formuliert: Für n = 1 folgt aus f 00 (x0 ) < 0, dass x0 eine Maximalstelle ist, und aus f 00 (x0 ) > 0 folgt, dass x0 eine Minimalstelle ist. Für n = 2 hatten wir eine Bedingungen für die gemischten zweiten Ableitungen (d.h., für die Einträge der Hesse-Matrix) aufgeschrieben. Das Ziel in diesem Abschnitt ist es (i) Bedingungen erster und zweiter Ordnung für Minimierungs-/Maximierungsprobleme mit Nebenbedingungen zu formulieren. (ii) Die hinreichenden Bedingungen zweiter Ordnung aus Ma1, Satz 8.26 für beliebige n ∈ N zu verallgemeinern, 53 7 Anwendungen der Linearen Algebra Satz 7.2. (Notwendige Bedingung erster Ordnung) Es seien f : Rn → R und g : Rn → Rm stetig differenzierbar, und x0 ∈ Rn erfülle g(x0 ) = 0 (Zulässigkeit), Rang(∇g(x0 )) = m. Wenn x0 eine Lösung des Optimierungsproblems (O) ist, dann muss ∇f (x0 ) ∈ L(∇g(xo )) (K) gelten, d.h. es müssen Zahlen λ̂1 , . . . , λ̂m existieren, so dass ∇f (x0 ) = m X λ̂k ∇gk (x0 ). k=1 Beispiel 7.3. Definition 7.4. Die Funktion L : Rn+m → R, L(x, λ) = L(x1 , x2 , . . . , xn , λ1 , λ2 , . . . , λm ) = f (x) + m X λk gk (x) k=1 heißt Lagrange-Funktion zum Optimierungsproblem (O). Punkte x0 ∈ Rn , die zulässig sind (d.h. g(x0 ) = 0) und die Bedingung (K) erfüllen, heißen kritische Punkte, und die zugehörigen Koeffizienten λ1 , . . . λm heißen Lagrange-Multiplikatoren von (O) in x0 . Die Zahlen λk entsprechen jeweils −λ̂k aus Satz 7.2. 54 7.1 Extremwertaufgaben mit Nebenbedingungen P Bemerkung 7.5. (i) Die Bedingungen g(x0 ) = 0, ∇f (x0 ) + m k=1 λk ∇gk (x0 ) bilden ein System von n + m Gleichungen mit n + m Unbestimmten x0 = (x0,1 , . . . , x0,n ), λ = (λ1 , . . . , λm ). Diese Gleichungen sind typischerweise nicht linear! (ii) Mit der Lagrangefunktion L(x, λ) aus Def. 7.4 kann man die notwendigen Bedingungen aus Satz 7.2 kompakt schreiben als ∇L(x, λ) = 0 ∈ Rn+m . (iii) Extremwertaufgaben ohne Nebenbedingungen sind als Spezialfall von O mit m = 0 zu verstehen. Die Bedingung aus Satz 7.2 liefert dann ∇f (x0 ) = 0 X λ̂k ∇gk (x0 ) = 0, k=1 und das ist genau die Bedingung aus Ma1 Satz 8.26 (s.o.). Satz 7.6 (Hinreichende Bedingung zweiter Ordnung). Es seien f : Rn → R und g : Rn → Rm zweimal stetig differenzierbar, und x0 ∈ Rn sei ein kritischer Punkt zum Optimierungsproblem (O). Wenn die Hesse-Matrix von L bezüglich x d2 d2 d2 L(x , λ ) L(x , λ ) . . . L(x , λ ) 2 0 0 0 0 0 0 dx1 dx2 dx1 dxn dx d21 d2 d2 L(x0 , λ0 ) L(x , λ ) L(x , λ ) . . . 2 0 0 0 0 dx dx dx dx dx n x 2 1 2 2 HL (x0 ) = .. .. .. . . . d2 d2 d2 L(x , λ ) L(x , λ ) L(x , λ ) . . . 0 0 0 0 0 0 dxn dx1 dxn dx1 dx2 n > positiv definit über dem Raum U = Ker(∇g(x0 ) ) ist, dann ist x0 ein striktes lokales Minimum von f , wenn sie negativ definit über U ist, dann ist x0 ein striktes lokales Maximum von f , und wenn sie indefinit über U ist, dann liegt in x0 kein Extremum vor. Beispiel 7.7. Bemerkung 7.8. Die Bedingungen aus Satz 7.6 liefern für m = 0 und n = 1 bzw. n = 2 genau die Bedingungen aus MaI Satz 8.26. 55 7 Anwendungen der Linearen Algebra 7.2 Systeme linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten Definition 7.9. Gegeben sind n ∈ N, ein Zeitintervall I ⊂ R, eine Matrix mit Koeffizientenfunktionen A(t) = (aij (t)), und ein Vektorfeld h(t) ∈ K n (t ∈ I). Ein System linearer Differentialgleichungen erster Ordnung oder lineares Differentialgleichungssystem hat die Form y 0 (t) = A(t)y(t) + h(t), (S) wobei die gesuchte Lösung y(t) = (y1 (t), y2 (t), . . . , yn (t)) ein Vektor mit n Komponenten ist. Das System heißt homogen, falls h(t) = 0 ist, und mit konstanten Koeffizienten, wenn alle Koeffizientenfunktionen konstant in t sind, d.h., A(t) = A hängt nicht von t ab. Beispiel 7.10. Satz 7.11. Die Lösungsmenge eines linearen homogenen Differentialgleichungssystems mit n Gleichungen und konstanten Koeffizienten ist ein Vektorraum der Dimension n, und besitzt somit eine Basis B = {b1 (t), b2 (t), . . . , bn (t)}. Eine solche Basis heißt Fundamentalsystem der Differentialgleichung. Satz 7.12. (i) Ist λ ∈ R ein Eigenwert von A und v ein zugehöriger Eigenvektor, so ist b(t) = eλt v eine Lösung von y 0 (t) = Ay(t). (ii) Ist λ = α+βi ∈ C ein Eigenwert von A und v = a+bi ein zugehöriger Eigenvektor, dann sind b1 (t) = eαt (cos(βt)a − sin(β)b) und b2 (t) = eαt (cos(βt)a + sin(β)b) zwei linear unabhängige reelle Lösungen von y 0 (t) = Ay(t). (iii) Ist A diagonalisierbar, so besitzt die Differentialgleichung y 0 (t) = Ay(t) ein Fundamentalsystem aus Lösungen der Form (i) und (ii). Beweis. 56 7.2 Systeme linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten Bemerkung 7.13. Ist ein homogenes Anfangswertproblem y 0 (t) = Ay(t), y(t0 ) = y0 ∈ Rn zu P lösen, so bestimmt man die Koeffizienten c1 , c2 , . . . cn in der P Linearkombination y(t) = nk=1 ck bk (t) durch Lösen des linearen Gleichungssystems nk=1 ck bk (t0 ) = y0 . Beispiel 7.14. Bemerkung 7.15 (Variation der Konstanten). Ist eine inhomogene Differentialgleichung y 0 (t) = Ay(t) + h(t) zu lösen, so kann man wie folgt vorgehen, 1. man bestimmt zunächst die allgemeine Lösung yh,c (t) (d.h. ein Fundamentalsystem B = {b1 (t), . . . , bn (t)}) der zugehörigen linearen Differentialgleichung y 0 (t) = Ay(t), 2. man setzt den Ansatz yP (t) = n X ck (t)bk (t) k=1 in die inhomogene Differentialgleichung ein. Das liefert ein lineares Gleichungssystem für die Funktionen c0k (t), 3. dessen Lösung c0 (t) = (c01 (t), c02 (t), . . . , c0n (t)) man mit der Kramer’schen Regel aus Satz 5.17 berechnen kann. 4. Die Funktionen ck (t) bestimmt Pn man durch Integration, damit bekommt man die partikuläre Lösung yp (t) = k=1 ck (t)bk (t). 5. Die allgemeine Lösung der inomogenen Gleichung ist dann y(t) = yh,c (t) + yP (t). Bemerkung 7.16. Ist ein inhomogenes Anfangswertproblem y 0 (t) = Ay(t) + h(t), y(t0 ) = y0 ∈ Rn zu lösen, so bestimmt man die Koeffizienten c1 , c2 , . . . cn in der allgePn meinen Lösung y(t) = yP (t) + k=1 ck bk (t) durch Lösen des linearen Gleichungssystems Pn c k=1 k bk (t0 ) = y0 − yP (t0 ). 57