Kapitel 7

Werbung
7 Anwendungen der Linearen Algebra
7.1 Extremwertaufgaben mit Nebenbedingungen
Bemerkung 7.1. Wir behandeln das Problem: Gegeben ist eine zweimal stetig differenzierbare Funktion f : Rn → R und ein stetig differenzierbares Vektorfeld g : Rn → Rm ,
wobei m < n. Gesucht sind Maximal-/Minimalstellen x von f , wobei g(x) = 0 (Maximierungs-/Minimierungsproblem mit Nebenbedingungen):
Minimiere/Maximiere f (x)
wobei g(x) = 0.
(O)
In MaI, Kap. 8.4 wurden Extremwertaufgaben ohne Nebenbedingungen behandelt. In
den Übungen traten auch Ungleichungsnebenbedingungen auf, wenn die Menge, über die
man minimiert oder maximiert hat, abgeschlossen war (z.B. Aufgabe 12.2). In diesem
Abschnitt sind nur Gleichheitsnebenbedingungen g(x) = 0 erlaubt.
In MaI, Satz 8.24 steht die notwendige Bedingung für eine Extremalstelle:
Wenn x0 ∈ Rn eine lokale Extremalstelle von f ist, dann ist ∇f (x0 ) = 0
(alle Punkte x mit ∇f (x) = 0 heißen kritische Punkte). In MaI, Satz 8.26 wurden im
Fall n = 1 oder n = 2 hinreichende Bedingungen zweiter Ordnung formuliert:
Für n = 1 folgt aus f 00 (x0 ) < 0, dass x0 eine Maximalstelle ist,
und aus f 00 (x0 ) > 0 folgt, dass x0 eine Minimalstelle ist.
Für n = 2 hatten wir eine Bedingungen für die gemischten zweiten Ableitungen (d.h.,
für die Einträge der Hesse-Matrix) aufgeschrieben.
Das Ziel in diesem Abschnitt ist es
(i) Bedingungen erster und zweiter Ordnung für Minimierungs-/Maximierungsprobleme
mit Nebenbedingungen zu formulieren.
(ii) Die hinreichenden Bedingungen zweiter Ordnung aus Ma1, Satz 8.26 für beliebige
n ∈ N zu verallgemeinern,
53
7 Anwendungen der Linearen Algebra
Satz 7.2. (Notwendige Bedingung erster Ordnung) Es seien f : Rn → R und g : Rn →
Rm stetig differenzierbar, und x0 ∈ Rn erfülle
g(x0 ) = 0 (Zulässigkeit),
Rang(∇g(x0 )) = m.
Wenn x0 eine Lösung des Optimierungsproblems (O) ist, dann muss
∇f (x0 ) ∈ L(∇g(xo ))
(K)
gelten, d.h. es müssen Zahlen λ̂1 , . . . , λ̂m existieren, so dass
∇f (x0 ) =
m
X
λ̂k ∇gk (x0 ).
k=1
Beispiel 7.3.
Definition 7.4. Die Funktion L : Rn+m → R,
L(x, λ) = L(x1 , x2 , . . . , xn , λ1 , λ2 , . . . , λm ) = f (x) +
m
X
λk gk (x)
k=1
heißt Lagrange-Funktion zum Optimierungsproblem (O). Punkte x0 ∈ Rn , die zulässig
sind (d.h. g(x0 ) = 0) und die Bedingung (K) erfüllen, heißen kritische Punkte, und die
zugehörigen Koeffizienten λ1 , . . . λm heißen Lagrange-Multiplikatoren von (O) in x0 . Die
Zahlen λk entsprechen jeweils −λ̂k aus Satz 7.2.
54
7.1 Extremwertaufgaben mit Nebenbedingungen
P
Bemerkung 7.5. (i) Die Bedingungen g(x0 ) = 0, ∇f (x0 ) + m
k=1 λk ∇gk (x0 ) bilden
ein System von n + m Gleichungen mit n + m Unbestimmten x0 = (x0,1 , . . . , x0,n ),
λ = (λ1 , . . . , λm ). Diese Gleichungen sind typischerweise nicht linear!
(ii) Mit der Lagrangefunktion L(x, λ) aus Def. 7.4 kann man die notwendigen Bedingungen aus Satz 7.2 kompakt schreiben als
∇L(x, λ) = 0 ∈ Rn+m .
(iii) Extremwertaufgaben ohne Nebenbedingungen sind als Spezialfall von O mit m = 0
zu verstehen. Die Bedingung aus Satz 7.2 liefert dann
∇f (x0 ) =
0
X
λ̂k ∇gk (x0 ) = 0,
k=1
und das ist genau die Bedingung aus Ma1 Satz 8.26 (s.o.).
Satz 7.6 (Hinreichende Bedingung zweiter Ordnung). Es seien f : Rn → R und g :
Rn → Rm zweimal stetig differenzierbar, und x0 ∈ Rn sei ein kritischer Punkt zum
Optimierungsproblem (O). Wenn die Hesse-Matrix von L bezüglich x

 d2
d2
d2
L(x
,
λ
)
L(x
,
λ
)
.
.
.
L(x
,
λ
)
2
0
0
0
0
0
0
dx1 dx2
dx1 dxn
dx

 d21
d2
d2

L(x0 , λ0 )
L(x
,
λ
)
L(x
,
λ
)
.
.
.
2
0
0
0
0
dx
dx
dx
dx
dx
n
x
2
1
2
2

HL (x0 ) = 
..
..
..




.
.
.
d2
d2
d2
L(x
,
λ
)
L(x
,
λ
)
L(x
,
λ
)
.
.
.
0
0
0
0
0
0
dxn dx1
dxn dx1
dx2
n
>
positiv definit über dem Raum U = Ker(∇g(x0 ) ) ist, dann ist x0 ein striktes lokales
Minimum von f , wenn sie negativ definit über U ist, dann ist x0 ein striktes lokales
Maximum von f , und wenn sie indefinit über U ist, dann liegt in x0 kein Extremum vor.
Beispiel 7.7.
Bemerkung 7.8. Die Bedingungen aus Satz 7.6 liefern für m = 0 und n = 1 bzw. n = 2
genau die Bedingungen aus MaI Satz 8.26.
55
7 Anwendungen der Linearen Algebra
7.2 Systeme linearer Differentialgleichungen 1. Ordnung
mit konstanten Koeffizienten
Definition 7.9. Gegeben sind n ∈ N, ein Zeitintervall I ⊂ R, eine Matrix mit Koeffizientenfunktionen A(t) = (aij (t)), und ein Vektorfeld h(t) ∈ K n (t ∈ I). Ein System
linearer Differentialgleichungen erster Ordnung oder lineares Differentialgleichungssystem hat die Form
y 0 (t) = A(t)y(t) + h(t),
(S)
wobei die gesuchte Lösung y(t) = (y1 (t), y2 (t), . . . , yn (t)) ein Vektor mit n Komponenten
ist. Das System heißt homogen, falls h(t) = 0 ist, und mit konstanten Koeffizienten,
wenn alle Koeffizientenfunktionen konstant in t sind, d.h., A(t) = A hängt nicht von t
ab.
Beispiel 7.10.
Satz 7.11. Die Lösungsmenge eines linearen homogenen Differentialgleichungssystems
mit n Gleichungen und konstanten Koeffizienten ist ein Vektorraum der Dimension n,
und besitzt somit eine Basis B = {b1 (t), b2 (t), . . . , bn (t)}. Eine solche Basis heißt Fundamentalsystem der Differentialgleichung.
Satz 7.12. (i) Ist λ ∈ R ein Eigenwert von A und v ein zugehöriger Eigenvektor, so
ist b(t) = eλt v eine Lösung von y 0 (t) = Ay(t).
(ii) Ist λ = α+βi ∈ C ein Eigenwert von A und v = a+bi ein zugehöriger Eigenvektor,
dann sind b1 (t) = eαt (cos(βt)a − sin(β)b) und b2 (t) = eαt (cos(βt)a + sin(β)b) zwei
linear unabhängige reelle Lösungen von y 0 (t) = Ay(t).
(iii) Ist A diagonalisierbar, so besitzt die Differentialgleichung y 0 (t) = Ay(t) ein Fundamentalsystem aus Lösungen der Form (i) und (ii).
Beweis.
56
7.2 Systeme linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten
Bemerkung 7.13. Ist ein homogenes Anfangswertproblem y 0 (t) = Ay(t), y(t0 ) = y0 ∈
Rn zu P
lösen, so bestimmt man die Koeffizienten c1 , c2 , . . . cn in der
P Linearkombination
y(t) = nk=1 ck bk (t) durch Lösen des linearen Gleichungssystems nk=1 ck bk (t0 ) = y0 .
Beispiel 7.14.
Bemerkung 7.15 (Variation der Konstanten). Ist eine inhomogene Differentialgleichung y 0 (t) = Ay(t) + h(t) zu lösen, so kann man wie folgt vorgehen,
1. man bestimmt zunächst die allgemeine Lösung yh,c (t) (d.h. ein Fundamentalsystem B = {b1 (t), . . . , bn (t)}) der zugehörigen linearen Differentialgleichung y 0 (t) =
Ay(t),
2. man setzt den Ansatz
yP (t) =
n
X
ck (t)bk (t)
k=1
in die inhomogene Differentialgleichung ein. Das liefert ein lineares Gleichungssystem für die Funktionen c0k (t),
3. dessen Lösung c0 (t) = (c01 (t), c02 (t), . . . , c0n (t)) man mit der Kramer’schen Regel aus
Satz 5.17 berechnen kann.
4. Die Funktionen ck (t) bestimmt
Pn man durch Integration, damit bekommt man die
partikuläre Lösung yp (t) = k=1 ck (t)bk (t).
5. Die allgemeine Lösung der inomogenen Gleichung ist dann y(t) = yh,c (t) + yP (t).
Bemerkung 7.16. Ist ein inhomogenes Anfangswertproblem y 0 (t) = Ay(t) + h(t),
y(t0 ) = y0 ∈ Rn zu lösen, so bestimmt
man die Koeffizienten c1 , c2 , . . . cn in der allgePn
meinen
Lösung y(t) = yP (t) + k=1 ck bk (t) durch Lösen des linearen Gleichungssystems
Pn
c
k=1 k bk (t0 ) = y0 − yP (t0 ).
57
Herunterladen