6.4 Extrema ohne Nebenbedingungen

Werbung
6.4 Extrema ohne Nebenbedingungen
Die Funktion f : D → R, D ⊆ Rn, sei stetig partiell
differenzierbar. Besitzt f in a ∈ D o ein relatives
Extremum, dann gilt:
(Relative (lokale) Extrema) Sei f : D → R, D ⊆
Rn, eine Funktion. Wir sagen, dass f in a ∈ D o
ein relatives Maximum (bzw. relatives Minimum)
hat, wenn es eine Umgebung U von a gibt, so dass
gradf (a) = 0
d.h. fx1 (a) = fx2 (a) = · · · = fxn (a) = 0. Der Punkt
a heißt dann ein stationärer Punkt von f .
f (x) ≤ f (a) (bzw. f (x) ≥ f (a)) für alle x ∈ U
gilt.
Unser Ziel ist es, notwendige Bedingungen für relative Extrema einer
differenzierbaren Funktion finden. Die Verallgemeinerung von “erste Ableitung =
0” ist:
Mathematik I – WiSe 2004/2005
662
und weiße Schokolade (W). Die Kosten, um x Vollmilch und y weiße Schokoladen
zu produzieren, sind in einer imaginären Kakaowährung (Kakao-Euros) gemessen
Lokale Extrema von f sind also unter den Lösungen der n Gleichungen in n
Unbekannten
fx1 (x) = fx2 (x) = · · · = fxn (x) = 0
zu finden (aber nicht jede Lösung ist wirklich ein lokales Extremum von f !).
Beispiel 6.11 Die Firma MILK produziert zwei Sorten Schokolade, Vollmilch (V)
Mathematik I – WiSe 2004/2005
partiellen Ableitungen sind
C(x, y) = 0, 04x2 + 0, 01xy + 0, 01y 2 + 4x + 2y + 500
Wir nehmen an, MILK kann die weiße Schokolade für 15 Kakao-Euros und die
Vollmilchschokolade für 9 Kakao-Euros verkaufen. Wieviel Schokolade sollte
MILK produzieren, um den Profit π zu maximieren?
663
∂π
∂x
= 15 − 0, 08x − 0, 01y − 4
∂π
∂y
= 9 − 0, 01x − 0, 02y − 2
Die Lösung des inhomogenen Gleichungssystems
Die Profitfunktion ist
π(x, y) = 15x + 9y − C(x, y).
Wenn wir als Definitionsbereich D = {(x, y) : x, y > 0} annehmen, müssen
wir lokale Extrema von π finden, also zunächst einmal stationäre Punkte. Die
Mathematik I – WiSe 2004/2005
664
0, 08 0, 01
0, 01 0, 02
11
x
=
7
y
ist
x = 100,
y = 300.
Mathematik I – WiSe 2004/2005
665
Da dies der einzige stationäre Punkt ist, muss er ein Maximum sein, denn für
große Werte von x und y wird die Profitfunkton π negativ. Man kann dies aber
noch anders begründen, indem man folgendes Kriterium benutzt:
den Fall n = 2 wie folgt konkretisieren (machen Sie sich bitte klar, dass dies
unmittelbar aus der obigen allgemeinen Aussage folgt), vgl. R 13.1.10 in
Schwarze, Band 2:
Die Funktion f : D → R, D ⊆ Rn, sei zweimal stetig
partiell differenzierbar. Es sei a ∈ D o ein stationärer
Punkt von f .
Ist die Hesse-Matrix Hf (a) negativ definit (bzw.
positiv definit), so hat f in a ein relatives Maximum
(bzw. Minimum). Ist Hf (a) indefinit, so besitzt f in
a mit Sicherheit kein relatives Extremum. Ist D = D o
und Hf (x) negativ definit (bzw. positiv definit) für
alle x ∈ D, so ist a auch globales Maximum (bzw.
Minimum) in D.
Die Funktion f : D → R, D ⊆ R2, sei zweimal stetig partiell differenzierbar in
a ∈ D o, und es sei a ein stationärer Punkt von f . Gilt für die Determinante der
Hesse-Matrix in a
2
det Hf (a) = fxx (a) · fyy (a) − fxy
(a) > 0 ,
dann besitzt f in a ein relatives Extremum, und zwar ein Maximum, falls
fxx(a) < 0,
und ein Minimum, falls
fxx(a) > 0.
Mit Hilfe unseres Determinantenkriteriums für Definitheit kann man dies für
Mathematik I – WiSe 2004/2005
666
Gilt det Hf (a) < 0, so liegt kein Extremum vor. Bei det Hf (a) = 0 ist keine
Aussage möglich.
Beispiel 6.12 In unserem Beispiel 6.11 ist die Hesse-Matrix
Mathematik I – WiSe 2004/2005
667
partiellen Ableitungen:
∂f
= 2xy + y 2,
∂x
∂f
= x2 + 2xy + y 2 − 4
∂y
Setze beide partiellen Ableitungen = 0:
Hπ
100
300
=
−0, 08 −0, 01
−0, 01 −0, 02
2xy + y 2 = 0
2
x + 2xy + y 2 − 4 = 0
negativ definit, wir haben also ein Maximum!
Beispiel 6.13 Wir untersuchen
1
f (x, y) = x2y + xy 2 + y 3 − 4y
3
auf Extrema. Wir bestimmen zunächst die stationären Punkte und dazu die
Mathematik I – WiSe 2004/2005
668
Einsetzen der ersten in die zweite Gleichung liefert x2 − 4 = 0, also x = ±2.
Für x = 2 gilt 4y + y 2 = 0, also y = 0 oder y = −4. Für x = −2 ergibt sich
−4y + y 2 = 0, also y = 0 oder y = 4. Es gibt also vier stationäre Punkte:
−2
−2
2
2
, a4 =
, a3 =
, a2 =
a1 =
4
0
−4
0
Mathematik I – WiSe 2004/2005
669
Die Hesse-Matrix ist
0.16
0.14
2y
x
=
Hf
2x + 2y
y
2x + 2y
2x + 2y
0.12
10.65
0.1
0.08
10.6
0.06
also
0.04
0 4
4 4
−8 −4
Hf (a2) =
−4
−4
0 −4
Hf (a3) =
−4 −4
8 4
Hf (a4) =
4 4
Die folgenden vier Bilder skizzieren
Umgebung von ai:
Hf (a1) =
10.55
0.02
kein Extremum, weil indefinit
1.9
0
10.5
1.95
–0.02
2
–0.2
2.1
Maximum, weil negativ definit
–0.1
2.05
x
–4.2
0.1
1.95
–4
y
y
1.9
kein Extremum, weil indefinit
x
2.05
–4.1
0
2
–3.9
–3.8
2.1
Umgebungen von a1 und a2
Minimum, weil positiv definit
diese vier Stellen, jeweils in einer kleinen
Mathematik I – WiSe 2004/2005
670
Mathematik I – WiSe 2004/2005
671
6.5 Extrema unter Nebenbedingungen
–10.58
0.02
0
Ziel:
Bestimme Extrema der Funktion z = f (x1, . . . , xn) unter den
Nebenbedingungen
–10.6
–0.02
–0.04
–10.62
–0.06
–0.08
–10.64
g1(x1, . . . , xn) = 0
g2(x1, . . . , xn) = 0
.........
gm(x1, . . . , xn) = 0
–0.1
–0.12
–10.66
–0.14
–0.16
–0.2
–0.1
–1.9
4
0
–1.95
–2
x
0.1
–2.05
y
y
–1.9
–1.95
–2.05
–2
–2.1
x
–2.1
Lassen sich die Bedingungen
Umgebungen von a3 und a4
gj (x1, . . . , xn) = 0, j = 1, 2, . . . , m ,
Mathematik I – WiSe 2004/2005
672
nach m der Variablen auflösen, etwa nach x1, . . . , xm, dann gilt:
x1
x2
xm
Mathematik I – WiSe 2004/2005
Wir lösen die Nebenbedingung nach l auf und erhalten
=
=
ϕ1(xm+1, xm+2, . . . , xn)
ϕ2(xm+1, xm+2, . . . , xn)
.........
= ϕm(xm+1, xm+2, . . . , xn)
l=
Für
G
2a
Beispiel 6.14 (Schwarze Band 2, 13.3.1(b)) Ziel: Stelle quaderförmige
Blechschachteln (Länge l, Breite b und Höhe h) vorgegebenen Gewichts G
und größtem Volumen her. Ein cm2 Blech wiege a Gramm. Wir erhalten so das
Problem
maximiere V (l, b, h) = l · b · h
unter G = 2 · a · (l · b + l · h + b · h)
Mathematik I – WiSe 2004/2005
674
wir die ersten partiellen Ableitungen:
G
2a
− bh
b+h
setzen wir A. Einsetzen in V liefert dann
Einsetzen in f (x1, x2, . . . , xn) liefert eine Funktion Φ(xm+1, xm+2, . . . , xn), deren
Extrema dann gesucht werden.
V (b, h) =
A − bh
Abh − b2h2
bh =
b+h
b+h
Beachte dass V eine Funktion in den Variablen b und h ist. Die Variable l haben
wir eliminiert.
Von dieser Funktion müssen wir nun ein Maximnum bestimmen. Dazu bestimmen
Mathematik I – WiSe 2004/2005
675
ebenfalls nicht sinnvoll sind, gilt
∂V
∂b
=
h2(A − b2 − 2bh)
(b + h)2
∂V
∂h
=
b2(A − h2 − 2bh)
(b + h)2
676
r
A
.
3
q
Man rechnet leicht nach, dass dann auch l = A3 . Unser Volumen hat also für
den Würfel einen Extremwert. Weil dies das einzige Extremum ist, kann man
sich leicht klarmachen, dass es ein Maximum sein muss, denn sicherlich muss das
Volumen irgendwo maximiert werden. Wenn dies nicht für den Würfel passiert,
müsste es ja einen anderen stationären Punkt geben, was aber nicht der Fall ist.
Alternativ können Sie auch die Hessematrix bestimmen:


2
2
2 2
b=h=
Wir müssen nun b und h so bestimmen, dass beide partiellen Ableitungen 0 sind.
Das wäre für b = h = 0 der Fall, was aber offensichtlich keine sinnvolle Lösung
für unser Optimierungsproblem ist. Wir erhalten b = ±h. Weil negative Lösungen
Mathematik I – WiSe 2004/2005
673

H=
Mathematik I – WiSe 2004/2005
−2h (h +A)
(b+h)3
−2bh(−A+b2 +3bh+h2)
(b+h)3
−2bh(−A+b +3bh+h )
(b+h)3

−2b2 (b2 +A)
(b+h)3

677
Die Hessematrix H = (hi,j ) ist negativ definit für b = h =
√
3A
<0
h1,1 = −
3
A
det(H) =
>0
4
Die λj , j = 1, . . . , m, heißen Lagrange-Multiplikatoren.
p
A/3, denn
Ferner definieren wir die Jacobi-Matrix J der gi an der Stelle a:
Der Würfel maximiert also in der Tat das Volumen.
Jg (a) =
In vielen Fällen ist es nicht möglich, die Gleichungsrestriktionen aufzulösen. Um
auch diesen Fall zu behandeln, definieren wir zunächst die Lagrange-Funktion:
L(x; λ) = L(x1, . . . , xn; λ1, . . . , λm)
m
P
λj · gj (x1, . . . , xn)
= f (x1, . . . , xn) +
678
j=1,...,m; k=1,...,n
Die Matrix J ist eine m × n Matrix. Man kann Sie als Ableitung von (g1, . . . , gm)
an der Stelle a ∈ Rn auffassen.
Mathematik I – WiSe 2004/2005
679
Beachte, dass die partiellen Ableitungen
Seien f : D → R und gj : D → R, j = 1, 2, . . . , m,
D ⊆ Rn, stetig partiell differenzierbare Funktionen.
Die Funktion f habe an der Stelle a ∈ D o (dem
Innern von D) ein relatives Extremum unter den
Nebenbedingungen gj (a) = 0, j = 1, . . . , m, und die
Jacobi-Matrix Jg (a) habe den Rang m. Dann gibt
es λ∗ = (λ∗1 , . . . , λ∗m) ∈ Rm, so dass für i = 1, . . . , n
gilt:
Lxi (a, λ∗) =
∂gj
(a)
∂xk
Wir erhalten folgende notwendige Bedingung für Extrempunkte:
j=1
Mathematik I – WiSe 2004/2005
∂L
= gj
∂λj
gerade die Gleichungsrestriktionen sind. Wenn wir also die partielle Ableitung der
Lagrangefunktion L nach λi gleich 0 setzen, ist das gleichbedeutend damit, gi
gleich 0 zu setzen. Wir können also sagen, dass die Lagrange-Funktion L(x, λ)
an der Stelle (a, λ0) einen stationären Punkt hat.
Um potentielle relative Extrema für f in der obigen Situation zu finden, werden
also n + m Gleichungen für die n + m Unbekannten x1, . . . , xn, λ1, . . . , λm gelöst,
um stationäre Punkte der Lagrange-Funktion zu finden.
m
X
∂f
∂gj
(a) +
(a) = 0 .
λ∗j
∂xi
∂x
i
j=1
Beispiel 6.15 Wir wollen
f (x1, x2, x3, x4) = x21 + x22 + x23 + x24
Mathematik I – WiSe 2004/2005
680
unter den Nebenbedingungen
Mathematik I – WiSe 2004/2005
681
Die Lagrangefunktion ist
x1 + x 2 = 2
x2 + x 3 + x 4 = 4
L(x1, x2, x3, x4, λ1, λ2) = x21 + x22 + x23 + x24 +
minimieren. Die beiden Funktionen g1 und g2 sind also
+λ1(2 − x1 − x2) +
g1 = 2 − x 1 − x 2
+λ2(4 − x2 − x3 − x4).
g2 = 4 − x 2 − x 3 − x 4
und bestimmen die Nebenbedingungen
g1 = 0,
g2 = 0.
Mathematik I – WiSe 2004/2005
Um stationäre Punkte zu finden, müssen wir die partiellen Ableitungen bilden und
682
diese 0 setzen:
Mathematik I – WiSe 2004/2005
Gleichungssystem
Lx 1
Lx 2
Lx 3
Lx 4
L λ1
L λ2

   
2
0
0
0 −1 0
x1
0
0
   
2
0
0 −1 −1 

  x2   0 
0
   
0
2
0
0 −1 

  x3  =  0 
0
   
0
0
2
0 −1 

  x4   0 
−1 −1 0
0
0
0  λ1 −2
0 −1 −1 −1 0
0
λ2
−4
= 2x1 − λ1
= 2x2 − λ1 − λ2
= 2x3 − λ2
= 2x4 − λ2
= 2 − x 1 − x2
= 4 − x 2 − x3 − x4
mit der eindeutigen Lösung
x1 = 0, 4;
Beachte dass die letzten beiden Gleichungen nichts anderes als unsere
Gleichungsrestriktionen g1 = 0 und g2 = 0 sind. Das liefert das inhomogene
Mathematik I – WiSe 2004/2005
683
684
Mathematik I – WiSe 2004/2005
x2 = 1, 6; x3 = x4 = 1, 2;
λ1 = 0, 8; λ2 = 2, 4
685
Beachte, dass die Nebenbedingungen hier nur eine vornehme Art sind, (1−x 1)3 =
0 auszudrücken. Wir haben also ein Minimum an der Stelle x1 = 1 (dem einzigen
Punkt, der beide Gleichungsrestriktionen erfüllt). Die Lagrangefunktion lautet
Die Jacobimatrix ist (unabhängig von a)
J=
−1 −1 0
0
0 −1 −1 −1
L(x1, x2, λ1, λ2) = −x1 + λ1(x2 − (1 − x1)3) − λ2(x2 + (1 − x1)3)
hat also den Rang 2.
Bevor wir nun zu hinreichenden Bedingungen kommen, ein Wort zu der Bedingung,
dass die Jacobi-Matrix vollen Rang hat. Diese Bedingung wird beispielsweise in
Schwarze unterschlagen:
An der Stelle x1 = 1, x2 = 0 haben wir aber keinen stationären Punkt, weil
∂L 1
= −1.
∂x1 0
Beispiel 6.16 Wir betrachten das Problem
In diesem Fall hat die Jacobi-Matrix
minimiere − x1
unter x2 − (1 − x1)3 = 0
−x2 − (1 − x1)3 = 0
Mathematik I – WiSe 2004/2005
Jg
686
nicht den Rang 2.
Nun zu den hinreichenden Bedingungen: Ist (a, λ∗) ein stationärer Punkt der
Lagrange-Funktion, dann betrachten wir die Hesse-Matrix von L nach den
Variablen x1, . . . , xn für λ∗. Bezeichne diese Hesse-Matrix mit Ĥ:

ĤL(x; λ ) = 
∗

Lx1xn (x; λ∗)
..

Lxnxn (x; λ∗)
Lx1x1 (x; λ∗) · · ·
..
...
Lxnx1 (x; λ∗) · · ·
Mathematik I – WiSe 2004/2005
688
2
0
ĤL = 
0
0
0
2
0
0
0
0
2
0
Mathematik I – WiSe 2004/2005
687
Hinreichende Bedingung
Es seien f : D → R und gj : D → R, D ⊆ Rn,
zweimal stetig partiell differenzierbare Funktionen.
Die zugehörige Lagrange-Funktion L(x; λ) habe an
der Stelle (a; λ∗), a ∈ D o, einen stationären Punkt.
Ist ĤL(a; λ∗) positiv definit (negativ definit), so
ist a ein relatives Minimum (Maximum) unter den
Nebenbedingungen gj (a) = 0 für j = 1, 2, . . . , m.
Ist ĤL(x; λ∗) sogar positiv definit (negativ definit)
für alle x ∈ D, so ist a ein globales Minimum
(Maximum) unter den Nebenbedingungen gj (a) = 0
für j = 1, 2, . . . , m.
Mathematik I – WiSe 2004/2005
689
unter den Restriktionen
Beispiel 6.17 In Beispiel 6.15 ist die Matrix Ĥ unabhängig von a und λ:

1
0 1
=
0
0 −1

0
0

0
2
x + 2y + z
= 1
2x − y − 3z
= 4
bestimmen. Die Lagrangefunktion L ist
ist positiv definit, wir haben also ein Minimum.
Beispiel 6.18 Wir wollen Extrema der Funktion
L(x, y, z, λ1, λ2) = x2 + y 2 + z 2 +
+λ1(−x − 2y − z + 1) +
f (x, y, z) = x2 + y 2 + z 2
Mathematik I – WiSe 2004/2005
+λ2(−2x + y + 3z + 4)
690
Die partiellen Ableitungen sind
Lz
L λ1
L λ2
691
Wenn wir dies in die dritte Gleichung einsetzen bekommen wir
x − y + z = 0.
Lx = 2x − λ1 − 2λ2
Ly
Mathematik I – WiSe 2004/2005
Diese Gleichung zusammen mit den letzten beiden Gleichungen liefert das
inhomogene Gleichungssystem

    
1 −1 1
x
0
1 2
1  · y  = 1
2 −1 −3
z
4
= 2y − 2λ1 + λ2
= 2z − λ1 + 3λ2
= −x − 2y − z + 1
= −2x + y + 3z + 4
mit der Lösung
Alle diese Ableitungen sollen gleich Null sein. Die ersten beiden Gleichungen
zeigen dann
4
2
λ1 = x + y,
5
5
Mathematik I – WiSe 2004/2005
4
2
λ2 = x − y
5
5
692
x0 =
Die Multiplikatoren sind
Mathematik I – WiSe 2004/2005
16
,
15
1
y0 = ,
3
λ1 =
52
,
75
z0 = −
λ2 =
11
15
54
75
693
Angenommen, x∗ löst dieses Problem. Dann ist x∗ in der Regel eine Funktion
abhängig von c, z.B. x∗(c). Auch der zugehörige Lagrange-Multiplikator λ ist
eine Funktion von c, also λ(c). Das Optimum von f ist
Die zugehörige Hessematrix Ĥ ist


2 0 0
0 2 0 
0 0 2
f (x∗(c)) = f ∗(c),
also positiv definit. Deshalb haben wir an der Stelle (x0, y0, z0) ein Minimum!
also eine Funktion abhängig von c. Unter geeigneten Annahmen (auf die wir hier
nicht eingehen) kann man zeigen
Lagrangemultiplikatoren haben eine wichtige ökonomische Interpretation. Wir
erläutern dies an einem Beispiel mit nur einer Gleichungsrestriktion. Für den
allgemeinen Fall verweisen wir auf die Literatur.
Unser Ziel ist
Das heißt, der Lagrangemultiplikator ist ein Maß, wie sich das Maximum f ∗(c)
relativ zu c ändert. Bezeichnet f etwa den Profit, die Restriktion g(x) = c die
Verfügbarkeit einer knappen Ressource, dann ist λ(c) ein Maß dafür, wie sich der
Profit relativ zu einer Änderung der knappen Ressource ändert.
max f (x)
unter der Restriktion
g(x) = c.
Mathematik I – WiSe 2004/2005
df ∗(c)
= λ(c).
dc
694
Mathematik I – WiSe 2004/2005
695
Wir erläutern dies an einem Beispiel:
unter der Restriktion
Beispiel 6.19 Die Firma AUD benutzt als Input K (Kapital; damit sind
insbesondere Maschinen gemeint) und W (Arbeit), um ein Auto zu produzieren.
Um ein Auto zu produzieren müssen insgesamt
Die Lagrangefunktion ist
Q = K 1/2W 1/4.
L(K, W, λ) = rK + wW + λ(K 1/2W 1/4 − Q).
Q = F (K, W ) = K 1/2W 1/4
Partielle Ableitung nach K und W sind
Produktionsmittel eingesetzt werden; d.h. die Firma hat eine gewisse Freiheit,
wieviel Kapital und wieviel Arbeit sie einsetzt. Kapital ist hier wertvoller als Arbeit:
Wenn Sie den Kapitaleinsatz verdoppeln, können Sie den Arbeitseinsatz um den
Faktor 4 verringern. Kapital und Arbeit konkurrieren: Sowohl das Kapital kostet
Geld (Zinsen, Refinanzierung) als auch Arbeit (was jedem klar ist). Die Kosten
fürs Kapital seien r, die für Arbeit w. Wir erhalten das Optimierungsproblem
1
∂L
= r − λK −1/2 W 1/4
∂K
2
Beide partiellen Ableitungen sollen 0 sein, also
1
r = λK −1/2 W 1/4,
2
min rK + wW
Mathematik I – WiSe 2004/2005
696
Auflösen nach λ gibt
1
w = λK 1/2W 3/4
4
Mathematik I – WiSe 2004/2005
697
Einfache Umformungen liefern als Lösung des Lagrangeproblems
K ∗ = 21/3r −1/3w1/3Q4/3
λ = 2rK 1/2W −1/4 = 4wK −1/2 W 3/4
W ∗ = 2−2/3r 2/3w−2/3Q4/3
λ∗ = 24/3r 2/3w1/3Q1/3
also
2rK = 4wW,
C ∗ = 3 · 2−2/3 r 2/3w1/3Q4/3
rK
.
also W =
2w
Die Matrix Ĥ ist

Wir setzen dies in die Restriktion Q = K 1/2W 1/4 ein und erhalten
K 3/4 = Q
r
4
∗
− 81 K 1/2λW 3/4
3 λK 1/2
16 W 3/4



Der (1,1)-Eintrag dieser Matrix ist offenbar > 0. Die Determinante erhält man
698
nach einigem Rechnen als
det(Ĥ) =
1 λ∗ W 1/4
 4 K 3/2
Ĥ = 
∗
− 18 K 1/2λW 3/4
2w
r
Mathematik I – WiSe 2004/2005
1 λ2
32 KL3/2
sie ist also auch > 0 und somit ist die Matrix positiv definit, wir haben also ein
Minimum. Man rechnet leicht nach, das
dC ∗
= 24/3r 2/3w1/3Q1/3 = λ∗.
dQ
Mathematik I – WiSe 2004/2005
∂L
1
= w − λK −1/2 W −3/4
∂W
4
700
Mathematik I – WiSe 2004/2005
699
Herunterladen