6.4 Extrema ohne Nebenbedingungen

6.4 Extrema ohne Nebenbedingungen
Die Funktion f : D → R, D ⊆ Rn, sei stetig partiell
differenzierbar. Besitzt f in a ∈ D o ein relatives
Extremum, dann gilt:
(Relative (lokale) Extrema) Sei f : D → R, D ⊆
Rn, eine Funktion. Wir sagen, dass f in a ∈ D o
ein relatives Maximum (bzw. relatives Minimum)
hat, wenn es eine Umgebung U von a gibt, so dass
gradf (a) = 0
d.h. fx1 (a) = fx2 (a) = · · · = fxn (a) = 0. Der Punkt
a heißt dann ein stationärer Punkt von f .
f (x) ≤ f (a) (bzw. f (x) ≥ f (a)) für alle x ∈ U
gilt.
Unser Ziel ist es, notwendige Bedingungen für relative Extrema einer
differenzierbaren Funktion finden. Die Verallgemeinerung von “erste Ableitung =
0” ist:
Mathematik I – WiSe 2004/2005
662
und weiße Schokolade (W). Die Kosten, um x Vollmilch und y weiße Schokoladen
zu produzieren, sind in einer imaginären Kakaowährung (Kakao-Euros) gemessen
Lokale Extrema von f sind also unter den Lösungen der n Gleichungen in n
Unbekannten
fx1 (x) = fx2 (x) = · · · = fxn (x) = 0
zu finden (aber nicht jede Lösung ist wirklich ein lokales Extremum von f !).
Beispiel 6.11 Die Firma MILK produziert zwei Sorten Schokolade, Vollmilch (V)
Mathematik I – WiSe 2004/2005
partiellen Ableitungen sind
C(x, y) = 0, 04x2 + 0, 01xy + 0, 01y 2 + 4x + 2y + 500
Wir nehmen an, MILK kann die weiße Schokolade für 15 Kakao-Euros und die
Vollmilchschokolade für 9 Kakao-Euros verkaufen. Wieviel Schokolade sollte
MILK produzieren, um den Profit π zu maximieren?
663
∂π
∂x
= 15 − 0, 08x − 0, 01y − 4
∂π
∂y
= 9 − 0, 01x − 0, 02y − 2
Die Lösung des inhomogenen Gleichungssystems
Die Profitfunktion ist
π(x, y) = 15x + 9y − C(x, y).
Wenn wir als Definitionsbereich D = {(x, y) : x, y > 0} annehmen, müssen
wir lokale Extrema von π finden, also zunächst einmal stationäre Punkte. Die
Mathematik I – WiSe 2004/2005
664
0, 08 0, 01
0, 01 0, 02
11
x
=
7
y
ist
x = 100,
y = 300.
Mathematik I – WiSe 2004/2005
665
Da dies der einzige stationäre Punkt ist, muss er ein Maximum sein, denn für
große Werte von x und y wird die Profitfunkton π negativ. Man kann dies aber
noch anders begründen, indem man folgendes Kriterium benutzt:
den Fall n = 2 wie folgt konkretisieren (machen Sie sich bitte klar, dass dies
unmittelbar aus der obigen allgemeinen Aussage folgt), vgl. R 13.1.10 in
Schwarze, Band 2:
Die Funktion f : D → R, D ⊆ Rn, sei zweimal stetig
partiell differenzierbar. Es sei a ∈ D o ein stationärer
Punkt von f .
Ist die Hesse-Matrix Hf (a) negativ definit (bzw.
positiv definit), so hat f in a ein relatives Maximum
(bzw. Minimum). Ist Hf (a) indefinit, so besitzt f in
a mit Sicherheit kein relatives Extremum. Ist D = D o
und Hf (x) negativ definit (bzw. positiv definit) für
alle x ∈ D, so ist a auch globales Maximum (bzw.
Minimum) in D.
Die Funktion f : D → R, D ⊆ R2, sei zweimal stetig partiell differenzierbar in
a ∈ D o, und es sei a ein stationärer Punkt von f . Gilt für die Determinante der
Hesse-Matrix in a
2
det Hf (a) = fxx (a) · fyy (a) − fxy
(a) > 0 ,
dann besitzt f in a ein relatives Extremum, und zwar ein Maximum, falls
fxx(a) < 0,
und ein Minimum, falls
fxx(a) > 0.
Mit Hilfe unseres Determinantenkriteriums für Definitheit kann man dies für
Mathematik I – WiSe 2004/2005
666
Gilt det Hf (a) < 0, so liegt kein Extremum vor. Bei det Hf (a) = 0 ist keine
Aussage möglich.
Beispiel 6.12 In unserem Beispiel 6.11 ist die Hesse-Matrix
Mathematik I – WiSe 2004/2005
667
partiellen Ableitungen:
∂f
= 2xy + y 2,
∂x
∂f
= x2 + 2xy + y 2 − 4
∂y
Setze beide partiellen Ableitungen = 0:
Hπ
100
300
=
−0, 08 −0, 01
−0, 01 −0, 02
2xy + y 2 = 0
2
x + 2xy + y 2 − 4 = 0
negativ definit, wir haben also ein Maximum!
Beispiel 6.13 Wir untersuchen
1
f (x, y) = x2y + xy 2 + y 3 − 4y
3
auf Extrema. Wir bestimmen zunächst die stationären Punkte und dazu die
Mathematik I – WiSe 2004/2005
668
Einsetzen der ersten in die zweite Gleichung liefert x2 − 4 = 0, also x = ±2.
Für x = 2 gilt 4y + y 2 = 0, also y = 0 oder y = −4. Für x = −2 ergibt sich
−4y + y 2 = 0, also y = 0 oder y = 4. Es gibt also vier stationäre Punkte:
−2
−2
2
2
, a4 =
, a3 =
, a2 =
a1 =
4
0
−4
0
Mathematik I – WiSe 2004/2005
669
Die Hesse-Matrix ist
0.16
0.14
2y
x
=
Hf
2x + 2y
y
2x + 2y
2x + 2y
0.12
10.65
0.1
0.08
10.6
0.06
also
0.04
0 4
4 4
−8 −4
Hf (a2) =
−4
−4
0 −4
Hf (a3) =
−4 −4
8 4
Hf (a4) =
4 4
Die folgenden vier Bilder skizzieren
Umgebung von ai:
Hf (a1) =
10.55
0.02
kein Extremum, weil indefinit
1.9
0
10.5
1.95
–0.02
2
–0.2
2.1
Maximum, weil negativ definit
–0.1
2.05
x
–4.2
0.1
1.95
–4
y
y
1.9
kein Extremum, weil indefinit
x
2.05
–4.1
0
2
–3.9
–3.8
2.1
Umgebungen von a1 und a2
Minimum, weil positiv definit
diese vier Stellen, jeweils in einer kleinen
Mathematik I – WiSe 2004/2005
670
Mathematik I – WiSe 2004/2005
671
6.5 Extrema unter Nebenbedingungen
–10.58
0.02
0
Ziel:
Bestimme Extrema der Funktion z = f (x1, . . . , xn) unter den
Nebenbedingungen
–10.6
–0.02
–0.04
–10.62
–0.06
–0.08
–10.64
g1(x1, . . . , xn) = 0
g2(x1, . . . , xn) = 0
.........
gm(x1, . . . , xn) = 0
–0.1
–0.12
–10.66
–0.14
–0.16
–0.2
–0.1
–1.9
4
0
–1.95
–2
x
0.1
–2.05
y
y
–1.9
–1.95
–2.05
–2
–2.1
x
–2.1
Lassen sich die Bedingungen
Umgebungen von a3 und a4
gj (x1, . . . , xn) = 0, j = 1, 2, . . . , m ,
Mathematik I – WiSe 2004/2005
672
nach m der Variablen auflösen, etwa nach x1, . . . , xm, dann gilt:
x1
x2
xm
Mathematik I – WiSe 2004/2005
Wir lösen die Nebenbedingung nach l auf und erhalten
=
=
ϕ1(xm+1, xm+2, . . . , xn)
ϕ2(xm+1, xm+2, . . . , xn)
.........
= ϕm(xm+1, xm+2, . . . , xn)
l=
Für
G
2a
Beispiel 6.14 (Schwarze Band 2, 13.3.1(b)) Ziel: Stelle quaderförmige
Blechschachteln (Länge l, Breite b und Höhe h) vorgegebenen Gewichts G
und größtem Volumen her. Ein cm2 Blech wiege a Gramm. Wir erhalten so das
Problem
maximiere V (l, b, h) = l · b · h
unter G = 2 · a · (l · b + l · h + b · h)
Mathematik I – WiSe 2004/2005
674
wir die ersten partiellen Ableitungen:
G
2a
− bh
b+h
setzen wir A. Einsetzen in V liefert dann
Einsetzen in f (x1, x2, . . . , xn) liefert eine Funktion Φ(xm+1, xm+2, . . . , xn), deren
Extrema dann gesucht werden.
V (b, h) =
A − bh
Abh − b2h2
bh =
b+h
b+h
Beachte dass V eine Funktion in den Variablen b und h ist. Die Variable l haben
wir eliminiert.
Von dieser Funktion müssen wir nun ein Maximnum bestimmen. Dazu bestimmen
Mathematik I – WiSe 2004/2005
675
ebenfalls nicht sinnvoll sind, gilt
∂V
∂b
=
h2(A − b2 − 2bh)
(b + h)2
∂V
∂h
=
b2(A − h2 − 2bh)
(b + h)2
676
r
A
.
3
q
Man rechnet leicht nach, dass dann auch l = A3 . Unser Volumen hat also für
den Würfel einen Extremwert. Weil dies das einzige Extremum ist, kann man
sich leicht klarmachen, dass es ein Maximum sein muss, denn sicherlich muss das
Volumen irgendwo maximiert werden. Wenn dies nicht für den Würfel passiert,
müsste es ja einen anderen stationären Punkt geben, was aber nicht der Fall ist.
Alternativ können Sie auch die Hessematrix bestimmen:


2
2
2 2
b=h=
Wir müssen nun b und h so bestimmen, dass beide partiellen Ableitungen 0 sind.
Das wäre für b = h = 0 der Fall, was aber offensichtlich keine sinnvolle Lösung
für unser Optimierungsproblem ist. Wir erhalten b = ±h. Weil negative Lösungen
Mathematik I – WiSe 2004/2005
673

H=
Mathematik I – WiSe 2004/2005
−2h (h +A)
(b+h)3
−2bh(−A+b2 +3bh+h2)
(b+h)3
−2bh(−A+b +3bh+h )
(b+h)3

−2b2 (b2 +A)
(b+h)3

677
Die Hessematrix H = (hi,j ) ist negativ definit für b = h =
√
3A
<0
h1,1 = −
3
A
det(H) =
>0
4
Die λj , j = 1, . . . , m, heißen Lagrange-Multiplikatoren.
p
A/3, denn
Ferner definieren wir die Jacobi-Matrix J der gi an der Stelle a:
Der Würfel maximiert also in der Tat das Volumen.
Jg (a) =
In vielen Fällen ist es nicht möglich, die Gleichungsrestriktionen aufzulösen. Um
auch diesen Fall zu behandeln, definieren wir zunächst die Lagrange-Funktion:
L(x; λ) = L(x1, . . . , xn; λ1, . . . , λm)
m
P
λj · gj (x1, . . . , xn)
= f (x1, . . . , xn) +
678
j=1,...,m; k=1,...,n
Die Matrix J ist eine m × n Matrix. Man kann Sie als Ableitung von (g1, . . . , gm)
an der Stelle a ∈ Rn auffassen.
Mathematik I – WiSe 2004/2005
679
Beachte, dass die partiellen Ableitungen
Seien f : D → R und gj : D → R, j = 1, 2, . . . , m,
D ⊆ Rn, stetig partiell differenzierbare Funktionen.
Die Funktion f habe an der Stelle a ∈ D o (dem
Innern von D) ein relatives Extremum unter den
Nebenbedingungen gj (a) = 0, j = 1, . . . , m, und die
Jacobi-Matrix Jg (a) habe den Rang m. Dann gibt
es λ∗ = (λ∗1 , . . . , λ∗m) ∈ Rm, so dass für i = 1, . . . , n
gilt:
Lxi (a, λ∗) =
∂gj
(a)
∂xk
Wir erhalten folgende notwendige Bedingung für Extrempunkte:
j=1
Mathematik I – WiSe 2004/2005
∂L
= gj
∂λj
gerade die Gleichungsrestriktionen sind. Wenn wir also die partielle Ableitung der
Lagrangefunktion L nach λi gleich 0 setzen, ist das gleichbedeutend damit, gi
gleich 0 zu setzen. Wir können also sagen, dass die Lagrange-Funktion L(x, λ)
an der Stelle (a, λ0) einen stationären Punkt hat.
Um potentielle relative Extrema für f in der obigen Situation zu finden, werden
also n + m Gleichungen für die n + m Unbekannten x1, . . . , xn, λ1, . . . , λm gelöst,
um stationäre Punkte der Lagrange-Funktion zu finden.
m
X
∂f
∂gj
(a) +
(a) = 0 .
λ∗j
∂xi
∂x
i
j=1
Beispiel 6.15 Wir wollen
f (x1, x2, x3, x4) = x21 + x22 + x23 + x24
Mathematik I – WiSe 2004/2005
680
unter den Nebenbedingungen
Mathematik I – WiSe 2004/2005
681
Die Lagrangefunktion ist
x1 + x 2 = 2
x2 + x 3 + x 4 = 4
L(x1, x2, x3, x4, λ1, λ2) = x21 + x22 + x23 + x24 +
minimieren. Die beiden Funktionen g1 und g2 sind also
+λ1(2 − x1 − x2) +
g1 = 2 − x 1 − x 2
+λ2(4 − x2 − x3 − x4).
g2 = 4 − x 2 − x 3 − x 4
und bestimmen die Nebenbedingungen
g1 = 0,
g2 = 0.
Mathematik I – WiSe 2004/2005
Um stationäre Punkte zu finden, müssen wir die partiellen Ableitungen bilden und
682
diese 0 setzen:
Mathematik I – WiSe 2004/2005
Gleichungssystem
Lx 1
Lx 2
Lx 3
Lx 4
L λ1
L λ2

   
2
0
0
0 −1 0
x1
0
0
   
2
0
0 −1 −1 

  x2   0 
0
   
0
2
0
0 −1 

  x3  =  0 
0
   
0
0
2
0 −1 

  x4   0 
−1 −1 0
0
0
0  λ1 −2
0 −1 −1 −1 0
0
λ2
−4
= 2x1 − λ1
= 2x2 − λ1 − λ2
= 2x3 − λ2
= 2x4 − λ2
= 2 − x 1 − x2
= 4 − x 2 − x3 − x4
mit der eindeutigen Lösung
x1 = 0, 4;
Beachte dass die letzten beiden Gleichungen nichts anderes als unsere
Gleichungsrestriktionen g1 = 0 und g2 = 0 sind. Das liefert das inhomogene
Mathematik I – WiSe 2004/2005
683
684
Mathematik I – WiSe 2004/2005
x2 = 1, 6; x3 = x4 = 1, 2;
λ1 = 0, 8; λ2 = 2, 4
685
Beachte, dass die Nebenbedingungen hier nur eine vornehme Art sind, (1−x 1)3 =
0 auszudrücken. Wir haben also ein Minimum an der Stelle x1 = 1 (dem einzigen
Punkt, der beide Gleichungsrestriktionen erfüllt). Die Lagrangefunktion lautet
Die Jacobimatrix ist (unabhängig von a)
J=
−1 −1 0
0
0 −1 −1 −1
L(x1, x2, λ1, λ2) = −x1 + λ1(x2 − (1 − x1)3) − λ2(x2 + (1 − x1)3)
hat also den Rang 2.
Bevor wir nun zu hinreichenden Bedingungen kommen, ein Wort zu der Bedingung,
dass die Jacobi-Matrix vollen Rang hat. Diese Bedingung wird beispielsweise in
Schwarze unterschlagen:
An der Stelle x1 = 1, x2 = 0 haben wir aber keinen stationären Punkt, weil
∂L 1
= −1.
∂x1 0
Beispiel 6.16 Wir betrachten das Problem
In diesem Fall hat die Jacobi-Matrix
minimiere − x1
unter x2 − (1 − x1)3 = 0
−x2 − (1 − x1)3 = 0
Mathematik I – WiSe 2004/2005
Jg
686
nicht den Rang 2.
Nun zu den hinreichenden Bedingungen: Ist (a, λ∗) ein stationärer Punkt der
Lagrange-Funktion, dann betrachten wir die Hesse-Matrix von L nach den
Variablen x1, . . . , xn für λ∗. Bezeichne diese Hesse-Matrix mit Ĥ:

ĤL(x; λ ) = 
∗

Lx1xn (x; λ∗)
..

Lxnxn (x; λ∗)
Lx1x1 (x; λ∗) · · ·
..
...
Lxnx1 (x; λ∗) · · ·
Mathematik I – WiSe 2004/2005
688
2
0
ĤL = 
0
0
0
2
0
0
0
0
2
0
Mathematik I – WiSe 2004/2005
687
Hinreichende Bedingung
Es seien f : D → R und gj : D → R, D ⊆ Rn,
zweimal stetig partiell differenzierbare Funktionen.
Die zugehörige Lagrange-Funktion L(x; λ) habe an
der Stelle (a; λ∗), a ∈ D o, einen stationären Punkt.
Ist ĤL(a; λ∗) positiv definit (negativ definit), so
ist a ein relatives Minimum (Maximum) unter den
Nebenbedingungen gj (a) = 0 für j = 1, 2, . . . , m.
Ist ĤL(x; λ∗) sogar positiv definit (negativ definit)
für alle x ∈ D, so ist a ein globales Minimum
(Maximum) unter den Nebenbedingungen gj (a) = 0
für j = 1, 2, . . . , m.
Mathematik I – WiSe 2004/2005
689
unter den Restriktionen
Beispiel 6.17 In Beispiel 6.15 ist die Matrix Ĥ unabhängig von a und λ:

1
0 1
=
0
0 −1

0
0

0
2
x + 2y + z
= 1
2x − y − 3z
= 4
bestimmen. Die Lagrangefunktion L ist
ist positiv definit, wir haben also ein Minimum.
Beispiel 6.18 Wir wollen Extrema der Funktion
L(x, y, z, λ1, λ2) = x2 + y 2 + z 2 +
+λ1(−x − 2y − z + 1) +
f (x, y, z) = x2 + y 2 + z 2
Mathematik I – WiSe 2004/2005
+λ2(−2x + y + 3z + 4)
690
Die partiellen Ableitungen sind
Lz
L λ1
L λ2
691
Wenn wir dies in die dritte Gleichung einsetzen bekommen wir
x − y + z = 0.
Lx = 2x − λ1 − 2λ2
Ly
Mathematik I – WiSe 2004/2005
Diese Gleichung zusammen mit den letzten beiden Gleichungen liefert das
inhomogene Gleichungssystem

    
1 −1 1
x
0
1 2
1  · y  = 1
2 −1 −3
z
4
= 2y − 2λ1 + λ2
= 2z − λ1 + 3λ2
= −x − 2y − z + 1
= −2x + y + 3z + 4
mit der Lösung
Alle diese Ableitungen sollen gleich Null sein. Die ersten beiden Gleichungen
zeigen dann
4
2
λ1 = x + y,
5
5
Mathematik I – WiSe 2004/2005
4
2
λ2 = x − y
5
5
692
x0 =
Die Multiplikatoren sind
Mathematik I – WiSe 2004/2005
16
,
15
1
y0 = ,
3
λ1 =
52
,
75
z0 = −
λ2 =
11
15
54
75
693
Angenommen, x∗ löst dieses Problem. Dann ist x∗ in der Regel eine Funktion
abhängig von c, z.B. x∗(c). Auch der zugehörige Lagrange-Multiplikator λ ist
eine Funktion von c, also λ(c). Das Optimum von f ist
Die zugehörige Hessematrix Ĥ ist


2 0 0
0 2 0 
0 0 2
f (x∗(c)) = f ∗(c),
also positiv definit. Deshalb haben wir an der Stelle (x0, y0, z0) ein Minimum!
also eine Funktion abhängig von c. Unter geeigneten Annahmen (auf die wir hier
nicht eingehen) kann man zeigen
Lagrangemultiplikatoren haben eine wichtige ökonomische Interpretation. Wir
erläutern dies an einem Beispiel mit nur einer Gleichungsrestriktion. Für den
allgemeinen Fall verweisen wir auf die Literatur.
Unser Ziel ist
Das heißt, der Lagrangemultiplikator ist ein Maß, wie sich das Maximum f ∗(c)
relativ zu c ändert. Bezeichnet f etwa den Profit, die Restriktion g(x) = c die
Verfügbarkeit einer knappen Ressource, dann ist λ(c) ein Maß dafür, wie sich der
Profit relativ zu einer Änderung der knappen Ressource ändert.
max f (x)
unter der Restriktion
g(x) = c.
Mathematik I – WiSe 2004/2005
df ∗(c)
= λ(c).
dc
694
Mathematik I – WiSe 2004/2005
695
Wir erläutern dies an einem Beispiel:
unter der Restriktion
Beispiel 6.19 Die Firma AUD benutzt als Input K (Kapital; damit sind
insbesondere Maschinen gemeint) und W (Arbeit), um ein Auto zu produzieren.
Um ein Auto zu produzieren müssen insgesamt
Die Lagrangefunktion ist
Q = K 1/2W 1/4.
L(K, W, λ) = rK + wW + λ(K 1/2W 1/4 − Q).
Q = F (K, W ) = K 1/2W 1/4
Partielle Ableitung nach K und W sind
Produktionsmittel eingesetzt werden; d.h. die Firma hat eine gewisse Freiheit,
wieviel Kapital und wieviel Arbeit sie einsetzt. Kapital ist hier wertvoller als Arbeit:
Wenn Sie den Kapitaleinsatz verdoppeln, können Sie den Arbeitseinsatz um den
Faktor 4 verringern. Kapital und Arbeit konkurrieren: Sowohl das Kapital kostet
Geld (Zinsen, Refinanzierung) als auch Arbeit (was jedem klar ist). Die Kosten
fürs Kapital seien r, die für Arbeit w. Wir erhalten das Optimierungsproblem
1
∂L
= r − λK −1/2 W 1/4
∂K
2
Beide partiellen Ableitungen sollen 0 sein, also
1
r = λK −1/2 W 1/4,
2
min rK + wW
Mathematik I – WiSe 2004/2005
696
Auflösen nach λ gibt
1
w = λK 1/2W 3/4
4
Mathematik I – WiSe 2004/2005
697
Einfache Umformungen liefern als Lösung des Lagrangeproblems
K ∗ = 21/3r −1/3w1/3Q4/3
λ = 2rK 1/2W −1/4 = 4wK −1/2 W 3/4
W ∗ = 2−2/3r 2/3w−2/3Q4/3
λ∗ = 24/3r 2/3w1/3Q1/3
also
2rK = 4wW,
C ∗ = 3 · 2−2/3 r 2/3w1/3Q4/3
rK
.
also W =
2w
Die Matrix Ĥ ist

Wir setzen dies in die Restriktion Q = K 1/2W 1/4 ein und erhalten
K 3/4 = Q
r
4
∗
− 81 K 1/2λW 3/4
3 λK 1/2
16 W 3/4



Der (1,1)-Eintrag dieser Matrix ist offenbar > 0. Die Determinante erhält man
698
nach einigem Rechnen als
det(Ĥ) =
1 λ∗ W 1/4
 4 K 3/2
Ĥ = 
∗
− 18 K 1/2λW 3/4
2w
r
Mathematik I – WiSe 2004/2005
1 λ2
32 KL3/2
sie ist also auch > 0 und somit ist die Matrix positiv definit, wir haben also ein
Minimum. Man rechnet leicht nach, das
dC ∗
= 24/3r 2/3w1/3Q1/3 = λ∗.
dQ
Mathematik I – WiSe 2004/2005
∂L
1
= w − λK −1/2 W −3/4
∂W
4
700
Mathematik I – WiSe 2004/2005
699

6.4 Extrema ohne Nebenbedingungen

Produkte

Unterstützung

6.4 Extrema ohne Nebenbedingungen

Dieses Dokument Sammlung (en)

Dieses Dokument gespeichert

Schlagen Sie uns vor, wie wir StudyLib verbessern können