Author: Colopen 彩色铅笔
Link: https://www.colopen-blog.com
Download the pdf: 多元函数极值专题.pdf
last publication: 2021-12-11 18:00
无条件极值
无条件极值属于多元函数极值中,较为简单的一类问题,其解决的问题描述一般是:
[
\text{给定一个多元函数 } z=f(x,y)\text{,求解他在实数域上的极值}
] 解决该类问题的思路也很简单,直接沿用我们在 一元函数 中的手段:通过 驻点 找 极值点
用
z 对
x,y 分别求 偏导,然后令 一阶偏导数 为零,找出 驻点
如何判断 驻点 是否是 极值点 ?常用手段是 黑塞矩阵(Hessian Matrix)判别式
他是用于研究函数在一点处 曲率 的变化而存在的(就像一元函数求二阶导数的行为,本质相同)
黑塞矩阵判别式:
\begin{vmatrix}f_{xx} & f_{xy} \\\\f_{yx} & f_{yy}\end{vmatrix} \xlongequal{?} 0若 黑塞矩阵判别式 :
- 大于
0,则该驻点是极值点
- 若
f_{xx} > 0 则为极小值点
- 若
f_{xx} < 0 则为极大值点
- 小于
0,则该驻点不是极值点
- 等于
0,则 判别式失效
当 判别式失效 时,我们可以利用 极值的定义,然后通过一个 二元极限 判断该点是否是极值点
- 如果找到两条路径,一条路径极限大于该点值,一条路径极限小于该点值,则非 极值点
- 如果 去心邻域 内的值都大于或小于该驻点的值,则该驻点为极值点
关于 无条件极值,各大辅导书上步骤都有详细讲解,故这里就不准备例题了,只帮助大家理清思路
条件极值
条件极值 是考研中常考的,方法超固定,计算超复杂的一类问题
条件极值 围绕着 目标函数、约束条件 两个关键字展开
求解的是 目标函数 在 约束条件 下的 极值 问题
其问题描述一般为:
[
\text{已知函数 }z = f(x,y) \text{,求解 }z \text{ 在约束条件 } D = \{(x,y)|g(x,y)=0\}\text{ 下的最值}
] 通法 是 拉格朗日数乘法:是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法
构造如下方程组:
[
L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \xlongequal{\text{令}} 0
][
\begin{cases}
L_x = f_x(x,y) + \lambda g_x(x,y) \xlongequal{\text{令}} 0
\\
L_y = f_y(x,y) + \lambda g_y(x,y) \xlongequal{\text{令}} 0
\\
L_\lambda = g_x(x,y) \xlongequal{\text{令}} 0
\end{cases}
]然后解该方程组,便可以得到 目标函数 在 约束条件 下的 极值点
然后比较几个 极值点,选出 最大最小值 即可
不过 条件极值 难,从来都不是难在做法上,而是构造的 拉格朗日数乘法方程 难解
接下来的内容,将会围绕优化解方程出发,分享几个我常用的方法
利用轮换对称式化简拉格朗日乘子
在下方的 利用齐次式化简拉格朗日乘子 中介绍过:(这个专题我是从下往上写的 w)
拉格朗日函数 是一个 多项式函数,可以利用很多 多项式的特性 对计算进行化简
而本篇中,提到的方法便是 轮换对称式
二元轮换对称式 的定义:
对于一个二元多项式
f(x,y),如果用
x 代替
y,用
y 代替
x,后 代数式 保持不变,则称
f(x,y) 具有 轮换对称性
上述定义可以扩充到
n 元,此外 二元轮换对称式 也是一个 完全对称式
轮换对称性用简单一个点的话来说就是,如果交换
x,y 后,
f(x,y) 保持不变
对于具有 轮换对称性 的函数,一定有解
y = x因此我们不妨直接让
L_x - L_y 然后提出
(y-x) 的因式
然后分类讨论两个因式分别为
0 的解
【例】设计一个容积为
V 的长方体开口水箱,长宽高分别为多少时最节省材料
【解】根据题意可得 目标函数:
S = 2xz + 2zy + xy,约束条件
V = xyz构造拉格朗日函数:
L = 2xz + 2zy + xy + \lambda (xyz - V) 显然
x,y 具有轮换对称性
[
\begin{cases}
L_x = 2z + y + \lambda yz \xlongequal{\text{令}} 0 \\
L_y = 2z + x + \lambda xz \xlongequal{\text{令}} 0 \\
L_z = 2x + 2y + \lambda xy \xlongequal{\text{令}} 0 \\
L_\lambda = xyz \xlongequal{\text{令}} V
\end{cases}
]利用轮换对称性,让
L_x - L_y 得:
[
\begin{aligned}
(y-x) + \lambda z(y - x) &= 0 \\
(y-x) \cdot (1 + \lambda z) &= 0 \\
\end{aligned}
]
x = y 时:
L_z: 4x + \lambda x^2 = 0 \Rightarrow x(4 + \lambda x) = 0 \Rightarrow \lambda = -\dfrac{4}{x}L_\lambda : z = \dfrac{V}{x^2},
L_x : \dfrac{2V}{x^2} + x - 4 \cdot \dfrac{V}{x^2} = 0 \Rightarrow x^3 = 2V \Rightarrow x = \sqrt[3]{2V}故
\begin{cases} x = \sqrt[3]{2V} \\ y = \sqrt[3]{2V} \\ z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}} \end{cases}
1 + \lambda z = 0 时:
L_x : -\dfrac{2}{\lambda} + y - y = 0 \Rightarrow \dfrac{2}{\lambda} = 0 无解
由于题目保证一定有解,故最小值解为:
\begin{cases} x = \sqrt[3]{2V} \\ y = \sqrt[3]{2V} \\ z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}} \end{cases} 2013年超难解的多元极值问题,就可以利用本技巧化简运算,读者可以去试一下
三角换元法
这个方法很简单,本质就是沿用了大家在 二重积分 里常用的 极直互化 技巧
考虑按照 约束条件 的形式,将 直角坐标 转化成 极坐标 形式
这样就从原来的
f(x,y) 极值问题,转化为
f(r,\theta) 极值问题
由于是基于 约束条件 转换的坐标,转化过来后
r,\theta 是带着 约束条件 的 取值范围限制
故
f(r,\theta) 最后可以通过 三角恒等变形 化成一个
ar\sin(\theta + \varphi) 的形式
然后就可以根据
r 范围直接写出
f 的 取值范围
【例】
4x^2+y^2 \le 25,求
L = x^2 + 12xy + 2y^2 的取值范围
【解】根据 约束条件 的形式,进行 极直互化
不妨令
2x = r\cos \theta,
y = r\sin \theta,则
r^2 \le 25 \Rightarrow (0 \le r \le 5,
0 \le \theta \le 2\pi)对 目标函数 转 极坐标:
[
\begin{aligned}
L
&=
x^2 + 12xy + 2y^2
\\
&=
\dfrac{r^2}{4}\cos^2\theta + 6r^2\sin\theta\cos\theta + 2r^2\sin^2\theta
\\
&=
\dfrac{r^2}{4} \cdot \dfrac{1+\cos 2\theta}{2} + 3r^2\sin 2\theta + 2r^2\cdot \dfrac{1-\cos 2\theta}{2}
\\
&=
\dfrac{r^2}{8} + \dfrac{r^2}{8}\cos 2\theta + 3r^2\sin 2\theta + r^2 - r^2\cos 2\theta
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + 24\sin 2\theta - 7\cos 2\theta
}\bigg)
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + \sqrt{24^2 + 7^2} \sin(2\theta + \varphi)
}\bigg)
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + 25 \sin(2\theta + \varphi)
}\bigg)
\\
\end{aligned}
]由于
\theta \in [0, 2\pi], r \in [0, 5],故
f(r,\theta)\in [-50, \dfrac{425}{4}] 该方法同样适用于 三个变量平方和的等式 下
由于是等式,故可以选择两个变量建立极坐标,让第三个变量代替
r 作为参数限制
如下面这题
【例】
x^2+y^2+z^2=10,求
L = xy + 2yz 的取值范围
【解】对
L 进行变形:
L = y \cdot (x + 2z),考虑围绕
x,z 建立极坐标
对约束条件进行恒等变形:
x^2 + z^2 = 10 - y^2建立极坐标:
x = \sqrt{10 - y^2} \cos \theta, z = \sqrt{10 - y^2} \sin \theta易得
-\sqrt{10} \le y < \sqrt{10},
0 \le \theta \le 2\pi对目标函数进行换元:
[
\begin{aligned}
L &=
y \cdot \bigg({
\sqrt{10 - y^2} \cos\theta + 2\sqrt{10 - y^2}\sin\theta
}\bigg)
\\
&=
y \sqrt{10 - y^2} \cdot
\sqrt{5} \sin (\theta + \varphi)
\end{aligned}
]根据
y\in[-\sqrt{10},\sqrt{10}],有
y\sqrt{10-y^2} \in [-5, 5] (读者自证不难)
而
\sqrt{5} \sin (\theta + \varphi) \in [-\sqrt{5}, \sqrt{5}]故
L = y \sqrt{10 - y^2} \cdot \sqrt{5} \sin (\theta + \varphi) \in [-5\sqrt{5}, 5\sqrt{5}]利用齐次式化简拉格朗日乘子
部分参考自 [@考研竞赛凯哥](),及其他参考文献
这一部分,有一些数学知识作为前置铺垫,不过最后得出来的结论相当简单
如果没有想要了解的想法,只是以考试为主要目的的同学,可以直接往下滑
解 多元函数条件极值 问题时,需要用到 拉格朗日乘数法 构造 拉格朗日函数
[
L(x_1,x_2,x_2,\lambda) = f(x_1,x_2,x_3) + \lambda [g(x_1,x_2,x_3) - m]
]其中
\lambda 为参数
由于
\lambda 是作为参数存在的,故研究 拉格朗日函数 实际上是在研究一个 多项式函数
而当研究对象转换到 多项式函数 后,就可以用到很多 特殊多项式函数 的性质
例如,本篇中会介绍的 齐次函数(如果该次数是二次型,推荐用下一个二次型解法)
k 次式的齐次函数 的 定义 为:
f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \lambda^kf(x_1,x_2,\cdots,x_n)对于
k 次 齐次函数 ,有 齐次函数 的 欧拉定理:
[
x_1\dfrac{\partial f}{\partial x_1} + x_2\dfrac{\partial f}{\partial x_2} + \cdots + x_n\dfrac{\partial f}{\partial x_n} = k f(x_1,x_2,\cdots,x_n)
] 简单证明:
对于
k 次齐次函数
f(x_1,x_2,\cdots,x_n),对定义式两边求全微分:
[
\dfrac{d}{d\lambda} f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \sum_{i=1}^n \dfrac{\partial f}{\partial(\lambda x_i)} \cdot \dfrac{d(\lambda x_i)}{d\lambda} = \sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)}
][
\dfrac{d}{d\lambda} \lambda^k f(x_1,x_2,\cdots,x_n) = k\lambda^{k-1}f(x_1,x_2,\cdots,x_n)
]
通过这个 算两次 的思想,由于两个 全微分 必相等,于是:
[
\sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} =
k\lambda^{k-1}f(x_1,x_2,\cdots,x_n)
]
取
\lambda = 1,得:
[
\sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} =
kf(x_1,x_2,\cdots,x_n) \qquad QED
]回到 多元函数条件极值 问题上来
若目标函数
f 和约束条件
g = m 满足
f 和
g 是
k 次多项式,那么
F = f + \lambda g 也是
k 次多项式。
对于 拉格朗日乘子
L = f + \lambda(g-m),
L_x = 0, L_y = 0可以考虑
xL_x + yL_y = 0,即
xF_x + yF_y = 0(常数
m 求偏导后被干掉了)
根据 欧拉定理,
kF = 0,再根据条件
g = m,
kF = 0 可以进一步化简为
f = -\lambda m因此考虑
f 的最值问题,就化为考虑
-\lambda m 的最值问题
理论铺垫多说无益,我们直接来一道实战题目进行讲解
题选自李林预测卷,我是在群里找来的到的
【例】求中心在坐标原点的椭圆
x^2 - 4xy + 5y^2 = 1 的长半轴和短半轴长度
【解】椭圆长/短半轴长度就是椭圆上离中心点最 远/近 的距离长度
故可以目标函数就是
\sqrt{x^2 + y^2},但为了化简计算,不妨设目标函数为
x^2 + y^2构造拉格朗日乘数法:
L(x,y,\lambda) = x^2 + y^2 + \lambda(x^2 - 4xy + 5y^2 - 1)[
\begin{cases}
L_x = 2x + 2\lambda x - 4\lambda y \xlongequal{\text{令}} 0
\\
L_y = 2y + 10\lambda y - 4\lambda x \xlongequal{\text{令}} 0
\\
L_\lambda = x^2 - 4xy + 5y^2 - 1 \xlongequal{\text{令}} 0
\end{cases}
]考虑使用齐次型化简转化研究对象,让
xL_x + yL_y:
[
2(x^2 + y^2) + 2\lambda (x^2 - 4xy + 5y^2) = 0
]由于已知约束条件
x^2 - 4xy + 5y^2 = 1,故直接代入上式得:
[
x^2 + y^2 = -\lambda
]求
x^2 + y^2最值的问题,成功转化为求
-\lambda 最值的问题了
由于
(x,y) \ne (0,0) 否则肯定不满足第三个方程
L_\lambda(0,0) = -1 \ne 0故一、二两个方程
L_x 和
L_y 一定含有 非零解,故他们的 系数矩阵行列式 =
0:
[
\begin{vmatrix}
2+2\lambda & -4\lambda \\
-4\lambda & 2 + 10\lambda
\end{vmatrix} = 4\lambda^2 + 24\lambda + 4 = 0 \quad\Rightarrow\quad \lambda = -3 \pm 2\sqrt{2}
]由此可知
x^2 + y^2 的最大值为
3 + 2\sqrt{2},最小值为
3 - 2\sqrt{2}对应到
d = \sqrt{x^2 + y^2},
d_{min} = \sqrt{2} - 1,
d_{max} = \sqrt{2} + 1利用二次型求解
根据 线性代数 知识我们知道,二次型 化成 标准型,可以通过 正交变换 实现
而 正交变换 有一个非常好的性质:保向量 模长 相等
这样就能利用该 性质,把原有的 约束条件,运用到新坐标下,产生新的 约束条件
适用的题型要求:
- 目标函数
f(x_1,x_2,x_3) 是二次型
- 约束条件
g 只含有平方项,形如
x_1^2+x_2^2+x_3^2 = m这样,我们最终要找的 目标函数 最值,就分别是该 二次型矩阵 的 最大最小特征值
上述为直接结论,我会在下面这道例题中详细讲解原理
【例】求
f(x_1,x_2,x_3)=x_1^2+x_2^2+3x_3^2-2x_1x_2 在约束条件
x_1^2+x_2^2+x_3^2=1 上的最值
【解】目标函数 是 二次型,且 约束条件 为 平方和,考虑使用 二次型 计算
令 二次型
f 对应的矩阵
A = \begin{pmatrix} 1 & -1 & 0 \\ -1& 1 & 0 \\ 0 & 0 & 3 \end{pmatrix}求出
A 的 特征值,令
|A - \lambda E| =0[
\begin{vmatrix}
1-\lambda & -1 & 0 \\
-1& 1-\lambda & 0 \\
0 & 0 & 3-\lambda
\end{vmatrix} = - (\lambda - 3) \cdot \lambda \cdot (\lambda - 2)
]故可得特征值:
\lambda_1 = 0, \lambda_2 = 2, \lambda_3 = 3\lambda = 0 时:
(A - 0 \cdot E) \rightarrow \begin{pmatrix} 1 & -1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_1 = \begin{pmatrix} 1\\ 1\\ 0 \end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix} 1\\ 1\\ 0 \end{pmatrix}\lambda = 2 时:
(A - 2 \cdot E) \rightarrow \begin{pmatrix} 1 & 1 & 0 \\ 0 & 0 & 1 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_2 = \begin{pmatrix} -1\\ 1\\ 0 \end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix} -1\\ 1\\ 0 \end{pmatrix}\lambda = 3 时:
(A - 3 \cdot E) \rightarrow \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{pmatrix} \quad\Rightarrow\quad \xi_3 = \begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix} \quad\Rightarrow\quad e_3 = \begin{pmatrix} 0\\ 0\\ 1 \end{pmatrix}故存在 正交矩阵
Q = (e_1,e_2,e_3), s.t. Q^TAQ = \Lambda = \begin{pmatrix} 0 & & \\ & 2 & \\ & & 3 \end{pmatrix}故存在 正交变换
x = Q y, s.t. f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2由于 正交变换 是保向量模长的,故
||x|| = ||y|| \Rightarrow y_1^2 + y_2^2 + y_3^2 = x_1^2 + x_2^2 + x_3^2 = 1故原命题就等价于:目标函数:
f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2 在 约束条件:
y_1^2 + y_2^2 + y_3^2 = 1 下的最值问题
因此,
f 的最大值就是把全部模长分给系数最大的分量,最小值就是分给系数最小的分量
即我在开头说过的,最大最小特征值
故
f_{min} = 0, f_{max} = 3利用常见不等式求解
这里不会使用额外其他的不等式,我只介绍考研中常用的 均值不等式 和 柯西不等式
柯西不等式:
[
(a_1^2+a_2^2+\cdots+a_n^2) \times (b_1^2+b_2^2+\cdots+b_n^2) \ge (a_1b_1+a_2b_2+\cdots+a_nb_n)^2
]当且仅当
\dfrac{a_1}{b_1} = \dfrac{a_2}{b_2} = \dots = \dfrac{a_n}{b_n} 时,等号成立
均值不等式:
[
\dfrac{a_1^2 + a_2^2 + \cdots + a_n^2}{n} \ge \sqrt[n]{a_1 \cdot a_2 \cdots a_n}
]当且仅当
a_1 = a_2 = \cdots = a_n 时,等号成立
柯西不等式 建立的是 多项平方和
\ge 多项和 的不等式
均值不等式 建立的是 多项平方和
\ge 多项积 的不等式
一个是 平方和 到 和,一个是 平方和 到 积,这是我们考虑使用不等式时,首先要考虑的问题
【2018年19题】将
2m 的铁丝分成三段,依次围城圆、正方形、正三角形。三个图形的面积之和是否存在最小值?若存在,求出最小值。
【解】令铁丝分给三个图形的长度分别为
a ,b, c,则
a + b + c = 2通过已知周长分别计算出三个图形的面积,应为:
\dfrac{a^2}{4\pi}, \dfrac{b^2}{16}, \dfrac{c^2}{12\sqrt{3}}故
S = \dfrac{a^2}{4\pi}+ \dfrac{b^2}{16}+ \dfrac{c^2}{12\sqrt{3}}原命题就等价于,目标函数 为
S(a,b,c),在 约束条件
a + b + c = 2 下的最小值
目标函数是 多项平方和,约束条件是 多项和,考虑选用 柯西不等式 放缩
构造柯西不等式:
[
\begin{aligned}
\bigg[(\dfrac{a}{2\sqrt{\pi}})^2 + (\dfrac{b}{4})^2 + (\dfrac{c}{\sqrt{12\sqrt{3}}})^2\bigg] \cdot \bigg[(2\sqrt{\pi})^2 + 4^2 + (\sqrt{12\sqrt{3}})^2\bigg] &\ge (a + b + c)^2 \\
S \cdot \bigg[4\pi + 16 + 12\sqrt{3}\bigg] &\ge 4
\\
\dfrac{4}{4\pi + 16 + 12\sqrt{3}} &\le S
\\
\dfrac{1}{\pi + 4 + 3\sqrt{3}} &\le S
\end{aligned}
]故
S_{min} = \dfrac{1}{\pi + 4 + 3\sqrt{3}},当且仅当
\dfrac{a}{4\pi} = \dfrac{b}{16} = \dfrac{c}{12\sqrt{3}} 时等号成立
【2021年数一】设
x,y,z,满足
\begin{cases} x^2 + 2y^2-z = 6 \\ 4x + 2y + z = 30 \end{cases},求
z 的取值范围
【解】目标函数
z,约束条件
\begin{cases} x^2 + 2y^2 = z + 6 \\ 4x + 2y = 30 - z \end{cases}- 式左侧是 多项平方和,(2) 式左侧式 多项和 考虑 柯西不等式 放缩
构造 柯西不等式:
[
\begin{aligned}
(x^2 + (\sqrt{2} y)^2) \cdot (4^2 + (\sqrt{2})^2) &\ge (4x + 2y)^2
\\
(z + 6) \cdot 18 &\ge (30 - z)^2
\\
z^2 - 78z + 792 &\le 0
\\
(z - 12)(z - 66) &\le 0
\\
\end{aligned}
]故
z\in[12, 66]