多元微分学 [8]

对应《大学数学 微积分 下》:“8.8 二元 Taylor 公式与多元函数的极值”、“8.9 条件极值——拉格朗日乘数法”

本篇内容

  • 复习一元 Taylor 公式
  • 二元 Taylor 公式
  • 二元函数极值的必要条件
  • 二元函数极值的充分条件

二元函数的 Taylor 公式

1. 一元 Taylor 公式

在学习二元函数的 Taylor 公式之前,我们最好先回顾一下一元函数的 Taylor 公式如何展开。
明智的选择是首先复习这个视频:微积分的本质 - 10 - 泰勒级数_哔哩哔哩_bilibili,如果赶时间,也可以选择这篇文章:泰勒级数 - 微积分的本质 10 (qq.com)

这里我们只简单展示一下一元函数 f(x)f(x) 展开的 Taylor 公式:

f(x)=n=0f(n)(a)n!(xa)nf(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(a)}{n!}(x-a)^n

其中,f(n)(a)f^{(n)}(a) 表示函数 f(x)f(x)x=ax=a 处的 nn 阶导数。

2. 二元 Taylor 公式

我们先摆出公式本体,然后再进行从一元公式到二元公式的推导。

为了简洁表示,我们需要先定义一个新的运算:

(Δxx+Δyy)f=Δxfx+Δyfy(\Delta x \frac{\partial}{\partial x} + \Delta y \frac{\partial}{\partial y})f = \Delta x \frac{\partial f}{\partial x} + \Delta y \frac{\partial f}{\partial y}

f(x0+Δx,y0+Δy)=k=0n1k!(Δxx+Δyy)kf(x0+Δx,y0+Δy)+Rnf(x_{0} + \Delta x, y_{0} + \Delta y) = \sum_{k=0}^{n} \frac{1}{k!} (\Delta x \frac{\partial}{\partial x} + \Delta y \frac{\partial}{\partial y})^kf|_{(x_{0} + \Delta x, y_{0} + \Delta y)} + R_n

其中 RnR_n 是泰勒公式的余项,又被称为拉格朗日型(Lagrange)余项,它可被如下计算:

Rn=1(n+1)!(Δxx+Δyy)n+1f(x0+θΔx,y0+θΔy)    (0<θ<1)R_n = \frac{1}{(n+1)!} (\Delta x \frac{\partial}{\partial x} + \Delta y \frac{\partial}{\partial y})^{n+1}f|_{(x_0 + \theta \Delta x, y_0 + \theta \Delta y)} \ \ \ \ (0 < \theta < 1)

上述公式称为 f(x,y)f(x, y) 在点 P0 ( x0, y0 )P_ {0}\ (\ x_ {0},\ y_{0}\ ) 处的 nn 阶 Taylor 公式。

这个公式可以用来将一个二元函数在某个点 (x0,y0)(x_0, y_0) 处展开成关于 Δx\Delta xΔy\Delta y 的幂级数,使得在 (x0,y0)(x_0, y_0) 附近 Δx\Delta xΔy\Delta y 足够小时,可以用前 nn 项来近似计算 f(x0+Δx,y0+Δy)f(x_0 + \Delta x, y_0 + \Delta y),而余项 RnR_n 则描述了近似误差。

在二元函数 Taylor 公式中,取 x0=0, y0=0x_ {0} =0,\ y_ {0} = 0 便得到二元函数的麦卡林(Maclaurin)公式:

f(x,y)=k=0n1k!(xx+yy)kf(0,0)+Rnf(x,y) = \sum_{k=0}^{n} \frac{1}{k!} (x \frac{\partial}{\partial x} + y \frac{\partial}{\partial y})^kf|_{(0,0)} + R_n


多元函数的极值

1. 概念

如果在点 P0(x0,y0)P_0(x_0,y_0) 的某个邻域 U(P0)U(P_0) 内,函数 f(x,y)f(x,y) 的值始终小于等于或大于等于 f(x0,y0)f(x_0,y_0),则称函数在点 P0P_0 处取得极大值或极小值。点 P0P_0 被称为函数的极大值点或极小值点。

2. 极值的必要条件

例如,对于函数 z=x22+y242z=\frac{x2}{2}+\frac{y2}{4}-2 ,它在 (0,0)(0, 0) 处的值为 -2,在 (0,0)(0, 0) 附近的函数值都大于 2-2,因此该函数在 (0,0)(0, 0) 处取得极小值 2-2,而 (0,0)(0, 0) 是一个极小值点。

如果一个二元函数在某一点取得极值,并且该函数在该点处的一阶偏导数存在,则其包含的一元函数也有一个类似的性质:它们在该点处也有一个极值。因此,根据可导的一元函数极值的必要条件,我们可以得到:

{fx(x0,y0)=0fy(x0,y0)=0\left \{ \begin{matrix}f_x(x_0,y_0)= 0\\ f_y(x_0,y_0)= 0\end{matrix}\right.

而反过来看,在这个例子中,如果两个等式同时满足,就说明 f(x,y)f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 处可以取得极值 ;在所有的情况下,我们都会称点 P0P_0 为二元函数 ff驻点

但是这并不是某个点为极值点的充要条件,只是必要条件,也就是说极值点一定是驻点没错,但是驻点可不一定是极值点。

3. 极值的充分条件

极值的充分条件的证明过于冗长,故这里只提主要内容和注意事项

设二元函数 z=f(x,y)z=f(x,y) 在点 P0(x0,y0)P_0(x_0,y_0) 的邻域 U(P0)U(P_0) 内有连续的二阶偏导数,且 P0(x0,y0)P_0(x_0,y_0) 是函数 f(x,y)f(x,y) 的驻点。我们定义以下符号的意义:

\begin{align*}&A=f_{xx}(x_0,y_0)\\ &B=f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0)\\ &C=f_{yy}(x_0,y_0)\end{align*}$$ 以及 $$H=AC-B^2

有了以上新定义的符号,我们能简洁地表示极值的充分条件:

  1. H>0H>0 时,f(x0,y0)f(x_0,y_0) 是函数 ff 的极值。若 A>0A>0,则 f(x0,y0)f(x_0,y_0) 是极小值;若 A<0A<0,则 f(x0,y0)f(x_0,y_0) 是极大值。
  2. H<0H<0 时,f(x0,y0)f(x_0,y_0) 不是函数 ff 的极值。
  3. H=0H=0 时,存在着各种可能,没有确定的情况。

条件极值

1. 概念

条件极值问题是指在函数自变量满足一定条件的情况下,求目标函数的极值问题。通常情况下,这些条件可以表示为附加条件或约束条件。

2. 拉格朗日乘数法

拉格朗日乘数法是一种通过辅助函数将条件极值问题转化成无条件极值问题的方法。

它的基本思路是构造一个包含拉格朗日乘数的函数,通过求解这个函数的一阶偏导数为零的方程组,找到可能的极值点。

以三元函数 u=f(x,y,z)u=f(x,y,z) 在约束条件 φ(x,y,z)=0\varphi(x,y,z)=0 下的极值问题为例,我们希望找到函数 u=f(x,y,z(x,y))u=f(x,y,z(x,y)) 的无条件极值问题,即将约束条件中的变量 zzx,yx,y 代表,代入目标函数中,从而得到一个只含有 xxyy 的函数。

但是,有时从约束条件中解出变量 zz 是非常困难的,因此我们需要另寻他路。在假设约束条件 φ(x,y,z)\varphi(x,y,z) 的一阶偏导数连续且不为零的前提下,我们可以利用复合隐函数的概念,将目标函数表示为 u=f(x,y,z(x,y))u=f(x,y,z(x,y)) 的形式。

接下来,根据极值的必要条件,我们可以得到函数 u=f(x,y,z(x,y))u=f(x,y,z(x,y)) 在驻点处的一阶偏导数为零的方程组:

{ux=fx+fzzx=0uy=fy+fzzy=0\left\{ \begin{matrix} \frac{\partial u}{\partial x} = f_x + f_z \cdot \frac{\partial z}{\partial x} = 0 \\ \frac{\partial u}{\partial y} = f_y + f_z \cdot \frac{\partial z}{\partial y} = 0 \end{matrix} \right.

同时,根据隐函数的微分法,我们可以求出 zx\frac{\partial z}{\partial x}zy\frac{\partial z}{\partial y} 的值:

zx=φxφz,zy=φyφz,\frac{\partial z}{\partial x} = -\frac{\varphi_x}{\varphi_z}, \frac{\partial z}{\partial y} = -\frac{\varphi_y}{\varphi_z},

将这些信息代入方程组中:

{fxφzfzφx=0fyφzfzφy=0\left\{ \begin{matrix} f_x \cdot \varphi_z - f_z \cdot \varphi_x = 0 \\ f_y \cdot \varphi_z - f_z \cdot \varphi_y = 0 \end{matrix} \right.

由这个方程组我们能够得到: fxφx=fyφy=fzφz\frac{f_x}{\varphi_x} = \frac{f_y}{\varphi_y} = \frac{f_z}{\varphi_z}。连同约束条件 φ(x,y,z)=0\varphi(x,y,z)=0,可解得 (x0,y0,z0)(x_ {0}, y_ {0} , z_ {0}) 为可能的极值点,连同约束条件 φ(x,y,z)=0\varphi (x,y,z)=0,可解得( x0,y0,z0x_ {0} , y_ {0} , z_ {0} )为可能的极值点。若记 λ=fzφz(x0,y0,z0)-\lambda = \frac{f_z}{\varphi_z}\bigg|_{(x_0, y_0, z_0)} ,那么 x0,y0,z0,λx_0, y_0, z_0, \lambda 就满足方程组:

{fx+λφx=0fy+λφy=0fz+λφz=0φ(x,y,z)=0\left\{ \begin{matrix} f_x + \lambda \varphi_x = 0 \\ f_y + \lambda \varphi_y = 0 \\ f_z + \lambda \varphi_z = 0 \\ \varphi(x,y,z) = 0 \end{matrix} \right.

其中 λ\lambda 是一个常数,称为拉格朗日乘数或乘子。

通过求解这个方程组,我们可以得到可能的极值点 (x0,y0,z0)(x_0,y_0,z_0),同时也可以求出对应的拉格朗日乘数 λ\lambda

这个方程组通常可以表示为一个函数,称为拉格朗日函数:

L(x,y,z,λ)=f(x,y,z)+λφ(x,y,z)L(x,y,z,\lambda)=f(x,y,z)+\lambda\varphi(x,y,z)

在点 (x0,y0,z0,λ)(x_0,y_0,z_0,\lambda) 取得无条件极值的必要条件就是 LL 的一阶偏导数为零。