多元微分学 [4]

对应《大学数学 微积分 下》:“8.4 全微分及其应用”

本篇内容:

  • 全增量
  • 全微分
  • 可微,可导和可偏导的关系

全增量

全增量是指一个多元函数在一定范围内所有自变量的增量之和,它可以表示为一个微分形式的积分。

具体地说,设 z=f(x1,x2,,xn)z=f(x_1,x_2,\dots,x_n) 是一个 nn 元函数,如果 Δx1,Δx2,,Δxn\Delta x_1,\Delta x_2,\dots,\Delta x_n 分别表示 x1,x2,,xnx_1,x_2,\dots,x_n 的一组增量,那么 zz 的全增量可以表示为:

Δz=f(x1+Δx1, x2+Δx2, , xn+Δxn)f(x1,x2,,xn)\Delta z = f(x_1+\Delta x_1,\ x_2+\Delta x_2,\ \dots,\ x_n+\Delta x_n) - f(x_1,x_2,\dots,x_n)

全增量可以看作是函数在一定范围内所有自变量增量之和,它可以用微分形式来表示为:

Δz=Δf=fx1Δx1+fx2Δx2++fxnΔxn\Delta z = \Delta f = \frac{\partial f}{\partial x_1} \Delta x_1 + \frac{\partial f}{\partial x_2} \Delta x_2 + \dots + \frac{\partial f}{\partial x_n} \Delta x_n

这里的 dfdf 表示函数 ff 的微分形式,也称全微分。全增量的计算可以看作是对微分形式的积分,即:

Δz=PQdf\Delta z = \int_{P}^{Q} df

其中 PPQQ 是自变量从 (x1,x2,,xn)(x_1,x_2,\dots,x_n) 变化到 (x1+Δx1,x2+Δx2,,xn+Δxn)(x_1+\Delta x_1, x_2+\Delta x_2, \dots, x_n+\Delta x_n) 的过程中经过的路径,称为积分路径


全微分

1. 定义

其实全微分就是给多元函数的微分的特殊称谓[1]

全微分是指一个函数的函数值在某一点处的微小变化,可以用该点的偏导数来计算出来的微分形式。

具体地说,设一个二元函数 f(x, y)f(x,\ y),那么它的全微分可以被表示为:

df=fxdx+fydydf = \frac{\partial f}{\partial x} dx + \frac{\partial f}{\partial y} dy

其中 dxdxdydy 分别表示 xxyy 的微小变化量。

这个式子可以理解为,全微分是由函数在 xx 方向和 yy 方向上的微小变化量加权得到的。

稍加观察我们能发现函数 ff 在点 (x0, y0)(x_0,\ y_0) 的全微分就是 Δf\Delta f 对于 Δx\Delta xΔy\Delta y 的线性近似[2]

需要注意的是,只有所有偏导数都连续的函数(函数在该区间内连续可微)才能有全微分,否则全微分不存在。这其实就是多元函数可微,可导和可偏导的关系,我们在接下来更有条理的叙述这点。

2. 可微,可导和可偏导的关系

针对点

  • 可微 \longleftrightarrow 可导

因为导数就是增量除以微分;增量必定能存在,所以只要微分存在,导数就存在

  • 可偏导 \longleftrightarrow 可微

对于每个变量都是可偏导的,那么根据全微分的定义,此时全微分存在

  • 总结:可偏导 \longleftrightarrow 可微 \longleftrightarrow 可导

针对域

  • 均可微 \longrightarrow 函数连续

只有连续的函数才能做到均可微

  • 导数连续 \longleftrightarrow 均可微

均连续就意味着在这个域中每个点都是可导的,那么每个点都是可微分的

  • 偏导数均连续 \longleftrightarrow 均可微

均连续就意味着在这个域中每个点都是可偏导的,那么每个点都是可微分的

  • 总结: 偏导数均连续 \longleftrightarrow 导数连续 \longleftrightarrow 均可微 \longrightarrow 函数连续

3. 全微分的几何意义

正如前文所说,全微分是全增量关于两个自变量的线性近似,所以我们可以得到全微分的近似计算公式。

假设有一个二元函数 f(x, y)f(x,\ y),并且 f(x, y)f(x,\ y) 在某一点 (x0, y0)(x_0,\ y_0) 处连续可微,那么它在该点的全微分可以近似表示为:

df=fx(x0, y0)Δx+fy(x0, y0)Δydf = \frac{\partial f}{\partial x}(x_0,\ y_0) \Delta x + \frac{\partial f}{\partial y}(x_0,\ y_0) \Delta y

需要注意的是,这个公式只是一个近似值,并且只在 (x0, y0)(x_0,\ y_0) 点附近有效。当增量 Δx\Delta xΔy\Delta y 很小的时候,这个公式的误差可以忽略不计;因此要比较准确地计算全微分,需要令 Δx\Delta xΔy\Delta y 趋近于零。

根据这个公式,我们可以窥见全微分的几何意义:全微分的几何意义是微小的平面区域,即微元。

我们来推演一下其由来:

对于二元函数 f(x, y)f(x,\ y),全微分 dfdf 的向量(dx, dy)(dx,\ dy)在点 (x, y)(x,\ y) 附近可以看做是一个平面的法向量,该平面是通过点 (x, y,f(x,y))(x,\ y,f(x,y)) 的函数曲面的切平面。这个切平面描述了函数在该点的局部变化率。

对于微小增量 (dx, dy)(dx,\ dy)dfdf 等于切平面的法向量与增量的点积,即:

df=fdr=fxdx+fydydf = \nabla f \cdot d\mathbf{r} = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy

其中,f\nabla f 是函数 ff 的梯度,即 (fx, fy)(\frac{\partial f}{\partial x},\ \frac{\partial f}{\partial y})drd\mathbf{r} 是微小增量 (dx, dy)(dx,\ dy) 的向量形式。这个式子可以解释为:当 (dx, dy)(dx,\ dy) 增加时,函数值的变化率等于切平面法向量与增量向量的点积。

从几何上来看,全微分可以看做是函数 f(x, y)f(x,\ y)(x, y)(x,\ y) 点附近的一个微小平面区域的切平面的法向量乘以微小增量的内积。也就是说,全微分 df(x, y)df(x,\ y) 表示的是函数 f(x, y)f(x,\ y) 在点 (x, y)(x,\ y) 处沿着微小平面区域的方向的微小变化率。


  1. 1.对于一元函数的微分我们直接称为微分
  2. 2.线性近似是指通过对一个函数在某一点处进行一阶泰勒展开,得到该点附近的线性函数,以此来近似原函数在该点附近的行为。