多元函数微分学

偏导数

​ 令一个自变量固定,研究一个自变量的变化率

定义(偏导数):设函数z=f(x,y)在点\((x_0,y_0)\)的某一邻域U\((x_0,y_0)\)内有定义,当自变量y固定在\(y=y_0\),而x在\(x_0\)有改变量\(\Delta x,(x_0+\Delta x,y_0)\in U(x_0,y_0)\)时,相应地,函数f有改变量 \[ f(x_0+\Delta x,y_0)-f(x_0,y_0) \] 如果极限 \[ \lim _{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x} \] 存在,则称此极限值为函数\(z=f(x,y)\)在点\((x_0,y_0)\)处对x的偏导数,记作 \[ f_x(x_0,y_0),\frac{\partial f(x_0,y_0)}{\partial x},z_x(x_0,y_0)或\frac{\partial z}{\partial x} |_{(x_0,y_0)} \]\[ f_x(x_0,y_0)=\frac{\partial f(x_0,y_0)}{\partial x}=\lim _{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x} \] ​ 如果二元函数\(z=f(x,y)\)在点\((x_0,y_0)\)处对x与y的偏导数均存在,那么称\(f(x,y)\)\((x_0,y_0)\)处可偏导.

​ 把其中一个自变量固定,对另一个自变量求导.

注意,可偏导不一定可连续

​ 偏导只能保证当点(x,y)分别沿平行于x轴和y轴两个特殊路径趋于点\((x_0,y_0)\)时,\(f(x,y)\to f(x_0,y_0)\),不能保证当点\((x,y)\)任意路径和方式趋于点\((x_0,y_0)\)时,都有\(f(x,y)\to f(x_0,y_0)\),所以不能保证\(f(x,y)\)在点\((x_0,y_0)\)连续

几何意义

​ 固定y,即\(y=y_0\)的平面对函数曲面的截面,对x求导,即得到截面的函数曲线的斜率

Notes

​ 对于n元函数求偏导,也是固定n-1个变量,对剩余的变量求偏导

全微分

​ 一元函数的微分:对于一元函数\(f:U(x_0)\subseteq R \to R\),若存在一个关于\(\Delta x\)的线性函数\(L(\Delta x)=a\Delta x\),使得函数的改变量可表示为: \[ f(x_0+\Delta x)-f(x_0)=a \Delta x+o(\Delta x) \] ​ 其中常数\(a\)\(\Delta x\)无关,\(o(\Delta x)\)是当\(\Delta x\to 0\)时关于\(\Delta x\)的高阶无穷小,则称f在点x0处可微,且称函数改变量的线性主部\(a\Delta x\)为f在x0处的微分.

​ 由此我们能得到二元函数的全微分:

​ 设二元函数z=f(x,y)在点\((x_0,y_0)\) 的某邻域\(U(x_0,y_0)\)内有定义.如果对于\((x_0+\Delta x,y_0+\Delta y)\in U(x_0,y_0)\),函数f在\((x_0,y_0)\)处的改变量 \[ \Delta z=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0) \] ​ 可以表示为: \[ \Delta z=a_1\Delta x+a_2\Delta y+o(p) \] ​ 其中,\(\alpha_1,\alpha_2\)是与\(\Delta x,\Delta y\)无关的两个常数(但与一般点\((x_0,y_0)\)有关),\(p=\sqrt{(\Delta x)^2+(\Delta y)^2},o(p)\)是当\(p\to 0(即\Delta x\to 0,\Delta y\to 0)\)时关于p的高阶无穷小,则称函数f在点\((x_0,y_0)\)处可微,并称\(a_1\Delta x+a_2\Delta y\) 为函数f在点\((x_0,y_0)\)处的全微分记作\(dz \mid _{(x_0,y_0)}\)\(df(x_0,y_0)\) \[ dz\mid _{(x_0,y_0)}=a_1 \Delta x+ a_2 \Delta y \] ​ 也即是 \[ dz\mid _{(x_0,y_0)}=a_1 dx+ a_2 dy \] ​ 当p充分小,且a1,a2不为0时,全微分\(dz\mid _{(x_0,y_0)}\)就是函数f在\((x_0,y_0)\)处的线性主部

可微的必要条件

​ 设函数\(z=f(x,y)\)在点\((x_0,y_0)\)处可微,则

  1. f在\((x_0,y_0)\)连续

  2. f在\((x_0,y_0)\)处的两个偏导数均存在,且有\(a_1=f_x(x_0,y_0),a_2=f_y(x_0,y_0)\)\[ df(x_0,y_0)=f_x(x_0,y_0)dx+f_y(x_0,y_0)dy \]

证明可微得到偏导存在:

​ 由可微的定义,函数f在\((x_0,y_0)\)处的改变量可表示为: \[ f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)=a_1 \Delta x+ a_2 \Delta y+o(p) \] ​ 取\(\Delta y=0\),则有\(\rho=|\Delta x|\),上式变为: \[ f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)=a_1 \Delta x+o(|x|) \] ​ 所以: \[ \lim _{\Delta x\to 0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}=\lim _{\Delta x\to 0}[a_1+\frac{o(|x|)}{\Delta x}]=a_1 \] ​ 即在点\((x_0,y_0)\)\(f(x,y)\)对x的偏导数存在且\(f_x(x_0,y_0)=a_1\)

​ 同理可得,当取\(\Delta x=0\)时,可得到在该点对y的偏导数也存在且\(f_y(x_0,y_0)=a_2\)

​ 当\(z=f(x,y)\)\(x_0=(x_0,y_0)\)处可微时,f在\(x_0\)处的改变量必可表示为: \[ \Delta z=f_x(x_0)\Delta x+f_y(x_0)\Delta y+o(\rho) \] ​ 其中\(o(\rho)\)是当\(\rho \to 0\)时关于\(\rho\)的高阶无穷小;反之,若\(\Delta z\)可表示为上式,则由全微分的定义可知:\(f\)\(x_0\)处可微.

​ 若\(z=f(x,y)\)在区域\(\Omega\subseteq R^2\)的每一点处都可微,则称f是\(\Omega\)内的可微函数,此时,有 \[ dz=f_xdx+f_ydy \] ​ 多元函数在一点处连续而且所有的偏导数都存在也不能保证其在该点可微.

可微的充分条件

​ 设函数\(z=f(x,y)\)在点\((x_0,y_0)\)的某邻域有定义,若\(f(x,y)\)的两个偏导数均在点\((x_0,y_0)\)处连续,则该函数在点\((x_0,y_0)\)处可微.(即偏导数存在且连续

证明:

​ 证明可微,证明\(\Delta z=f_x(x_0)\Delta x+f_y(x_0)\Delta y+o(p)\)成立即可

​ 首先通过插项的方法把二元函数的改变量转化为一元函数的改变量

\[\begin{align*} \Delta z&=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)\\&= [f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0+\Delta y)]+[f(x_0,y_0+\Delta y)-f(x_0,y_0)] \end{align*}\]

​ 上式右端中每一方括号内都是一元函数的改变量,由Lagrange微分中值公式,存在\(\theta _i(0<\theta_i<1,i=1,2)\)使得上式化为: \[ \Delta z=f_x(x_0+\theta_1 \Delta x,y_0+\Delta y)\Delta x+f_y(x_0,y_0+\theta_2\Delta y)\Delta y \] ​ 由于\(f_x(x,y)在(x_0,y_0)\)连续,有: \[ \lim_{\rho \to 0}f_x(x_0+\theta_1\Delta x,y_0+\Delta y)=f_x(x_0,y_0) \] ​ 其中\(\rho =\sqrt{\Delta x^2+\Delta y^2}\),因此有 \[ f_x(x_0+\theta_1\Delta x,y_0+\Delta y)=f_x(x_0,y_0)+\alpha_1(\rho) \] ​ 其中\(\alpha_1(\rho)\)是当\(\rho \to 0\)时的无穷小.同理可得: \[ f_y(x_0,y_0+\theta_2\Delta y)=f_y(x_0,y_0)+\alpha_2(\rho) \] ​ 其中\(\alpha_2(\rho)\)是当\(\rho \to 0\)时的无穷小.

​ 最后得到: \[ \Delta z=f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+a_1(\rho)\Delta x+a_2(\rho) \Delta y \] ​ 由: \[ \left| \frac{a_1(\rho)\Delta x+a_2(\rho)\Delta y}{\rho} \right| \le |a_1(\rho)|+|a_2(\rho)| \] ​ 易知: \[ \lim _{\rho \to 0}\frac{a_1(\rho)\Delta x+a_2(\rho)\Delta y}{\rho}=0 \] ​ 所以: \[ a_1(\rho)\Delta x+a_2(\rho)\Delta y=o(\rho) \] ​ 证毕

​ f的所有偏导数均在点\((x_0,y_0)\)处连续时,f必在点\((x_0,y_0)\)处可微,但可微函数的偏导数未必连续.

n元函数的全微分

​ 设n元函数\(u=f(\mathbf{x})=f(x_1,x_2,\cdots,x_n)\)在点\(\mathbf{x_0}=(x_{0.1},x_{0.2},\cdots,x_{0.n})\in R^n\)的邻域\(U(\mathbf{x_0})\subseteq R^n\)内有定义,如果\(\forall \mathbf{x=x_0+\Delta x\in}U(\mathbf{x_0})\),存在一组与\(\mathbf{\Delta x}=(\mathbf{\Delta x_1,\cdots,\Delta x_n})\)无关的常数\(a_1,a_2,\cdots ,a_n\),使得函数f在\(\mathbf{x_0}\)处的改变量 \[ \Delta u=f(\mathbf{x_0+\Delta x})-f(\mathbf{x_0}) \] ​ 可表示为: \[ \Delta u=a_1\Delta \mathbf{x_1}+\cdots +a_n\Delta \mathbf{x_n}+o(\rho) \] ​ 其中\(o(\rho)\)是当\(\rho=\left \| \Delta x \right \| \to 0\)时关于\(\rho\)的高阶无穷小,则称\(f\)在点\(\mathbf{x_0}\)可微,且称关于\(\Delta x_1,\cdots,\Delta x_n\)的线性函数 \[ a_1\mathbf{\Delta x_1}+\cdots+a\mathbf{\Delta x_n} \] ​ 为\(f\)\(\mathbf{x_0}\)处全微分,记为\(df(\mathbf{x_0})\),或\(du |_{x=x_0}\),即 \[ df(\mathbf{x_0})=a\mathbf{\Delta x_1}+\cdots+a_n\mathbf{\Delta x_n} \] ​ 同二元函数一样,常记\(\mathbf{x_i}=dx_i\),于是\(f\)的全微分也常写成: \[ df(\mathbf{x_0})=\sum _{i=1} ^n a_idx_i \]

近似计算和误差估计

​ 局部线性逼近(局部线性化)

​ 例题:

​ 误差估计:

​ 乘积的相对误差等于各个因子的相对误差之和

​ 商的相对误差等于分子和分母的相对误差之和

方向导数和梯度

方向导数

​ 设点\(\mathbf{x_0}\in R^2,\mathbf{l}\)是平面上的某一向量,其单位向量记为\(\mathbf{e_l},f:U(\mathbf{x_0})\subseteq R^2 \to R\)是一个二元函数.我们讨论\(f\)在点\(\mathbf{x_0}\)处沿\(l\)方向的变化率(记作\(\frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}\)).过点\(\mathbf{x_0}\)作与\(\mathbf{l}\)平行的直线L,它的方程是 \[ \mathbf{x=x_0+}t\mathbf{e_l},t\in R \]\(f(\mathbf{x})\)在点\(\mathbf{(x_0)}\)处沿\(l\)方向的变化率,就是当点\(x\)在直线\(\mathbf l\)上变动时\(f(x)\)在点\(\mathbf{x_0}\)处的变化率.在点\(\mathbf{x_0}\)\(\mathbf{e_l}\)固定的情况下,当\(\mathbf{x}\)在L上变动时,函数 \[ f(\mathbf{x})=f(\mathbf{x_0+}t\mathbf{e_l}) \] ​ 实际上是自变量t的一元函数,记作 \[ F(t)=f(\mathbf{x_0+}t\mathbf{e_l}) \] ​ 因此,\(f(\mathbf{x})\)在点\(\mathbf{(x_0)}\)处沿\(l\)方向的变化率也就是一元函数F(t)在t=0处的导数,即 \[ \frac{\partial f}{\partial \mathbf {l} }|_{ \mathbf{x_0} }=\frac{dF(t)}{dt}|_{ {t=0} }=\lim _{t \to 0}\frac{F(t)-F(0)}{t}=\lim _{t \to 0}\frac{f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})}{t} \] ​ 由此,我们给出以下定义:

​ 设点\(\mathbf{x_0}\in R^2\),\(\mathbf l\)是平面上的某一向量,与l同向的单位向量为\(\mathbf{e_l}\),二元函数f定义在\(\mathbf{x_0}\)的邻域\(U(\mathbf{x_0})\subseteq R^2\)内,在\(U(\mathbf{x_0})\)内让自变量\(\mathbf{x}\)\(\mathbf{x_0}\)沿与\(\mathbf{e_l}\)的平行的直线变到\(\mathbf{x_0+}t\mathbf{e_l}\),从而函数值有对应的改变量\(f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})\).若 \[ \lim _{t \to 0}\frac{f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})}{t} \] ​ 存在,则称该极限值为f在点\(\mathbf{x_0}\)处沿\(\mathbf l\)方向的方向导数,记作\(\frac{\partial f(\mathbf{x_0})}{\partial \mathbf{l}}|_{\mathbf{x_0}}\),或\(\frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}\),即 \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}=\lim _{t \to 0}\frac{f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})}{t} \]

  1. 定义中的t的绝对值就是两点\(\mathbf{x_0}\)\(\mathbf{x_0+}t\mathbf{e_l}\)之间的距离d,事实上,注意到\(\mathbf{e_l}\)单位向量,于是有 \[ d=\left \| (\mathbf{x_0+}t\mathbf{e_l})-\mathbf{x_0} \right \|=\left \| t\mathbf{e_l} \right \| =|t|\| \mathbf{e_l} \|=|t| \]

  2. 方向导数实际上是函数f在\(\mathbf{x_0}\)处沿l方向关于距离的变化率

几何意义

​ 过直线\(L:\mathbf{x=x_0+}t\mathbf{e_l}\)作平行于z轴的平面\(\pi\),它与曲面\(z=f(x,y)\)所交的曲线记为C.取一点\(P_0\),曲线C在\(P_0\)仅有唯一的切线T,它关于l方向的斜率就是方向导数\(\frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}\)

方向导数存在条件及计算公式

​ 若\(f(x,y)\)在点\((x_0,y_0)\)可微,则函数f在点\((x_0,y_0)\)沿任意l方向的方向导数均存在,且 \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}=f_x(x_0,y_0)\cos \alpha +f_y(x_0,y_0)\cos \beta \] ​ 其中\(l\)方向上的单位向量是\(\mathbf{e_l}=(\cos\alpha,\cos \beta)\)

证明:

​ 当\(f(x,y)\)在点\((x_0,y_0)\)可微时,函数\(f(x,y)\)\((x_0,y_0)\)处的改变量为: \[ f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)=a_1 \Delta x+a _2 \Delta y+o(\rho) \] ​ 其中\(a_1=f_x(x_0,y_0)\),\(a=f_y(x_0,y_0)\).取\(\Delta x=t\cos \alpha,\Delta y=t\cos \beta,\mathbf{x_0}=(x_0,y_0)\),则有\(\rho=\sqrt{\Delta x^2+\Delta y^2}=|t|\),且

\[\begin{align*} &f(x_0+t\cos \alpha,y_0+t\cos \beta)-f(x_0,y_0)\\ &=f(\mathbf{x_0}+t\mathbf{e_l})-f(\mathbf{x_0})=a_1t\cos \alpha+a_2 t\cos \beta+o(\rho) \end{align*}\]

于是由方向导数的定义式有:

\[\begin{align*} \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}&=\lim _{t\to 0}\frac{f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})}{t}\\ &=\lim _{t\to 0}(a_1\cos \alpha+a_2\cos\beta+\frac{o(\rho)}{t})=a_1\cos \alpha+a_2\cos \beta +\lim _{t \to 0}\frac{o(|t|)}{t}\\ &=a_1\cos \alpha+a_2 \cos \beta \end{align*}\]

​ 证毕

梯度

​ 梯度即某点最大的方向导数

​ 定义:设二元函数\(z=f(x,y)\)在点\((x_0,y_0)\)处可微,则\(f\)在该点的梯度一定存在,并且: \[ \mathbf{grad}f(x_0,y_0)=f_x(x_0,y_0)\mathbf{i}+f_y(x_0,y_0)\mathbf j \]

证明:

\(f(x,y)\)在点\((x_0,y_0)\)处可微,则\(f\)在点\((x_0,y_0)\)处沿\(\mathbf{e_l}=(\cos \alpha,\cos \beta )\)的方向导数必定存在,并且 \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}=f_x(x_0,y_0)\cos \alpha+f_y(x_0,y_0)\cos \beta \] ​ 作向量\(\mathbf g=(f_x(x_0,y_0),f_y(x_0,y_0))\),下面证明\(\mathbf g\)就是\(f\)在点\((x_0,y_0)\)处的梯度

​ 由于: \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}=<\mathbf g,\mathbf {e_l}>=\|\mathbf g\|\cos (\mathbf g,\mathbf{e_l})\le \|\mathbf g\| \] ​ 方向导数\(\frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}\)等于梯度在\(\mathbf l\)方向的投影

​ 所以,当\(\cos (\mathbf g,\mathbf{e_l})=1\)时,即\(\mathbf{e_l}\)\(\mathbf g\)同向时,\(\frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{(x_0,y_0)}}=\|\mathbf g\|\).

​ 也就是说,向量\(\mathbf g\)的方向是函数\(f\)在点\((x_0,y_0)\)处取得方向导数最大值的方向,\(\mathbf g\)的模就是\(f\)在该点方向导数的最大值,因此: \[ \mathbf g=f_x(x_0,y_0)\mathbf{i}+f_y(x_0,y_0)\mathbf j=\mathbf{grad}f(x_0,y_0) \]

​ 函数\(f\)\((x_0,y_0)\)处的梯度可用nabla算符\(\nabla\)表示(也称向量微分算子),记作\(\nabla f(x_0,y_0)\)其中符号\(\nabla =(\frac{\partial f(x_0,y_0)}{\partial x},\frac{\partial f(x_0,y_0)}{\partial y} )\),它本身并无意义,仅当将\(\nabla\)作用于函数\(f\)后表示如下向量 \[ \nabla f(x_0,y_0)=\left( \frac{\partial f(x_0,y_0)}{\partial x},\frac{\partial f(x_0,y_0)}{\partial y} \right) \]

n元函数的方向导数与梯度

​ 设\(\mathbf {x_0}\)\(R^n\)中的一个点,\(f\)为定义在\(\mathbf{x_0}\)的邻域的\(U(\mathbf{x_0})\)内的一个n元函数,\(\mathbf{e_l}\)\(R^n\)中的一个单位向量,则n元函数\(f(\mathbf x)\)在点\(\mathbf {x_0}\)沿\(\mathbf {e_l}\)方向的方向导数定义为 \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}=\lim _{t \to 0}\frac{f(\mathbf{x_0+}t\mathbf{e_l})-f(\mathbf{x_0})}{t} \]\(f\)在点\(\mathbf {x_0}\)可微时,\(f\)在点\(\mathbf {x_0}\)沿任意\(\mathbf l\)方向的方向导数都存在,并且有如下计算公式: \[ \frac{\partial f}{\partial \mathbf{l}}|_{\mathbf{x_0}}=\sum _{k=1} ^n\frac{\partial f(\mathbf {x_0}) }{\partial x_k}\cos \alpha _k \] ​ 其中\(\cos \alpha_1,\cos \alpha_2 ,\cdots ,\cos \alpha _n\)为向量\(\mathbf l\)的方向余弦.

​ 梯度计算公式: \[ \mathbf{grad}f(\mathbf {x_0} )=\nabla f(\mathbf {x_0})=\left ( \frac{\partial f }{\partial x_1},\frac{\partial f }{\partial x_2},\cdots,\frac{\partial f }{\partial x_n}\right ) \] ​ 求梯度实际上就是求偏导数,故梯度的运算法则类似于求导法则

高阶偏导数和高阶全微分

二阶偏导数

​ 若\(z=f(x,y)\)在区域D内的两个偏导函数 \[ z_x=\frac{\partial z}{\partial x} =f_x(x,y),\space z_y=\frac{\partial z}{\partial y}=f_y(x,y) \] ​ 在D内某点x处的偏导数仍存在,则这两个函数\(f_x(x,y)\)\(f_y(x,y)\)的偏导数称为函数\(f(x,y)\)二阶偏导数.

​ 按照求导次序的不同,二元函数z有四种不同的偏导数

​ 当\(f_{xy}\)\(f_{yx}\)都在点P连续时,则在点P处有\(f_{xy}=f_{yx}\),即二阶混合偏导数与求导次序无关

二阶全微分

​ 当二元函数\(u=f(x,y)\)在区域\(\Omega \subseteq R^2\)内每一点均可微时,则在\(\Omega\)内u的全微分为: \[ du=\left \langle \nabla f,\Delta \mathbf x \right \rangle=\frac{\partial f}{\partial x}dx+\frac{\partial f}{\partial y}dy \] ​ 如果把dx,dy看作固定不变,那么du就是(x,y)的函数.如果函数du仍在\(\Omega\)内可微,那么把这个函数du再求全微分,其结果称为u的二阶全微分,记作\(d^2u=d(du)\) \[ \begin{align*} d^2u=d(du)&=\frac{\partial }{\partial x}(f_xdx+f_ydy)dx+\frac{\partial}{\partial x}(f_xdx+f_ydy)dy\\ &=f_{xx}dx^2+2f_{xy}dxdy+f_{yy}dy^2\\ &=\frac{\partial^2 }{\partial x^2}dx^2+2\frac{\partial^2 }{\partial x \partial y}dxdy+\frac{\partial ^2}{\partial y^2}dy^2\\ &=\left ( \frac{\partial }{\partial x}dx+\frac{\partial }{\partial x}dy\right )^2 \end{align*} \] ​ 二阶全微分也可简洁地写成,按二项式定理展开 \[ d^2u=\left ( \frac{\partial }{\partial x}dx+\frac{\partial }{\partial x}dy\right )^2f \]

多元复合函数的偏导数和全微分

​ 若\(u=u(x,y)\)\(v=v(x,y)\)均在点\((x,y)\)处可微,且函数\(z=f(u,v)\)在对应的点\((u,v)\)处可微,则复合函数\(z=f[u(x,y),v(x,y)]\)在点\((x,y)\)处也必可微,且其全微分为: \[ dz=(\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial x})dx+(\frac{\partial z}{\partial u}\frac{\partial u}{\partial y}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial y})dy \] ​ 求导有如下链式法则: \[ \frac{\partial z}{\partial x}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial u}{\partial y} \]

\[ \frac{\partial z}{\partial y}=\frac{\partial z}{\partial u}\frac{\partial z}{\partial y}+\frac{\partial z}{\partial v}\frac{\partial z}{\partial y} \]

​ 推广到m个中间变量,n个自变量构成的一般复合函数

​ 设函数: \[ v=f(u_1,u_2,\cdots,u_m)及u_i=u_i(x_1,x_2,\cdots,x_n),i=1,2,\cdots,m \] ​ 都可微,则复合函数\(y=f(u_1(\mathbf x),u_2(\mathbf x),\cdots,u_n(\mathbf x))\)也可微,其中\(\mathbf x=(x_1,x_2,\cdots,x_n)\),且有 \[ dy=\frac{\partial y}{\partial x_1}dx_1+\frac{\partial y}{\partial x_2}dx_2+\cdots+\frac{\partial y}{\partial x_n}dx_n \] ​ 其中: \[ \frac{\partial y}{\partial x_j}=\frac{\partial y}{\partial u_1}\frac{\partial u_1}{\partial x_j}+\frac{\partial y}{\partial u_2}\frac{\partial u_2}{\partial x_j}+\cdots+\frac{\partial y}{\partial u_m}\frac{\partial u_m}{\partial x_j},j=1,2,\cdots,n \] ​ 多元函数的复合有多种情况:

  1. \(z=f(u,v),u=\varphi(x),v=\psi (x)\)均可微,则复合函数\(z=f[\varphi (x),\psi (x)]\)是x的一元函数 \[ \frac{dz}{dx}=\frac{\partial z}{\partial u}\frac{du}{dx}+\frac{\partial z}{\partial v}\frac{dv}{dx} \] 它称为复合函数z对x的全导数

  2. \(w=f(u),u=\varphi (x,y,z)\)均可微,则复合函数\(w=f[u(x,y,z)]\)可微,它有一个中间变量,有三个自变量 \[ \frac{\partial w}{\partial x}=\frac{dw}{du}\frac{\partial u}{\partial x},\frac{\partial w}{\partial y}=\frac{dw}{du}\frac{\partial u}{\partial y},\frac{\partial w}{\partial z}=\frac{dw}{du}\frac{\partial u}{\partial z} \]

  3. \(u=f(x,y,z),z=\varphi(x,y)\)均可微,则复合函数\(u=f[x,y,z(x,y)]\)可微,它有三个中间变量,两个自变量 \[ \frac{\partial u}{\partial x}=\frac{\partial f}{\partial x}+\frac{\partial f}{\partial z}\frac{\partial z}{\partial x},\frac{\partial u}{\partial y}=\frac{\partial f}{\partial y}+\frac{\partial f}{\partial z}\frac{\partial z}{\partial y} \]

一阶全微分形式不变性

​ 证明:

​ 设有函数\(z=f(u,v)\)\(u=\varphi(x,y),v=\psi(x,y)\)复合.若\(\varphi,\psi\)在点\((x,y)\)处可微,且\(f\)在与\((x,y)\)相应的\((u,v)\)处可微,则复合函数的全微分为: \[ dz=\frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy \] ​ 由复合函数求导法则: \[ \frac{\partial z}{\partial x}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial x}, \frac{\partial z}{\partial y}=\frac{\partial z}{\partial u}\frac{\partial u}{\partial y}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial y} \] ​ 整理得到: \[ dz=\frac{\partial z}{\partial u}(\frac{\partial u}{\partial x}dx+\frac{\partial u}{\partial y}dy)+\frac{\partial z}{\partial v}(\frac{\partial v}{\partial x}dx+\frac{\partial v}{\partial y}dy) \] ​ 而\(\frac{\partial u}{\partial x}dx+\frac{\partial u}{\partial y}dy=du,\frac{\partial v}{\partial x}dx+\frac{\partial v}{\partial y}dy=dv\)

​ 所以有: \[ dz=\frac{\partial z}{\partial u}du+\frac{\partial z}{\partial v}dv \]

\[ \frac{\partial z}{\partial x}dx+\frac{\partial z}{\partial y}dy=\frac{\partial z}{\partial u}du+\frac{\partial z}{\partial v}dv \]

​ 上面的全微分形式与把函数\(z=f(u,v)\)中的中间变量\(u,v\)看作是自变量时的全微分形式的完全一样的,我们把这一性质成为一阶全微分形式不变性

隐函数微分法(determined by 1 equation)

​ 一般地,设有方程 \[ F(x_1,\cdots,x_n,y)=0 \] ​ 如果存在一个n元函数\(y=\varphi(\mathbf x),\mathbf x=(x_1,\cdots,x_n)\in \Omega \subseteq R^n(\Omega 为一区域)\)使得将\(y=\varphi (\mathbf x)\)代入后成为恒等式 \[ F(x_1,\cdots,x_n,\varphi(x_1,\cdots,x_n)) \equiv 0 \] ​ 则称\(y=\varphi(\mathbf x)\)是由上述方程确定的隐函数

隐函数存在定理

​ 如果二元函数\(F(x,y)\)满足:

  1. \(F(x_0,y_0)=0\)
  2. 在点\((x_0,y_0)\)的某邻域中有连续的偏导数
  3. \(F_y(x_0,y_0)\neq 0\)

​ 则方程\(F(x,y)=0\)在点\((x_0,y_0)\)的某一邻域中唯一确定了一个具有连续导数的函数\(y=f(x)\),它满足\(y_0=f(x_0)\),及\(F(x,f(x))\equiv 0\)并且 \[ \frac{dy}{dx}=-\frac{F_x}{F_y} \] ​ 计算公式的推导就是对满足的方程进行求导,然后解一个方程,多元函数也是同理

多元函数的泰勒公式和极值问题

​ 设二元函数\(z=f(x,y)\)在点\((x_0,y_0)\)的某邻域\(U(x_0,y_0)\)内连续的二阶偏导数.\((x_0+\Delta x,y_0+\Delta y)\in U(x_0,y_0)\),则存在\(\theta \in (0,1)\)使得 \[ f(x_0+\Delta x,y_0+\Delta y)=f(x_0,y_0)+f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+R_1 \] ​ 其中 \[ R_1=\frac{1}{2!}(f_{xx}\Delta x^2+2f_{xy}\Delta x \Delta y +f_{yy}\Delta y^2)|_{(x_0+\theta \Delta ,y_0+\theta \Delta)} \] ​ 二元函数Tylor公式证明的基本思路也是引入参数t,将二元函数化为t的一元函数\(\varphi(t)=f(x_0+t\Delta x,y_0+t\Delta y)\),要使证明的公式中的各项\((f(x_0,y_0),f_x(x_0,y_0),f_y(x_0,y_0)及二阶偏导数)\)可利用一元函数\(\varphi (t)\)的对应项来表示,并利用一元函数\(\varphi(t)\)的Taylor公式来证明

​ 将上述式子写成矩阵形式

​ 令\(\Delta x_0=(x_0,y_0)^T,\mathbf{x_0+\Delta x}=(x_0+\Delta x,y_0+\Delta y)^T\),则\(f(x_0+\Delta x,y_0+\Delta y)=f(x_0,y_0)+f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y+R_1\)中的一阶导数部分可以写成二元函数\(f\)的梯度向量\(\nabla f(x_0,y_0)=(f_x(x_0,y_0),f_y(x_0,y_0))\)与向量\(\mathbf{\Delta x=(\Delta x,\Delta y)}^T\)的内积形式,即 \[ (f_x\Delta x+f_y\Delta y)|_{(x_0,y_0)}=\left \langle \nabla f(x_0,y_0),\mathbf {\Delta x} \right \rangle \] ​ 而\(R_1=\frac{1}{2!}(f_{xx}\Delta x^2+2f_{xy}\Delta x \Delta y +f_{yy}\Delta y^2)|_{(x_0+\theta \Delta ,y_0+\theta \Delta)}\)是关于\(\Delta x,\Delta y\)的一个二次型,其系数矩阵为 \[ \mathbf {H_f(x_0+\theta \Delta x)}=\begin{bmatrix} f_{xx} & f_{xy}\\ f_{xy} & f_{yy} \end{bmatrix} \bigg|_\mathbf{(x_0+\theta \Delta x)} \] ​ 称为函数\(f\)\(\mathbf{x_0+\theta \Delta x}\)处的Hesse矩阵,故二次型的矩阵形式为 \[ R_1=\frac{1}{2!}(\mathbf {\Delta x})^T\mathbf{H_f(x_0+\theta \Delta x)\Delta x} \] ​ 这样,我们就可以把Taylor公式写成如下的矩阵形式 \[ f(\mathbf{x_0+\Delta x})=f(\mathbf{x_0}+\left \langle \nabla f(\mathbf {x_0} ),\mathbf {\Delta x_0} \right \rangle +\frac{1}{2!}(\mathbf {\Delta x})^T\mathbf{H_f(x_0+\theta \Delta x)\Delta x} \] ​ 由于\(\mathbf {H_f}\)的元素由\(f\)的二阶偏导数构成,而\(f\)的所有二阶偏导数均连续,可以证明 \[ (\mathbf {\Delta x})^T\mathbf{H_f(x_0+\theta \Delta x)\Delta x}=(\mathbf {\Delta x})^T\mathbf{H_f(x_0)\Delta x}+o(\|\mathbf{\Delta x} \|^2) \] ​ 由此得到\(f(\mathbf{x})\)\(\mathbf {x_0}\)处带有Peano余项的二阶Taylor公式: \[ f(\mathbf{x_0+\Delta x})=f(\mathbf {x_0})+\left \langle \nabla f(\mathbf {x_0},\mathbf {\Delta x}) \right \rangle +\frac{1}{2!}(\mathbf {\Delta x})^T\mathbf{H_f(x_0)\Delta x}+o(\|\mathbf{\Delta x} \|^2) \]

类函数

​ 定义:设\(f(x)\)是定义在区域\(\Omega \subseteq R^n\)内的n元函数,若\(f\)\(\Omega\)内连续,则称\(f\)是定义在\(\Omega\)上的\(C^{(0)}\)类函数,记为\(f\in C^{(0)}(\Omega)\),或\(C(\Omega)\)若函数在\(\Omega\)内具有连续的\(m(m\ge 1为正整数)\)阶偏导数,则称\(f\)\(\Omega\)上的\(C^{(m)}\)类函数,记作\(f\in C^{(m)}(\Omega)\)

​ 设n元函数\(f\in C^{(2)}(U(\mathbf {x_0})),\mathbf{x_0+\Delta x\in U(x_0)}\),其中\(\mathbf{x_0}=(x_{0.1},x_{0.2},\cdots,x_{0.n}^T\).则存在\(\theta \in(0,1)\)使得 \[ f(\mathbf{x_0+\Delta x})=f(\mathbf{x_0})+\sum _{i=1} ^n \frac{\partial f(\mathbf {x_0})}{\partial x_i}\mathbf{\Delta x_i}+R_1 \] ​ 其中 \[ R_1=\frac{1}{2!}\sum _{i=1}^n \sum _{j=1}^{j} \frac{\partial^2f (\mathbf{x_0+\Delta x)} } {\partial x_i \partial x_j }\mathbf{\Delta x_i \Delta x_j} \] ​ 称为Lagrange余项的一阶形式.

​ 上述公式也可写成如下的矩阵形式 \[ f(\mathbf{x_0+\Delta x})=f(\mathbf{x_0}+\left \langle \nabla f(\mathbf {x_0} ),\mathbf {\Delta x_0} \right \rangle +\frac{1}{2!}(\mathbf {\Delta x})^T\mathbf{H_f(x_0+\theta \Delta x)\Delta x} \] ​ 其中实对称矩阵 \[ \mathbf{H_f}(\mathbf{x_0+\Delta x})= \begin{bmatrix} f_{x_1x_1}(\mathbf x) &f_{x_1x_2}(\mathbf x) & \cdots & f_{x_1x_n}(\mathbf x)\\ f_{x_2x_1}(\mathbf x) & f_{x_2x_2}(\mathbf x) & \cdots &f_{x_2x_n}(\mathbf x) \\ \vdots & \vdots & &\vdots \\ f_{x_nx_1}(\mathbf x) & f_{x_nx_2}(\mathbf x) &\cdots &f_{x_nx_n}(\mathbf x) \end{bmatrix} _{\mathbf{x_0+\Delta x}} \] ​ 是函数\(f\)在点\(\mathbf{x_0+\Delta x}\)的Hesse矩阵

​ 同理可以得到n元函数\(f\)\(\mathbf{x_0}\)处带有Peano余项的Taylo公式

无约束极值、最大值与最小值

极值的必要条件:

​ 由一元函数极值的必要条件,必有\(f_x(x_0,y_0)=0\)同理能得到\(f_y(x_0,y_0)=0\),由梯度计算公式能得到

​ 设n元函数\(f\)在点\(\mathbf{x_0}\)处可微,且\(\mathbf{x_0}\)\(f\)的极值点,则必有\(\nabla f(\mathbf{x_0)=0}\)

​ 我们称满足\(\nabla f(\mathbf{x_0)=0}\)的点为\(f\)的驻点,

​ 驻点不一定是极值点,极值点也不一定是驻点(极值点处偏导数不存在),若极值点处存在偏导数,则极值点一定是驻点。

极值的充分条件

​ 设n元函数\(f\in C^{(2)}(\Omega),\nabla f(\mathbf{x_0)=0},\mathbf{H_f}(\mathbf{x_0})\)\(f\)在点\(\mathbf{x_0}\)的Hesse矩阵.若\(\mathbf{H_f}(\mathbf{x_0})\)正定(负定),则\(f(\mathbf {x_0})\)\(f\)的极小值(极大值).

The concept of positive definite matrix can move to Linear Algebra Notes | Sa1ge 's Blog)

证明:

​ 因为\(\nabla f(\mathbf{x_0)=0}\)由Talyor公式,有 \[ f(\mathbf{x_0+\Delta x})-f(\mathbf {x_0})=\frac{1}{2!}(\mathbf {\Delta x})^T\mathbf{H_f(x_0)\Delta x}+o(\|\mathbf{\Delta x} \|^2) \] ​ 当\(\mathbf{H_f(x_0)}\)正定时,知\(\mathbf{H_f(x_0)}\)的最小特征值\(\lambda_1>0\),而且\(\forall \mathbf{\Delta x\neq 0}\),恒有: \[ (\mathbf {\Delta x})^T\mathbf{H_f(x_0)\Delta x} \ge \lambda_1\|\mathbf{\Delta x}\|^2 \] ​ 于是有: \[ f(\mathbf{x_0+\Delta x})-f(\mathbf {x_0})\ge \frac{1}{2}\lambda_1\|\mathbf{\Delta x}\|^2+o(\|\mathbf{\Delta x} \|^2)=[\frac{1}{2}\lambda_1o(1)]\|\mathbf{\Delta x}\| \] ​ 其中o(1)是当\(\mathbf{\Delta x \to 0}\)时的无穷小量.由上式即知:当\(\mathbf{\Delta x\neq 0}\)\(\|\mathbf{\Delta x}\|\)充分小时,就有: \[ f(\mathbf{x_0+\Delta x})-f(\mathbf {x_0})>0,或f(\mathbf{x_0+\Delta x})>f(\mathbf {x_0}) \] ​ 这就是说,当\(\mathbf{H_f(x_0)}\)正定时,\(f(\mathbf{x_0})\)\(f\)的极小值;同理可得,当当负定时,\(f(\mathbf{x_0})\)\(f\)的极大值

​ 求\(C^{(2)}\)类函数\(f\)的极值的步骤:

  1. 求出\(f\)的所有驻点
  2. 求出\(f\)在各个驻点的Hesse矩阵
  3. 判断Hesse矩阵的类型,确定出\(f\)的极值点

​ 当\(\mathbf{H_f(x_0)}\)不定时,因为二次型\((\mathbf{x-x_0})^T\mathbf{H_f}(\mathbf{x-x_0})\)不定,从而在\(\mathbf{x_0}\)的邻域内\([f(\mathbf{x})-f(\mathbf{x_0})]\)不定号,所以\(f(\mathbf{x_0})\)不是极值.

​ 特别地,对于二元函数\(z=f(x,y)\),若点\(P_0(x_0,y_0)\)\(f\)的驻点,记 \[ f_{xx}(P_0)=A,f_{xy}(P_0)=B,f_{yy}(P_0)=C \] ​ 则\(f\)在点\(P_0\)的Hesse矩阵为 \[ \mathbf{H_f}(P_0)=\begin{bmatrix} A &B \\ B &C \end{bmatrix} \] ​ 于是根据矩阵判定,有:

  • \(A>0,AC-B^2>0\)\({H_f}(P_0)\)正定,故\(f(P_0)\)为极小值;
  • \(A<0,AC-B^2>0\)\({H_f}(P_0)\)负定,故\(f(P_0)\)为极大值;
  • \(AC-B^2<0\)\({H_f}(P_0)\)不定,故\(f(P_0)\)不是极值;

​ 当\(AC-B^2=0\),称为临界情况,这是只根据二阶泰勒公式不能确定点\(P_0\)是否是\(f\)的极值点,需要进一步用极限的定义来讨论

最大值和最小值

​ 可以先求\(f\)\(\Omega\)内部的一切驻点处的函数值、偏导数不存在点处的函数值以及\(f\)\(\Omega\)边界上的最大值(最小值),这些数中最大(最小)的一个便是所求的最大(最小)值.

有约束极值,Lagrange乘数法

​ 附有约束条件的极值问题,称为有约束极值问题(或条件极值问题)

​ 某些情形下,这种有约束极值问题可以化为无约束极值问题来求解,但并不一般适用

Lagrange乘数法

​ 设目标函数 \[ z=f(x,y) \] ​ 在约束条件 \[ \varphi(x,y)=0 \] ​ 下取得极值,且\((x_0,y_0)\)为其极值点,并设\(f,\varphi\in C ^{(1)}(U(x_0,y_0))\)\(\varphi_y(x_0,y_0)\neq 0\),于是有 \[ \varphi(x_0,y_0)=0 \] ​ 且由隐函数存在定理可知,方程\(\varphi(x,y)=0\)确定了一可导函数\(y=y(x)\),它满足\(\varphi[x,y(x)]\equiv 0\)\(y_0=y(x_0)\),把它代入目标函数得: \[ z=f[x,y(x)] \] ​ 这样将有约束极值问题化为了一元函数的无约束极值问题,而\(x=x_0\)就是函数的极值点,由一元可导函数取得极值的必要条件可知: \[ \frac{dz}{dx}\bigg |_{x=x_0}=f_x(x_0,y_0)+f_y(x_0,y_0)\frac{dy}{dx}\bigg|_{x=x_0}=0 \] ​ 对\(\varphi(x,y)=0\)运用隐函数求导法则,得: \[ \frac{dy}{dx}\bigg|_{x=x_0}=-\frac{\partial_x(x_0,y_0)}{\partial_y(x_0,y_0)} \] ​ 代入\(\frac{dz}{dx}\bigg |_{x=x_0}=f_x(x_0,y_0)+f_y(x_0,y_0)\frac{dy}{dx}\bigg|_{x=x_0}=0\)得: \[ f_x(x_0,y_0)-f_y(x_0,y_0)\frac{\partial_x(x_0,y_0)}{\partial_y(x_0,y_0)}=0 \] ​ 于是 \[ \varphi(x_0,y_0)=0\varphi(x_0,y_0)=0 \]

\[ f_x(x_0,y_0)-f_y(x_0,y_0)\frac{\partial_x(x_0,y_0)}{\partial_y(x_0,y_0)}=0 \]

​ 两式就是所求有约束极值的必要条件.从此两式解出的\((x_0,y_0)\)就可能是所求有约束极值的极值点(条件极值点

​ 用行列式写成 \[ \begin{vmatrix} f_x(x_0,y_0) &f_y(x_0,y_0) \\ \varphi_x(x_0,y_0) & \varphi_y(x_0,y_0) \end{vmatrix}=0 \]

​ 由行列式的性质知,其两行对应成比例,令此比例系数为\(-\lambda_0\),于是得到: \[ \begin{cases} f_x(x_0,y_0)+\lambda_0\varphi_x(x_0,y_0)=0\\ f_y(x_0,y_0)+\lambda_0\varphi_y(x_0,y_0)=0\\ \varphi(x_0,y_0)=0 \end{cases} \] ​ 容易看出,上式就是三元函数 \[ L(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y) \] ​ 在\((x_0,y_0,\lambda_0)\)取得无约束极值的必要条件.

​ 所以要求目标函数在约束条件下的有约束极值点\((x_0,y_0)\),可先构成函数\(L(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y)\),然后令它的三个偏导数为零得: \[ \begin{cases} L_x(x,y,\lambda)=f_x(x,y)+\lambda\varphi_x(x,y)=0\\ L_x(x,y,\lambda)=f_y(x,y)+\lambda\varphi_y(x,y)=0\\ L_\lambda(x,y,\lambda)=\varphi_(x,y)=0 \end{cases} \] ​ 再从这三个方程中解出\(x_0,y_0,\lambda\),则其中的点\((x_0,y_0)\)就可能是所求的有约束极值点

​ 函数\(L(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y)\)称为Lagrange函数,数\(\lambda\)称为Lagrange乘数,这种求有约束极值点的必要条件的方法称为Lagrange乘数法\((x_0,y_0,\lambda_0)\)就是Lagrange函数L的驻点.

​ 方程组也可写成向量形式: \[ \begin{cases} \nabla f(P)=-\lambda\nabla\varphi(P)\\ \varphi(P)= \end{cases} \] ​ 其中\(\nabla f=(f_x,f_y)\)是函数\(f\)的梯度,\(\nabla \varphi\)\(\varphi\)的梯度. ​ 当约束条件有多个时,需要构造的Lagrange函数是 \[ L(x_1,\cdots,x_n,\lambda_1,\cdots,\lambda_m)=f(x_1,\cdots,x_n)+\sum _{k=1} ^m \lambda_k\varphi_k(x_1,\cdots,x_n) \]

隐函数的求导公式

​ 一个方程确定的隐函数已在上文给出隐函数微分法

​ 由m个m+n元方程组成的方程组 \[ \begin{cases} F_1(x_1,\cdots,x_n,y_1,\cdots,y_m)=0,\\ F_2(x_1,\cdots,x_n,y_1,\cdots,y_m)=0,\\ \cdots\cdots\\ F_n(x_1,\cdots,x_n,y_1,\cdots,y_m)=0,\\ \end{cases} \] ​ 对于给定的\(x_1,\cdots,x_n\),上式就是包含m个方程、m+n个变量的方程组.如果存在定义在点集\(A\subseteq R^n\)上的m个函数 \[ y_i=f_i(x_1,\cdots,x_n),i=1,2,\cdots,m \] ​ 使得其代入方程组后变成m个恒等式,那么就称m个函数是它的解,或称由该方程组所确定的隐函数

### 隐函数存在定理

​ 设有函数方程组 \[ \begin{cases} F_1(x,y,u,v)=0\\ F_2(x,y,u,v)=0 \end{cases} \] ​ 如果函数\(F_1,F_2\)满足

  1. \(F_i\in C^{(1)}(U(x_0,y_0,u_0,v_0)),i=1,2\)

  2. \(F_i(x_0,y_0,u_0,v_0)=0,i=1,2\)

  3. Jacobi行列式 \[ J=\frac{\partial (F_1,F_2)}{\partial (u,v)}\bigg |_{(x_0,y_0,u_0,v_0)}=\begin{vmatrix} \frac{\partial F_1}{\partial u} &\frac{\partial F_1}{\partial v} \\ \frac{\partial F_2}{\partial u} &\frac{\partial F_2}{\partial v} \end{vmatrix} \neq0 \]

​ 则在点\((x_0,y_0,u_0,v_0)\in R^4\)的某邻域\(U(x_0,y_0,u_0,v_0)\)内由方程组唯一确定了两个单值且有连续偏导数的二元函数 \[ u=u(x,y),v=v(x,y) \] ​ 它满足 \[ u_0=u(x_0,y_0),v_0=v(x_0,y_0) \] ​ 及 \[ F_i(x,y,(x,y),v(x,y))\equiv 0,u=1,2,(x,y)\in U((x_0,y_0)) \] ​ 对隐函数的导数公式的推导:

​ 例题:

几何学应用

空间曲线的切线与切面

空间曲线的切线与法平面

​ 设空间简单曲线\(\Gamma\)的方程为 \[ \mathbf {r=r(t)}=(x(t),y(t),z(t))\space \space (\alpha \le t \le \beta) \] ​ 其中向量值函数\(\mathbf r(t)\)\([\alpha,\beta]\)上可导,其导数记作\(\mathbf{\dot{r(t)} }=(\dot{x(t)},\dot{y(t)},\dot{z(t)})\neq \mathbf 0 \space \space (\alpha \le t\le \beta)\)

​ 向径\(\mathbf{r(t)}\)的导数\(\mathbf{\dot{r(t)} }\)\(\Gamma\)在点\(P_0\)的切线的一个方向向量,而且它的方向与\(\Gamma\)的正方向一致,称它为\(\Gamma\)在点\(P_0\)切向量.

​ 曲线\(\Gamma\)\(P_0(\mathbf r(t_0))\)处切线的向量方程写为 \[ \mathbf \rho =\mathbf{r(t_0)}+t\dot{\mathbf r}(t_0) \] ​ 其中\(\mathbf \rho=(x,y,z)\)为切线上动点\(P(x,y,z)\)的向径,\(t\in R\)为参数,消去参数t,即得该切线的对称式方程 \[ \frac{x-x(t_0)}{\dot{x}(t_0)}=\frac{y-y(t_0)}{\dot{y}(t_0)}=\frac{z-z(t_0)}{\dot{z}(t_0)} \] ​ 过曲线\(\Gamma\)上的点\(P_0\)且与点\(P_0\)处的切线垂直的任一直线称为此曲线\(\Gamma\)在点\(P_0\)的法线,这些法线位于的同一平面称为\(\Gamma\)在点\(P_0\)的法平面.

​ 显然\(\dot{\mathbf r(t_0)}\)是法平面的一个法线向量,于是法平面的方程是 \[ \dot{\mathbf r(t_0)}\cdot[\mathbf \rho -\mathbf r(t_0)]=0 \] ​ 或 \[ \dot{x(t_0)}[x-x(t_0)]+\dot{y(t_0)}[y-y(t_0)]+\dot{z(t_0)}[z-z(t_0)]=0 \] ​ 其中\(\mathbf \rho =(x,y,z)\)是法平面上点\((x,y,z)\)的向径.

​ 如果曲线\(\Gamma\)是由两柱面的交线给出,设它的方程为 \[ y=y(x),z=z(x)\space (a \le x \le b) \] ​ 把x看作是参数,得出 \[ x=x,y=y(x),z=z(x)\space (a \le x \le b) \] ​ 那么\(\Gamma\)上与参数\(x=x_0\)相对应的点的切线方程是 \[ \frac{x-x(t_0)}{1}=\frac{y-y(t_0)}{\dot{y}(t_0)}=\frac{z-z(t_0)}{\dot{z}(t_0)} \] ​ 法平面方程: \[ x-x(t_0)+\dot{y(t_0)}[y-y(t_0)]+\dot{z(t_0)}[z-z(t_0)]=0 \] ​ 如果曲线\(\Gamma\)的方程由一般式方程 \[ \begin{cases} F(x,y,z)=0\\ G(x,y,z)=0 \end{cases} \] ​ 给出,且在点\(P(x_0,y_0,z_0)\)的某邻域内方程组满足隐函数存在定理的条件,不妨设 \[ \frac{\partial(F,G)}{\partial(y,z)}\bigg |_{P_0}\neq 0 \] ​ 那么在点\(P_0\)的某邻域内由方程组确定两个具有连续导数的一元隐函数\(y=y(x),z=z(x)\).由隐函数求导法求出\(\dot{y(x)}\)\(\dot{z(x)}\)之后,再代入方程组,得到曲线的切线方程和法平面方程

弧长

​ 定义:设简单曲线\(\Gamma\)的方程是 \[ \mathbf{r=r(t)}=(x(t),y(t),z(t))\space \space (\alpha \le t\le \beta) \]\(\Gamma\)的两个端点A,B分别对应于向径\(\mathbf{r(\alpha)},\mathbf{r(\beta)}\),在\(\Gamma\)上介于A和B之间沿着参数t增大的方向依次去n-1个分点\(P_1,P_2,\cdots,P_{n-1}\),它们把\(\Gamma\)分为了n段,用直线段把相邻分点连结起来,即得到一折线,它的长度是 \[ s_n=\sum _{i=1} ^n \| \overrightarrow {P_{i-1}P_i}\| \] ​ 其中\(A=P_0,B=P_N\).如果不管分点如何选取,当\(d=max\|\overrightarrow {P_{i-1}P_i}\|\to 0\)时,折线的长度\(s_n\)有确认的极限\(s\),则称\(\Gamma\)为可求长的曲线,且这个极限值\(s\)\(\Gamma\)的长度,或\(\Gamma\)的弧长,即 \[ s=\lim _{d\to 0}\sum _{i=1} ^n \|\overrightarrow {P_{i-1}P_i}\| \] ​ 弧长的计算公式:

​ 设在\([\alpha,\beta]\)\(\dot{\mathbf r}(t)\)连续且\(\dot{\mathbf r}(t)\neq \mathbf 0\),则曲线\(\mathbf r=\mathbf r(t)\space (\alpha \le t\le \beta)\)是可求长的曲线,且\(\Gamma\)的长度为 \[ s=\int _\alpha ^\beta \|\dot{\mathbf {r} }(t)dt=\int _\alpha ^\beta \sqrt{[\dot{x}(t)]^2+\dot{y}(t)]^2+\dot{z}(t)]^2}dt \] ​ 对于平面曲线\(\Gamma:x=x(t),y=y(t)(\alpha \le t\le \beta)\),其弧长为: \[ s=\int _\alpha ^\beta \sqrt{ [\dot{x}(t)]^2+\dot{y}(t) ]^2 } dt \] ​ 从而有:

  • 若平面曲线\(\Gamma\)在直角坐标系下的方程为: \[ y=y(x) (a\le x\le b) \] ​ 则\(\Gamma\)有参数方程\(x=x,y=y(x)(a\le x\le b)\),因而\(\Gamma\)的弧长为 \[ s=\int _a ^b \sqrt{1+[y'(x)]^2}dx \]

  • 若平面曲线\(\Gamma\)在极坐标下的方程是 \[ \rho=\rho(\theta) (\alpha\le \theta\le \beta) \] ​ 则\(\Gamma\)有参数方程\(x=\rho(\theta)\cos \theta,y=x=\rho(\theta)\sin \theta\space (\alpha \le \theta \le \beta)\).于是\(\Gamma\)的弧长为 \[ s=\int _\alpha ^\beta \sqrt{[x'(\theta)]^2+[y'(\theta)]^2}d\theta=\int _\alpha ^\beta \sqrt{[\rho(\theta)]^2+[\rho'(\theta)]^2}d\theta \]

    ## 弧微分

​ 我们称 \[ ds=\|\dot{\mathbf{r}}(t)\|=\sqrt{[\dot{x}(t)]^2+\dot{y}(t)]^2+\dot{z}(t)]^2}dt \] ​ 为弧长\(s(t)\)的微分,简称弧微分.

​ 由于\(\frac{ds}{dt}=\|\dot{\mathbf{r}}(t)\|>0\),故\(s=s(t)\)存在反函数\(t=t(s)\),将它代入\(\Gamma\)的参数方程\(\mathbf{r=r}(t)\),便得到\(\Gamma\)​以弧长s为参数的方程 \[ \mathbf{r=r}(t(s)) \space (a\le s\le b) \] ​ 称\(s\)为曲线\(\Gamma\)自然参数,其中\([a,b]\)为函数\(s=s(t)\space (\alpha \le t\le \beta)\)的值域