研一数学基础复习笔记(九):从微分方程反推泛函

1. 为什么面试前要看这个问题?

前面几篇主要是从“泛函”出发,通过变分得到控制方程。

例如对泛函:

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

进行变分,并令:

$$ \delta J = 0 $$

可以得到欧拉-拉格朗日方程:

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

这是一条从泛函到微分方程的路线。

但是在实际问题中,我们经常遇到的是相反情况:

已经知道了微分方程,能不能找到它对应的泛函?

这就是变分反问题。

例如我们已经知道某个边值问题:

$$ y'' - y = 1 $$

并且边界条件为:

$$ y(0) = 0,\quad y(L) = 0 $$

那么是否可以找到一个泛函 $S[y]$,使得对它变分之后正好得到这个微分方程?

这个问题非常重要。

因为很多数值方法,尤其是 Ritz 方法和有限元方法,通常需要从泛函或弱形式出发。如果能从微分方程构造出泛函,就可以把微分方程问题转化为能量极值问题,再进一步转化为代数方程组。

所以本篇的核心是:

从微分方程反推泛函,本质上是在寻找这个方程背后的能量形式或变分结构。


2. 核心概念

2.1 什么是变分正问题?

所谓变分正问题,就是已知泛函,通过变分得到微分方程。

例如已知:

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

令:

$$ \delta J = 0 $$

可以得到:

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

这条路线可以概括为:

$$ \text{泛函} \quad \Longrightarrow \quad \text{变分} \quad \Longrightarrow \quad \text{微分方程} $$

在力学中,这对应于从能量原理推出平衡方程。

例如最小势能原理可以推出结构平衡方程,Hamilton 原理可以推出动力学方程。


2.2 什么是变分反问题?

变分反问题则是反过来。

已知微分方程:

$$ L[y] = 0 $$

希望找到一个泛函:

$$ J[y] $$

使得:

$$ \delta J = 0 $$

能够推出原来的微分方程。

这条路线可以概括为:

$$ \text{微分方程} \quad \Longrightarrow \quad \text{构造泛函} \quad \Longrightarrow \quad \text{变分形式} $$

这就是变分反问题。

需要注意的是:

并不是所有微分方程都一定存在自然对应的泛函。

有些方程可以很容易找到能量形式,有些方程则很难,甚至没有标准的变分结构。


2.3 为什么不是所有方程都有简单泛函?

从欧拉-拉格朗日方程看,一个方程如果能由泛函:

$$ J[y] = \int F(x,y,y')\,dx $$

推出,那么它必须具有某种特殊结构:

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

也就是说,微分方程的形式要能写成某个泛函的一阶变分。

但有些微分方程中包含非保守项、阻尼项、对流项或非自伴算子,这些项不一定能直接对应到一个简单能量泛函。

例如讲义中提到的方程:

$$ y'' + y' - f(x) = 0 $$

其中 $y’’$ 项和 $f(x)$ 项比较容易通过分部积分找到泛函来源,但 $y’$ 项就不容易直接写成某个常规泛函的一阶变分。

这说明变分反问题不是简单地“把方程积分一下”,而是要看方程本身是否具有合适的变分结构。


2.4 最小二乘法是一种通用构造思路

如果一个微分方程难以直接找到自然泛函,可以考虑最小二乘形式。

假设方程为:

$$ L[y] = 0 $$

那么可以构造泛函:

$$ S[y] = \int_{x_0}^{x_1} \left(L[y]\right)^2 dx $$

因为:

$$ S[y] \ge 0 $$

并且当:

$$ L[y] = 0 $$

时,$S[y]$ 取得最小值 $0$。

所以最小二乘法的思想是:

不直接寻找原方程的自然能量泛函,而是让微分方程残差的平方积分最小。

这种方法非常通用,也和后续的残差法、最小二乘有限元有关系。


3. 关键公式

3.1 从欧拉-拉格朗日方程反推

假设一个微分方程可以写成:

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

两端乘以任意变分 $\delta y$:

$$ \delta y \left[ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) \right] = 0 $$

在区间上积分:

$$ \int_{x_0}^{x_1} \delta y \left[ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) \right] dx = 0 $$

对第二项做分部积分:

$$ -\int_{x_0}^{x_1} \delta y \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) dx = -\left.\delta y\frac{\partial F}{\partial y'}\right|_{x_0}^{x_1} + \int_{x_0}^{x_1} \frac{\partial F}{\partial y'}\delta y'\,dx $$

如果边界变分为零:

$$ \delta y(x_0)=0,\quad \delta y(x_1)=0 $$

则边界项消失,于是得到:

$$ \int_{x_0}^{x_1} \left[ \frac{\partial F}{\partial y}\delta y + \frac{\partial F}{\partial y'}\delta y' \right] dx = 0 $$

而括号中的内容正是:

$$ \delta F = \frac{\partial F}{\partial y}\delta y + \frac{\partial F}{\partial y'}\delta y' $$

所以:

$$ \delta \int_{x_0}^{x_1}F(x,y,y')\,dx = 0 $$

因此可以得到泛函:

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

这就是从方程反推泛函的基本逻辑。


3.2 一个典型例子

考虑边值问题:

$$ y'' - y = 1 $$

边界条件为:

$$ y(0)=0,\quad y(L)=0 $$

先将方程改写为:

$$ y'' - y - 1 = 0 $$

乘以任意变分 $\delta y$ 并积分:

$$ \int_0^L \delta y(y'' - y - 1)\,dx = 0 $$

展开为:

$$ \int_0^L \delta y\,y''\,dx - \int_0^L \delta y\,y\,dx - \int_0^L \delta y\,dx = 0 $$

对第一项分部积分:

$$ \int_0^L \delta y\,y''\,dx = \left.\delta y\,y'\right|_0^L - \int_0^L \delta y'\,y'\,dx $$

由于边界变分为零:

$$ \delta y(0)=0,\quad \delta y(L)=0 $$

所以边界项消失:

$$ \int_0^L \delta y\,y''\,dx = - \int_0^L \delta y'\,y'\,dx $$

于是原式变成:

$$ -\int_0^L \delta y'\,y'\,dx - \int_0^L \delta y\,y\,dx - \int_0^L \delta y\,dx = 0 $$

这可以写成:

$$ -\delta \int_0^L \left[ \frac{1}{2}(y')^2 + \frac{1}{2}y^2 + y \right] dx = 0 $$

所以对应泛函可以取为:

$$ S[y] = \int_0^L \left[ \frac{1}{2}(y')^2 + \frac{1}{2}y^2 + y \right] dx $$

这说明原微分方程:

$$ y'' - y = 1 $$

可以通过上述泛函的变分得到。


3.3 最小二乘泛函

对于一个一般微分方程:

$$ L[y] = 0 $$

可以构造最小二乘泛函:

$$ S[y] = \int_{x_0}^{x_1}(L[y])^2\,dx $$

例如对方程:

$$ y'' + y' - f(x) = 0 $$

可以构造:

$$ S[y] = \int_{x_0}^{x_1} \left[y'' + y' - f(x)\right]^2 dx $$

显然:

$$ S[y] \ge 0 $$

当:

$$ y'' + y' - f(x) = 0 $$

时:

$$ S[y] = 0 $$

因此原方程的精确解会使这个残差平方积分泛函取得最小值。

这就是最小二乘构造法的基本思想。


3.4 残差的概念

在数值计算中,如果近似解 $\tilde{y}$ 不能完全满足微分方程:

$$ L[\tilde{y}] = 0 $$

那么:

$$ R = L[\tilde{y}] $$

称为残差。

残差越小,说明近似解越接近满足原方程。

最小二乘法就是通过最小化残差平方积分:

$$ \int R^2\,dx $$

来寻找近似解。

这和后续 Galerkin 方法、加权残值法、最小二乘有限元都有联系。


4. 和力学/数值计算的联系

4.1 变分反问题帮助我们从方程走向能量

在力学中,有些问题一开始是以微分方程形式给出的。

例如:

$$ L[y] = 0 $$

如果能找到对应泛函:

$$ J[y] $$

那么就可以从“方程求解”转化为“能量极值”。

这有几个好处:

第一,能量形式通常更适合整体建模。
第二,泛函形式更容易构造弱形式。
第三,弱形式更适合有限元离散。
第四,能量形式有助于分析稳定性和误差性质。

所以从微分方程反推泛函,是连接微分方程方法和变分数值方法的重要步骤。


4.2 分部积分是从强形式到弱形式的关键

在反推泛函过程中,最关键的操作往往是分部积分。

例如:

$$ \int_0^L \delta y\,y''\,dx $$

通过分部积分可以转化为:

$$ -\int_0^L \delta y'\,y'\,dx $$

这个操作有两个意义:

第一,把二阶导数转移成一阶导数。
第二,使方程形式更接近能量泛函的变分。

在有限元中,分部积分同样重要。

强形式微分方程通常要求较高阶导数存在;弱形式通过分部积分降低导数阶次,使得分片多项式近似成为可能。

例如有限元形函数通常只要求在单元内满足一定连续性,而不一定能满足强形式所要求的高阶光滑性。


4.3 最小二乘法适合构造残差型泛函

有些方程很难找到自然能量泛函,这时可以使用最小二乘思想。

比如将方程残差写成:

$$ R[y] = L[y] $$

然后构造:

$$ S[y] = \int R[y]^2\,dx $$

这样做的优势是比较通用。

只要能定义残差,就可以构造残差平方积分泛函。

但它也有代价:

  • 可能提高微分阶次要求;
  • 可能改变原问题的数值结构;
  • 形成的矩阵可能更复杂;
  • 不一定保留原方程的物理能量意义。

所以最小二乘法是一种有效的构造方法,但它不一定等同于原问题的自然能量原理。


4.4 Ritz 方法需要泛函,Galerkin 方法需要弱形式

后续要讲的 Ritz 方法通常从泛函出发。

它的基本思路是:

$$ y(x) \approx \sum_{i=1}^{n}a_i\phi_i(x) $$

然后把近似解代入泛函:

$$ J[y] $$

再对未知系数 $a_i$ 求极值条件。

所以,如果要用 Ritz 方法,通常需要先有泛函。

而 Galerkin 方法可以直接从微分方程的残差出发,要求残差对试函数正交。

这两者的区别可以简单理解为:

  • Ritz 方法:从泛函极值出发;
  • Galerkin 方法:从残差正交或弱形式出发。

这也是为什么本篇作为第 10 篇的铺垫非常重要。


4.5 从面试角度看这部分

面试中通常不会要求完整推导一个复杂泛函,但可能会问:

已知微分方程,怎么构造对应的变分形式?

这时可以回答:

第一步,把微分方程乘以任意变分或测试函数。
第二步,在定义域上积分。
第三步,通过分部积分降低导数阶次。
第四步,观察能否写成某个泛函的一阶变分。
第五步,如果自然泛函不好找,可以考虑最小二乘残差泛函。

这样回答会比单纯说“积分一下”更准确。


5. 面试中可以怎么回答?

如果面试官问:

什么是变分反问题?

可以这样回答:

从泛函出发,通过变分得到微分方程,这是变分正问题。反过来,如果已知微分方程,希望找到一个泛函,使它的一阶变分为零时能够推出原方程,这就是变分反问题。它的核心是寻找微分方程背后的能量形式或变分结构。

如果面试官问:

已知微分方程,怎么构造泛函?

可以这样回答:

一种常见方法是将微分方程乘以任意变分或测试函数,然后在定义域上积分,通过分部积分把高阶导数转移到测试函数或变分上,再判断能否写成某个泛函的一阶变分。如果可以,就得到了对应泛函。如果自然泛函不好构造,也可以考虑最小二乘残差泛函。

如果面试官问:

为什么有些方程不好构造泛函?

可以这样回答:

因为不是所有微分方程都具有自然的变分结构。能由欧拉-拉格朗日方程推出的方程通常具有特定形式,而含有非保守项、阻尼项或非自伴算子的方程,不一定能直接对应到简单的能量泛函。因此变分反问题有时并不容易。

如果面试官问:

最小二乘法构造泛函的思想是什么?

可以这样回答:

最小二乘法的思想是把微分方程残差作为衡量误差的量。如果方程为 $L[y]=0$,就构造泛函 $S[y]=\int (L[y])^2 dx$。这个泛函非负,当残差为零时取得最小值。因此通过最小化残差平方积分,可以逼近原微分方程的解。

如果面试官问:

变分反问题和有限元有什么关系?

可以这样回答:

有限元方法通常需要弱形式或泛函形式。对于已知微分方程,如果能构造对应泛函,就可以使用 Ritz 方法;如果构造出弱形式,也可以使用 Galerkin 方法。因此变分反问题是从微分方程通向有限元离散的重要桥梁。


6. 这一篇的核心总结

这一篇主要复习了泛函构造和变分反问题。

可以总结为三句话:

  1. 从泛函变分得到微分方程是变分正问题,从微分方程反推泛函是变分反问题。
  2. 常见构造思路是将方程乘以任意变分后积分,再通过分部积分寻找对应泛函。
  3. 如果自然泛函难以构造,可以使用最小二乘法,将残差平方积分作为泛函。

所以,变分反问题的意义在于:

它把已知微分方程转化为能量形式或残差最小化形式,为 Ritz 方法、Galerkin 方法和有限元离散做准备。

从面试角度看,可以这样理解:

变分反问题是在问:这个微分方程背后有没有一个能量或残差泛函,使真实解成为它的驻点或最小点?


7. 下一篇预告

下一篇准备整理:

研一数学基础复习笔记(十):Ritz、Galerkin 与有限元思想

下一篇会作为这个系列的收束,重点讨论如何把连续的变分问题转化为有限维代数问题。会讲 Ritz 方法、Galerkin 方法、残差正交、基函数选择,以及它们和有限元方法之间的关系。


研一数学基础复习笔记(九):从微分方程反推泛函
http://zncddh.cn/2026/05/03/研一数学基础复习笔记(九):从微分方程反推泛函/
作者
creativity
发布于
2026年5月3日
许可协议