研一数学基础复习笔记（九）：从微分方程反推泛函

1. 为什么面试前要看这个问题？

前面几篇主要是从“泛函”出发，通过变分得到控制方程。

例如对泛函：

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

进行变分，并令：

$$ \delta J = 0 $$

可以得到欧拉-拉格朗日方程：

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

这是一条从泛函到微分方程的路线。

但是在实际问题中，我们经常遇到的是相反情况：

已经知道了微分方程，能不能找到它对应的泛函？

这就是变分反问题。

例如我们已经知道某个边值问题：

$$ y'' - y = 1 $$

并且边界条件为：

$$ y(0) = 0,\quad y(L) = 0 $$

那么是否可以找到一个泛函 $S[y]$，使得对它变分之后正好得到这个微分方程？

这个问题非常重要。

因为很多数值方法，尤其是 Ritz 方法和有限元方法，通常需要从泛函或弱形式出发。如果能从微分方程构造出泛函，就可以把微分方程问题转化为能量极值问题，再进一步转化为代数方程组。

所以本篇的核心是：

从微分方程反推泛函，本质上是在寻找这个方程背后的能量形式或变分结构。

2. 核心概念

2.1 什么是变分正问题？

所谓变分正问题，就是已知泛函，通过变分得到微分方程。

例如已知：

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

令：

$$ \delta J = 0 $$

可以得到：

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

这条路线可以概括为：

$$ \text{泛函} \quad \Longrightarrow \quad \text{变分} \quad \Longrightarrow \quad \text{微分方程} $$

在力学中，这对应于从能量原理推出平衡方程。

例如最小势能原理可以推出结构平衡方程，Hamilton 原理可以推出动力学方程。

2.2 什么是变分反问题？

变分反问题则是反过来。

已知微分方程：

$$ L[y] = 0 $$

希望找到一个泛函：

$$ J[y] $$

使得：

$$ \delta J = 0 $$

能够推出原来的微分方程。

这条路线可以概括为：

$$ \text{微分方程} \quad \Longrightarrow \quad \text{构造泛函} \quad \Longrightarrow \quad \text{变分形式} $$

这就是变分反问题。

需要注意的是：

并不是所有微分方程都一定存在自然对应的泛函。

有些方程可以很容易找到能量形式，有些方程则很难，甚至没有标准的变分结构。

2.3 为什么不是所有方程都有简单泛函？

从欧拉-拉格朗日方程看，一个方程如果能由泛函：

$$ J[y] = \int F(x,y,y')\,dx $$

推出，那么它必须具有某种特殊结构：

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

也就是说，微分方程的形式要能写成某个泛函的一阶变分。

但有些微分方程中包含非保守项、阻尼项、对流项或非自伴算子，这些项不一定能直接对应到一个简单能量泛函。

例如讲义中提到的方程：

$$ y'' + y' - f(x) = 0 $$

其中 $y’’$ 项和 $f(x)$ 项比较容易通过分部积分找到泛函来源，但 $y’$ 项就不容易直接写成某个常规泛函的一阶变分。

这说明变分反问题不是简单地“把方程积分一下”，而是要看方程本身是否具有合适的变分结构。

2.4 最小二乘法是一种通用构造思路

如果一个微分方程难以直接找到自然泛函，可以考虑最小二乘形式。

假设方程为：

$$ L[y] = 0 $$

那么可以构造泛函：

$$ S[y] = \int_{x_0}^{x_1} \left(L[y]\right)^2 dx $$

因为：

$$ S[y] \ge 0 $$

并且当：

$$ L[y] = 0 $$

时，$S[y]$ 取得最小值 $0$。

所以最小二乘法的思想是：

不直接寻找原方程的自然能量泛函，而是让微分方程残差的平方积分最小。

这种方法非常通用，也和后续的残差法、最小二乘有限元有关系。

3. 关键公式

3.1 从欧拉-拉格朗日方程反推

假设一个微分方程可以写成：

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

两端乘以任意变分 $\delta y$：

$$ \delta y \left[ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) \right] = 0 $$

在区间上积分：

$$ \int_{x_0}^{x_1} \delta y \left[ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) \right] dx = 0 $$

对第二项做分部积分：

$$ -\int_{x_0}^{x_1} \delta y \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) dx = -\left.\delta y\frac{\partial F}{\partial y'}\right|_{x_0}^{x_1} + \int_{x_0}^{x_1} \frac{\partial F}{\partial y'}\delta y'\,dx $$

如果边界变分为零：

$$ \delta y(x_0)=0,\quad \delta y(x_1)=0 $$

则边界项消失，于是得到：

$$ \int_{x_0}^{x_1} \left[ \frac{\partial F}{\partial y}\delta y + \frac{\partial F}{\partial y'}\delta y' \right] dx = 0 $$

而括号中的内容正是：

$$ \delta F = \frac{\partial F}{\partial y}\delta y + \frac{\partial F}{\partial y'}\delta y' $$

所以：

$$ \delta \int_{x_0}^{x_1}F(x,y,y')\,dx = 0 $$

因此可以得到泛函：

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

这就是从方程反推泛函的基本逻辑。

3.2 一个典型例子

考虑边值问题：

$$ y'' - y = 1 $$

边界条件为：

$$ y(0)=0,\quad y(L)=0 $$

先将方程改写为：

$$ y'' - y - 1 = 0 $$

乘以任意变分 $\delta y$ 并积分：

$$ \int_0^L \delta y(y'' - y - 1)\,dx = 0 $$

展开为：

$$ \int_0^L \delta y\,y''\,dx - \int_0^L \delta y\,y\,dx - \int_0^L \delta y\,dx = 0 $$

对第一项分部积分：

$$ \int_0^L \delta y\,y''\,dx = \left.\delta y\,y'\right|_0^L - \int_0^L \delta y'\,y'\,dx $$

由于边界变分为零：

$$ \delta y(0)=0,\quad \delta y(L)=0 $$

所以边界项消失：

$$ \int_0^L \delta y\,y''\,dx = - \int_0^L \delta y'\,y'\,dx $$

于是原式变成：

$$ -\int_0^L \delta y'\,y'\,dx - \int_0^L \delta y\,y\,dx - \int_0^L \delta y\,dx = 0 $$

这可以写成：

$$ -\delta \int_0^L \left[ \frac{1}{2}(y')^2 + \frac{1}{2}y^2 + y \right] dx = 0 $$

所以对应泛函可以取为：

$$ S[y] = \int_0^L \left[ \frac{1}{2}(y')^2 + \frac{1}{2}y^2 + y \right] dx $$

这说明原微分方程：

$$ y'' - y = 1 $$

可以通过上述泛函的变分得到。

3.3 最小二乘泛函

对于一个一般微分方程：

$$ L[y] = 0 $$

可以构造最小二乘泛函：

$$ S[y] = \int_{x_0}^{x_1}(L[y])^2\,dx $$

例如对方程：

$$ y'' + y' - f(x) = 0 $$

可以构造：

$$ S[y] = \int_{x_0}^{x_1} \left[y'' + y' - f(x)\right]^2 dx $$

显然：

$$ S[y] \ge 0 $$

当：

$$ y'' + y' - f(x) = 0 $$

时：

$$ S[y] = 0 $$

因此原方程的精确解会使这个残差平方积分泛函取得最小值。

这就是最小二乘构造法的基本思想。

3.4 残差的概念

在数值计算中，如果近似解 $\tilde{y}$ 不能完全满足微分方程：

$$ L[\tilde{y}] = 0 $$

那么：

$$ R = L[\tilde{y}] $$

称为残差。

残差越小，说明近似解越接近满足原方程。

最小二乘法就是通过最小化残差平方积分：

$$ \int R^2\,dx $$

来寻找近似解。

这和后续 Galerkin 方法、加权残值法、最小二乘有限元都有联系。

4. 和力学/数值计算的联系

4.1 变分反问题帮助我们从方程走向能量

在力学中，有些问题一开始是以微分方程形式给出的。

例如：

$$ L[y] = 0 $$

如果能找到对应泛函：

$$ J[y] $$

那么就可以从“方程求解”转化为“能量极值”。

这有几个好处：

第一，能量形式通常更适合整体建模。
第二，泛函形式更容易构造弱形式。
第三，弱形式更适合有限元离散。
第四，能量形式有助于分析稳定性和误差性质。

所以从微分方程反推泛函，是连接微分方程方法和变分数值方法的重要步骤。

4.2 分部积分是从强形式到弱形式的关键

在反推泛函过程中，最关键的操作往往是分部积分。

例如：

$$ \int_0^L \delta y\,y''\,dx $$

通过分部积分可以转化为：

$$ -\int_0^L \delta y'\,y'\,dx $$

这个操作有两个意义：

第一，把二阶导数转移成一阶导数。
第二，使方程形式更接近能量泛函的变分。

在有限元中，分部积分同样重要。

强形式微分方程通常要求较高阶导数存在；弱形式通过分部积分降低导数阶次，使得分片多项式近似成为可能。

例如有限元形函数通常只要求在单元内满足一定连续性，而不一定能满足强形式所要求的高阶光滑性。

4.3 最小二乘法适合构造残差型泛函

有些方程很难找到自然能量泛函，这时可以使用最小二乘思想。

比如将方程残差写成：

$$ R[y] = L[y] $$

然后构造：

$$ S[y] = \int R[y]^2\,dx $$

这样做的优势是比较通用。

只要能定义残差，就可以构造残差平方积分泛函。

但它也有代价：

可能提高微分阶次要求；
可能改变原问题的数值结构；
形成的矩阵可能更复杂；
不一定保留原方程的物理能量意义。

所以最小二乘法是一种有效的构造方法，但它不一定等同于原问题的自然能量原理。

4.4 Ritz 方法需要泛函，Galerkin 方法需要弱形式

后续要讲的 Ritz 方法通常从泛函出发。

它的基本思路是：

$$ y(x) \approx \sum_{i=1}^{n}a_i\phi_i(x) $$

然后把近似解代入泛函：

$$ J[y] $$

再对未知系数 $a_i$ 求极值条件。

所以，如果要用 Ritz 方法，通常需要先有泛函。

而 Galerkin 方法可以直接从微分方程的残差出发，要求残差对试函数正交。

这两者的区别可以简单理解为：

Ritz 方法：从泛函极值出发；
Galerkin 方法：从残差正交或弱形式出发。

这也是为什么本篇作为第 10 篇的铺垫非常重要。

4.5 从面试角度看这部分

面试中通常不会要求完整推导一个复杂泛函，但可能会问：

已知微分方程，怎么构造对应的变分形式？

这时可以回答：

第一步，把微分方程乘以任意变分或测试函数。
第二步，在定义域上积分。
第三步，通过分部积分降低导数阶次。
第四步，观察能否写成某个泛函的一阶变分。
第五步，如果自然泛函不好找，可以考虑最小二乘残差泛函。

这样回答会比单纯说“积分一下”更准确。

5. 面试中可以怎么回答？

如果面试官问：

什么是变分反问题？

可以这样回答：

从泛函出发，通过变分得到微分方程，这是变分正问题。反过来，如果已知微分方程，希望找到一个泛函，使它的一阶变分为零时能够推出原方程，这就是变分反问题。它的核心是寻找微分方程背后的能量形式或变分结构。

如果面试官问：

已知微分方程，怎么构造泛函？

可以这样回答：

一种常见方法是将微分方程乘以任意变分或测试函数，然后在定义域上积分，通过分部积分把高阶导数转移到测试函数或变分上，再判断能否写成某个泛函的一阶变分。如果可以，就得到了对应泛函。如果自然泛函不好构造，也可以考虑最小二乘残差泛函。

如果面试官问：

为什么有些方程不好构造泛函？

可以这样回答：

因为不是所有微分方程都具有自然的变分结构。能由欧拉-拉格朗日方程推出的方程通常具有特定形式，而含有非保守项、阻尼项或非自伴算子的方程，不一定能直接对应到简单的能量泛函。因此变分反问题有时并不容易。

如果面试官问：

最小二乘法构造泛函的思想是什么？

可以这样回答：

最小二乘法的思想是把微分方程残差作为衡量误差的量。如果方程为 $L[y]=0$，就构造泛函 $S[y]=\int (L[y])^2 dx$。这个泛函非负，当残差为零时取得最小值。因此通过最小化残差平方积分，可以逼近原微分方程的解。

如果面试官问：

变分反问题和有限元有什么关系？

可以这样回答：

有限元方法通常需要弱形式或泛函形式。对于已知微分方程，如果能构造对应泛函，就可以使用 Ritz 方法；如果构造出弱形式，也可以使用 Galerkin 方法。因此变分反问题是从微分方程通向有限元离散的重要桥梁。

6. 这一篇的核心总结

这一篇主要复习了泛函构造和变分反问题。

可以总结为三句话：

从泛函变分得到微分方程是变分正问题，从微分方程反推泛函是变分反问题。
常见构造思路是将方程乘以任意变分后积分，再通过分部积分寻找对应泛函。
如果自然泛函难以构造，可以使用最小二乘法，将残差平方积分作为泛函。

所以，变分反问题的意义在于：

它把已知微分方程转化为能量形式或残差最小化形式，为 Ritz 方法、Galerkin 方法和有限元离散做准备。

从面试角度看，可以这样理解：

变分反问题是在问：这个微分方程背后有没有一个能量或残差泛函，使真实解成为它的驻点或最小点？

7. 下一篇预告

下一篇准备整理：

研一数学基础复习笔记（十）：Ritz、Galerkin 与有限元思想

下一篇会作为这个系列的收束，重点讨论如何把连续的变分问题转化为有限维代数问题。会讲 Ritz 方法、Galerkin 方法、残差正交、基函数选择，以及它们和有限元方法之间的关系。

研究生基础 > 数值计算

#面试复习 #有限元 #变分原理 #变分反问题 #泛函构造 #最小二乘法

研一数学基础复习笔记（九）：从微分方程反推泛函

http://zncddh.cn/2026/05/03/研一数学基础复习笔记（九）：从微分方程反推泛函/

作者

creativity

发布于

2026年5月3日

许可协议

研一数学基础复习笔记（三）：线性空间、基与正交化上一篇

研一数学基础复习笔记（二）：分块矩阵与工程计算思维下一篇