研一数学基础复习笔记:从矩阵、变分到有限元思想

1. 为什么整理这个系列?

研一阶段学过很多数学基础,比如线性代数、矩阵函数、变分原理、Ritz 方法、Galerkin 方法和有限元思想。

刚学的时候,这些内容很容易被理解成一堆公式:

  • 矩阵怎么乘;
  • 特征值怎么求;
  • 欧拉-拉格朗日方程怎么推;
  • Ritz 方法怎么代入基函数;
  • Galerkin 方法怎么做残差正交。

但真正到面试、科研和工程计算中,更重要的是回答:

这些数学工具到底是怎么服务于力学和数值计算的?

所以我把研一学过的这部分内容重新整理成一个系列,目标不是复刻教材,而是从面试复习的角度建立一条主线:

从矩阵语言出发,经过函数空间和变分原理,最后走向 Ritz、Galerkin 和有限元方法。

这条主线可以帮助我把零散知识连接起来,也方便面试时用更清晰的逻辑表达。


2. 这个系列的总主线

整个系列可以用一句话概括:

数值力学的核心,是先用数学结构理解物理问题,再用有限维近似把连续问题转化为计算机可以求解的矩阵方程。

更具体地说,可以分成四层。

第一层是线性代数。

矩阵、向量、基、特征值这些概念,是描述多自由度系统的基础语言。

第二层是动力系统。

矩阵指数、特征值和状态空间方法,可以描述系统随时间的演化和稳定性。

第三层是变分原理。

泛函、变分、欧拉-拉格朗日方程、最小势能原理,可以把能量和控制方程联系起来。

第四层是数值离散。

Ritz 方法、Galerkin 方法和有限元方法,把连续问题变成有限维代数方程组。

最后得到的形式通常是:

$$ \mathbf{K}\mathbf{u} = \mathbf{F} $$

或者动力学形式:

$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{C}\dot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{F} $$

这就是从数学基础走向工程计算的过程。


3. 系列文章目录

3.1 第一篇:矩阵为什么是力学计算的语言

这一篇主要回答:

为什么矩阵是数值力学的基本表达方式?

连续力学问题经过离散化后,往往会形成大量代数方程。矩阵可以把这些方程组织成统一形式。

例如有限元静力问题常写为:

$$ \mathbf{K}\mathbf{u} = \mathbf{F} $$

其中:

  • $\mathbf{K}$ 是整体刚度矩阵;
  • $\mathbf{u}$ 是节点位移向量;
  • $\mathbf{F}$ 是外载荷向量。

这篇重点理解矩阵、方阵、对称矩阵、正定矩阵和稀疏矩阵在力学中的意义。

面试关键词:

矩阵方程、刚度矩阵、对称正定、稀疏矩阵、有限元自由度。


3.2 第二篇:分块矩阵与工程计算思维

这一篇主要回答:

为什么大规模系统需要用分块矩阵来理解?

分块矩阵不是简单地把矩阵切开,而是把复杂系统按自由度、子结构、边界条件或物理场进行划分。

例如:

$$ \begin{bmatrix} \mathbf{K}_{11} & \mathbf{K}_{12} \\ \mathbf{K}_{21} & \mathbf{K}_{22} \end{bmatrix} \begin{bmatrix} \mathbf{u}_1 \\ \mathbf{u}_2 \end{bmatrix} = \begin{bmatrix} \mathbf{F}_1 \\ \mathbf{F}_2 \end{bmatrix} $$

这种形式可以用于处理边界条件、自由度消元、静力凝聚和多场耦合。

面试关键词:

分块矩阵、自由度划分、边界条件、子结构、静力凝聚。


3.3 第三篇:线性空间、基与正交化

这一篇主要回答:

为什么基、坐标和正交化是模态分析和降维方法的基础?

未知函数或向量可以用一组基来表示:

$$ \mathbf{y} = k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_n\mathbf{x}_n $$

在数值计算中,选择什么样的基非常重要。

有限元中用形函数作为基函数,模态分析中用振型作为基,POD 降阶中用正交模态作为低维基。

Gram-Schmidt 正交化的核心思想是:
不断减去已有方向上的投影,从而构造互相正交的基。

面试关键词:

线性无关、基、坐标、换基、正交基、Gram-Schmidt、POD。


3.4 第四篇:特征值与系统固有性质

这一篇主要回答:

为什么特征值问题可以描述系统的固有性质?

特征值和特征向量满足:

$$ \mathbf{A}\mathbf{x} = \lambda\mathbf{x} $$

它表示矩阵在某些特殊方向上只改变大小,不改变方向。

在结构动力学中,模态分析可以写成广义特征值问题:

$$ \mathbf{K}\boldsymbol{\phi} = \omega^2\mathbf{M}\boldsymbol{\phi} $$

其中:

  • $\omega^2$ 是特征值;
  • $\boldsymbol{\phi}$ 是振型;
  • $\omega$ 对应固有频率。

面试关键词:

特征值、特征向量、固有频率、振型、瑞利商、谱半径、对角化。


3.5 第五篇:矩阵指数与动力系统

这一篇主要回答:

矩阵指数为什么可以描述线性动力系统的时间演化?

对于一阶线性系统:

$$ \dot{\mathbf{x}} = \mathbf{A}\mathbf{x} $$

其解可以写成:

$$ \mathbf{x}(t) = e^{\mathbf{A}(t-t_0)}\mathbf{x}_0 $$

这里的矩阵指数 $e^{\mathbf{A}t}$ 可以看作状态转移矩阵。

它描述了系统如何从初始状态演化到未来状态。

面试关键词:

矩阵指数、状态空间、状态转移矩阵、稳定性、时间积分。


3.6 第六篇:变分法到底在“变”什么?

这一篇主要回答:

变分法如何从泛函极值推出控制方程?

普通函数极值是找一个数,使函数取极值。
变分问题是找一个函数,使泛函取极值。

例如:

$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$

其极值函数满足欧拉-拉格朗日方程:

$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$

在力学中,最小势能原理就是典型变分原理。

面试关键词:

泛函、变分、欧拉-拉格朗日方程、最小势能原理、弱形式。


3.7 第七篇:勒让德变换与 Hamilton 形式

这一篇主要回答:

如何从位移型变分原理过渡到 Hamilton 型或混合型变分原理?

勒让德变换的作用是改变变量选择。

例如轴向杆中,原来能量密度依赖 $w$ 和 $w’$:

$$ L(w,w') = \frac{1}{2}kw^2 + \frac{1}{2}EF(w')^2 $$

引入轴力:

$$ N = EFw' $$

可以构造 Hamilton 函数:

$$ H(N,w) = \frac{N^2}{2EF} - \frac{1}{2}kw^2 $$

进而得到一阶正则方程:

$$ w' = \frac{N}{EF} $$ $$ N' = kw $$

面试关键词:

多类变量变分、勒让德变换、Hamilton 形式、混合能、正则方程。


3.8 第八篇:约束变分与拉格朗日乘子法

这一篇主要回答:

有约束的变分问题如何处理?

如果变量之间存在约束,例如:

$$ G(y_1,y_2,\cdots,y_n) = 0 $$

可以引入拉格朗日乘子,把约束加入泛函。

例如单摆中:

$$ X^2 + Y^2 = L^2 $$

利用拉格朗日乘子后,可以得到包含约束力的动力学方程。

拉格朗日乘子在力学中往往不只是数学变量,它常常对应约束力、内力或反力。

面试关键词:

约束变分、拉格朗日乘子、约束力、单摆、微分-代数方程。


3.9 第九篇:从微分方程反推泛函

这一篇主要回答:

已知微分方程时,如何寻找对应的泛函?

从泛函变分得到微分方程是变分正问题。
从微分方程反推泛函是变分反问题。

常见方法是:

  1. 将微分方程乘以任意变分或测试函数;
  2. 在定义域上积分;
  3. 通过分部积分降低导数阶次;
  4. 判断能否写成某个泛函的一阶变分;
  5. 如果自然泛函不好找,可以构造最小二乘残差泛函。

对于方程:

$$ L[y] = 0 $$

最小二乘泛函可以写成:

$$ S[y] = \int (L[y])^2\,dx $$

面试关键词:

变分反问题、泛函构造、分部积分、残差、最小二乘法。


3.10 第十篇:Ritz、Galerkin 与有限元思想

这一篇主要回答:

连续变分问题如何变成计算机可以求解的代数方程组?

核心近似形式是:

$$ y_a(x) = \sum_{i=1}^{n}a_iN_i(x) $$

Ritz 方法从泛函极值出发,将无限维变分问题转化为有限维优化问题。

Galerkin 方法从残差正交出发,要求:

$$ \int_0^L N_i(x)R(x)\,dx = 0 $$

有限元方法则使用局部形函数和单元装配,把 Ritz/Galerkin 思想发展成适合复杂工程问题的通用数值方法。

面试关键词:

Ritz 方法、Galerkin 方法、加权残数法、局部形函数、有限元装配、稀疏矩阵。


4. 这 10 篇之间的逻辑关系

这 10 篇不是孤立的知识点,而是一条从数学到计算的路线。

可以这样串起来:

矩阵
  ↓
分块矩阵
  ↓
线性空间与基
  ↓
特征值与模态
  ↓
矩阵指数与动力系统
  ↓
变分法
  ↓
Hamilton 形式与多类变量
  ↓
约束变分
  ↓
变分反问题
  ↓
Ritz / Galerkin / 有限元

研一数学基础复习笔记:从矩阵、变分到有限元思想
http://zncddh.cn/2026/05/03/研一数学基础复习笔记:从矩阵、变分到有限元思想/
作者
creativity
发布于
2026年5月3日
许可协议