研一数学基础复习笔记:从矩阵、变分到有限元思想
1. 为什么整理这个系列?
研一阶段学过很多数学基础,比如线性代数、矩阵函数、变分原理、Ritz 方法、Galerkin 方法和有限元思想。
刚学的时候,这些内容很容易被理解成一堆公式:
- 矩阵怎么乘;
- 特征值怎么求;
- 欧拉-拉格朗日方程怎么推;
- Ritz 方法怎么代入基函数;
- Galerkin 方法怎么做残差正交。
但真正到面试、科研和工程计算中,更重要的是回答:
这些数学工具到底是怎么服务于力学和数值计算的?
所以我把研一学过的这部分内容重新整理成一个系列,目标不是复刻教材,而是从面试复习的角度建立一条主线:
从矩阵语言出发,经过函数空间和变分原理,最后走向 Ritz、Galerkin 和有限元方法。
这条主线可以帮助我把零散知识连接起来,也方便面试时用更清晰的逻辑表达。
2. 这个系列的总主线
整个系列可以用一句话概括:
数值力学的核心,是先用数学结构理解物理问题,再用有限维近似把连续问题转化为计算机可以求解的矩阵方程。
更具体地说,可以分成四层。
第一层是线性代数。
矩阵、向量、基、特征值这些概念,是描述多自由度系统的基础语言。
第二层是动力系统。
矩阵指数、特征值和状态空间方法,可以描述系统随时间的演化和稳定性。
第三层是变分原理。
泛函、变分、欧拉-拉格朗日方程、最小势能原理,可以把能量和控制方程联系起来。
第四层是数值离散。
Ritz 方法、Galerkin 方法和有限元方法,把连续问题变成有限维代数方程组。
最后得到的形式通常是:
$$ \mathbf{K}\mathbf{u} = \mathbf{F} $$或者动力学形式:
$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{C}\dot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{F} $$这就是从数学基础走向工程计算的过程。
3. 系列文章目录
3.1 第一篇:矩阵为什么是力学计算的语言
这一篇主要回答:
为什么矩阵是数值力学的基本表达方式?
连续力学问题经过离散化后,往往会形成大量代数方程。矩阵可以把这些方程组织成统一形式。
例如有限元静力问题常写为:
$$ \mathbf{K}\mathbf{u} = \mathbf{F} $$其中:
- $\mathbf{K}$ 是整体刚度矩阵;
- $\mathbf{u}$ 是节点位移向量;
- $\mathbf{F}$ 是外载荷向量。
这篇重点理解矩阵、方阵、对称矩阵、正定矩阵和稀疏矩阵在力学中的意义。
面试关键词:
矩阵方程、刚度矩阵、对称正定、稀疏矩阵、有限元自由度。
3.2 第二篇:分块矩阵与工程计算思维
这一篇主要回答:
为什么大规模系统需要用分块矩阵来理解?
分块矩阵不是简单地把矩阵切开,而是把复杂系统按自由度、子结构、边界条件或物理场进行划分。
例如:
$$ \begin{bmatrix} \mathbf{K}_{11} & \mathbf{K}_{12} \\ \mathbf{K}_{21} & \mathbf{K}_{22} \end{bmatrix} \begin{bmatrix} \mathbf{u}_1 \\ \mathbf{u}_2 \end{bmatrix} = \begin{bmatrix} \mathbf{F}_1 \\ \mathbf{F}_2 \end{bmatrix} $$这种形式可以用于处理边界条件、自由度消元、静力凝聚和多场耦合。
面试关键词:
分块矩阵、自由度划分、边界条件、子结构、静力凝聚。
3.3 第三篇:线性空间、基与正交化
这一篇主要回答:
为什么基、坐标和正交化是模态分析和降维方法的基础?
未知函数或向量可以用一组基来表示:
$$ \mathbf{y} = k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_n\mathbf{x}_n $$在数值计算中,选择什么样的基非常重要。
有限元中用形函数作为基函数,模态分析中用振型作为基,POD 降阶中用正交模态作为低维基。
Gram-Schmidt 正交化的核心思想是:
不断减去已有方向上的投影,从而构造互相正交的基。
面试关键词:
线性无关、基、坐标、换基、正交基、Gram-Schmidt、POD。
3.4 第四篇:特征值与系统固有性质
这一篇主要回答:
为什么特征值问题可以描述系统的固有性质?
特征值和特征向量满足:
$$ \mathbf{A}\mathbf{x} = \lambda\mathbf{x} $$它表示矩阵在某些特殊方向上只改变大小,不改变方向。
在结构动力学中,模态分析可以写成广义特征值问题:
$$ \mathbf{K}\boldsymbol{\phi} = \omega^2\mathbf{M}\boldsymbol{\phi} $$其中:
- $\omega^2$ 是特征值;
- $\boldsymbol{\phi}$ 是振型;
- $\omega$ 对应固有频率。
面试关键词:
特征值、特征向量、固有频率、振型、瑞利商、谱半径、对角化。
3.5 第五篇:矩阵指数与动力系统
这一篇主要回答:
矩阵指数为什么可以描述线性动力系统的时间演化?
对于一阶线性系统:
$$ \dot{\mathbf{x}} = \mathbf{A}\mathbf{x} $$其解可以写成:
$$ \mathbf{x}(t) = e^{\mathbf{A}(t-t_0)}\mathbf{x}_0 $$这里的矩阵指数 $e^{\mathbf{A}t}$ 可以看作状态转移矩阵。
它描述了系统如何从初始状态演化到未来状态。
面试关键词:
矩阵指数、状态空间、状态转移矩阵、稳定性、时间积分。
3.6 第六篇:变分法到底在“变”什么?
这一篇主要回答:
变分法如何从泛函极值推出控制方程?
普通函数极值是找一个数,使函数取极值。
变分问题是找一个函数,使泛函取极值。
例如:
$$ J[y] = \int_{x_0}^{x_1}F(x,y,y')\,dx $$其极值函数满足欧拉-拉格朗日方程:
$$ \frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0 $$在力学中,最小势能原理就是典型变分原理。
面试关键词:
泛函、变分、欧拉-拉格朗日方程、最小势能原理、弱形式。
3.7 第七篇:勒让德变换与 Hamilton 形式
这一篇主要回答:
如何从位移型变分原理过渡到 Hamilton 型或混合型变分原理?
勒让德变换的作用是改变变量选择。
例如轴向杆中,原来能量密度依赖 $w$ 和 $w’$:
$$ L(w,w') = \frac{1}{2}kw^2 + \frac{1}{2}EF(w')^2 $$引入轴力:
$$ N = EFw' $$可以构造 Hamilton 函数:
$$ H(N,w) = \frac{N^2}{2EF} - \frac{1}{2}kw^2 $$进而得到一阶正则方程:
$$ w' = \frac{N}{EF} $$ $$ N' = kw $$面试关键词:
多类变量变分、勒让德变换、Hamilton 形式、混合能、正则方程。
3.8 第八篇:约束变分与拉格朗日乘子法
这一篇主要回答:
有约束的变分问题如何处理?
如果变量之间存在约束,例如:
$$ G(y_1,y_2,\cdots,y_n) = 0 $$可以引入拉格朗日乘子,把约束加入泛函。
例如单摆中:
$$ X^2 + Y^2 = L^2 $$利用拉格朗日乘子后,可以得到包含约束力的动力学方程。
拉格朗日乘子在力学中往往不只是数学变量,它常常对应约束力、内力或反力。
面试关键词:
约束变分、拉格朗日乘子、约束力、单摆、微分-代数方程。
3.9 第九篇:从微分方程反推泛函
这一篇主要回答:
已知微分方程时,如何寻找对应的泛函?
从泛函变分得到微分方程是变分正问题。
从微分方程反推泛函是变分反问题。
常见方法是:
- 将微分方程乘以任意变分或测试函数;
- 在定义域上积分;
- 通过分部积分降低导数阶次;
- 判断能否写成某个泛函的一阶变分;
- 如果自然泛函不好找,可以构造最小二乘残差泛函。
对于方程:
$$ L[y] = 0 $$最小二乘泛函可以写成:
$$ S[y] = \int (L[y])^2\,dx $$面试关键词:
变分反问题、泛函构造、分部积分、残差、最小二乘法。
3.10 第十篇:Ritz、Galerkin 与有限元思想
这一篇主要回答:
连续变分问题如何变成计算机可以求解的代数方程组?
核心近似形式是:
$$ y_a(x) = \sum_{i=1}^{n}a_iN_i(x) $$Ritz 方法从泛函极值出发,将无限维变分问题转化为有限维优化问题。
Galerkin 方法从残差正交出发,要求:
$$ \int_0^L N_i(x)R(x)\,dx = 0 $$有限元方法则使用局部形函数和单元装配,把 Ritz/Galerkin 思想发展成适合复杂工程问题的通用数值方法。
面试关键词:
Ritz 方法、Galerkin 方法、加权残数法、局部形函数、有限元装配、稀疏矩阵。
4. 这 10 篇之间的逻辑关系
这 10 篇不是孤立的知识点,而是一条从数学到计算的路线。
可以这样串起来:
矩阵
↓
分块矩阵
↓
线性空间与基
↓
特征值与模态
↓
矩阵指数与动力系统
↓
变分法
↓
Hamilton 形式与多类变量
↓
约束变分
↓
变分反问题
↓
Ritz / Galerkin / 有限元