研一数学基础复习笔记(四):特征值与系统固有性质
1. 为什么面试前要看这个问题?
前一篇整理了线性空间、基和正交化。我们知道,一个向量可以在不同基下表示;如果选取合适的基,问题会变得更简单。
那么自然会出现一个问题:
有没有一组特殊的方向,使得矩阵作用在这些方向上时,只改变大小,不改变方向?
这就是特征值和特征向量要回答的问题。
对于一个矩阵 $\mathbf{A}$,如果存在非零向量 $\mathbf{x}$ 和数 $\lambda$,使得:
$$ \mathbf{A}\mathbf{x} = \lambda \mathbf{x} $$那么 $\lambda$ 称为矩阵 $\mathbf{A}$ 的特征值,$\mathbf{x}$ 称为对应的特征向量。
这句话的直观含义是:
在特征向量这个特殊方向上,矩阵 $\mathbf{A}$ 的作用只是把向量拉伸或压缩了 $\lambda$ 倍,而没有改变方向。
这在力学中非常重要。
例如结构动力学中的模态分析,本质上就是求解一个特征值问题。特征值可以对应系统的固有频率,特征向量可以对应系统的振型。
所以本篇的核心是理解:
特征值和特征向量不是单纯的代数概念,而是系统固有性质的数学表达。
2. 核心概念
2.1 行列式:判断矩阵是否奇异的重要工具
对于一个 $n$ 阶方阵 $\mathbf{A}$,它的行列式记为:
$$ |\mathbf{A}| $$行列式可以理解为矩阵映射到一个数的函数。
对于二阶矩阵:
$$ \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{bmatrix} $$它的行列式为:
$$ |\mathbf{A}| = a_{11}a_{22} - a_{12}a_{21} $$在面试中,行列式最重要的意义不是手算公式,而是它和矩阵可逆性的关系:
$$ |\mathbf{A}| \ne 0 $$意味着矩阵 $\mathbf{A}$ 非奇异,也就是可逆。
如果:
$$ |\mathbf{A}| = 0 $$则说明矩阵 $\mathbf{A}$ 奇异,不可逆。
从线性方程组角度看,矩阵是否奇异直接关系到方程组是否有唯一解。
例如:
$$ \mathbf{A}\mathbf{x} = \mathbf{b} $$如果 $\mathbf{A}$ 可逆,则可以形式上写成:
$$ \mathbf{x} = \mathbf{A}^{-1}\mathbf{b} $$当然,在实际数值计算中,我们通常不会真的去显式求逆,而是采用分解法或迭代法求解。
2.2 逆矩阵:线性方程组可解性的表达
对于 $n$ 阶方阵 $\mathbf{A}$,如果存在另一个 $n$ 阶方阵 $\mathbf{B}$,使得:
$$ \mathbf{A}\mathbf{B} = \mathbf{B}\mathbf{A} = \mathbf{I} $$则称 $\mathbf{B}$ 为 $\mathbf{A}$ 的逆矩阵,记为:
$$ \mathbf{B} = \mathbf{A}^{-1} $$逆矩阵有几个重要性质:
$$ (\mathbf{A}\mathbf{B})^{-1} = \mathbf{B}^{-1}\mathbf{A}^{-1} $$ $$ (\mathbf{A}^{\mathrm{T}})^{-1} = (\mathbf{A}^{-1})^{\mathrm{T}} $$ $$ |\mathbf{A}^{-1}| = |\mathbf{A}|^{-1} $$注意第一个性质中,逆矩阵的顺序会反过来。这和前面讲过的矩阵乘法不满足交换律是一致的。
在工程计算中,逆矩阵更重要的意义是:
如果系统矩阵可逆,那么线性系统在给定载荷下可以确定唯一响应。
例如静力问题:
$$ \mathbf{K}\mathbf{u} = \mathbf{F} $$如果刚度矩阵 $\mathbf{K}$ 非奇异,那么位移响应 $\mathbf{u}$ 可以唯一确定。
但是工程上通常不写成:
$$ \mathbf{u} = \mathbf{K}^{-1}\mathbf{F} $$因为直接求逆计算量大,数值稳定性也不一定好。实际中更常用:
- LDLT 分解;
- Cholesky 分解;
- LU 分解;
- 共轭梯度法;
- 预处理迭代法。
尤其对于对称正定矩阵,常常可以使用更高效稳定的求解方法。
2.3 特征值与特征向量
对任意 $n$ 阶矩阵 $\mathbf{A}$,如果存在非零向量 $\mathbf{x}$,满足:
$$ \mathbf{A}\mathbf{x} = \lambda \mathbf{x} $$则 $\lambda$ 是 $\mathbf{A}$ 的特征值,$\mathbf{x}$ 是对应的特征向量。
也可以写成:
$$ (\lambda \mathbf{I} - \mathbf{A})\mathbf{x} = \mathbf{0} $$因为 $\mathbf{x}$ 是非零向量,所以要想有非零解,必须满足:
$$ |\lambda \mathbf{I} - \mathbf{A}| = 0 $$这个方程称为特征方程。
从几何意义上看,特征向量是矩阵作用下方向保持不变的向量,特征值则表示这个方向上的伸缩倍数。
从力学意义上看,特征值和特征向量通常对应系统的固有属性。
例如无阻尼自由振动方程:
$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{0} $$假设结构做简谐振动,可以得到广义特征值问题:
$$ \mathbf{K}\boldsymbol{\phi} = \omega^2 \mathbf{M}\boldsymbol{\phi} $$其中:
- $\omega$ 是圆频率;
- $\omega^2$ 是特征值;
- $\boldsymbol{\phi}$ 是振型,也就是特征向量。
所以在结构动力学中,特征值问题直接对应模态分析。
2.4 特征值的几个重要性质
设矩阵 $\mathbf{A}$ 的特征值为:
$$ \lambda_1,\lambda_2,\cdots,\lambda_n $$则有:
$$ |\mathbf{A}| = \prod_{i=1}^{n}\lambda_i $$也就是说,矩阵的行列式等于所有特征值的乘积。
矩阵的迹满足:
$$ \mathrm{tr}(\mathbf{A}) = \sum_{i=1}^{n}\lambda_i $$也就是说,矩阵的迹等于所有特征值之和。
如果 $\mathbf{A}$ 可逆,那么 $\mathbf{A}^{-1}$ 的特征值为:
$$ \lambda_i^{-1} $$如果矩阵 $\mathbf{A}$ 和 $\mathbf{B}$ 相似,即存在可逆矩阵 $\mathbf{P}$,使得:
$$ \mathbf{B} = \mathbf{P}^{-1}\mathbf{A}\mathbf{P} $$那么 $\mathbf{A}$ 和 $\mathbf{B}$ 具有相同的特征值。
这个性质非常重要,因为它说明:
相似变换改变的是矩阵的表示形式,不改变矩阵所代表线性变换的本质特征。
3. 关键公式
3.1 特征方程
特征值由特征方程确定:
$$ |\lambda \mathbf{I} - \mathbf{A}| = 0 $$求出 $\lambda$ 后,再代入:
$$ (\lambda \mathbf{I} - \mathbf{A})\mathbf{x} = \mathbf{0} $$就可以求对应的特征向量。
这个过程可以理解为:
- 先找系统有哪些特殊的伸缩比例;
- 再找对应的特殊方向。
3.2 瑞利商
对于对称矩阵,瑞利商是研究特征值的重要工具。
瑞利商定义为:
$$ R(\mathbf{y}) = \frac{\mathbf{y}^{\mathrm{T}}\mathbf{A}\mathbf{y}} {\mathbf{y}^{\mathrm{T}}\mathbf{y}} $$其中 $\mathbf{y}$ 是非零向量。
最小特征值可以写成:
$$ \lambda_{\min} = \min_{\mathbf{y}\ne\mathbf{0}} \frac{\mathbf{y}^{\mathrm{T}}\mathbf{A}\mathbf{y}} {\mathbf{y}^{\mathrm{T}}\mathbf{y}} $$如果 $\mathbf{y}$ 正好取为对应的特征向量 $\mathbf{x}_1$,则:
$$ \lambda_{\min} = \frac{\mathbf{x}_1^{\mathrm{T}}\mathbf{A}\mathbf{x}_1} {\mathbf{x}_1^{\mathrm{T}}\mathbf{x}_1} $$从能量角度看,瑞利商非常有意义。
例如结构振动问题中,频率平方可以写成类似形式:
$$ \omega^2 = \frac{\boldsymbol{\phi}^{\mathrm{T}}\mathbf{K}\boldsymbol{\phi}} {\boldsymbol{\phi}^{\mathrm{T}}\mathbf{M}\boldsymbol{\phi}} $$其中分子可以理解为刚度相关的能量项,分母可以理解为质量相关的能量项。
这也是为什么瑞利商常用于固有频率估计和模态分析。
3.3 谱与谱半径
矩阵 $\mathbf{A}$ 的全部特征值称为矩阵的谱。
特征值最大模称为谱半径,记为:
$$ \rho(\mathbf{A}) = \max_i |\lambda_i| $$谱半径在数值计算中非常重要。
例如判断迭代方法是否收敛时,经常需要看迭代矩阵的谱半径。如果迭代矩阵 $\mathbf{G}$ 满足:
$$ \rho(\mathbf{G}) < 1 $$那么迭代过程往往具有收敛性。
因此,谱半径可以理解为:
矩阵反复作用时,系统增长或衰减趋势的关键指标。
3.4 矩阵对角化
如果矩阵 $\mathbf{A}$ 有 $n$ 个线性无关的特征向量:
$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n $$把它们按列组成矩阵:
$$ \mathbf{X} = \begin{bmatrix} \mathbf{x}_1 & \mathbf{x}_2 & \cdots & \mathbf{x}_n \end{bmatrix} $$再把特征值放到对角矩阵中:
$$ \mathbf{D} = \begin{bmatrix} \lambda_1 & 0 & \cdots & 0 \\ 0 & \lambda_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & \lambda_n \end{bmatrix} $$则有:
$$ \mathbf{A}\mathbf{X} = \mathbf{X}\mathbf{D} $$如果 $\mathbf{X}$ 可逆,则:
$$ \mathbf{X}^{-1}\mathbf{A}\mathbf{X} = \mathbf{D} $$这说明矩阵 $\mathbf{A}$ 可以通过特征向量矩阵对角化。
对角化的意义是:
在特征向量构成的基下,原来可能耦合的线性变换变成了互不耦合的对角形式。
这和模态分析中的解耦思想是一致的。
4. 和力学/数值计算的联系
4.1 特征值问题对应结构的固有频率和振型
结构动力学中的无阻尼自由振动方程为:
$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{0} $$假设:
$$ \mathbf{u}(t) = \boldsymbol{\phi}\sin(\omega t) $$代入后可以得到:
$$ (\mathbf{K} - \omega^2\mathbf{M})\boldsymbol{\phi} = \mathbf{0} $$这就是广义特征值问题:
$$ \mathbf{K}\boldsymbol{\phi} = \omega^2\mathbf{M}\boldsymbol{\phi} $$其中:
- 特征值 $\omega^2$ 对应固有频率的平方;
- 特征向量 $\boldsymbol{\phi}$ 对应结构振型。
所以,模态分析其实就是特征值问题在结构动力学中的应用。
4.2 对称正定矩阵的特征值具有良好性质
在力学计算中,刚度矩阵和质量矩阵常常是对称正定矩阵。
如果矩阵 $\mathbf{A}$ 是对称正定矩阵,则它的特征值都是正数。
这和能量正性有关。
例如应变能可以写成:
$$ U = \frac{1}{2} \mathbf{u}^{\mathrm{T}}\mathbf{K}\mathbf{u} $$如果 $\mathbf{K}$ 正定,则对于任意非零 $\mathbf{u}$,都有:
$$ \mathbf{u}^{\mathrm{T}}\mathbf{K}\mathbf{u} > 0 $$这意味着系统发生非零变形时会储存正的弹性势能。
从数值计算上看,正定性也非常重要,因为它决定了很多算法是否稳定、是否收敛、是否可以使用高效分解方法。
4.3 对角化对应系统解耦
在物理坐标下,动力学方程可能是耦合的:
$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{F} $$如果引入模态坐标:
$$ \mathbf{u} = \mathbf{\Phi}\mathbf{q} $$其中 $\mathbf{\Phi}$ 是振型矩阵,那么在满足正交性的情况下,方程可以转化为一组相互独立的单自由度方程。
这本质上就是:
用特征向量作为新的基,把耦合系统变成解耦系统。
所以从线性代数角度看,模态分析就是换基和对角化;从力学角度看,它是把复杂振动分解成若干独立模态。
4.4 瑞利商可以估计固有频率
在工程中,有时不需要求出所有特征值,而只想估计最低阶固有频率。
这时可以使用瑞利商。
对于结构系统,可以写成:
$$ \omega^2 \approx \frac{\mathbf{u}^{\mathrm{T}}\mathbf{K}\mathbf{u}} {\mathbf{u}^{\mathrm{T}}\mathbf{M}\mathbf{u}} $$如果选取的 $\mathbf{u}$ 接近真实一阶振型,那么估计得到的 $\omega$ 就会接近一阶固有频率。
这在结构动力学、振动分析和近似计算中都非常有用。
4.5 谱半径和迭代收敛有关
很多数值方法都是迭代形式:
$$ \mathbf{x}^{(k+1)} = \mathbf{G}\mathbf{x}^{(k)} + \mathbf{c} $$其中 $\mathbf{G}$ 是迭代矩阵。
误差传播可以写成:
$$ \mathbf{e}^{(k+1)} = \mathbf{G}\mathbf{e}^{(k)} $$如果 $\rho(\mathbf{G}) < 1$,误差会逐步衰减,迭代方法趋于收敛。
因此谱半径可以用来判断迭代过程是否稳定。
这说明特征值不仅出现在结构动力学里,也广泛出现在数值算法分析中。
5. 面试中可以怎么回答?
如果面试官问:
你怎么理解特征值和特征向量?
可以这样回答:
我理解特征向量是矩阵作用后方向不变的特殊向量,特征值表示在这个方向上的伸缩倍数。数学上它满足 $\mathbf{A}\mathbf{x}=\lambda\mathbf{x}$。在力学中,特征值和特征向量往往对应系统的固有性质,例如结构动力学中,特征值可以对应固有频率的平方,特征向量可以对应振型。
如果面试官问:
特征值问题和模态分析有什么关系?
可以这样回答:
在无阻尼自由振动问题中,动力学方程可以化为 $\mathbf{K}\boldsymbol{\phi}=\omega^2\mathbf{M}\boldsymbol{\phi}$。这是一个广义特征值问题,其中 $\omega^2$ 是特征值,$\boldsymbol{\phi}$ 是特征向量,也就是振型。因此模态分析本质上就是求结构系统的特征值和特征向量。
如果面试官问:
瑞利商有什么作用?
可以这样回答:
瑞利商可以用来估计矩阵的特征值。在结构动力学中,瑞利商形式可以表示为刚度能量项和质量能量项的比值,用来估计固有频率。如果假设的位移形状接近真实振型,那么通过瑞利商得到的频率估计也会比较接近真实值。
如果面试官问:
为什么对称正定矩阵重要?
可以这样回答:
对称正定矩阵在力学中通常对应稳定系统的正能量形式,例如刚度矩阵对应应变能,质量矩阵对应动能。数学上,对称正定矩阵的特征值为正,这有利于保证系统稳定性和数值求解的可靠性。很多高效算法,比如 Cholesky 分解和共轭梯度法,也依赖对称正定性。
如果面试官问:
什么是矩阵对角化,它有什么意义?
可以这样回答:
如果矩阵有足够多线性无关的特征向量,就可以用特征向量矩阵将其对角化。对角化的意义是,在特征向量构成的基下,原本耦合的线性变换变成了对角形式,也就是各个方向相互独立。在结构动力学中,这对应模态坐标下的方程解耦。
6. 这一篇的核心总结
这一篇主要复习了行列式、逆矩阵、特征值、特征向量、瑞利商和对角化。
可以总结为三句话:
- 行列式和逆矩阵主要反映矩阵是否奇异,以及线性方程组是否具有唯一解。
- 特征值和特征向量描述矩阵作用下保持方向不变的特殊方向及其伸缩比例。
- 在力学中,特征值问题直接对应系统固有性质,例如固有频率、振型和模态解耦。
因此,特征值不是一个孤立的代数概念,而是连接线性代数、结构动力学和数值算法的重要桥梁。
理解特征值问题,本质上是在理解:
一个系统在自身最自然的方向上会如何响应。
7. 下一篇预告
下一篇准备整理:
研一数学基础复习笔记(五):矩阵指数与动力系统
下一篇会从矩阵幂级数、矩阵指数函数讲起,重点理解为什么矩阵指数可以求解一阶线性微分方程组,以及它和状态空间方程、动力系统时间演化之间的关系。