研一数学基础复习笔记(三):线性空间、基与正交化

1. 为什么面试前要看这个问题?

前两篇主要围绕矩阵展开:矩阵可以描述多自由度系统的耦合关系,分块矩阵可以帮助我们理解复杂系统的自由度划分和子结构耦合。

但如果继续往后看,比如模态分析、振型展开、POD 降阶、Galerkin 投影,就会发现还有一个更基础的问题:

我们到底是在什么“空间”里表示解?

例如一个结构系统的位移向量可以写成:

$$ \mathbf{u} = \begin{bmatrix} u_1 \\ u_2 \\ \vdots \\ u_n \end{bmatrix} $$

这个向量不是孤立存在的,它属于一个 $n$ 维向量空间。我们可以选择不同的基来表示它,比如:

  • 用节点自由度作为基;
  • 用模态振型作为基;
  • 用 POD 模态作为基;
  • 用有限元形函数作为基。

这就是“线性空间”和“基”的意义。

所以本篇的核心不是单纯复习定义,而是理解:

基决定了我们如何表示问题,正交基决定了我们能否更方便地投影、展开和降维。

这对面试非常重要。因为很多数值方法本质上都是:

在某个函数空间或向量空间中,选取一组基函数,把无限维或高维问题转化成有限维代数问题。


2. 核心概念

2.1 什么是线性组合?

给定一组向量:

$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_s $$

如果某个向量 $\mathbf{y}$ 可以写成:

$$ \mathbf{y} = k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_s\mathbf{x}_s $$

则称 $\mathbf{y}$ 是这组向量的线性组合。

其中 $k_1,k_2,\cdots,k_s$ 是组合系数。

从工程角度看,线性组合就是“用若干基本形态叠加出一个复杂形态”。

例如结构动力学中的振型叠加法,就是把结构响应写成若干振型的线性组合:

$$ \mathbf{u}(t) \approx q_1(t)\boldsymbol{\phi}_1 + q_2(t)\boldsymbol{\phi}_2 + \cdots + q_r(t)\boldsymbol{\phi}_r $$

其中:

  • $\boldsymbol{\phi}_i$ 是第 $i$ 阶振型;
  • $q_i(t)$ 是对应的广义坐标;
  • $r$ 是保留的模态数。

这就是线性组合在力学中的典型应用。


2.2 什么是线性相关和线性无关?

如果存在一组不全为零的系数:

$$ k_1,k_2,\cdots,k_s $$

使得:

$$ k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_s\mathbf{x}_s = \mathbf{0} $$

则称这组向量线性相关。

如果只有当所有系数都为零时,等式才成立,即:

$$ k_1=k_2=\cdots=k_s=0 $$

则称这组向量线性无关。

直观理解:

  • 线性相关:这组向量中存在“多余方向”,某个向量可以由其他向量线性表示;
  • 线性无关:每个向量都提供了一个新的独立方向。

在数值计算中,线性无关非常重要。

如果选取的基函数线性相关,就会导致矩阵奇异或病态,进而影响方程求解。

例如在有限元或 Ritz 方法中,如果试函数不是线性无关的,最后形成的代数方程组可能无法稳定求解。


2.3 什么是基?

在一个 $n$ 维线性空间 $V$ 中,如果一组向量:

$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n $$

满足两个条件:

  1. 它们线性无关;
  2. 空间中任意向量都可以由它们线性表示;

那么这组向量就称为空间 $V$ 的一组基。

也就是说,任意向量 $\mathbf{y}$ 都可以写成:

$$ \mathbf{y} = k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_n\mathbf{x}_n $$

其中:

$$ k_1,k_2,\cdots,k_n $$

就是向量 $\mathbf{y}$ 在这组基下的坐标。

这说明:

基是描述空间的基本方向,坐标是某个向量在这些基本方向上的展开系数。


2.4 同一个向量可以有不同坐标

基不是唯一的。

同一个向量,在不同基下会有不同的坐标。

例如在二维平面中,一个点既可以用直角坐标系表示,也可以用斜坐标系表示。点本身没有变,但坐标值变了。

这件事在力学和数值计算中非常重要。

比如同一个位移向量 $\mathbf{u}$:

可以用节点自由度表示:

$$ \mathbf{u} = \begin{bmatrix} u_1 \\ u_2 \\ \vdots \\ u_n \end{bmatrix} $$

也可以用模态坐标表示:

$$ \mathbf{u} = \mathbf{\Phi}\mathbf{q} $$

其中:

  • $\mathbf{\Phi}$ 是由模态向量组成的基矩阵;
  • $\mathbf{q}$ 是模态坐标。

这里的 $\mathbf{u}$ 没变,只是表示方式从“物理坐标”变成了“模态坐标”。

这就是换基思想。


3. 关键公式

3.1 基矩阵与坐标

设一组基为:

$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n $$

把这些基向量按列组成矩阵:

$$ \mathbf{A} = \begin{bmatrix} \mathbf{x}_1 & \mathbf{x}_2 & \cdots & \mathbf{x}_n \end{bmatrix} $$

如果:

$$ \mathbf{y} = k_1\mathbf{x}_1 + k_2\mathbf{x}_2 + \cdots + k_n\mathbf{x}_n $$

则可以写成矩阵形式:

$$ \mathbf{A}\mathbf{k} = \mathbf{y} $$

其中:

$$ \mathbf{k} = \begin{bmatrix} k_1 \\ k_2 \\ \vdots \\ k_n \end{bmatrix} $$

这里的 $\mathbf{k}$ 就是 $\mathbf{y}$ 在基 $\mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n$ 下的坐标。

如果 $\mathbf{A}$ 的列向量线性无关,那么 $\mathbf{k}$ 是唯一的。

这说明:

线性方程组有唯一解,本质上要求系数矩阵的列向量线性无关。


3.2 换基矩阵

设:

$$ \mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n $$

和:

$$ \mathbf{y}_1,\mathbf{y}_2,\cdots,\mathbf{y}_n $$

是同一个线性空间中的两组基。

如果每个 $\mathbf{y}_i$ 都可以用 $\mathbf{x}_1,\mathbf{x}_2,\cdots,\mathbf{x}_n$ 表示,那么可以写成:

$$ \begin{bmatrix} \mathbf{y}_1 & \mathbf{y}_2 & \cdots & \mathbf{y}_n \end{bmatrix} = \begin{bmatrix} \mathbf{x}_1 & \mathbf{x}_2 & \cdots & \mathbf{x}_n \end{bmatrix} \mathbf{K} $$

其中 $\mathbf{K}$ 称为两组基之间的转换矩阵。

从工程角度看,换基矩阵的作用是:

把同一个物理量从一种表示方式转换到另一种表示方式。

例如模态分析中,从物理坐标转换到模态坐标,本质上就是一种换基。


3.3 正交基

如果一组基中的任意两个不同向量满足:

$$ \mathbf{x}_i^{\mathrm{T}}\mathbf{x}_j=0 \quad (i\ne j) $$

则称这组基为正交基。

如果进一步满足:

$$ \mathbf{x}_i^{\mathrm{T}}\mathbf{x}_i=1 $$

则称为标准正交基。

也就是说,标准正交基满足:

$$ \mathbf{x}_i^{\mathrm{T}}\mathbf{x}_j = \delta_{ij} $$

其中:

$$ \delta_{ij} = \begin{cases} 1, & i=j \\ 0, & i\ne j \end{cases} $$

正交基的好处是非常明显的:
不同方向之间互不干扰,投影和展开都更简单。

如果:

$$ \mathbf{y} = \sum_{i=1}^{n}k_i\mathbf{x}_i $$

且 $\mathbf{x}_i$ 是标准正交基,那么系数可以直接通过内积得到:

$$ k_i = \mathbf{x}_i^{\mathrm{T}}\mathbf{y} $$

这就是正交基在计算中的优势。


3.4 Gram-Schmidt 正交化

如果已有一组线性无关的基:

$$ \boldsymbol{\alpha}_1, \boldsymbol{\alpha}_2, \cdots, \boldsymbol{\alpha}_n $$

可以通过 Gram-Schmidt 方法构造一组正交基:

$$ \boldsymbol{\beta}_1, \boldsymbol{\beta}_2, \cdots, \boldsymbol{\beta}_n $$

首先令:

$$ \boldsymbol{\beta}_1 = \boldsymbol{\alpha}_1 $$

然后:

$$ \boldsymbol{\beta}_2 = \boldsymbol{\alpha}_2 - \frac{ \boldsymbol{\alpha}_2^{\mathrm{T}}\boldsymbol{\beta}_1 }{ \boldsymbol{\beta}_1^{\mathrm{T}}\boldsymbol{\beta}_1 } \boldsymbol{\beta}_1 $$

一般地:

$$ \boldsymbol{\beta}_i = \boldsymbol{\alpha}_i - \sum_{j=1}^{i-1} \frac{ \boldsymbol{\alpha}_i^{\mathrm{T}}\boldsymbol{\beta}_j }{ \boldsymbol{\beta}_j^{\mathrm{T}}\boldsymbol{\beta}_j } \boldsymbol{\beta}_j $$

这个公式的含义是:

从当前向量中减去它在前面所有基向量方向上的投影,剩下的部分就与前面的方向正交。

如果还要得到标准正交基,可以进一步归一化:

$$ \boldsymbol{\gamma}_i = \frac{ \boldsymbol{\beta}_i }{ \sqrt{ \boldsymbol{\beta}_i^{\mathrm{T}}\boldsymbol{\beta}_i } } $$

于是:

$$ \boldsymbol{\gamma}_1, \boldsymbol{\gamma}_2, \cdots, \boldsymbol{\gamma}_n $$

就是一组标准正交基。


4. 和力学/数值计算的联系

4.1 基决定了解的表示方式

在力学问题中,我们关心的未知量通常是位移场、速度场、应力场等。

如果是连续问题,未知函数可能是无限维的。
如果经过离散化,未知量就变成有限维向量。

例如有限元中常写:

$$ u(x) \approx \sum_{i=1}^{n}N_i(x)u_i $$

其中:

  • $N_i(x)$ 是形函数;
  • $u_i$ 是节点自由度。

这其实就是用一组基函数 $N_i(x)$ 表示未知位移场。

所以有限元的核心思想之一就是:

用有限个基函数近似连续场变量。

这和线性空间中的“用基表示向量”是一致的。


4.2 模态分析本质上是一种换基

结构动力学方程通常可以写成:

$$ \mathbf{M}\ddot{\mathbf{u}} + \mathbf{K}\mathbf{u} = \mathbf{F} $$

如果直接在物理坐标 $\mathbf{u}$ 下求解,系统可能是耦合的。

模态分析中,可以令:

$$ \mathbf{u} = \mathbf{\Phi}\mathbf{q} $$

其中:

  • $\mathbf{\Phi}$ 是振型矩阵;
  • $\mathbf{q}$ 是模态坐标。

这一步本质上就是换基。

如果振型满足关于质量矩阵和刚度矩阵的正交性,那么原来的耦合方程可以被解耦成若干独立方程。

这就是正交基在结构动力学中的重要作用。


4.3 POD 降阶也依赖正交基

在降阶模型中,经常希望用少量基向量表示高维系统状态。

例如:

$$ \mathbf{u} \approx \mathbf{\Phi}_r\mathbf{a} $$

其中:

  • $\mathbf{\Phi}_r$ 是保留的低维基;
  • $\mathbf{a}$ 是低维坐标;
  • $r \ll n$。

如果 $\mathbf{\Phi}_r$ 是一组正交基,那么高维变量到低维坐标的投影会非常方便。

例如:

$$ \mathbf{a} = \mathbf{\Phi}_r^{\mathrm{T}}\mathbf{u} $$

这就是 POD、Galerkin 投影、模态截断等方法中的基础思想。

所以线性空间、基和正交化并不是抽象概念,而是降维计算的数学基础。


4.4 正交化可以改善数值稳定性

如果一组基函数之间非常接近,虽然理论上可能线性无关,但在数值计算中会导致矩阵病态。

病态矩阵会带来几个问题:

  • 求解结果对误差非常敏感;
  • 小扰动可能引起大变化;
  • 数值迭代收敛变慢;
  • 矩阵求逆或线性方程组求解不稳定。

通过正交化,可以让不同基向量之间尽量独立,从而改善数值稳定性。

因此,在 Krylov 子空间方法、QR 分解、Arnoldi 方法、POD 模态构造中,正交化都是非常重要的步骤。


5. 面试中可以怎么回答?

如果面试官问:

什么是线性相关和线性无关?

可以这样回答:

如果一组向量中存在某个向量可以由其他向量线性表示,那么这组向量就是线性相关的;如果每个向量都提供了一个新的独立方向,只有所有系数都为零时线性组合才等于零向量,那么这组向量就是线性无关的。在线性方程组和数值计算中,线性无关非常重要,因为它关系到解的唯一性和矩阵是否奇异。

如果面试官问:

你怎么理解“基”?

可以这样回答:

我理解基就是描述一个线性空间的一组基本方向。空间中的任意向量都可以由这组基线性表示,而且这种表示是唯一的。不同基下,同一个向量会有不同坐标。在力学中,比如物理坐标、模态坐标、POD 坐标,本质上都是对同一个状态变量采用了不同的基来表示。

如果面试官问:

正交基有什么好处?

可以这样回答:

正交基的好处是不同方向之间互不耦合,投影和展开都更简单。如果是标准正交基,展开系数可以直接通过内积得到。在模态分析中,振型正交性可以帮助解耦动力学方程;在 POD 降阶中,正交基可以方便地把高维状态投影到低维空间中。

如果面试官问:

Gram-Schmidt 正交化的思想是什么?

可以这样回答:

Gram-Schmidt 正交化的核心思想是逐个处理向量。对于当前向量,减去它在前面已构造正交向量方向上的投影,剩下的部分就与前面的向量正交。最后再进行归一化,就可以得到标准正交基。它的作用是把一组线性无关向量转化为一组正交基,方便后续投影和数值计算。

如果面试官问:

这些内容和有限元、模态分析有什么关系?

可以这样回答:

有限元中用形函数作为基函数来近似位移场,模态分析中用振型作为基来表示结构响应,POD 降阶中用少量正交模态作为低维基来近似高维状态。所以线性空间和基的概念是这些方法的共同数学基础,而正交性则可以简化投影、解耦方程并改善数值稳定性。


6. 这一篇的核心总结

这一篇主要复习了线性空间、基、坐标和正交化。

可以总结为三句话:

  1. 线性空间中的向量可以由一组基线性表示,基决定了变量的表示方式。
  2. 正交基可以简化投影和展开,是模态分析、POD 降阶和 Galerkin 方法的重要基础。
  3. Gram-Schmidt 正交化的本质是不断减去已有方向上的投影,从而构造互相正交的基。

所以,线性空间不是抽象的数学概念,而是数值力学中“如何表示解”的基础。

从有限元形函数,到模态振型,再到 POD 降阶基,本质上都是在回答同一个问题:

用什么基来表示未知解,才能既准确又高效?


7. 下一篇预告

下一篇准备整理:

研一数学基础复习笔记(四):特征值与系统固有性质

下一篇会重点讨论行列式、逆矩阵、特征值、特征向量、瑞利商和谱半径,并进一步联系结构动力学中的固有频率、振型和模态分析。


研一数学基础复习笔记(三):线性空间、基与正交化
http://zncddh.cn/2026/05/03/研一数学基础复习笔记(三):线性空间、基与正交化/
作者
creativity
发布于
2026年5月3日
许可协议