Skip to content

矩阵

INFO

本文介绍一些矩阵基础。

向量形式下的方差计算

向量形式下的方差计算是通过将标量的平方和表示为向量的范数(norm)平方来实现的。这里的 表示的是向量的 欧几里得范数(也称为 L2范数)。让我们详细解释这一点。

1. 向量的欧几里得范数

欧几里得范数(通常用 表示)是指向量中各个元素平方和的平方根。对于一个 m×1 的列向量 x,其欧几里得范数定义为:

x=i=1mxi2

2. 方差的向量形式表示

我们先回顾标量的方差定义:

σ2=1mi=1m(AiA¯)2

在这里,Ai 是可达性向量 A 的第 i 个元素,A¯A 的平均值。

3. 转换为向量形式

当我们将方差的计算转换为向量形式时,可以将每个 AiA¯ 看作是向量 A 减去一个向量 A¯1,其中 1 是一个全为1的向量。于是:

AA¯1=(A1A¯A2A¯AmA¯)

其欧几里得范数(L2范数)就是:

AA¯1=i=1m(AiA¯)2

因此,方差可以表示为:

σ2=1mAA¯12

4. 最小化方差

为了最小化方差,我们需要最小化 AA¯12。而在许多优化问题中,常常忽略 1m 这一常数因子,因此最终目标是最小化 AA¯12

总结

  • 表示 欧几里得范数,即向量的各元素平方和的平方根。
  • 方差的向量形式 通过欧几里得范数的平方来表示向量中每个元素与平均值的偏差平方和。
  • 最小化方差 即为最小化这一偏差的平方和,因此可以表示为最小化 (PSa)2,其中 PS 是可达性向量,a 是其平均值。

欧几里得范数

欧几里得范数(L2范数)的平方确实可以通过向量的转置与原向量的乘积来计算。

1. 欧几里得范数的定义

对于一个 m×1的列向量 x,其欧几里得范数(L2范数)定义为:

x=i=1mxi2

2. 欧几里得范数的平方

欧几里得范数的平方表示为:

x2=i=1mxi2

3. 用转置和原向量的乘积表示范数的平方

将欧几里得范数的平方表示为向量的转置与原向量的乘积,可以如下进行:

x2=xx

4. 详细计算步骤

假设 x是一个 m×1的列向量:

x=(x1x2xm)

其转置 x是一个 1×m的行向量:

x=(x1x2xm)

计算 xx的结果是一个标量(1×1的矩阵):

xx=(x1x2xm)(x1x2xm)=x12+x22++xm2

这正好等于向量 x的欧几里得范数的平方 x2

5. 总结

  • 欧几里得范数的平方 可以通过向量的转置与原向量的乘积来计算,即 x2=xx
  • 欧几里得范数 是向量中各元素平方和的平方根,即 x=xx

这种表示方式在许多数学和工程领域中非常有用,因为它将范数计算与矩阵操作(如转置和乘积)联系了起来。

矩阵分解

以下是正定矩阵、Cholesky分解、特征值分解(包括特征值、特征向量)、谱分解以及奇异值分解的总结与区分:


1. 正定矩阵

  • 定义
    一个实对称矩阵 A 是正定的,如果对所有非零向量 x,满足 xTAx>0

    • 性质:
      • 所有特征值均为正。
      • 可以进行Cholesky分解。
  • 几何意义:正定矩阵常用作二次型中的系数矩阵,描述凸二次曲面的性质。


2. Cholesky分解

  • 定义
    对于正定矩阵 A,可以分解为下列形式:

    A=LLT

    其中 L 是一个下三角矩阵,LT 是其转置。

  • 特点

    • 仅适用于正定矩阵。
    • 高效,计算复杂度比通用分解方法低。
    • 常用于加速数值计算(如求解线性方程组)。

3. 特征值分解

  • 定义
    对于方阵 A,如果存在标量 λ 和非零向量 v,使得:

    Av=λv

    λA 的特征值,v 是对应的特征向量。

  • 特征值分解公式
    如果 A 是实对称矩阵,特征值分解为:

    A=QΛQT

    其中 Q 是正交矩阵(特征向量组成的矩阵),Λ 是对角矩阵(特征值组成的矩阵)。

  • 应用

    • 数据降维(如PCA)。
    • 矩阵幂运算或指数运算。
    • 分析系统稳定性(线性代数和动力系统)。

4. 谱分解

  • 定义
    谱分解是特征值分解的另一种表达,适用于任意对称矩阵。
    A 的谱分解可以写为:

    A=i=1nλiviviT

    其中 λiA 的特征值,vi 是归一化后的特征向量。

  • 区别

    • 谱分解是特征值分解的几何视角。
    • 强调矩阵是由其特征值和特征向量加权组合构成的。

5. 奇异值分解(SVD)

  • 定义
    对于任意矩阵 A(不要求方阵或对称),可以分解为:

    A=UΣVT
    • UAAT 的特征向量矩阵(列正交)。
    • VATA 的特征向量矩阵(列正交)。
    • Σ:奇异值构成的对角矩阵(非负)。
  • 特点

    • 适用于任意矩阵。
    • 奇异值对应矩阵的尺度信息,反映矩阵的“结构性”。
  • 应用

    • 矩阵压缩(如图像处理)。
    • 低秩近似(数据降维)。
    • 求解不适定问题。

核心区分

方法适用范围特点应用场景
正定矩阵实对称正定矩阵所有特征值正,可Cholesky分解。二次优化、数值稳定性。
Cholesky分解正定矩阵快速分解为 LLT,仅限正定矩阵。数值计算、线性方程组求解。
特征值分解实对称矩阵表达为 QΛQT,强调特征值和特征向量。数据分析、矩阵运算。
谱分解对称矩阵结合几何解释,将矩阵分解为特征向量加权和。凸优化、矩阵近似。
奇异值分解(SVD)任意矩阵分解为 UΣVT,奇异值可量化矩阵性质。图像处理、低秩近似、主成分分析(PCA)。

总结:

  • Cholesky分解正定矩阵关系紧密,仅适用于正定矩阵;
  • 特征值分解谱分解是针对实对称矩阵的特定分解方法;
  • **奇异值分解(SVD)**适用于任意矩阵,具有更广泛的应用场景。

特征值与特征向量的总结

特征值和特征向量是线性代数中的核心概念,广泛应用于矩阵的分析、数据降维、主成分分析(PCA)、物理学中的振动分析等领域。理解它们的定义、求解过程及其背后的几何和代数含义,对于深入学习矩阵理论和应用非常重要。


1. 特征值和特征向量的定义

对于一个 n×n 的方阵 A,如果存在一个标量 λ 和一个非零向量 v 满足下式:

Av=λv

λ 称为矩阵 A特征值,而 v 称为矩阵 A 对应的 特征向量

关键细节

  • 特征向量 v 必须是 非零 向量。
  • 特征值 λ 是一个标量,表示矩阵 A 在特征向量方向上的伸缩因子。

特征向量是矩阵在特定方向上保持不变的方向,而特征值描述的是这个方向上向量的拉伸或压缩的程度。


2. 特征方程的推导

从定义 Av=λv 开始,可以通过如下变形得到:

Avλv=0(AλI)v=0

其中 I 是单位矩阵。为了保证方程有非零解 v,要求矩阵 AλI奇异的(即不可逆),否则方程只会有零解。

为什么会有零解?

  • 如果 AλI 可逆,则 (AλI)v=0 只有零解,因为可逆矩阵的方程 (AλI)v=0 只有 v=0 这个解。
  • 特征值的几何意义:只有当矩阵 AλI 不可逆时,才能有非零解 v,这些解就是矩阵 A 的特征向量。

3. 求解特征值和特征向量

特征值的求解

  1. 构造特征方程
    对于矩阵 A,构造 AλI,并计算其行列式:

    det(AλI)=0

    这是 特征方程,其解即为矩阵 A 的特征值 λ

  2. 求解特征多项式
    通过求解特征方程 det(AλI)=0,可以得到矩阵 A 的所有特征值 λ1,λ2,,λn

特征向量的求解

对于每一个特征值 λ,代入方程 (AλI)v=0,解这个线性方程组,得到对应的特征向量 v

  • 解线性方程组 (AλI)v=0 通常可以使用高斯消元法或矩阵分解等方法得到特征向量 v
  • 由于特征向量有自由度,可以通过乘以常数得到不同的解,因此通常我们选择归一化特征向量。

4. 特征值和特征向量的几何与代数意义

几何解释

  • 特征值 λ:描述矩阵 A 对特征向量 v 的伸缩比例,表示 A 在特征向量方向上作用后的变化倍数。
  • 特征向量 v:表示矩阵 A 不改变方向的向量,特征向量经过矩阵 A 的变换后,依然指向同一方向,只是可能被拉伸或压缩。

代数解释

  • 通过解特征方程 det(AλI)=0,我们得到矩阵的特征值,这些特征值代表了矩阵对不同方向的伸缩。
  • 对于每个特征值 λ,通过解线性方程 (AλI)v=0,我们得到对应的特征向量,这些特征向量是矩阵作用下保持方向不变的向量。

5. 示例

考虑矩阵 A=[4123]

  1. 构造特征方程

    AλI=[4λ123λ]

    计算行列式:

    det(AλI)=(4λ)(3λ)21=λ27λ+10

    特征方程为:

    λ27λ+10=0
  2. 求解特征值: 解方程 λ27λ+10=0,得到特征值:

    λ1=5,λ2=2
  3. 求解特征向量

    • 对于 λ1=5,代入 (A5I)v=0

      [1122][x1x2]=0

      得到特征向量 v1=[11]

    • 对于 λ2=2,代入 (A2I)v=0

      [2121][x1x2]=0

      得到特征向量 v2=[12]


6. 总结

  • 特征值 λ特征向量 v 满足方程 Av=λv
  • 特征方程 det(AλI)=0 用来求解矩阵 A 的特征值。
  • 对于每个特征值 λ,通过解方程 (AλI)v=0 求得对应的特征向量。
  • 特征值描述了矩阵在特征向量方向上的伸缩比例,特征向量则描述了矩阵作用下保持不变的方向。

通过求解特征值和特征向量,我们可以更好地理解矩阵的性质,进而在多个应用中发挥作用。