《矩阵论》课程笔记

type

status

date

slug

summary

1 矩阵代数基础

线性方程组解的个数

唯一解:

无穷多解:

无解:

向量的内积与范数

典范内积：

加权内积：

其中是正定Hermitian矩阵。

常用的向量范数：

(1)范数(0范数)

(2)范数(和范数、1范数)

(3)范数(Eculidean范数、Frobenius范数)

(4)范数(无穷范数、极大范数)

(5)范数(Holoder范数)

函数向量的内积与范数：

随机向量的内积与范数：

向量的外积：

矩阵的内积与范数

矩阵的向量化：

内积的推广：

诱导范数：

诱导-范数：

当取不同的值时，有如下范数的定义：

(1)绝对列和范数

(2)矩阵的最大奇异值

(3)绝对行和范数

“元素形式”范数：

(1)范数：

(2)Frobenius范数:

(3)范数:

随机向量

联合累计分布函数(CDF):

概率密度函数(PDF):

均值向量：

相关矩阵：

为Hermitian矩阵。

自协方差矩阵：

自相关矩阵和自协方差矩阵的关系：

互相关矩阵：

互协方差矩阵：

互相关矩阵和互协方差矩阵的关系：

实高斯白噪声向量：

对于一个实高斯白噪声向量,其PDF为

复高斯白噪声向量：

对于一个复高斯白噪声向量,其PDF为

Moore-Penrose逆矩阵

令是任意矩阵，称矩阵为的广义逆矩阵，若满足

(1)

(2)

(3)

(4)

矩阵的直和和Hadamard积

直和：

Hadamard积：

Kronecker积：（默认为右）

向量化与矩阵化

按列堆栈：

按行堆栈：

2 特殊矩阵

置换矩阵

一个正方矩阵是置换矩阵，若它的每一行和每一列有且仅有一个非零元素1,容易验证是正交矩阵。

互换矩阵

交换矩阵

一个的矩阵为交换矩阵，若它对矩阵满足

广义置换矩阵

相似矩阵和相似变换

存在一个非奇异矩阵使得，称。

相似变换：

相似矩阵的特征值相同，特征向量存在线性变换关系。

Hadamard矩阵

称为Hadamard矩阵，若它的所有元素取或，且

第一列和第一行所有元素为的Hadamard矩阵称为规范化Hadamard矩阵。

只有当或者是的整数倍时，Hadamard矩阵才存在。

容易验证是标准正交矩阵，且

令则规范化的标准正交Hadamard矩阵具有通用构造公式：

其中

3 矩阵微分

Jacobian矩阵与梯度矩阵

行偏导：

Jacobian矩阵：

对于实标量函数

对于实矩阵函数

列偏导：

梯度矩阵：

对于实标量函数

对于实矩阵函数

一阶实矩阵微分

矩阵微分：

的微分：

矩阵乘积的微分：

标量函数的Jacobian矩阵辨识：

对于实标量函数

Hessian矩阵

共轭梯度与复Hessian矩阵

复变元向量的微分：

复变元向量的全Hessian矩阵：

4 梯度分析与最优化

实变量函数无约束优化的梯度分析

复变函数的平稳点和极值点条件

无约束最小化问题的梯度分析——闭式解

令实变函数的梯度或复变函数的共轭梯度为0.

平滑凸优化的一阶算法——梯度下降方法

线搜索法：

精确线搜索法（全松弛准则）：

Goldstein-Armijo准则：

记

求，使得

即用两条线限制每一步的搜索范围。

平滑凸优化的二阶算法——牛顿法

修正牛顿法：

拟牛顿法：

约束优化算法——Lagrange乘子法

考虑优化问题

则可以构造Lagrangian函数：

其中有约束条件.

对于等式约束问题，令各个变量的梯度为0即可求得。

约束优化算法——罚函数法

同样考虑上述的优化问题，其基本原理是，将约束优化问题通过罚函数转化成反应优化问题和约束条件的无约束极小化问题。

记为的可行集，那么有如下两种方式进行转化：

加性罚函数：

其中罚函数.

乘性罚函数：

其中罚函数.

通常采用加性罚函数。

对于等式约束，考虑罚函数

对于不等约束，考虑外罚和内罚两种情况：

外罚函数（对所有都进行惩罚）：

内罚函数（阻止离开):

混合罚函数即对外罚函数和内罚函数进行加权。

5 矩阵方程求解

最小二乘法

求解矩阵方程，考虑无解的情况，想要找到近似解，使得

令代价函数为

则有

且时：

一定有是非奇异矩阵，即，因此

且时：

方程欠定，不可辨识。

Gauss-Markov定理

方程的最小二乘解是方程的最优无偏估计。

同时也是最大似然估计。

数据最小二乘法

解矩阵方程，其中数据矩阵在观测时存在误差，即观测到的满足

目标是找到一个解，使得

构造Lagrange函数：

令，有

代入得

即

因此

带回原目标函数，有

因此数据最小二乘问题等价为优化问题

Tikhonov正则化

考虑当代价函数加入一个正则项时，有

令

使，有

即，因此

总体最小二乘法

解矩阵方程，其中和的观测均存在误差，即观测到的满足

因此问题变成

约束条件可以写成

即

令

此时问题变成

此时问题转化为一个特殊的数据最小二乘问题，因此可进一步等价为优化问题

上式的形式称为Rayleigh商。

6 特征分析

特征分解(EVD, Eigen Value Decomposition)

矩阵具有个特征值，其对应的个单位特征向量为，记

则可分解为

特征多项式与Caley-Hamiton定理

特征多项式：

称

为矩阵的特征多项式

Caley-Hamiton定理：

标准正交变换

给定一组相关的随机变量，希望通过某个线性变换，把它变成另外一组统计不相关的随机变量。

令为一随机向量，其均值向量为,协方差矩阵为,其EVD为希望能够找到一个线性变换,使得当时，有

前者是显然的，后者有

即，由于为正交矩阵，因此.

迷向圆变换

进一步地，找到一个线性变换，使得当时，有

因此有.

离散Karhonen-Loeve变换（重构最优性）

令是一个零均值的随机向量，其自相关矩阵为.希望找到一个线性正交变换

其中是一酉矩阵。于是可以表示成的列向量的线性组合

为了减小变换后的系数的个数，假设只使用前个系数来表示，有

误差为

由此可以得到均方误差

因此可构造约束优化问题

构造Lagrange函数

令其共轭梯度为0有

因此在均方误差最小时，有

即若有个大特征值，个可以忽略的特征值，可以通过上式近似代替.

Rayleigh商

设为Hermitian矩阵，称下式为其Rayleigh商

其最大值,最小值.

广义Rayleigh商

令，得

7 奇异值分析

数值稳定性与条件数

当线性方程组存在扰动时，即

则有

称为条件数，反应解的扰动情况。条件数很大时称矩阵为病态的。

奇异值分解(SVD, Singular Value Decomposition)

令,则存在酉矩阵,使得

其中，。

且，按从大到小的顺序排列，称为的奇异值。因此有

并且为矩阵和的第个特征值，为的特征向量组成的矩阵，为的特征向量组成的矩阵。

1 矩阵代数基础

线性方程组解的个数

向量的内积与范数

矩阵的内积与范数

随机向量

Moore-Penrose逆矩阵

矩阵的直和和Hadamard积

向量化与矩阵化

2 特殊矩阵

置换矩阵

互换矩阵

交换矩阵

广义置换矩阵

相似矩阵和相似变换

Hadamard矩阵

3 矩阵微分

Jacobian矩阵与梯度矩阵

一阶实矩阵微分

Hessian矩阵

共轭梯度与复Hessian矩阵

4 梯度分析与最优化

实变量函数无约束优化的梯度分析

复变函数的平稳点和极值点条件

无约束最小化问题的梯度分析——闭式解

平滑凸优化的一阶算法——梯度下降方法

平滑凸优化的二阶算法——牛顿法

约束优化算法——Lagrange乘子法

约束优化算法——罚函数法

5 矩阵方程求解

最小二乘法

Gauss-Markov定理

数据最小二乘法

Tikhonov正则化

总体最小二乘法

6 特征分析

特征分解(EVD, Eigen Value Decomposition)

特征多项式与Caley-Hamiton定理

标准正交变换

迷向圆变换

离散Karhonen-Loeve变换（重构最优性）

Rayleigh商

广义Rayleigh商

7 奇异值分析

数值稳定性与条件数

奇异值分解(SVD, Singular Value Decomposition)

矩阵范数与奇异值的关系

基本信息

About 二次