考虑矩阵运算本质上很困难,我们期望寻找一个简单的思考逻辑而不是反复纠结矩阵每一项的具体意义。我们可以从函数的角度去看矩阵,这样可以让我们更简单理解矩阵的运算。
我们知道对于函数
也可以使用 笛卡尔积(Cartesian product) 表示:
$$
f: m \times n
$$
让我们再考虑一个
矩阵的形状
对于$m$ 行$n$ 列 的矩阵,其形状为$(m\times n)$ ,类似的,我们可以认为$d$ 维向量是一个$d \times 1$ 形状的矩阵。
我们发现矩阵的形状表示和函数的笛卡尔积非常类似($(m\times n)$ vs.
我们可以将
$$ \begin{align*} f(\mathbf{v}) &\mapsto \mathbb{R}^m\ \mathbf{M}{m\times n} \mathbf{v}{n\times 1} &\mapsto \mathbf{u}_{m\times 1} \end{align*} $$
对于
换句话说,我们可以认为矩阵运算和函数运算非常类似。其都是将输入空间映射到对应的输出空间。 即其都在将输入空间变换到输出空间。
如果我们再考虑组合,即考虑一个函数
组合运算为: $$ g \circ f (x) = g(f(x)) $$
而我们再考虑矩阵,假设矩阵
如考虑点
即
flowchart LR
s1((s1))
s2((s2))
s3((s3))
s1 --f1--> s2
s2 --f2--> s3
s1 --f1 o f2--> s3
如令
flowchart LR
s1((s1))
s2((s2))
s3((s3))
s1 --f1--> s2
s2 --f2--> s3
s1 --g--> s3
如果矩阵
$$ s_2 = \mathbf{M}_1 s_1 \qquad s_3 = \mathbf{M}_2 s_2 \qquad s_3 = \underbrace{\mathbf{M}_2\mathbf{M}1}{\mathbf{G}} s_1 \ s_3 = \mathbf{G} s_1\ $$
flowchart LR
s1((s1))
s2((s2))
s3((s3))
s1 --M1--> s2
s2 --M2--> s3
s1 --G--> s3
而如果考虑逆运算,即
类似的,矩阵可以写作
$$ s_1 = \mathbf{M}_1^{-1} s_2\qquad s_2 = \mathbf{M}_2^{-1}s_3 \qquad s_1 = \underbrace{\mathbf{M}_1^{-1} \mathbf{M}2^{-1}}{\mathbf{G^{-1}}} s_3 \ s_1 = \mathbf{G^{-1}} s_3 $$
因此我们获得了矩阵的逆运算规则:
$$
\mathbf{G^{-1}} = (\mathbf{M}2\mathbf{M}1)^{-1} = \mathbf{M}1^{-1} \mathbf{M}2^{-1}
$$
而如果矩阵 $\mathbf{P}{m\times n}$ 不是方阵(Square Matrix),则其并没有严格意义上的 Inverse,即 $\mathbf{P}^{-1}$,我们可以引入 Pseudo Inverse (Moore–Penrose inverse) $\mathbf{P}^+$ 来表示 $\mathbf{P}$ 的逆:
$$
\mathbf{P}^+{n\times m} = \underbrace{\mathbf{P}^T}{n\times m}\underbrace{(\overbrace{\mathbf{P}\mathbf{P}^T}^{(m\times n)\cdot (n\times m)})^{-1}}{m\times m}
$$
⚠️ 注意:这两个性质并不总是同时成立。实际上,对于非方阵的伪逆,只有在以下情况下才成立:如果
$m < n$ 且$\mathbf{P}$ 是行满秩的,则只有第一个等式成立 如果$m < n$ 且$\mathbf{P}$ 是列满秩的,则只有第二个等式成立 只有当$m = n$ 且$\mathbf{P}$ 是满秩方阵时,两个等式才同时成立
在函数空间和向量空间,我们有如下对应关系
运算 | 函数空间 | 向量空间 |
---|---|---|
映射/变换 |
|
|
组合 | ||
逆运算 |
|
|
组合逆运算 |
我们可以把矩阵看作一个函数映射,这样的好处是你不再需要关注矩阵具体在做什么,而只需要映射这件事的语义(semantic)以及输入和输出空间的形状即可。
例如,如果我们需要求一个矩阵,其可以将红绿蓝三色的光值(3 维向量,分别代表红绿蓝的值)转换为灰度值(1 个标量,也可以看作
当然,需要注意的矩阵能表达的映射是有限的,而函数则可以表达更多的映射关系。因此,矩阵看作是函数的一种特殊形式。