MP逆及其性质

之前在奇异值分解与穆尔-彭罗斯伪逆简单地学了一下MP逆,下面进一步学习MP逆矩阵的性质。

定义

对于任意矩阵 \(\mathbf{A}\),其MP逆矩阵记为 \(\mathbf{A}^{+}\) ,其为满足下面四个条件的解(注意下面的 *号表示共轭转置,下同)。

  1. \(\boldsymbol{A} \boldsymbol{A^+} \boldsymbol{A}=\boldsymbol{A}\);
  2. \(\boldsymbol{A^+} \boldsymbol{A} \boldsymbol{A^+}=\boldsymbol{A^+} ;\)
  3. \(\left(\boldsymbol{A} \boldsymbol{A}^{+}\right)^{\mathrm{*}}=\boldsymbol{A} \boldsymbol{A}^{+}\);
  4. \(\left(\boldsymbol{A}^{+} \boldsymbol{A}\right)^{\mathrm{*}}=\boldsymbol{A}^{+} \boldsymbol{A}\);

唯一性及构造

奇异值分解与穆尔-彭罗斯伪逆 中,我们证明了基于 \(\mathbf{A}\) 的奇异值分解可以得到满足上面四个条件的MP逆为 \(\mathbf{A^{+}}=\mathbf{V \Sigma^{+} U^{\mathrm{T}}}\) 。因此对于任意矩阵 \(\mathbf{A}\) , 至少存在一个MP逆满足上面四个条件,下面我们进一步证明MP逆的唯一性

假设 \(\mathbf{X}\)\(\mathbf{Y}\) 均是矩阵 \(\mathbf{A}\) 的MP逆矩阵,通过反复利用 MP 逆矩阵的四个方程,有 \[ \begin{aligned} \boldsymbol{X} &=\boldsymbol{X} \boldsymbol{A}=\boldsymbol{X}(\boldsymbol{A X})^{*}=\boldsymbol{X} \boldsymbol{X}^{*} \boldsymbol{A}^{*}=\boldsymbol{X} \boldsymbol{X}^{*} \boldsymbol{A}^{*} \boldsymbol{X}^{*} \boldsymbol{A}^{*} \\ &=\boldsymbol{X} \boldsymbol{X}^{*} \boldsymbol{A}^{*} \boldsymbol{Y}^{*} \boldsymbol{A}^{*}=\boldsymbol{X}(\boldsymbol{A X})^{*}(\boldsymbol{A Y})^{*}=\boldsymbol{X} \boldsymbol{A} \boldsymbol{X} \boldsymbol{AY}=\boldsymbol{X} \boldsymbol{A} \boldsymbol{Y} \\ &=\boldsymbol{X} \boldsymbol{A} \boldsymbol{Y} \boldsymbol{AY}=(\boldsymbol{X} \boldsymbol{A})^{*}(\boldsymbol{Y} \boldsymbol{A})^{*} \boldsymbol{Y}=\boldsymbol{A}^{*} \boldsymbol{X}^{*} \boldsymbol{A}^{*} \boldsymbol{Y}^{*} \boldsymbol{Y} \\ &=\boldsymbol{A}^{*} \boldsymbol{Y}^{*} \boldsymbol{Y}=(\boldsymbol{Y} \boldsymbol{A})^{*} \boldsymbol{Y}=\boldsymbol{Y} \boldsymbol{A} \boldsymbol{Y}=\boldsymbol{Y} \end{aligned} \] 因此我们得证,对于任意矩阵 \(\mathbf{A}\) ,均存在唯一的一个MP逆矩阵,即 \(\mathbf{A^{+}}=\mathbf{V \Sigma^{+} U^{\mathrm{T}}}\)

我们还有一种表示形式,假设 \(\mathbf{A} \in \mathbf{C}^{m \times n}\) 有满秩分解 \(\mathbf{A=F G}\) ,其中 $ ^{m r}, ^{r n}, r=r()=r()=r() $ ,则我们有 \[ \mathbf{A^{+}=G^{*}\left(F^{*} A G^{*}\right)^{-1} F^{*}} \] 证明:首先我们要证明 \(\mathbf{F^{*} A G^{*}}\) 为可逆矩阵,注意到 \(r\left(\boldsymbol{F}^{*} \boldsymbol{F}\right)=r(\boldsymbol{F})=r, r\left(\boldsymbol{G} \boldsymbol{G}^{*}\right)=r(\boldsymbol{G})=r\) ,于是方阵 \(\boldsymbol{F}^{*} \boldsymbol{F}\)\(\boldsymbol{G} \boldsymbol{G}^{*}\) 均为可逆矩阵,因此 \(\mathbf{F^{*} A G^{*}} = \mathbf{F^{*} F G G^{*}}\) 也是可逆矩阵,并且 \[ \mathbf{\left(F^{*} A G^{*}\right)^{-1}=\left(G G^{*}\right)^{-1}\left(F^{*} F\right)^{-1}} \] 带入 \(\mathbf{A^{+}=G^{*}\left(F^{*} A G^{*}\right)^{-1} F^{*}}\) ,得到 \[ \mathbf{A^{+}=G^{*}\left(G G^{*}\right)^{-1}\left(F^{*} F\right)^{-1} F^{*}} \] 易证该式满足MP逆矩阵的四个条件,因此该式为 MP 逆矩阵,证明完毕。

实际上,存在(同样可以带入上面四个方程来证明) \[ \begin{aligned} &\boldsymbol{G}^{+}=\boldsymbol{G}^{*}\left(\boldsymbol{G} \boldsymbol{G}^{*}\right)^{-1}, \\ &\boldsymbol{F}^{+}=\left(\boldsymbol{F}^{*} \boldsymbol{F}\right)^{-1} \boldsymbol{F}^{*} \end{aligned} \] 因此上面的结论也可以写成 \[ \mathbf{A^{+}=(F G)^{+}=G^{+} F^{+}} \] 但是一般来说 \(\mathbf{(A B)^{+} \neq B^{+} A^{+}}\) ,这是 MP 逆矩阵和普通逆矩阵的一个不同之处。

最后一种 \(\mathbf{A^{+}}\) 的表达形式如下(缺证明) \[ \mathbf{A^{+}=A^{*}\left(A A^{*}\right)^{-} A\left(A^{*} A\right)^{-} A^{*}} \]

基本性质

性质1

  • \(\mathbf{A}^{+}\) 的满秩形式

    • \(\mathbf{A}\) 可逆,则 \(\mathbf{A}^{+} = \mathbf{A}^{-1}\)

    • \(\mathbf{A}\) 为列满秩矩阵,则 \(\mathbf{ A^{+} = (A^{*}A)^{-1}A^{*} }\)

    • \(\mathbf{A}\) 为行满秩矩阵,则 \(\mathbf{ A^{+} = A^{*} (AA^{*})^{-1} }\)

    • \(\mathbf{A = LR}\) 是秩为 \(r\)\(\mathrm{C}^{m \times n}\) 的矩阵,其中 \(\mathbf{L}\)\(m \times r\) 的列满秩矩阵, \(\mathbf{R}\)\(r \times n\) 的行满秩矩阵,则 \[ \mathbf{ A^{+} = R^{+}L^{+} = R^{*} (RR^{*})^{-1} (L^{*}L)^{-1} L^{*} } \] 这其实是满足乘法公式的一个特例,证明如下,首先我们知道 \(\mathbf{ R R^{+} = I}\)\(\mathbf{ L^{+} L = I}\) ,因此我们带入MP逆的四个方程,易证 \(\mathbf{ A^{+} = R^{+}L^{+}}\)

  • \((\mathbf{A}^{+})^{+} = \mathbf{A}^{+}\)

  • \(\mathbf{\left(A^{*}\right)^{+}=\left(A^{+}\right)^{*},\left(A^{\prime}\right)^{+}=\left(A^{+}\right)^{\prime}}\)

    只要对MP逆矩阵的四个条件的左右两边均进行转置即可得证。这条性质表明如果 \(\mathbf{A}\) 为 Hermite 矩阵,则 \(\mathbf{A}^{+}\) 也是 Hermite 矩阵。

\[ \lambda^{+}=\left\{\begin{array}{cc} \lambda^{-1}, & \text { 若 } \lambda \neq 0, \\ 0, & \text { 若 } \lambda=0, \end{array}\right. \]

​ 则 \[ (\lambda \mathbf{A})^{+}=\lambda^{+} \mathbf{A}^{+} \]

  • \(\mathbf{D}=\operatorname{diag}\left(d_{1}, \cdots, d_{n}\right)\), 则 \(\mathbf{D}^{+}=\operatorname{diag}\left(d_{1}^{+}, \cdots, d_{n}^{+}\right)\)

  • \(r\left( \mathbf{A}^{+}\right) = r\left( \mathbf{A}\right)\)

  • \(R(\mathbf{A}^{+}) = R(\mathbf{A}^{*})\)

    证明:由 {1}-逆的性质 \(R(\mathbf{A}^{*}) = R\left(\mathbf{(A^{-}A)}^{*}\right)\) ,有 $$

    \[\begin{aligned} R(\mathbf{A}^{*}) &= R\left(\mathbf{(A^{-}A)}^{*}\right) \\ &= R\left(\mathbf{(A^{+}A)}^{*}\right) \\ &= R\left(\mathbf{A^{+}A}\right) \\ &\subset R\left(\mathbf{A^{+}A}\right) \\ \end{aligned}\]

    $$ 又由于 \(r\left( \mathbf{A}^{+}\right) = r\left( \mathbf{A}\right) = r\left( \mathbf{A}^{*}\right)\) ,因而得证 \(R(\mathbf{A}^{+}) = R(\mathbf{A}^{*})\)

  • \(N(\mathbf{A}^{+}) = N(\mathbf{A}^{*})\)

同上。

性质2

对于任意的矩阵 \(\mathbf{A}\) ,均有以下等式成立

  • \(\mathbf{A=A A^{*}\left(A^{+}\right)^{*}=\left(A^{+}\right)^{*} A^{*} A}\).
  • \(\mathbf{A}^{+}=\mathbf{A}^{+}\left(\mathbf{A}^{+}\right)^{*} \mathbf{~A}^{*}=\mathbf{A}^{*}\left(\mathbf{~A}^{+}\right)^{*} \mathbf{~A}^{+}\).
  • \(\mathbf{\left(A^{*} A\right)^{+}=A^{+}\left(A^{+}\right)^{*}}\).
  • \(\mathbf{A^{+}=\left(A^{*} A\right)^{+} A^{*}=A^{*}\left(A A^{*}\right)^{+}}\).
这里第一条和第二条是等价的,通过第三条可以轻松得到第四条,因此只需要证明第一条和第三条即可。我们先看第一条,代入奇异值分解形式,我们有 $$ \[\begin{aligned} \mathbf{A A^{*}\left(A^{+}\right)^{*}} &= \mathbf{U \Sigma V^{*} V \Sigma^{*} U^{*} U \Sigma^{+ *} V^{*} } \\ &= \mathbf{U \Sigma \Sigma^{*} \Sigma^{+ *} V^{*} } \\ &= \mathbf{U \Sigma (\Sigma^{+} \Sigma)^{*} V^{*} } \\ &= \mathbf{U \Sigma V^{*} } \\ &= \mathbf{A} \\ \mathbf{\left(A^{+}\right)^{*} A^{*} A} &= \mathbf{U \Sigma^{+ *} V^{*} V \Sigma^{*} U^{*} U \Sigma V^{*} } \\ &= \mathbf{U \Sigma^{+ *} \Sigma^{*} \Sigma V^{*} } \\ &= \mathbf{U \Sigma V^{*} } \\ &= \mathbf{A} \\ \end{aligned}\]

$$ 得证第一条。

我们再看第三条,我们易得 \(\mathbf{A^{*} A} = \mathbf{V \Sigma^{\mathrm{T}} U^{\mathrm{T}} U \Sigma V^{\mathrm{T}} } = \mathbf{V \Sigma^{\mathrm{T}} \Sigma V^{\mathrm{T}} }\) ,易知该式就是 \(\mathbf{A^{*} A}\) 的对角化/奇异值分解的形式,因此 \(\mathbf{A^{+}\left(A^{+}\right)^{*}} = \mathbf{V (\Sigma^{\mathrm{T}} \Sigma)^{+} V^{\mathrm{T}} }\) ,其中 \(\mathbf{\Sigma^{T}} \mathbf{\Sigma}\) 格式为下式 \[ \left[\begin{array}{l|l} \mathbf{\Sigma_{1}^{2}} & \mathbf{O} \\ \hline \mathbf{O} & \mathbf{O} \end{array}\right] \] 易得 \((\mathbf{\Sigma^{T}} \mathbf{\Sigma})^{+} = \mathbf{\Sigma^{+}} \mathbf{(\Sigma^{T})^{+}} = \mathbf{\Sigma^{+}} \mathbf{(\Sigma^{+})^{T}}\) ,因此我们得证 \[ \mathbf{(A^{*}A)^{+}} = \mathbf{V (\Sigma^{T} \Sigma)^{+} V^{\prime}} = \mathbf{V \mathbf{\Sigma^{+}} \mathbf{(\Sigma^{+})^{T}} V^{T}} = \mathbf{V \Sigma^{+} U^{T} U (\Sigma^{+})^{T} V^{T}} =\mathbf{A^+}\left(\mathbf{A^+}\right)^{*} \] 同理可证,\(\mathbf{\left(A A^{*} \right)^{+}=\left(A^{+}\right)^{*} A^{+}}\)

推论,假设 \(\mathbf{A=\sum_{i=1}^{k} A_{i}}\) ,并且对一切 \(i \neq j\) ,均满足 \[ \mathbf{A_{i}^{*} A_{j}=0, \quad A_{i} A_{j}^{*}=0} \] 则有 \[ \mathbf{A^{+}=\sum_{i=1}^{k} A_{i}^{+}} \] 这个性质同样可以通过带入 MP 逆的四个方程得证。

性质3

\(\mathbf{A \in C^{m \times n}}\) ,则

  • \(\boldsymbol{A}^{+} \boldsymbol{A}, \boldsymbol{A A ^ { + }}, \boldsymbol{I}_{n}-\boldsymbol{A}^{+} \boldsymbol{A}\)\(\boldsymbol{I}_{m}-\boldsymbol{A A ^ { + }}\) 都是 Hermite 幂等矩阵

  • \[ \begin{aligned} r(\boldsymbol{A})=& r\left(\boldsymbol{A}^{+}\right)=r\left(\boldsymbol{A}^{+} \boldsymbol{A}\right)=r\left(\boldsymbol{A} \boldsymbol{A}^{+}\right) \\ & r\left(\boldsymbol{I}_{n}-\boldsymbol{A}^{+} \boldsymbol{A}\right)=n-r(\boldsymbol{A}) \\ & r\left(\boldsymbol{I}_{m}-\boldsymbol{A A}^{+}\right)=m-r(\boldsymbol{A}) \end{aligned} \]

  • \(I_{n} \geqslant A^{+} A, I_{m} \geqslant A A^{+}\), 这里 \(A \geqslant B\) 表示 \(A-B \geqslant 0\).

我们先看第一条,根据MP逆的性质,易得上面四个矩阵为 Hermite 矩阵,我们只需要证明其幂等,如下 $$ \[\begin{aligned} \mathbf{(A^{+}A)^2} &= \mathbf{A^{+}AA^{+}A} \\ &= \mathbf{A^{+}A} \\ \mathbf{(AA^{+})^2} &= \mathbf{AA^{+}AA^{+}} \\ &= \mathbf{AA^{+}} \\ \mathbf{(I_{n} - A^{+}A)^2} &= \mathbf{(I_{n} - A^{+}A)(I_{n} - A^{+}A)} \\ &= \mathbf{I_{n} - 2 A^{+}A + (A^{+}A)^2} \\ &= \mathbf{I_{n} - A^{+}A} \\ \mathbf{(I_{m} - AA^{+})^2} &= \mathbf{(I_{m} - AA^{+})(I_{m} - AA^{+})} \\ &= \mathbf{I_{m} - 2 AA^{+} + (AA^{+})^2} \\ &= \mathbf{I_{m} - AA^{+}} \\ \end{aligned}\] \[ 我们再看第二条性质,根据奇异值分解形式,易得 $r(\boldsymbol{A})= r\left(\boldsymbol{A}^{+}\right) =r\left(\boldsymbol{A}^{+} \boldsymbol{A}\right)=r\left(\boldsymbol{A} \boldsymbol{A}^{+}\right) $ 。后面两条可以根据对称幂等矩阵的秩等于秩的性质证明,如下 \] \[\begin{aligned} r\left(\mathbf{I_{n} - A^{+}A}\right) &= tr\left(\mathbf{I_{n} - A^{+}A}\right) \\ &= n - tr\left(\mathbf{ A^{+}A}\right) \\ &= n - r\left(\mathbf{ A^{+}A}\right) \\ \end{aligned}\] \[ 第三条,根据对称幂等矩阵的性质,如果 $A$ 奇异,对称,并且幂等,那么 $A$ 半正定,证明如下 \] \[\begin{aligned} x^{T}Ax & = x^{T}A^{2}x \\ &= x^{T}A^{T}Ax \\ &= (Ax)^{T}(Ax) \\ & \geq 0 \end{aligned}\]

$$ 因此 \(\boldsymbol{I}_{n}-\boldsymbol{A}^{+} \boldsymbol{A}\)\(\boldsymbol{I}_{m}-\boldsymbol{A A ^ { + }}\) 均为半正定矩阵。

性质4

我们知道向矩阵 \(\mathbf{A}\)列空间投影的投影矩阵为 (最小二乘的几何含义) \[ \mathbf{P_{A}=A\left(A^{*} A\right)^{-} A^{*}} \] 这个式子与所含的广义逆的选择无关,因此我们带入 MP 逆得到 \[ \mathbf{P_{A}=A\left(A^{*} A\right)^{+} A^{*} = AA^{+}} \] 因此矩阵 \(\mathbf{AA^{+}}\) 为向 \(C(\mathbf{A})\) 的正交投影矩阵。

同理可得,向矩阵 \(\mathbf{A}\)行空间投影的投影矩阵为 \[ \mathbf{P_{A^{*}}=A^{*}\left(A A^{*}\right)^{-} A=A^{*}\left(A A^{*}\right)^{+} A=A^{+} A} \]

性质5

对于一般的广义逆(只满足MP逆的第一个方程),假设 \(\mathbf{P,Q}\) 均为可逆矩阵时,存在 \[ \boldsymbol{Q}^{-1} \boldsymbol{A}^{-} \boldsymbol{P}^{-1} \in(\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q})\{1\} \] 证明很简单,如下 \[ \mathbf{(PAQ)(Q^{-1}A^{-}P^{-1})((PAQ))} = \mathbf{PAA^{-}AQ} = \mathbf{PAQ} \] 但是一般来说,对于 MP 逆,\((\boldsymbol{P} \boldsymbol{A} \boldsymbol{Q})^{+}=\boldsymbol{Q}^{-1} \boldsymbol{A}^{+} \boldsymbol{P}^{-1}\) 并不成立,然而我们有以下结论

  • \(\boldsymbol{P}\)\(\boldsymbol{Q}\) 分别为 \(m \times m\)\(n \times n\) 酉阵, 则

\[ (\boldsymbol{P A} \boldsymbol{Q})^{+}=\boldsymbol{Q}^{-1} \boldsymbol{A}^{+} \boldsymbol{P}^{-1}=\boldsymbol{Q}^{*} \boldsymbol{A}^{+} \boldsymbol{P}^{*} \text {. } \] * 若 \(\boldsymbol{P}\)\(\boldsymbol{Q}\) 分别为 \(k \times m\)\(l \times n\) 阵, 且满足 \(\boldsymbol{P}^{*} \boldsymbol{P}=\boldsymbol{I}_{m}\), \(\boldsymbol{Q^{*} Q=I_{n}}\). 则

\[ \left(\boldsymbol{P A} \boldsymbol{Q}^{*}\right)^{+}=\boldsymbol{Q} \boldsymbol{A}^{+} \boldsymbol{P}^{*} \]

证明很简单,只要带入MP逆的四个方程即可得证。

性质6

  • 若矩阵 \(\mathbf{A}\) 为 Hermite 幂等矩阵,则 \(\mathbf{A^{+} = A}\)
  • 若矩阵 \(\mathbf{A}\) 为正规矩阵,则 \(\mathbf{AA^{+} = A^{+}A}\)
  • 若矩阵 \(\mathbf{A}\) 为正规矩阵,对任意一个自然数 \(k\) , 满足 \(\mathbf{(A^{k})^{+} = (A^{+})^{k}}\)

第一条证明如下:设 \(n \times n\) 的正规矩阵 \(\mathbf{A}\) ( \(\mathbf{A^{*}A = AA^{*}}\) ) ,则其对角化分解为 \[ \boldsymbol{A}=\boldsymbol{U}\left(\begin{array}{llll} \lambda_{1} & & & \\ & \lambda_{2} & & \mathbf{0} \\ & & \ddots & \\ \mathbf{0} & & & \lambda_{n} \end{array}\right) \boldsymbol{U}^{*} \] 其中 \(\mathbf{U}\)\(n \times n\) 的酉矩阵,则 \[ \boldsymbol{A}^{+}=\boldsymbol{U}\left(\begin{array}{ccc} \lambda_{1}^{+} & & \mathbf{0} \\ & \ddots & \\ \mathbf{0} & & \lambda_{n}^{+} \end{array}\right) \boldsymbol{U}^{*} \] 由于 Hermite 幂等矩阵的特征值只能是 0 和 1 ,因此立即得到 \(\mathbf{A^{+} = A}\)

第二条证明如下 $$ \[\begin{aligned} \mathbf{AA^{+}} &= \mathbf{U \Sigma U^{*} U \Sigma^{*} U^{*} } \\ &= \mathbf{U \Sigma \Sigma^{*} U^{*} } \\ &= \mathbf{U \Sigma^{2} U^{*} } \\ \mathbf{A^{+} A} &= \mathbf{U \Sigma^{*} U^{*} U \Sigma U^{*} } \\ &= \mathbf{U \Sigma^{*} \Sigma U^{*} } \\ &= \mathbf{U \Sigma^{2} U^{*} } \\ \end{aligned}\]

$$ 得证 \(\mathbf{AA^{+} = A^{+}A}\)

第三条证明如下 $$ \[\begin{aligned} \mathbf{(A^{k})^{+}} &= \mathbf{(U \Sigma^{k} U^{T})^{+}} \\ &= \mathbf{U (\Sigma^{k})^{+} U^{T}} \\ \mathbf{(A^{+})^{k}} &= \mathbf{(U \Sigma^{+} U^{T})^{k}} \\ &= \mathbf{U (\Sigma^{+})^{k} U^{T}} \\ \end{aligned}\]

$$

性质7

  • \(\mathbf{B^{+} A^{+}=0 \Longleftrightarrow A B=0}\)
  • \(\mathbf{A B^{+}=0 \Longleftrightarrow A B^{*}=0}\)
  • \(\mathbf{B^{+} A=0 \Longleftrightarrow A^{*} B=0}\)

首先证明第一条,首先证明若 \(\mathbf{AB=0}\)\(\mathbf{B^{+} A^{+}=0}\) 。此时我们有 \(\mathbf{B^{*}A^{*}=0}\) ,左乘 \(\mathbf{(B^{*}B)^{+}}\) ,再右乘 \(\mathbf{(AA^{*})^{+}}\) 得到 \[ \mathbf{\left(B^{*} B\right)^{+} B^{*} A^{*}\left(A A^{*}\right)^{+}=0} \] 根据 \(\mathbf{A^{+}=\left(A^{*} A\right)^{+} A^{*}=A^{*}\left(A A^{*}\right)^{+}}\) ,可得 \[ \mathbf{ B^{+} A^{+} = \left(B^{*} B\right)^{+} B^{*} A^{*}\left(A A^{*}\right)^{+}=0 } \] 反过来,证明如果 \(\mathbf{B^{+} A^{+}=0}\)\(\mathbf{AB=0}\) 。左乘 \(\mathbf{B^{*}B}\) ,再右乘 \(\mathbf{AA^{*}}\) ,我们有 \[ \begin{aligned} \mathbf{0} &= \mathbf{B^{*} B B^{+} A^{+} A A^{*}=B^{*}\left(B B^{+}\right)^{*}\left(A^{+} A\right)^{*} A^{*}} \\ &=\mathbf{B^{*}\left(B^{+}\right)^{*} B^{*} A^{*}\left(A^{+}\right)^{*} A^{*}} \\ &=\mathbf{B^{*} A^{*}=(A B)^{*}} \end{aligned} \] 再证明第二条,若 \(\mathbf{AB^{*}=0}\) ,右乘 \(\mathbf{(B^{+})^{*}B^{+}}\) 得到 \(\mathbf{AB^{*}(B^{+})^{*}B^{+}= AB^{+} =0}\) ;反过来,如果 \(\mathbf{AB^{+}=0}\) ,右乘 \(\mathbf{BB^{*}}\) ,我们得到 \(\mathbf{ AB^{+}BB^{*} = A(B^{+}B)^{*}B^{*} = AB^{*}(B^{+})^{*}B^{*} = AB^{*} = 0}\)

第三条根据第二条同理可证。

乘法公式

对于 MP 逆矩阵,乘法公式一般不成立,即 \(\mathbf{(AB)^{+} \neq B^{+}A^{+} }\) ,但是在某些条件下这个等式成立。

我们先看一个引理,设 \(\mathbf{A} \in C^{m \times n}, \mathbf{X} \in C^{n \times m}, r(\mathbf{X}) \leqslant r(\mathbf{A})\), \[ \boldsymbol{X} \boldsymbol{A}=\boldsymbol{A}^{+} \boldsymbol{A}, \quad \boldsymbol{A X}=\boldsymbol{A} \boldsymbol{A}^{+}, \] 则必有 \(\mathbf{X=A^{+}}\)

证明:容易看出MP逆的后两个方程成立,因此只需要看前两个方程,我们有 \(\mathbf{AXA = A(A^{+}A) = A}\) ,因此第一个方程成立,再证明第二个方程,我们有 \[ r(X) \leqslant r(\boldsymbol{A})=r(\boldsymbol{A X A}) \leqslant r( \boldsymbol{X A}) \leqslant r(X) \] 因此得到 \[ r(\mathbf{X}) = r(\mathbf{XA}) \]

由于 \(\mathbf{XA}\) 的列均是 \(\mathbf{X}\) 的列的线性组合,因此

\[ C(\mathbf{X}) = C(\mathbf{XA}) \]

因此存在矩阵 \(\mathbf{Y}\) ,使得 \(\mathbf{X = XAY}\) ,对这个式子左乘 \(\mathbf{XA}\) 得到 \[ \mathbf{X A X=X (A X A) Y=X A Y=X} \] 得证。

充分必要条件

当且仅当下列两个条件同时成立时,乘法公式 \(\mathbf{(AB)^{+} = B^{+}A^{+} }\) 成立。 \[ \begin{aligned} \boldsymbol{A^{+} A B B^{*} A^{*}} &=\boldsymbol{B} \boldsymbol{B}^{*} \boldsymbol{A}^{*}, \\ \boldsymbol{B B^{+} A^{*} A B} &=\boldsymbol{A}^{*} \boldsymbol{A B} . \end{aligned} \] 证明:

首先证明充分性,假设这两个条件成立,用 \(\mathbf{B}^{+}\)\(\mathbf{(AB)}^{* +}\) 分别左乘、右乘 \(\boldsymbol{A^{+} A B B^{*} A^{*}} =\boldsymbol{B} \boldsymbol{B}^{*} \boldsymbol{A}^{*}\) 的两边,其左侧变为 \[ \begin{aligned} \mathbf{B^{+} A^{+} A B B^{*} A^{*}(A B)^{* +}} &= \mathbf{B^{+} A^{+}(A B)(A B)^{*}(A B)^{*+}} \\ \end{aligned} \] 根据 \(\mathbf{A=A A^{*}\left(A\right)^{+*}}\) ,得到 \(\boldsymbol{A B}(\boldsymbol{A B})^{*}(\boldsymbol{A B})^{*+}=\boldsymbol{A B}\) ,得到左侧为 \(\mathbf{B^{+} A^{+} A B}\) 。我们看右侧为 $$ \[\begin{aligned} \mathbf{B^{+} B B^{*} A^{*}(A B)^{*+}} &= \mathbf{\left(B^{+} B B^{*}\right) A^{*}(A B)^{*+}} \\ &= \mathbf{B^{*} A^{*}(A B)^{*+}} \quad \because \mathbf{A = A^{+*} A^{*} A}\\ &= \mathbf{(A B)^{*}\left(A B\right)^{*+}} \\ &= \mathbf{\left((A B)^{+}AB\right)^{*}} \\ &= \mathbf{(A B)^{+}AB} \\ \end{aligned}\] \[ 左侧等于右侧得到 \] = \[ 我们再看第二个条件,将其两边做转置共轭运算,得到 \] \[ 用 $\mathbf{(AB)}^{*+}$ 和 $\mathbf{A}^{+}$ 分别左乘、右乘上式两边,左边变为 \] \[\begin{aligned} & \mathbf{(A B)^{*+} B^{*} A^{*} A B^{*+} B^{*} A^{+}} \\ =& \mathbf{(A B)^{*+}(A B)^{*} A B^{*+} B^{*} A^{+}} \\ =& \mathbf{(A B)^{*+}(A B)^{*} A\left(B B^{+}\right)^{*} A^{+}} \\ =& \mathbf{(A B)^{*+}(A B)^{*} A B B^{+} A^{+}} \\ =& \mathbf{A B B^{+} A^{+}} \quad \because \mathbf{A = A^{+*} A^{*} A} \end{aligned}\] \[ 右侧变为 \] \[\begin{aligned} \mathbf{(A B)^{*+} B^{*} A^{*} A A^{+}} =& \mathbf{(A B)^{*+} B^{*} A^{*}} \quad \because \mathbf{A = A A^{*} A^{* +}}\\ =& \mathbf{(A B)^{*+}(A B)^{*}} \\ =& \mathbf{\left(A B(A B)^{+}\right)^{*}} \\ =& \mathbf{A B(A B)^{+}} \end{aligned}\] \[ 左侧等于右侧,得到 \] = \[ 另外,我们有 \] \[\begin{aligned} \mathbf{ B^{+} A^{+} } &=\mathbf{B^{+} B B^{+} A^{+} A A^{ + }} \\ &=\mathbf{B^{+} (B B^{+})^{*} (A^{+} A)^{*} A^{ + }} \\ &=\mathbf{B^{+} B^{+ *} B^{*} A^{*} A^{+}{ }^{*} A^{*}} \\ &=\mathbf{B^{+} B^{+ *}(A B)^{*} A^{+}{ }^{*} A^{+}} \end{aligned}\]

\[ 因此 \] r(^{+} ^{+}) r() $$ 将这个式子,与两个条件的推导式子结合起来,再利用乘法公式一开始介绍的引理 (设 \(\mathbf{A} \in C^{m \times n}, \mathbf{X} \in C^{n \times m}, r(\mathbf{X}) \leqslant r(\mathbf{A})\), \(\boldsymbol{X} \boldsymbol{A}=\boldsymbol{A}^{+} \boldsymbol{A}, \quad \boldsymbol{A X}=\boldsymbol{A} \boldsymbol{A}^{+},\) 则必有 \(\mathbf{X=A^{+}}\)。) ,因此我们证明了乘法公式成立,即 \(\mathbf{(AB)^{+} = B^{+}A^{+} }\)

我们再看必要性,根据 \(\mathbf{A = A^{* +} A^{*} A}\) ,我们有 \((\boldsymbol{A B})^{*}=(\boldsymbol{A B})^{+}(\boldsymbol{A B})(\boldsymbol{A B})^{*}\) ,带入乘法公式,得到 \[ \boldsymbol{B}^{*} \boldsymbol{A}^{*}=\boldsymbol{B}^{+} \boldsymbol{A}^{+} \boldsymbol{A B} \boldsymbol{B}^{*} \boldsymbol{A}^{*} . \]\(\mathbf{ABB^{*}B}\) 左乘上式,并利用 \(\mathbf{B^{*}BB^{+} = B^{*}}\) ,得到 \[ \begin{aligned} \mathbf{A B B^{*} B B^{*} A^{*}} &= \mathbf{A B B^{*} B B^{+} A^{+} A B B^{*} A^{*}} \\ &= \mathbf{A B B^{*} A^{+} A B B^{*} A^{*}} \end{aligned} \]\[ \mathbf{A B B^{*}\left(I-A^{+} A\right) B B^{*} A^{*}=0} \] 因为 \(\mathbf{I-A^{+} A}\) 为半正定 Hermite 矩阵,因此可以分解为 \(\mathbf{I-A^{+} A = U \Sigma U^{*} = U \Sigma^{0.5} \Sigma^{0.5} U^{*} = C C^{*} }\) ,其中 \(\mathbf{C = U \Sigma^{0.5}}\) ,因此我们有 \[ \mathbf{A B B^{*}C C^{*} B B^{*} A^{*} = (A B B^{*}C)(A B B^{*}C)^{*} =0} \] 因此 \(r\left(\mathbf{A B B^{*}C}\right) = r\left(\mathbf{(A B B^{*}C)^{*}}\right) =r\left(\mathbf{(A B B^{*}C)(A B B^{*}C)^{*}}\right) =0\) ,由于只有 \(\mathbf{0}\) 矩阵的秩才为 0 ,因此 \(\mathbf{C^{*} B B^{*} A^{*} = 0}\) ,左乘 \(\mathbf{C}\) ,得到 \(\mathbf{\left(I-A^{+} A\right) B B^{*} A^{*}=0}\) ,因此证明了第一个条件。

第二个条件等价于证明 \(\mathbf{( I - B B^{+} ) A^{*} A B = 0}\) ,这和第一个条件是类似地,因此同理可得第二个条件成立。

推论1

推论:当且仅当下面两个条件成立时,乘法公式成立 \[ \begin{gathered} C\left(\boldsymbol{B} \boldsymbol{B}^{*} \boldsymbol{A}^{*}\right) \subset C\left(\boldsymbol{A}^{*}\right) \\ C\left(\boldsymbol{A}^{*} \boldsymbol{A B}\right) \subset C(\boldsymbol{B}) \end{gathered} \] 证明:我们只需要证明这里的两个条件和上面的两个条件等价即可。

因为 \(\mathbf{BB^{+}}\)\(\mathbf{B}\) 列空间的投影矩阵,我们有 \[ \mathbf{A^{+}A = P_{A^{*}}} \]

\[ \mathbf{BB^{+} = P_{B}} \]

于是我们有 $$ \[\begin{aligned} \mathbf{A^{+} A B B^{*} A^{*}} &= \mathbf{P_{A^{*}} B B^{*} A^{*} } \\ &= \mathbf{B B^{*} A^{*}} \Longleftrightarrow C\left(\boldsymbol{B} \boldsymbol{B}^{*} \boldsymbol{A}^{*}\right) \subset C\left(\boldsymbol{A}^{*}\right) \\ \\ \mathbf{B B^{+} A^{*} A B} &= \mathbf{P_{B} A^{*} A B} \\ &=\mathbf{A^{*} A B} \Longleftrightarrow C\left(\boldsymbol{A}^{*} \boldsymbol{A B}\right) \subset C(\boldsymbol{B}) \\ \end{aligned}\]

$$

推论2

推论:若 \(\mathbf{A^{+} A B B^{*}}\)\(\mathbf{A^{*} A B B^{+}}\)皆为 Hermite 阵, 则乘法公式成立.

证明:若 \(\mathbf{A^{+} A B B^{*}}\) 为 Hermite 矩阵,则 \[ \mathbf{A^{+} A B B^{*} = B B^{*} (A^{+} A)^{*} = B B^{*} A^{+} A } \]\(\mathbf{A}^{*}\) 右乘上式,得 \[ \mathbf{A^{+} A B B^{*} A^{*} = B B^{*} A^{+} A A^{*} = B B^{*} A^{*} } \] 因此充要条件的第一个条件成立。

\(\mathbf{A^{*} A B B^{+}}\) 为 Hermite 矩阵,则 \[ \mathbf{A^{*} A B B^{+} = (B B^{+})^{*}A^{*} A = B B^{+}A^{*} A } \]\(\mathbf{B}\) 右乘上式,得 \[ \mathbf{ B B^{+}A^{*} A B = A^{*} A B B^{+} B = A^{*} A B } \] 因此充要条件的第二个条件成立,于是乘法公式成立,得证。

参考文献

  1. Rencher A C, Schaalje G B. Linear models in statistics[M]. John Wiley & Sons, 2008.
  2. 王松桂, 杨振海. 广义逆矩阵及其应用[M]. 北京工业大学出版社, 1996.
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信