正定矩阵都是对称矩阵吗

正定矩阵的概念来自于二次型,在定义正定矩阵时,就已经明确了正定矩阵是 Hermitian 矩阵的一种 (对于实数矩阵,就是指对称矩阵)。

矩阵的二次型

下面的内容来自于张贤达老师的《矩阵分析与应用》书中。

任意一个方阵 \(\boldsymbol{A}\) 的二次型定义为 \(x^{\mathrm{H}} \boldsymbol{A} \boldsymbol{x}\), 其中 \(\boldsymbol{x}\) 可以是任意的非零复向量。 以实矩阵为例, 考查二次型 \[ \begin{aligned} \boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x} &=\left[x_{1}, x_{2}, x_{3}\right]\left[\begin{array}{ccc} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{array}\right]\left[\begin{array}{l} x_{1} \\ x_{2} \\ x_{3} \end{array}\right] \\ &=x_{1}^{2}+7 x_{2}^{2}+3 x_{3}^{2}+3 x_{1} x_{2}+x_{1} x_{3}+11 x_{2} x_{3} \end{aligned} \] 这是变元 \(x\) 的二次型函数, 故称 \(\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}\) 为矩阵 \(\boldsymbol{A}\) 的二次型。

推而广之, 若 \(\boldsymbol{x}=\left[x_{1}, \cdots, x_{n}\right]^{\mathrm{T}}\), 且 \(n \times n\) 矩阵 \(\boldsymbol{A}\) 的元素为 \(a_{i j}\), 则二次型 \[ \begin{aligned} \boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x} &=\sum_{i=1}^{n} \sum_{j=1}^{n} x_{i} x_{j} a_{i j}=\sum_{i=1}^{n} a_{i i} x_{i}^{2}+\sum_{i=1, i \neq j}^{n} \sum_{j=1}^{n} a_{i j} x_{i} x_{j} \\ &=\sum_{i=1}^{n} a_{i i} x_{i}^{2}+\sum_{i=1}^{n-1} \sum_{j=i+1}^{n}\left(a_{i j}+a_{j i}\right) x_{i} x_{j} \end{aligned} \] 根据这一公式, 显然 \[ \begin{aligned} &\boldsymbol{A}=\left[\begin{array}{rrr} 1 & 4 & 2 \\ -1 & 7 & 5 \\ -1 & 6 & 3 \end{array}\right], \quad \boldsymbol{B}=\boldsymbol{A}^{\mathrm{T}}=\left[\begin{array}{rrr} 1 & -1 & -1 \\ 4 & 7 & 6 \\ 2 & 5 & 3 \end{array}\right], \quad \boldsymbol{C}=\left[\begin{array}{lll} 1.0 & 1.5 & 0.5 \\ 1.5 & 7.0 & 5.5 \\ 0.5 & 5.5 & 3.0 \end{array}\right] \\ &\boldsymbol{D}=\left[\begin{array}{rrr} 1 & 114 & 52 \\ -111 & 7 & 2 \\ -51 & 9 & 3 \end{array}\right], \quad \boldsymbol{F}=\left[\begin{array}{rrr} 1 & 114 & 52 \\ -111 & 7 & 4 \\ -51 & 7 & 3 \end{array}\right], \quad \cdots \end{aligned} \] 具有相同的二次型, 即 \[ \begin{aligned} \boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x} &=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{B} \boldsymbol{x}=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{C} \boldsymbol{x}=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{D} \boldsymbol{x}=\boldsymbol{x}^{\mathrm{T}} \boldsymbol{F} \boldsymbol{x} \\ &=x_{1}^{2}+7 x_{2}^{2}+3 x_{3}^{2}+3 x_{1} x_{2}+x_{1} x_{3}+11 x_{2} x_{3} \end{aligned} \] 这就是说, 对于任何一个二次型函数 \[ f\left(x_{1}, \cdots, x_{n}\right)=\sum_{i=1}^{n} \alpha_{i i} x_{i}^{2}+\sum_{i=1, i \neq j}^{n} \sum_{j=1}^{n} \alpha_{i j} x_{i} x_{j} \] 而言, 存在许多矩阵 \(\boldsymbol{A}\), 它们的二次型 \(\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=f\left(x_{1}, \cdots, x_{n}\right)\) 相同。但是, 只有一个唯一的对称矩阵 \(\boldsymbol{A}\) 满足 \(\boldsymbol{x}^{\mathrm{T}} \boldsymbol{A} \boldsymbol{x}=f\left(x_{1}, \cdots, x_{n}\right)\), 其元素为 \(a_{i j}=a_{j i}=\frac{1}{2}\left(\alpha_{i j}+\alpha_{j i}\right)\), 其 中, \(i=1, \cdots, n, j=1, \cdots, n\) 。因此, 为了保证定义的唯一性, 在讨论矩阵 \(\boldsymbol{A}\) 的二次型 时, 有必要假定 \(\boldsymbol{A}\) 为实对称矩阵或复共轭对称 (即 Hermitian) 矩阵

因此,在二次型的概念中,我们不严格要求矩阵 \(\boldsymbol{A}\) 为实对称矩阵或复共轭对称 (即 Hermitian) 矩阵,仅仅要求 其为方阵,但是通常我们还是假定其为实对称矩阵或复共轭对称 (即 Hermitian) 矩阵。

正定矩阵定义

下面这几段话来自于维基百科1

在线性代数裡,正定矩阵 (英語: positive-definite matrix) 是埃尔米特矩阵的一种,有时会简称为正定阵。在线性代数中,正定矩阵的性质類似复数中的正实数。

一个 \(n \times n\)实对称矩阵 \(M\) 是正定的,当且仅当对于所有的非零实系数向量 \(z\) ,都有 \(z^{\mathrm{T}} M z>0\) 。其 中 \(z^{\top}\) 表示 \(z\) 的转置。 对于复数的情况,定义则为: 一个 \(n \times n\) 的埃尔米特矩阵(或厄米矩阵) \(M\) 是正定的当且仅当对于每个非零的禎向量 \(Z\) ,都有 \(z^{*} M z>0\) 。其中 \(z^{*}\) 表示 \(Z\) 的共轭转置。由于 \(M\) 是埃尔米特矩阵,经计算可知,对于任意的複向量 \(z , z^{*} M z\) 必然是实数,从而可以与比较大小。因此这个定义是自洽的。

我们可以看到,对于实数矩阵而言,正定矩阵定义时就要求其为对称矩阵

非埃尔米特矩阵的情况

下面这段话主要来自于维基百科2

如果一个非对称的实数矩阵M满足对所有非零实向量 x,有 \(x^{T}Mx > 0\) ,当且仅当对称矩阵 \(\frac{1}{2} (M + M^{T})\) 是正定矩阵。

对于复系数矩阵,情况可能不太一样。主要看的是怎样扩展 \(z^{*} \mathbf{M} z>0\) 这一性质。要使 \(z^{*} \mathbf{M} z\) 总为实数,矩阵 \(M\) 必须是埃尔米特矩阵。因此,若 \(Z^{*} M Z\) 总是正实数, \(M\) 必然是正定的埃尔米特矩 阵。如果将 \(z^{*} \mathbf{M} z>0\) 扩展为 \(\operatorname{Re}\left(z^{*} \mathbf{M} z\right)>0\) ,则等价于 \(\left(\mathbf{M}+\mathbf{M}^{*}\right) / 2\) 为正定阵。

然后从知乎找到了一个回答3。其证明了一个非对称的实数矩阵\(A\) 的二次型等于对称矩阵 \(\frac{1}{2}(A + A^{T})\) 的二次型。

对于任何一个方阵 \(A\) ,我们都可以将其分解为: \[ A = \frac{1}{2}(A + A^{T}) + \frac{1}{2}(A - A^{T}) \] 这里 \(\frac{1}{2}(A + A^{T})\) 是对称矩阵,前面已经提到了。后面 \(\frac{1}{2}(A - A^{T})\) 为反对称矩阵,下面来证明 \[ \begin{aligned} (A-A^{T})_{ij} &= A_{ij}-A{ji}\\ (A-A^{T})_{ji} &= A_{ji}-A{ij}\\ \therefore (A-A^{T})_{ij} &= - (A-A^{T})_{ji}\\ \end{aligned} \] 因此,易得 \(\frac{1}{2}(A - A^{T})\) 的二次型为 0 。方阵 \(A\) 的二次型为: \[ \begin{aligned} x^{T}Ax &= x^{T}(\frac{1}{2}(A + A^{T}) + \frac{1}{2}(A - A^{T}))x \\ & = x^{T}(\frac{1}{2}(A + A^{T}) )x \\ \end{aligned} \] 因此,从个人理解来说,由于所有非对称方阵的二次型均可以转化为对称方阵,再加上对称矩阵的诸多优良性质,那就不如直接将正定矩阵定义在对称矩阵的基础上。


  1. https://www.wikiwand.com/zh/%E6%AD%A3%E5%AE%9A%E7%9F%A9%E9%98%B5↩︎

  2. https://www.wikiwand.com/zh/%E6%AD%A3%E5%AE%9A%E7%9F%A9%E9%98%B5↩︎

  3. 正定矩阵一定是对称阵吗? - 益者三友的回答 - 知乎 https://www.zhihu.com/question/66922790/answer/1463342936↩︎

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信