特征值的乘积与和

证明特征值的乘积为行列式,特征值的和为迹。

特征值和特征向量

这一小节的内容主要来自于吴恩达老师的讲义。

\(n \times n\) 矩阵 \(\mathbf{A}\) 的特征值和特征向量满足关系: \[ \mathbf{A} x=\lambda x, \quad x \neq 0 \] 我们注意到对于任何特征向量 \(x \in \mathbb{C}^{n}\) ,和特征值 \(t \in \mathbb{C}\)\(\mathbf{A}(c x)=c \mathbf{A} x=c \lambda x=\lambda(c x)\) ,因此 \(c x\) 一样是 \(\mathbf{A}\) 的特征向量。因此,当我们提到与特征值 \(\lambda\) 的特征向量 \(x\) 时,我们一般假定特征向量 \(x\) 是标准化的,即 \(\|x\| = 1\) 。但是,我们注意到,\(x\)\(-x\) 都是特征向量,因此我们无法保证特征向量的符号。

我们可以将上式改写为: \[ |(\mathbf{A}-\lambda I)|=0 \]

如果我们将上式中的行列式展开,我们得到一个变量为 \(\lambda\)\(n\) 次多项式。 \[ p(\lambda) = |(\mathbf{A}-\lambda I)| \] 这个多项式称为特征多项式 (characteristic polynomial) ,而 \(|(\mathbf{A}-\lambda I)|=0\) 这个方程称为矩阵 \(\mathbf{A}\)特征方程 (characteristic equation) 。特征多项式的根即为 \(\mathbf{A}\) 的特征值,如果对重根也计数,那么 \(\mathbf{A}\) 将有 \(n\) 个特征值,但是某些特征值可能会是复数,这一点可以通过代数基本定理证明。

举个例子,假设 \(\mathbf{A} = \left[\begin{array}{c} 3 & 2 \\ 3 & -2 \end{array} \right]\) ,那么其特征方程为 \[ \left|\begin{array}{c} 3-\lambda & 2 \\ 3 & -2-\lambda \end{array} \right| = 0 \quad \text{ 或 } \quad \lambda^{2}-\lambda+12=0 \] 那么\(\mathbf{A}\) 的特征值为 \(\lambda_{1} = 4\)\(\lambda_{2} = -3\)

代数基本定理

维基百科的说明如下

代数基本定理说明,任何一个一元复系数多项式方程都至少有一个复数。也就是说,复数代数封闭的。

有时这个定理表述为:任何一个非零的一元n次复系数多项式,都正好有n个复数根(重根视为多个根)。这似乎是一个更强的命题,但实际上是“至少有一个根”的直接结果,因为不断把多项式除以它的线性因子,即可从有一个根推出有n个根。也就是说,任何一个n次多项式,都可以因式分解为n个复系数一次多项式的乘积

代数基本定理是高斯发现的,高斯总共给出了四个证明,但是我看维基百科后面的证明过程都看不懂。

有一个数学乐的网址,更简单直观地解释了代数基本定理,感兴趣可以去看一下这里 代数基本定理

简单地说,就是任何一个一元 n 次多项式均有 n 个根(包括重根),但是可能是复数。任何一元 n 次多项式可以因式分解为下面地形式,其中 \(r_1,r_2,\cdots,r_n\)n 个根 ,并且易得 \(a\) 为多项式第一项 \(x^{n}\) 的系数。 \[ a(x-r_{1})(x-r_{2})\cdots(x-r_{n}) \] 如果多项式有复数根,它所有的复数根必然为共轭对 (\(a+b\mathbf{i}\)\(a-b\mathbf{i}\))。

特征值的乘积与和

这一节内容主要来自于《linear algebra with applications》 的第六章特征值。

\(p(\lambda)\) 为矩阵 \(\mathbf{A}\) 的特征多项式,则 \[ p(\lambda)=\operatorname{det}(\mathbf{A}-\lambda I)=\left|\begin{array}{cccc} a_{11}-\lambda & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22}-\lambda & \cdots & a_{2 n} \\ \vdots & & & \\ a_{n 1} & a_{n 2} & \cdots & a_{n n}-\lambda \end{array}\right| \] 按照第一列展开,我们得到 \[ \operatorname{det}(\mathbf{A}-\lambda I)=\left(a_{11}-\lambda\right) \operatorname{det}\left(\mathbf{M}_{11}\right)+\sum_{i=2}^{n} a_{i 1}(-1)^{i+1} \operatorname{det}\left(\mathbf{M}_{i 1}\right) \] 我们注意到,子式 \(\mathbf{M}_{11}\) 不包含一个对角线元素 (\(a_{11}-\lambda\)) ,而其他子式 \(\mathbf{M}_{i1}\) (\(i=2,\cdots,n\)) 不包含两个对角线元素 \(\left(a_{11}-\lambda\right)\)\(\left(a_{ii}-\lambda\right)\)

将子式 \(\mathbf{M}_{11}\) 采用相同的方法展开,我们得到下式是 \(\operatorname{det}(\mathbf{A}-\lambda I)\) 的展开式中唯一包含超过 \(n-2\) 个对角线元素的项(不好直接证明,在草稿上继续展开,就可以看出规律,其他项应该都是包括了\(n-2\) 个对角线元素 )。 \[ \left(a_{11}-\lambda\right)\left(a_{22}-\lambda\right) \cdots\left(a_{n n}-\lambda\right) \] 我们把这个式子展开后,易得 \(\lambda^{n}\) 的系数为 \((-1)^{n}\) ,因此 \(p(\lambda)\) 的首系数为 \((-1)^{n}\) 。根据代数基本定理,如果 \(\lambda_1,\lambda_2,\cdots,\lambda_n\) 为方阵 \(\mathbf{A}\) 的特征根,那么 \(p(\lambda)\) 可以因式分解为 \[ \begin{aligned} p(\lambda) &=(-1)^{n}\left(\lambda-\lambda_{1}\right)\left(\lambda-\lambda_{2}\right) \cdots\left(\lambda-\lambda_{n}\right) \\ &=\left(\lambda_{1}-\lambda\right)\left(\lambda_{2}-\lambda\right) \cdots\left(\lambda_{n}-\lambda\right) \end{aligned} \] 因此,我们得到下式,证明方阵的所有特征值之积为其行列式。 \[ p(0) = \lambda_{1} \lambda_{2}\cdots \lambda_{n} = \det(\mathbf{A}) \]\(\left(a_{11}-\lambda\right)\left(a_{22}-\lambda\right) \cdots\left(a_{n n}-\lambda\right)\) ,我们同样可以看出 \((-\lambda)^{n-1}\) 的系数为 \(\sum_{i=1}^{n} a_{ii}\) 。如果对 \(p(\lambda)=\left(\lambda_{1}-\lambda\right)\left(\lambda_{2}-\lambda\right) \cdots\left(\lambda_{n}-\lambda\right)\) 同样求 \((-\lambda)^{n-1}\) 的系数,可以得到其为 \(\sum_{i=1}^{n} \lambda_{i}\) ,因此我们得到 \[ \sum_{i=1}^{n} \lambda_{i} = \sum_{i=1}^{n} a_{ii} \] 因此我们证明所有特征值之和为矩阵的迹。

相似矩阵

这一节内容主要来自于《linear algebra with applications》 的第六章特征值。

对于矩阵 \(\mathbf{A}\) 和矩阵 \(\mathbf{B}\) ,若存在一个非奇异矩阵 \(\mathbf{S}\),使得 \(\mathbf{B} = \mathbf{S^{-1}AS}\) ,那么我们称矩阵 \(\mathbf{B}\) 相似于矩阵 \(\mathbf{A}\)

定理:令矩阵 \(\mathbf{A}\) 和矩阵 \(\mathbf{B}\)\(n \times n\) 矩阵,若 \(\mathbf{B}\) 相似于 \(\mathbf{A}\),则这两个矩阵有相同的特征多项式,且相应地有相同的特征值。

证明:令 \(p_{A}(\lambda)\)\(p_{B}(\lambda)\) 分别为 \(\mathbf{A}\)\(\mathbf{B}\) 的特征多项式。因为 \(\mathbf{B}\) 相似于 \(\mathbf{A}\),则存在一个非奇异矩阵 \(\mathbf{S}\),使得 \(\mathbf{B} = \mathbf{S^{-1}AS}\) 。因此 \[ \begin{aligned} p_{B}(\lambda) &=\operatorname{det}(\mathbf{B}-\lambda \mathbf{I}) \\ &=\operatorname{det}\left(\mathbf{S}^{-1} \mathbf{A} \mathbf{S}-\lambda \mathbf{I}\right) \\ &=\operatorname{det}\left(\mathbf{S}^{-1}(\mathbf{A}-\lambda \mathbf{I}) \mathbf{S}\right) \\ &=\operatorname{det}\left(\mathbf{S}^{-1}\right) \operatorname{det}(\mathbf{A}-\lambda \mathbf{I}) \operatorname{det}(\mathbf{S}) \\ &=p_{A}(\lambda) \end{aligned} \] 一个矩阵的特征值为特征多项式的根。因为两个矩阵有相同的特征多项式,所以它们必有相同的特征值。

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信