方差组分估计方法三之DF-REML

这是方差组分估计方法的第三篇博客,介绍非求导算法 (deritative free REML, DF-REML) 算法。非求导算法顾名思义即不计算导数,对于不同的参数直接计算似然函数值,从中找到使得似然函数最大的一组参数。不过我这里主要是介绍如何进一步推导似然函数。

推导 REML 似然函数

这里只是进一步推导REML的似然函数。

对于表型 \(\mathbf{y}\) ,其对数似然函数如下(\(n\) 为表型数目) \[ l=-\frac{1}{2}\left( n \times \ln (2 \pi) +\ln |\mathbf{V}|+(\mathbf{y}-\mathbf{X} \beta)^{\prime} \mathbf{V}^{-1}(\mathbf{y}-\mathbf{X} \beta)\right) \] Verbyla (1990) 提出一个非奇异矩阵 \(\mathbf{L} = [\mathbf{L}_{1} \ \mathbf{L}_{2} ]\) , 其中 \(\mathbf{L}_{1}\)\(\mathbf{L}_{2}\) 分别为 \(n \times p\)\(n \times (n-p)\) 的矩阵(\(n\) 为表型数目,\(p\)\(\mathbf{X}\) 的列数,假设 \(\mathbf{X}\) 满秩,如果不满秩可以提取其中一个满秩的子矩阵 ),并且满足 \[ \begin{aligned} \mathbf{L}_{1}^{\prime}\mathbf{X} &= \mathbf{I}_{p} \\ \mathbf{L}_{2}^{\prime}\mathbf{X} &= \mathbf{0} \end{aligned} \] 我们对表型 \(\mathbf{y}\) 进行线性转换得到: \[ \mathbf{L}^{\prime} \mathbf{y}=\left[\begin{array}{l} \mathbf{L}_1^{\prime} \mathbf{y} \\ \mathbf{L}_2^{\prime} \mathbf{y} \end{array}\right]=\left[\begin{array}{l} \mathbf{y}_1 \\ \mathbf{y}_2 \end{array}\right] \] 转换后的数据服从分布: \[ \left[\begin{array}{l} \mathbf{y}_1 \\ \mathbf{y}_2 \end{array}\right] \sim \mathrm{N}\left(\left[\begin{array}{l} \boldsymbol{\beta} \\ \mathbf{0} \end{array}\right], \left[\begin{array}{ll} \mathbf{L}_1^{\prime} \mathbf{V} \mathbf{L}_1 & \mathbf{L}_1^{\prime} \mathbf{V} \mathbf{L}_2 \\ \mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_1 & \mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_2 \end{array}\right]\right) \] 根据概率统计公式,我们有 \(f(\mathbf{L}^{\prime} \mathbf{y}) = f(\mathbf{y}_{1},\mathbf{y}_{2}) = f(\mathbf{y}_{1}|\mathbf{y}_{2})f(\mathbf{y}_{2})\) ,因此其对数似然函数满足 \[ l(\mathbf{L}^{\prime} \mathbf{y}) = l(\mathbf{y}_{1}|\mathbf{y}_{2}) + l(\mathbf{y}_{2}) \] 首先对于 \(\mathbf{L}^{\prime} \mathbf{y}\) ,我们有 \[ l(\mathbf{L}^{\prime} \mathbf{y})=-\frac{1}{2}\left( n \times \ln (2 \pi) +\ln |\mathbf{\mathbf{L}^{\prime}V\mathbf{L}}|+\left[\begin{array}{c} \left(\mathbf{y}_1-\boldsymbol{\beta}\right)^{\prime} & \mathbf{y}_2^{\prime} \end{array}\right]\left[\mathbf{L}^{\prime}\mathbf{V}\mathbf{L}\right]^{-1}\left[\begin{array}{c} \mathbf{y}_1-\boldsymbol{\beta} \\ \mathbf{y}_2 \end{array}\right]\right) \] 对于 \(\mathbf{y}_{2}\) ,我们有 $$ \[\begin{aligned} l(\mathbf{y}_{2}) &= -\frac{1}{2}\left( (n-p) \times \ln (2 \pi) + \ln |\mathbf{L_{2}^{\prime}VL_{2}}|+\mathbf{y}^{\prime} \mathbf{L}_{2} \left(\mathbf{L_{2}^{\prime}VL_{2}}\right)^{-1}\mathbf{L}_{2}^{\prime}\mathbf{y} \right) \\ &= -\frac{1}{2}\left( (n-p) \times \ln (2 \pi) + \ln |\mathbf{L_{2}^{\prime}VL_{2}}|+\mathbf{y}^{\prime} \mathbf{P} \mathbf{y} \right) \quad \because \mathbf{P} = \mathbf{L}_{2} \left(\mathbf{L_{2}^{\prime}VL_{2}}\right)^{-1}\mathbf{L}_{2}^{\prime} \\ \end{aligned}\] \[ 根据正态分布的条件分布公式 \] \[\begin{aligned} E(\mathbf{y} \mid \mathbf{x}) & =\boldsymbol{\mu}_y+\boldsymbol{\Sigma}_{y x} \boldsymbol{\Sigma}_{x x}^{-1}\left(\mathbf{x}-\boldsymbol{\mu}_x\right) \\ \operatorname{cov}(\mathbf{y} \mid \mathbf{x}) & =\boldsymbol{\Sigma}_{y y}-\boldsymbol{\Sigma}_{y x} \boldsymbol{\Sigma}_{x x}^{-1} \boldsymbol{\Sigma}_{x y} \end{aligned}\] \[ 我们得到 \] _1 _2 (+_1^{} _2(_2^{} _2)^{-1} _2, _1^{} _1-_1^{} _2(_2^{} _2)^{-1} _2^{} _1) \[ 其协方差部分可以进一步推导: \] \[\begin{aligned} & \quad \mathbf{L}_1^{\prime} \mathbf{V} \mathbf{L}_1-\mathbf{L}_1^{\prime} \mathbf{V} \mathbf{L}_2\left(\mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_2\right)^{-1} \mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_1 \\ &= \mathbf{L}_1^{\prime} \left(\mathbf{V} - \mathbf{V} \mathbf{L}_2\left(\mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_2\right)^{-1} \mathbf{L}_2^{\prime} \mathbf{V} \right)\mathbf{L}_1 \\ &= \mathbf{L}_1^{\prime} \left(\mathbf{V} - \mathbf{V} \mathbf{P} \mathbf{V} \right)\mathbf{L}_1 \\ &= \mathbf{L}_1^{\prime} \left(\mathbf{V} - \mathbf{V} \left(\mathbf{V}^{-1}-\mathbf{V}^{-1} \mathbf{X}\left(\mathbf{X}^{\prime} \mathbf{V}^{-1} \mathbf{X}\right)^{-1} \mathbf{X}^{\prime} \mathbf{V}^{-1} \right) \mathbf{V} \right)\mathbf{L}_1 \\ &= \mathbf{L}_1^{\prime} \mathbf{X}\left(\mathbf{X}^{\prime} \mathbf{V}^{-1} \mathbf{X}\right)^{-1} \mathbf{X}^{\prime} \mathbf{L}_1 \\ &=\left(\mathbf{X}^{\prime} \mathbf{V}^{-1} \mathbf{X}\right)^{-1} \quad \because \mathbf{L}_{1}^{\prime}\mathbf{X} = \mathbf{I}_{p} \\ \end{aligned}\]

\[ 因此,我们得到 \] _1 _2 (+_2^{*}, (^{} ^{-1} )^{-1}) $$ 其中 \(\mathbf{y}_2^{*} = \mathbf{L}_1^{\prime} \mathbf{V} \mathbf{L}_2\left(\mathbf{L}_2^{\prime} \mathbf{V} \mathbf{L}_2\right)^{-1} \mathbf{y}_2\)

因此 \(\mathbf{y}_1 \mid \mathbf{y}_2\) 的对数似然值可以写成 \[ l(\mathbf{y}_1 \mid \mathbf{y}_2) = -\frac{1}{2}\left( p \times \ln (2 \pi) + \ln |\mathbf{(X^{\prime}V^{-1}X)}^{-1}|+\left(\mathbf{y}_{1}-\boldsymbol{\beta}-\mathbf{y}_2^{*}\right)^{\prime}\mathbf{(X^{\prime}V^{-1}X)} \left(\mathbf{y}_{1}-\boldsymbol{\beta}-\mathbf{y}_2^{*}\right) \right) \] 因为 \(l(\mathbf{L}^{\prime} \mathbf{y}) = l(\mathbf{y}_{1}|\mathbf{y}_{2}) + l(\mathbf{y}_{2})\) ,因此左右两边的对数项也相等,得到: \[ \ln |\mathbf{\mathbf{L}^{\prime}V\mathbf{L}}| = \ln |\mathbf{L_{2}^{\prime}VL_{2}}| + \ln |\mathbf{(X^{\prime}V^{-1}X)}^{-1}| \] 化简得到 (因为 \(\ln |\mathbf{\mathbf{L}^{\prime}V\mathbf{L}}| = \ln |\mathbf{L}^{\prime}| + \ln | \mathbf{V} | +\ln |\mathbf{L}| = \ln |\mathbf{\mathbf{L}^{\prime}\mathbf{L}}| + \ln |\mathbf{V}|\) ) \[ \ln |\mathbf{L_{2}^{\prime}VL_{2}}| = \ln |\mathbf{\mathbf{L}^{\prime}\mathbf{L}}| + \ln |\mathbf{V}| + \ln |\mathbf{X^{\prime}V^{-1}X}| \] 因此 REML ( \(\mathbf{y}_{2}\) )的对数似然函数可以写为(前面两项是常数项,因为不包含参数) \[ l(\mathbf{y}_{2}) = -\frac{1}{2}\left( (n-p) \times \ln (2 \pi) + \ln |\mathbf{\mathbf{L}^{\prime}\mathbf{L}}| + \ln |\mathbf{V}| + \ln |\mathbf{X^{\prime}V^{-1}X}|+\mathbf{y}^{\prime} \mathbf{P} \mathbf{y} \right) \] 根据舒尔补公式,系数矩阵的行列式可以写为 $$ \[\begin{aligned} |\mathbf{C}| & =\left|\mathbf{C}_{Z Z}\right|\left|\mathbf{C}_{X X}-\mathbf{C}_{X Z} \mathbf{C}_{Z Z}^{-1} \mathbf{C}_{Z X}\right| \\ & =\left|\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right|\left|\mathbf{X}^{\prime} \mathbf{R}^{-1}\mathbf{X}-\mathbf{X}^{\prime} \mathbf{R}^{-1}\mathbf{Z}(\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1})^{-1}\mathbf{Z}^{\prime} \mathbf{R}^{-1}\mathbf{X}\right| \\ & =\left|\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right|\left|\mathbf{X}^{\prime} \left(\mathbf{R^{-1}-R^{-1}Z(Z^{\prime}R^{-1}Z+G^{-1})^{-1}Z^{\prime}R^{-1}} \right) \mathbf{X}\right| \\ & =\left|\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right|\left|\mathbf{X}^{\prime} \mathbf{V}^{-1} \mathbf{X}\right| \end{aligned}\]

$$ 因此,我们得到 \(\ln |\mathbf{X^{\prime}V^{-1}X}| = \ln |\mathbf{C}| - \ln \left|\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right|\)

对于 \(|\mathbf{V}|\) ,我们进行推导得到,其中 \(q\)\(\mathbf{G}\) 的维度。 \[ \begin{aligned} |\mathbf{V}| &= |\mathbf{R+ZGZ^{\prime}}| \\ &= |\mathbf{R}||\mathbf{I_{q}+Z^{\prime}R^{-1}ZG}| \quad \because |\mathbf{A}+\mathbf{B} \mathbf{C}|=|\mathbf{A}|\left|\mathbf{I}_n+\mathbf{C} \mathbf{A}^{-1} \mathbf{B}\right| \quad \text{见附录1}\\ &= |\mathbf{R}||\mathbf{G^{-1}+Z^{\prime}R^{-1}Z}||\mathbf{G}| \end{aligned} \] 因此 \(\ln |\mathbf{V}| = \ln |\mathbf{R}| + \ln|\mathbf{G^{-1}+Z^{\prime}R^{-1}Z}|+\ln|\mathbf{G}|\)

因此我们得到 $$ \[\begin{aligned} &\ln |\mathbf{X^{\prime}V^{-1}X}| + \ln |\mathbf{V}| \\ &= \ln |\mathbf{C}| - \ln \left|\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right| + \ln |\mathbf{R}| + \ln|\mathbf{G^{-1}+Z^{\prime}R^{-1}Z}|+\ln|\mathbf{G}| \\ &= \ln |\mathbf{C}| + \ln |\mathbf{R}| +\ln|\mathbf{G}| \\ &= \ln |\mathbf{R}| +\ln|\mathbf{G}| + \ln |\mathbf{C}| \\ \end{aligned}\] \[ 代入 $l(\mathbf{y}_{2})$ 得到 \] \[\begin{aligned} l(\mathbf{y}_{2}) &= -\frac{1}{2}\left( (n-p) \times \ln (2 \pi) + \ln |\mathbf{\mathbf{L}^{\prime}\mathbf{L}}| +\ln |\mathbf{V}| + \ln |\mathbf{X^{\prime}V^{-1}X}|+\mathbf{y}^{\prime} \mathbf{P} \mathbf{y} \right) \\ &= -\frac{1}{2}\left((n-p) \times \ln (2 \pi) + \ln |\mathbf{\mathbf{L}^{\prime}\mathbf{L}}| + \ln |\mathbf{R}| +\ln|\mathbf{G}| +\ln |\mathbf{C}|+\mathbf{y}^{\prime} \mathbf{P} \mathbf{y} \right) \\ \end{aligned}\]

\[ 左右乘以 -2 ,得到 \] -2l = (n-p) (2 ) + || + || +|| +||+^{} \[ 忽略常数项,得到 \] -2l || +|| +||+^{} $$

ln|C|和 y’Py 的计算

这里有两种方法可以计算 \(\ln |\mathbf{C}|\)\(\mathbf{y}^{\prime} \mathbf{P} \mathbf{y}\) ,第一种是是使用高斯消去法,我们建立混合线性模型方程组的增广矩阵如下: \[ \mathbf{M} = \left[\begin{array}{ll} \mathbf{X}^{\prime} \mathbf{R}^{-1} \mathbf{X} & \mathbf{X}^{\prime} \mathbf{R}^{-1} \mathbf{Z} & \mathbf{X}^{\prime} \mathbf{R}^{-1} \mathbf{y} \\ \mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{X} & \mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1} & \mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{y} \\ \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{X} & \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{Z} & \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} \end{array}\right] = \left[\begin{array}{c} \mathbf{C} & \mathbf{r} \\ \mathbf{r}^{\prime} & \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} \end{array}\right] \] 利用高斯消去法消除其对角线下方的元素,将其变成一个上三角矩阵,此时最后一行的对角线元素就等于 \(\mathbf{y}^{\prime} \mathbf{P} \mathbf{y}\) 。因为我们可以用等价的方式,将 \(\mathbf{C}\) 吸收近 \(\mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y}\) ,具体方式就是第二行子矩阵减去 \(\mathbf{r}^{\prime}\mathbf{C}^{-1}\) 乘以第一行(类似于元素级别的高斯消元,根据矩阵乘法的定义,这个行为是增广矩阵行之间的线性组合,和高斯消去法原理一样),得到 $$ \[\begin{aligned} \left[\begin{array}{c} \mathbf{C} & \mathbf{r} \\ \mathbf{r}^{\prime} & \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} \end{array}\right] &\underrightarrow{线性变换} \left[\begin{array}{c} \mathbf{C} & \mathbf{r} \\ \mathbf{r}^{\prime}-\mathbf{r}^{\prime}\mathbf{C}^{-1} \mathbf{C}& \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} -\mathbf{r}^{\prime}\mathbf{C}^{-1} \mathbf{r} \end{array}\right] \\ & \quad \quad = \left[\begin{array}{c} \mathbf{C} & \mathbf{r} \\ \mathbf{0}& \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} -\mathbf{r}^{\prime}\mathbf{C}^{-1} \mathbf{r} \end{array}\right] \\ \end{aligned}\] \[ 其中右下角元素进一步推导得到(根据之前 REML 公式的推导,我们得到 $\mathbf{y}^{\prime}\mathbf{PVPy} = \mathbf{y}^{\prime} \mathbf{R}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta} - \mathbf{Z}\mathbf{u})$ )。 \] \[\begin{aligned} \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} -\mathbf{r}^{\prime}\mathbf{C}^{-1} \mathbf{r} &= \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} -\mathbf{r}^{\prime} \mathbf{s} \quad \because \mathbf{Cs=r} \\ &= \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} - \left[\begin{array}{ll} \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{X} & \mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{Z} \end{array}\right] \left[\begin{array}{ll} \boldsymbol{\beta} \\ \mathbf{u} \end{array}\right] \\ &= \mathbf{y}^{\prime} \mathbf{R}^{-1} (\mathbf{y} - \mathbf{X} \boldsymbol{\beta} - \mathbf{Z}\mathbf{u}) \\ &= \mathbf{y}^{\prime}\mathbf{PVPy} \\ &= \mathbf{y}^{\prime}\mathbf{Py} \quad \because \mathbf{PVP=P} \\ \end{aligned}\]

\[ 高斯消元后, $\ln |\mathbf{C}|$ 就是其前 n 个对角线元素的对数值之和,即 \] || = U_{11} + U_{22} + + U_{nn} \[ 第二种方法是使用 Cholesky 分解,我们对系数矩阵进行分解,得到 \] = ^{} $$ 通过三角方程组求解,我们可以很容易地求解,得到 \(\mathbf{s}\)

通过推导,我们得到 \[ \begin{aligned} &\mathbf{Py} \\ &= \mathbf{V^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\beta}) \\ &= \left( \mathbf{R^{-1}-R^{-1}Z\left(Z^{\prime}R^{-1}Z+G^{-1}\right)^{-1}Z^{\prime}R^{-1}} \right)(\mathbf{y}-\mathbf{X}\boldsymbol{\beta}) \\ &= \mathbf{R^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\beta})- \mathbf{R^{-1}Z\left(Z^{\prime}R^{-1}Z+G^{-1}\right)^{-1}Z^{\prime}R^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\beta}) \\ &= \mathbf{R^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\beta})- \mathbf{R^{-1}Z}\mathbf{u} \quad \because \mathbf{u} =\left(\mathbf{Z}^{\prime} \mathbf{R}^{-1} \mathbf{Z}+\mathbf{G}^{-1}\right)^{-1} \mathbf{Z}^{\prime} \mathbf{R}^{-1}(\mathbf{y}-\mathbf{X} \boldsymbol{\beta}) \\ &= \mathbf{R^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\beta} -\mathbf{Z}\mathbf{u}) \\ &= \mathbf{R^{-1}}\mathbf{e} \\ \end{aligned} \] 此时我们可以通过 \(\mathbf{y^{\prime}R^{-1}}(\mathbf{y}-\mathbf{X}\boldsymbol{\hat{\beta}} -\mathbf{Z}\mathbf{\hat{u}})\) 计算 \(\mathbf{y}^{\prime} \mathbf{P} \mathbf{y}\) 。对于 \(\ln |\mathbf{C}|\) ,我们有 \[ \ln |\mathbf{C}| = 2\ln |\mathbf{L}| \] 如果我们对增广矩阵 \(\mathbf{M}\) 进行 Cholesky 分解,则有 \[ \begin{aligned} \ln |\mathbf{C}| &= 2 \sum_{i=1}^{n} \ln l_{ii} \\ \mathbf{y}^{\prime} \mathbf{P} \mathbf{y} &= l_{(n+1),(n+1)}^{2} \end{aligned} \] 第一条证明略,第二条证明如下,根据舒尔补公式,我们有 \[ |\mathbf{M}| = |\mathbf{C}||\mathbf{y}^{\prime} \mathbf{R}^{-1} \mathbf{y} -\mathbf{r}^{\prime}\mathbf{C}^{-1} \mathbf{r}| =|\mathbf{C}||\mathbf{y}^{\prime} \mathbf{P} \mathbf{y}| = |\mathbf{C}|\mathbf{y}^{\prime} \mathbf{P} \mathbf{y} \] 根据Cholesky 分解,我们有 \[ |\mathbf{M}| = \prod_{i=1}^{n+1} l_{ii}^{2} \] 因此我们得到 \[ \mathbf{y}^{\prime} \mathbf{P} \mathbf{y} = \frac{\prod_{i=1}^{n+1} l_{ii}^{2}}{\prod_{i=1}^{n} l_{ii}^{2}} = l_{(n+1),(n+1)}^{2} \]

DF-REML

非求导算法 (deritative-free, DF) 顾名思义即不计算导数对于不同的参数直接计算似然函数值,从中找到使得似然函数最大的一组参数。比如最简单的算法是将整个参数空间划分成 \(n\) 个网格,每个网格中取一个点,然后计算一次似然函数值,找出最大值。

目前DFREML 中推荐的方法主要是 Simplex 法,其基本思想如下,假设需要估计的方差组分数目为 \(p\) ,那么我们首先选择 \(p+1\) 组方差组分初始值,每一组初始值就相当于 \(p\) 维空间中的一个点,这里也称为一个 Simplex ,然后我们通过比较这 \(p+1\) 组方差组分的似然函数值,淘汰其中最差的一个点,并通过某种方式产生一个新的点加入其中,如此不停迭代下去,不断向最大值运行,最终收敛于最大值。

当需要估计的方差组分数目较少时,DF-REML 算法较为适用,反之其收敛较慢。

附录1:行列式性质

对于矩阵 \(\mathbf{A}_{m \times m}, \mathbf{B}_{m \times n}, \mathbf{C}_{n \times m}\), 其中 \(\mathbf{A}\) 可逆,则存在 \[ |\mathbf{A}+\mathbf{B} \mathbf{C}|=|\mathbf{A}|\left|\mathbf{I}_m+\mathbf{A}^{-1} \mathbf{B} \mathbf{C}\right|=|\mathbf{A}|\left|\mathbf{I}_n+\mathbf{C} \mathbf{A}^{-1} \mathbf{B}\right| \] 第一个等式不用证明,我们证明第二个等式。 \[ \begin{aligned} |\mathbf{A}+\mathbf{B} \mathbf{C}| &= \left| \left[\begin{array}{l} \mathbf{I}_{n} & \mathbf{0} \\ \mathbf{B} & \mathbf{I}_{m} \end{array}\right] \left[\begin{array}{l} \mathbf{I}_{n} & -\mathbf{C} \\ \mathbf{0} & \mathbf{A+BC} \end{array}\right]\right| \\ &= \left| \left[\begin{array}{l} \mathbf{I}_{n} & -\mathbf{C} \\ \mathbf{B} & \mathbf{A} \end{array}\right]\right| \\ &=|\mathbf{A}|\left|\mathbf{I}_n+\mathbf{C} \mathbf{A}^{-1} \mathbf{B}\right| \quad \because \text{舒尔补公式} \\ \end{aligned} \] 证明完毕。

参考文献

  1. Knight E. Improved iterative schemes for REML estimation of variance parameters in linear mixed models[D]. , 2008.

  2. Verbyla A P. A conditional derivation of residual maximum likelihood[J]. Australian Journal of Statistics, 1990, 32(2): 227-230.

  3. 分块矩阵的行列式

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信