混合线性模型三之BLUP方法

理论学习 / 线性模型

字数统计: 2.1k | 阅读时长≈ 7 分钟

在前面的章节中，我们提到了 BLP 方法需要已知固定效应的值，而这在实践中往往不可能实现，由此引出 BLUP 方法，这应该也是本系列的最后一篇。

BLUP

我们先看 BLUP 方法的一般推导，假设我们想要预测一个随机变量，我们只知道其均值为，方差为，其与的协方差为，我们该如何取预测呢？

一种可行的方案是我们找到一个关于的线性函数，其均值为（即无偏），并且其在所有线性无偏估计值中具有最小的预测误差方差，这种方法我们称为最佳线性无偏预测法 (BLUP) 。

假设预测函数为，其期望为，我们需要使之为，即对于所有可能的恒成立，因此存在

预测误差方差为下式，其中

构建拉格朗日函数如下

分别对和求偏导，使之为 0 ，得到

整理一下，我们得到方程组如下

这个方程组和广义最小二乘的方程组很相似。下面我们开始求解，对第一个方程进行变换，得到

因此我们得到了一个只关于的方程组

我们需要先证明这个方程组相容，我们只需要证明对于任何一个广义逆，均成立即可。假设可估计，则必然存在某个向量使得，因此上式可以写成。我们设这里的，这里的是的逆矩阵，易得，因此得证，即我们证明这个方程组相容。

因此的一个解为

我们将其带入到第一个方程，得到

此时我们的预测值为（这里需要设定同样是一个对称矩阵 ）

由于，所以预测值可以写为

我们注意到，如果或者如果已知，那么此时的预测值就是，就是选择指数法的预测公式。因此，BLUP 就是用替换的 BLP 。

从元素推广到向量，得到

其中，。

方差及协方差

我们现在来看一些有用的方差和协方差，我们有

假设是一个对称矩阵，并且是一个自反广义逆矩阵。因此我们有

协方差

预测误差方差为

BLUP 的性质

在所有的线性无偏预测值中，BLUP 最大化了和的相关
BLUP 具有不变性，即
在正态分布假设下，我们有
- $Var( \mathbf{\hat{w}} - \mathbf{w}) = Var( \mathbf{w} | \mathbf{\hat{w}}) $
- 是最大似然估计值，并且是的条件均值的最佳线性无偏估计值
- 元素正确排序的可能性最大

混合模型方程组

上面的BLUP计算公式中涉及到的计算，当观测值较多时，计算困难甚至不可计算，为此 Henderson 提出了求解的另一种方法，这个方法原来被 Henderson 称为最大似然法，但是实际上这个方法比最大似然方法更加具有普遍性，因为它其实不需要正态假设。这个方法就是混合模型方程组 (Mixed Model Equation, MME) .

对于一般的混合线性模型

均值和方差，协方差如下

我们沿着 Henderson 一开始推出 MME 的思路，我们假设和服从正态分布，和服从联合多变量高斯分布

那么和的联合密度函数为

根据多元正态分布，我们知道多元正态分布的条件分布也是正态分布，其均值和协方差矩阵满足公式

因此，我们有

因此，我们有

根据多元正态分布的概率密度公式，我们有

其中和为常数，如下

于是

其中。

取对数得到

根据最大似然的思想，我们要找一组参数和使得最大。我们分别针对和求偏导，得到

整理一下，可得

我们也可以整理成方程组的形式

此方程组就称为混合模型方程组。

我们下面证明混合模型方程组与根据 BLUP 的定义直接得到的和等价，也就是说混合模型方程组实际不需要正态假设。

证明等价

由混合模型方程组的第二个方程得

这里需要证明可逆，由于阵是正定矩阵，因此其逆矩阵也是正定矩阵，易证为半正定矩阵，因此也是正定矩阵，因此其可逆。

将该式带入到第一个方程得到

变换一下得到

其中有，推导可见混合线性模型一之广义最小二乘。

因此，混合模型方程组得到的就是广义最小二乘估计值。

然后我们再需要证明，即等于选择指数法估计值。

得证。

因此我们证明了混合模型方程组与根据 BLUP 的定义直接得到的和等价，所以在家畜育种中，混合模型方程组已成了 BLUP 法的同义词。

但是这种从最大似然法推导出来混合模型方程组的方式，和 BLUP 的定义似乎缺少概念上的直接联系，下面我们尝试直接从 BLUP 的定义出发，直接推导得到混合模型方程组。

重新推导

根据 BLUP 定义，对于单个变量，我们有方程组

推广至向量，我们有下面的方程组 (注意这里的是一个矩阵，上面是一个向量 )。矩阵满足。

将和带入第一个方程，得到

或者写成

令，则，于是有方程组

由其中的第一个方程可得

带入到第二方程，得

带入到第三方程，得

整理成方程组得格式为

前面前面的推导，我们知道这个方程组应该是相容的。我们将上式系数矩阵的一个广义逆表示为（假设这个广义逆也是一个对称矩阵，满足，和也是对称矩阵）

则该方程组的解为

于是

因此

同时根据上面的推导，我们有

因此

即

证明完毕。

性质

假设是一个对称矩阵，并且是一个自反广义逆矩阵。

固定效应估计值

固定效应估计值就是一个广义最小二乘估计值，公式如下，其性质不再赘述。

随机效应估计值

随机效应计算公式为

根据广义最小二乘估计值的性质，我们易得是一个可估计函数，即的值唯一，因此也是唯一的。

首先看期望

其中存在，证明如下，我们设，这里的是的逆矩阵，易得

第二，我们看随机效应的协方差矩阵，根据上面的 BLUP的一般推导，我们有

这里均值为，即，同时有带入得到

根据上面的 BLUP的一般推导，我们有

固定效应的可估计函数与随机效应估计值的协方差矩阵为

根据通式

我们有

系数矩阵广义逆矩阵的性质

假设混合模型方程组的系数矩阵的任意一个对称的广义逆矩阵为

则存在下式

下面的证明是基于系数矩阵满秩的前提下，即此时的广义逆就是逆矩阵存在下式成立。

这是 Henderson 在 1975 年提出的，我们有

其中，我们设

继续拆开，得到

或者

因此，我们有

我们可以得到下面这个等式

因此我们得到

利用这些结果，我们得到

全部证明完毕。

简化方程组

在家畜育种的实际运用中，我们常有

此时，我们可以对混合模型方程组的两侧均消去，得到一个简化版本

其中

优势

混合模型方程组中不涉及矩阵，在常规评估中，计算比容易得多，当然这主要得益于 Henderson 提出了一种不用求逆直接构建的方法。

参考文献

Henderson，1975，Best Linear Unbiased Estimation and Prediction under a Selection Model
Henderson，《Applications_of_Linear_Models_in_Animal_Breeding》, 1984
张沅，张勤，《畜禽育种中的线性模型》

版权声明： 本博客所有文章除特别声明外，著作权归作者所有。转载请注明出处！

请我喝杯茶吧~

支付宝

微信