最小二乘中的可估计函数

在不考虑互作的前提下,一个固定因子的不同水平效应之差是可估计的吗?

可估计函数

如果存在一个观测值 的线性组合的期望等于 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ ,我们就称这个参数的线性组合 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ 是可估计的 (estimable) ,也就是说,存在一个向量 ,使得下式成立

在模型 中,其中 是一个 的秩为 $k < p \leq n $ 的矩阵。那么当且仅当 的行的线性组合时,线性函数 可估计。也就是说存在一个向量 使得下式成立

证明: 如果存在一个向量 使得 ,那么我们有

因此 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ 可估计。

反过来,如果 可估计,那么存在一个向量 使得 ,因此 对于所有可能的 均成立,因此 $\mathbf{a}^{\prime} \mathbf{X}=\boldsymbol{\lambda}^{\prime} $ ,得证。

因此,我们可以轻松得到以下性质。

性质

  1. 任何一个观测值的期望值都是可估计的,即 是可估计的。

    证明:此时 ,即等于 矩阵的某一行 ,因此当然是 矩阵行的线性组合, 可估计,得证。

  2. 可估计函数的任意线性组合也是可估计函数

    证明:假设有两个可估计函数 ,这两个可估计函数的线性组合为:

    得证。

  3. 如果 可估计,则对于方程组 的任意解 是唯一的。

    证明:我们有

    因为对于任意的 均是唯一的(证明见 广义逆及其性质)因此证明 是唯一的。

  4. 如果 可估计,则 BLUE 估计值(最佳线性无偏估计值)。

    证明略

一个因子不同水平效应之差

如果一个固定因子与其他因子之间没有互作,那么它的不同水平效应之差是可估计的吗?

根据上面的内容,我们已知判断是否估计,关键要看 是不是 的行的线性组合。我们先看一个反例,假设总共只有两个固定因子 ,每个固定因子有两个水平。假设我们有8条数据,有4条数据包含效应 ,另外四条数据包含效应 ,构建模型时不考虑均值列,用矩阵形式表示为

或者

其中 是一个 的矩阵,秩为2 。此时我们无法得到唯一的估计值 ,因为 不存在。

由于可估计函数 中的 必须是 的行的线性组合,易得 的行空间的两个基向量为

这两个向量的线性组合为

那么所有可估计函数的形式就是

根据这个形式,我们不可能得到 或者 ,此时任何一个因子不同水平效应之差都是不可估计的。你只能得到 是可估计的。

因此根据这个反例,我们知道,一个因子不同水平效应之差是不可估计的,或者说不是在所有情况下都可以估计。

那么什么情况下,一个因子不同水平效应之差是可以估计的呢?我们还是要看其能不能表示为 的行的线性组合 ,一个最简单的情况就是能不能找 的两行的差值乘以 正好等于这两个水平的效应之差。也就是说需要存在两个观测值在其它固定因子的所属水平均相同,只在这个固定因子的所属水平不同,比如按照上面的例子,如果存在两个观测值 , ,那么这两个式子之差得到 ,因此 可估计。

因此,如果所有水平组合均至少存在一个观测值,那么此时所有因子不同水平效应之差都是可估计的。还是以上面的二变量固定模型为例,其数据分布如下,可以看出其数据过于不均衡。如果四个水平组合都有观测值,那么 或者 均可以估计。其实只需要三个水平组合都有观测值,那么 或者 也是可以估计的。

4 0
0 4

在实际数据中,一般 ,而且数据一般也不会像上面的例子一样这么不均衡,因此一般来说一个因子不同水平效应之差还是可估计的。

参考文献

  1. Rencher A C, Schaalje G B. Linear models in statistics[M]. John Wiley & Sons, 2008.
  2. 张沅,张勤,《畜禽育种中的线性模型》
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2024 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信