最小二乘中的可估计函数

在不考虑互作的前提下,一个固定因子的不同水平效应之差是可估计的吗?

可估计函数

如果存在一个观测值 \(\mathbf{y}\) 的线性组合的期望等于 $ $ ,我们就称这个参数的线性组合 $ $ 是可估计的 (estimable) ,也就是说,存在一个向量 \(\mathbf{a}\) ,使得下式成立 \[ E\left(\mathbf{a}^{\prime} \mathbf{y}\right)=\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta} \] 在模型 \(\mathbf{y}=\mathbf{X} \boldsymbol{\beta}+\boldsymbol{\varepsilon}\) 中,其中 \(E(\mathbf{y})=\mathbf{X} \boldsymbol{\beta}\)\(\mathbf{X}\) 是一个 \(n \times p\) 的秩为 $k < p n $ 的矩阵。那么当且仅当 \(\boldsymbol{\lambda}^{\prime}\)\(\mathbf{X}\) 的行的线性组合时,线性函数 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 可估计。也就是说存在一个向量 \(\mathbf{a}\) 使得下式成立 \[ \mathbf{a}^{\prime} \mathbf{X}=\boldsymbol{\lambda}^{\prime} \] 证明: 如果存在一个向量 \(\mathbf{a}\) 使得 \(\boldsymbol{\lambda}^{\prime}=\mathbf{a}^{\prime} \mathbf{X}\) ,那么我们有 \[ E\left(\mathbf{a}^{\prime} \mathbf{y}\right)=\mathbf{a}^{\prime} E(\mathbf{y})=\mathbf{a}^{\prime} \mathbf{X} \boldsymbol{\beta}=\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta} \] 因此 $ $ 可估计。

反过来,如果 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 可估计,那么存在一个向量 \(\mathbf{a}\) 使得 \(E\left(\mathbf{a}^{\prime} \mathbf{y}\right)=\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) ,因此 \(\mathbf{a}^{\prime} \mathbf{X} \boldsymbol{\beta}=\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 对于所有可能的 \(\boldsymbol{\beta}\) 均成立,因此 $^{} =^{} $ ,得证。

因此,我们可以轻松得到以下性质。

性质

  1. 任何一个观测值的期望值都是可估计的,即 \(E(y_{ijk}) = \mu + \alpha_{i} + \beta_{j}\) 是可估计的。

    证明:此时 \(\boldsymbol{\lambda^{\prime}} = \mathbf{x}_{i}^{\prime}\) ,即等于 \(\mathbf{X}\) 矩阵的某一行 ,因此当然是 \(\mathbf{X}\) 矩阵行的线性组合, \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 可估计,得证。

  2. 可估计函数的任意线性组合也是可估计函数

    证明:假设有两个可估计函数 \(E\left(\mathbf{a}_{1}^{\prime} \mathbf{y}\right)=\boldsymbol{\lambda}^{\prime}_{1} \boldsymbol{\beta}\)\(E\left(\mathbf{a}_{2}^{\prime} \mathbf{y}\right)=\boldsymbol{\lambda}^{\prime}_{2} \boldsymbol{\beta}\) ,这两个可估计函数的线性组合为: \[ c_{1} \boldsymbol{\lambda}^{\prime}_{1} \boldsymbol{\beta} + c_{2} \boldsymbol{\lambda}^{\prime}_{2} \boldsymbol{\beta} = c_{1} E\left(\mathbf{a}_{1}^{\prime} \mathbf{y}\right) + c_{2} E\left(\mathbf{a}_{2}^{\prime} \mathbf{y}\right) = E\left( (c_{1} \mathbf{a}_{1}^{\prime} + c_{2} \mathbf{a}_{2}^{\prime}) \mathbf{y} \right) \] 得证。

  3. 如果 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 可估计,则对于方程组 \(\mathbf{X'X} \boldsymbol{\beta}^{0} = \mathbf{X'y}\) 的任意解 \(\boldsymbol{\beta}^{0}\)\(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}^{0}\) 是唯一的。

    证明:我们有 \[ \boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}^{0} = \mathbf{a}^{\prime} \mathbf{X} \boldsymbol{\beta}^{0} = \mathbf{a}^{\prime} \mathbf{X(X'X)^{-}X'y} \] 因为对于任意的 \((\mathbf{X'X})^{-}\)\(\mathbf{X(X'X)^{-}X'}\) 均是唯一的(证明见 广义逆及其性质)因此证明 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}^{0}\) 是唯一的。

  4. 如果 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 可估计,则 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}^{0}\)BLUE 估计值(最佳线性无偏估计值)。

    证明略

一个因子不同水平效应之差

如果一个固定因子与其他因子之间没有互作,那么它的不同水平效应之差是可估计的吗?

根据上面的内容,我们已知判断是否估计,关键要看 \(\boldsymbol{\lambda}^{\prime}\) 是不是 \(\mathbf{X}\) 的行的线性组合。我们先看一个反例,假设总共只有两个固定因子 \(\alpha\)\(\beta\) ,每个固定因子有两个水平。假设我们有8条数据,有4条数据包含效应 \(\alpha_{1}\)\(\beta_{1}\) ,另外四条数据包含效应 \(\alpha_{2}\)\(\beta_{2}\) ,构建模型时不考虑均值列,用矩阵形式表示为 $$ ( \[\begin{array}{l} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \\ y_{5} \\ y_{6} \\ y_{7} \\ y_{8} \\ \end{array}\] )=( \[\begin{array}{lll} 1 & 0 & 1 & 0 \\ 1 & 0 & 1 & 0 \\ 1 & 0 & 1 & 0 \\ 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 1 \\ \end{array}\] )( \[\begin{array}{l} \alpha_{1} \\ \alpha_{2} \\ \beta_{1} \\ \beta_{2} \\ \end{array}\] )+( \[\begin{array}{l} \varepsilon_{1} \\ \varepsilon_{2} \\ \varepsilon_{3} \\ \varepsilon_{4} \\ \varepsilon_{5} \\ \varepsilon_{6} \\ \varepsilon_{7} \\ \varepsilon_{8} \\ \end{array}\]

) \[ 或者 \] = + $$ 其中 \(\mathbf{X}\) 是一个 \(8 \times 4\) 的矩阵,秩为2 。此时我们无法得到唯一的估计值 \(\hat{\boldsymbol{\beta}}=\left(\mathbf{X}^{\prime} \mathbf{X}\right)^{-1} \mathbf{X}^{\prime} \mathbf{y}\) ,因为 \(\left(\mathbf{X}^{\prime} \mathbf{X}\right)^{-1}\) 不存在。

由于可估计函数 \(\boldsymbol{\lambda}^{\prime} \boldsymbol{\beta}\) 中的 \(\boldsymbol{\lambda}^{\prime}\) 必须是 \(\mathbf{X}\) 的行的线性组合,易得 \(\mathbf{X}\) 的行空间的两个基向量为 $$ ( \[\begin{array}{lll} 1 & 0 & 1 & 0 \\ \end{array}\] ) \[ 和 \] ( \[\begin{array}{lll} 0 & 1 & 0 & 1 \\ \end{array}\] ) \[ 这两个向量的线性组合为 \] c_{1} ( \[\begin{array}{lll} 1 & 0 & 1 & 0 \\ \end{array}\] ) + c_{2} ( \[\begin{array}{lll} 0 & 1 & 0 & 1 \\ \end{array}\]

) =

( \[\begin{array}{lll} c_{1} & c_{2} & c_{1} & c_{2} \\ \end{array}\] ) \[ 那么所有可估计函数的形式就是 \] ( \[\begin{array}{lll} c_{1} & c_{2} & c_{1} & c_{2} \\ \end{array}\] ) ( \[\begin{array}{l} \alpha_{1} \\ \alpha_{2} \\ \beta_{1} \\ \beta_{2} \\ \end{array}\]

) = c_{1} {1} + c{2} {2} + c{1} {1} + c{2} _{2} $$ 根据这个形式,我们不可能得到 \(\alpha_{1} - \alpha_{2}\) 或者 \(\beta_{1} - \beta_{2}\) ,此时任何一个因子不同水平效应之差都是不可估计的。你只能得到 \(\alpha_{1} - \alpha_{2} + \beta_{1} - \beta_{2}\) 是可估计的。

因此根据这个反例,我们知道,一个因子不同水平效应之差是不可估计的,或者说不是在所有情况下都可以估计。

那么什么情况下,一个因子不同水平效应之差是可以估计的呢?我们还是要看其能不能表示为 \(\mathbf{X}\) 的行的线性组合 ,一个最简单的情况就是能不能找 \(\mathbf{X}\) 的两行的差值乘以 \(\boldsymbol{\beta}\) 正好等于这两个水平的效应之差。也就是说需要存在两个观测值在其它固定因子的所属水平均相同,只在这个固定因子的所属水平不同,比如按照上面的例子,如果存在两个观测值 \(E(y_{i}) = \alpha_{1} + \beta_{1}\) , \(E(y_{j}) = \alpha_{2} + \beta_{1}\) ,那么这两个式子之差得到 \(E(y_{i} - y_{j}) = \alpha_{1} - \alpha_{2}\) ,因此 \(\alpha_{1} - \alpha_{2}\) 可估计。

因此,如果所有水平组合均至少存在一个观测值,那么此时所有因子不同水平效应之差都是可估计的。还是以上面的二变量固定模型为例,其数据分布如下,可以看出其数据过于不均衡。如果四个水平组合都有观测值,那么 \(\alpha_{1} - \alpha_{2}\) 或者 \(\beta_{1} - \beta_{2}\) 均可以估计。其实只需要三个水平组合都有观测值,那么 \(\alpha_{1} - \alpha_{2}\) 或者 \(\beta_{1} - \beta_{2}\) 也是可以估计的。

\(\beta_{1}\) \(\beta_{2}\)
\(\alpha_{1}\) 4 0
\(\alpha_{2}\) 0 4

在实际数据中,一般 \(n \gg p\) ,而且数据一般也不会像上面的例子一样这么不均衡,因此一般来说一个因子不同水平效应之差还是可估计的。

参考文献

  1. Rencher A C, Schaalje G B. Linear models in statistics[M]. John Wiley & Sons, 2008.
  2. 张沅,张勤,《畜禽育种中的线性模型》
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信