最小二乘中的可估计函数

2022-06-18

字数统计: 1.1k | 阅读时长≈ 3 分钟

在不考虑互作的前提下，一个固定因子的不同水平效应之差是可估计的吗？

可估计函数

如果存在一个观测值的线性组合的期望等于 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ ，我们就称这个参数的线性组合 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ 是可估计的 (estimable) ，也就是说，存在一个向量，使得下式成立

在模型中，其中，是一个的秩为 $k < p \leq n $ 的矩阵。那么当且仅当是的行的线性组合时，线性函数可估计。也就是说存在一个向量使得下式成立

证明：如果存在一个向量使得，那么我们有

因此 $ \boldsymbol{\lambda^{\prime} \boldsymbol{\beta}}$ 可估计。

反过来，如果可估计，那么存在一个向量使得，因此对于所有可能的均成立，因此 $\mathbf{a}^{\prime} \mathbf{X}=\boldsymbol{\lambda}^{\prime} $ ，得证。

因此，我们可以轻松得到以下性质。

性质

任何一个观测值的期望值都是可估计的，即是可估计的。

证明：此时，即等于矩阵的某一行，因此当然是矩阵行的线性组合，可估计，得证。
可估计函数的任意线性组合也是可估计函数

证明：假设有两个可估计函数，，这两个可估计函数的线性组合为：

得证。
如果可估计，则对于方程组的任意解，是唯一的。

证明：我们有

因为对于任意的，均是唯一的（证明见广义逆及其性质）因此证明是唯一的。
如果可估计，则是 BLUE 估计值（最佳线性无偏估计值）。

证明略

一个因子不同水平效应之差

如果一个固定因子与其他因子之间没有互作，那么它的不同水平效应之差是可估计的吗？

根据上面的内容，我们已知判断是否估计，关键要看是不是的行的线性组合。我们先看一个反例，假设总共只有两个固定因子和，每个固定因子有两个水平。假设我们有8条数据，有4条数据包含效应和，另外四条数据包含效应和，构建模型时不考虑均值列，用矩阵形式表示为

或者

其中是一个的矩阵，秩为2 。此时我们无法得到唯一的估计值，因为不存在。

由于可估计函数中的必须是的行的线性组合，易得的行空间的两个基向量为

和

这两个向量的线性组合为

那么所有可估计函数的形式就是

根据这个形式，我们不可能得到或者，此时任何一个因子不同水平效应之差都是不可估计的。你只能得到是可估计的。

因此根据这个反例，我们知道，一个因子不同水平效应之差是不可估计的，或者说不是在所有情况下都可以估计。

那么什么情况下，一个因子不同水平效应之差是可以估计的呢？我们还是要看其能不能表示为的行的线性组合，一个最简单的情况就是能不能找的两行的差值乘以正好等于这两个水平的效应之差。也就是说需要存在两个观测值在其它固定因子的所属水平均相同，只在这个固定因子的所属水平不同，比如按照上面的例子，如果存在两个观测值 , ，那么这两个式子之差得到，因此可估计。