方差组分估计的普遍观点与启发

最近看 Misztal 2008年的一篇介绍方差组分估计的文章,其中一段话很有启发。

方差组分的普遍观点

原文如下。我大致翻译一下,方差组分估计的问题往往都可以归因为模型过于复杂,需要估计的参数太多。就像 Box and Draper (1987) 所说,实际上,所有的模型都是错误的,但是某些 (模型) 很有用。虽然复杂的模型可能能够更好地揭示性状的生物学性质,但是在遗传评估中简单的模型可能就足够了,因为 (很多文献报道) 复杂的模型和简单的模型可能预测能力差不多。

Problems with variance component estimation often can be traced to unnecessarily high model complexity with too many parameters to estimate. As Box and Draper (1987) stated, ‘Essentially, all models are wrong, but some are useful’, thus the search for a perfect model is futile. While more complex models may be needed to reveal the biology of traits, simpler models may suffice for genetic evaluation. For example, Lopez-Romero & Carabano (2003) compared random regression models using Legendre polynomials of orders 2–6. While more complex models fit the data better, the predictive ability of all the models was almost identical, indicating almost identical rankings of sires. Good arguments for following productivity in model comparisons were made by Blasco (2006). Reports from literature that simple and complicated models provide similar estimated breeding values are abound, e.g. Piles et al. (2006).

推荐

Misztal 推荐的估计方差组分的步骤为:

  1. 先通过 AI-REML 方法估计单性状模型的方差组分
  2. 尝试估计多性状的方差组分,首先采用不同的性状组合,其次如果性状总数较少(5-7),那么我们可以采用所有性状来估计方差组分。如果多性状模型和单性状模型的方差组分差别很大,那么说明存在问题。
  3. 如果方差组分估计值不切实际,那么检查数据是否有问题。举个例子,可以增加或剔除非加性效应,如果改变很小,那么就说明这个随机效应不重要。
  4. 如果采用 AI-REML 方法波动很大或者超出了参数空间,尝试 EM-REML 方法。
  5. 如果 AI 或 EM 方法的每一次迭代时间很长,或者分析时间太长(即一直在迭代),尝试 CT REML 方法(如果只有一个随机效应并且性状数目很多)或者 BaGS 方法。 当性状数目非常多时,你只能采用这两种方法。
  6. 如果数据量非常大,唯一可用的方法是优化后的 BaGS 方法
  7. 如果所有方法的估计结果均不稳定,或者估计值的 SE 非常大,那么建议简化模型。
  8. 如果 AI 方法估计的结果看上去有问题,尝试用 BaGS 方法再算一遍。对于大部分模型,这两种方法的估计结果是相似的。

启发

  • 对于实际应用,不同模型的判定标准是合用,而不是正确。判断是否合用应该有多个层面上的考虑,比如计算稳定性,计算时间/计算效率,结果准确性,结果是否易于使用等等。
  • 若无必要,勿增实体。做事情,做东西要从易到难,一步步增加复杂度,不要一开始就觉得越复杂的东西就越好。并且每一步最好需要和之前的简单方法进行比较,如果复杂的方式和简单的方式相比帮助不大,那么可能就不如回退到简单的方法。

参考文献

  1. Misztal I. Reliable computing in estimation of variance components[J]. Journal of animal breeding and genetics, 2008, 125(6): 363-370.
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2022 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信