image frame

只与同好争高下,不与傻瓜论短长

为什么GCTA做PCA分析是对G阵进行特征值分解

在机器学习中,进行PCA分析时都是说对特征的协方差矩阵 进行特征值分解,得到特征向量 后,再利用特征向量与特征的内积,计算样本点的新坐标 主成分)。

但是在我们对基因型数据进行PCA分析时,我们使用的常规软件 (例如plink 和 GCTA),其算法都是对G阵(可以理解为样本的协方差矩阵)进行特征值分解,然后得到的特征向量直接就是主成分。这里主要以 GCTA 文章为例,推导这种做法的合理性。

建议先看上一篇 PCA分析公式推导

阅读更多...
  • Copyrights © 2019-2024 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信