使用plink进行ROH分析

如何使用 plink 检测 ROH。

plink 检测 ROH

输入命令

长纯合片段(runs of homozygosity,ROH)是二倍体生物基因组中纯合基因型的连续片段。

现在一般都是用 plink 软件分析 ROH ,用到的参数描述如下:

  • --homozyg-snp n: ROH中的SNP数目应超过 n
  • --homozyg-kb n: ROH 长度应该超过 n kb
  • --homozyg-density n : ROH中平均每 n kb 必须有 1 个SNP
  • --homozyg-gap n :ROH中连续SNP的间隔必须小于 n kb
  • --homozyg-window-snp n: 滑窗大小为 n 个SNP
  • --homozyg-window-het n: 一个 ROH 中最多有 n 个SNP为杂合子
  • --homozyg-window-missing n: 一个 ROH 中最多有 n 个SNP为缺失

输出结果

三个输出结果,后缀分别为 .hom.hom.indiv.hom.summary

.hom

这个文件中内容就是每个个体的每个ROH的统计,其各列内容如下

FID 家系号
IID 个体号
PHE 表型值
CHR 染色体
SNP1 ROH中第一个SNP
SNP2 ROH中最后一个SNP
POS1 SNP1的物理位置
POS2 SNP2的物理位置
KB ROH长度(kb)
NSNP ROH中的SNP数目
DENSITY SNP密度(长度除以SNP数目,kb/SNP)
PHOM ROH中纯合子比例
PHET ROH中杂合子比例

.hom.indiv

这个文件是每个个体的汇总统计结果,其各列内容如下

FID 家系号
IID 个体号
PHE 表型值
NSEG ROH数目
KB ROH总长度 (kb)
KBAVG ROH平均长度 (kb)

.hom.summary

这个文件是每个SNP的汇总统计结果,其各列内容如下

CHR 染色体
SNP SNP名称
BP 物理位置
AFF 病历样本(case)ROH中包含这个SNP的数目
UNAFF 非病历样本(non-case)ROH中包含这个SNP的数目

如果表型是数量性状,那么所有样本都会放在 UNAFF 列中。

经过测试,如果所有表型均为缺失,那么所有样本也都会放在 UNAFF 列中。

参考文献

  1. 刘家鑫, 魏霞, 邓天宇, 谢锐, 韩建林, 杜立新, 赵福平, 王立贤. 绵羊全基因组ROH检测及候选基因鉴定[J]. 畜牧兽医学报, 2019, 50(8): 1554-1566.
  2. plink1.9官网
  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2024 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信