STR亲权鉴定指标

利用微卫星标记 (STR) 可以进行亲权鉴定,这里主要是介绍其中用到的一些指标。

亲权鉴定

先看几个概念:

三联体亲权鉴定 (parentage testing of trios):被检测男子、孩子生母与孩子,或者被检测女子,孩子生父与孩子的亲权鉴定

二联体亲权鉴定 (parentage testing of duos):被检测男子与孩子,或被检测女子与孩子的亲权鉴定

排除概率

排除概率 (power of exclusion, PE):不是孩子生父或生母的随机个体,能够被遗传标记排除血缘关系的概率。简单地说,就是使用单个标记能将假父亲(非生父)正确排除的概率。

排除概率是对于单个标记而言的,在 SF/Z JD0105001-2016 《亲权鉴定技术规范》给出的公式如下(下面推导过程有更加清晰的公式)

累积排除概率 (cumulative power of exclusion, CPE):顾名思义,就是使用所有位点的累积排除概率,其计算公式如下,其中 \(m\) 为标记数目 \[ \mathrm{CPE} = 1 - \prod_{i=1}^{m}(1-\mathrm{PE}_{i}) \] 这个公式解释一下,\(1-\mathrm{PE}_{i}\) 就是标记 \(i\) 不能排除随机样本是真实亲本的概率,所有位点连乘的结果就是所有位点都不能排除随机样本的概率,1减去这个值就是至少有一个位点能够排除随机样本的概率。

排除概率是针对标记而言的,标记的多态性越好则排除概率越高。

如果累积排除概率较低,说明标记数目不够,需要继续增加标记数目。

在《GBT27642-2011牛个体及亲子鉴定微卫星DNA法》中,CPE 需要大于等于 99.73% 。

排除概率公式推导过程

根据 Fung (2002) 的文献,我找到了排除概率公式的推导过程。

我们假设一个标记有 \(n\) 个等位碱基 \(A_{1}, \cdots, A_{n}\) ,相应的等位基因频率为 \(p_{1}, \cdots, p_{n}\) ,假设一个孩子和其母亲在这个位点的基因型标记为 \(G_{C}\)\(G_{M}\) ,举个例子,假设 \(G_{M} = A_{1}A_{2}\)\(G_{C} = A_{1}A_{1}\) ,因此任何没有 \(A_{1}\) 基因的男性都可以被排除(不是这个孩子的父亲),此时的排除概率我们定义为 individual probability of exclusion(IPE)\(\mathrm{IPE} = (1-p_{1})^{2}\) ,即 \((1-p_{1})^{2}\) 的男性群体可以被排除,即 \[ \mathrm{Pr}(\text{a random man is excluded} \ | \ G_{M},G_{C}) = (1-p_{1})^{2} \] 而这个母子对组合出现的概率为(计算过程) \[ \mathrm{Pr}( G_{M}=A_{1}A_{2},G_{C}=A_{1}A_{1})= \mathrm{Pr}(G_{C}) \mathrm{Pr}(G_{M}|G_{C}) = p_{1}^{2}p_{2} \] 因此我们可以通过对所有的母子对组合进行加权求和,从而得到 PE (这个我懒得推导了) \[ \begin{aligned} Q_1 & =\sum_{G_M, G_C} \operatorname{Pr}\left(\text { a random man is excluded } \mid G_M, G_C\right) \\ & \times \operatorname{Pr}\left(G_M, G_C\right) \\ & =\sum_{i=1}^n p_i\left(1-p_i+p_i^2\right)\left(1-p_i\right)^2 \\ & +\sum_{i=1}^{n-1} \sum_{j=i+1}^n p_i p_j\left(p_i+p_j\right)\left(1-p_i-p_j\right)^2 . \end{aligned} \] 一个等价的式子为 \[ Q_1=\sum_{i=1}^n p_i\left(1-p_i\right)^2-\sum_{i=1}^{n-1} \sum_{j=i+1}^n p_i^2 p_j^2\left(4-3 p_i-3 p_j\right) \] 如果母本基因型未知,此时 PE 的公式如下 \[ Q_2=\sum_{i=1}^n p_i^2\left(1-p_i\right)^2+\sum_{i=1}^{n-1} \sum_{j=i+1}^n 2 p_i p_j\left(1-p_i-p_j\right)^2 \] 上面例子中的已知母本基因型换成已知父本基因型也是一样的。

亲权指数

亲权指数 (parentage index; PI) :判断亲权关系所需的两个条件概率的似然比率。 \[ \mathrm{PI}=\frac{\text { 概率 (检测到当事人的遗传表型 } \mid \text { 假设被检测个体是孩子的生物学父亲或母亲) }}{\text { 概率 (检测到当事人的遗传表型 } \mid \text { 假设一个随机个体是孩子的生物学父亲或母亲) }} \] 实际上这就是 cervus 软件中计算单个位点的原始似然比,举例如下

累积亲权指数 (parentage index; CPI) :公式如下 \[ \mathrm{CPI} = \prod_{i=1}^{m}\mathrm{PI}_{i} \] 累积亲权指数就是所有位点的原始似然值。

因为 cervus 对原始似然比求了 ln ,得到 LOD值,因此我们得到二者关系为 \[ \text{CPI} = \mathrm{e}^{\mathrm{LOD}} \] 但是,如果存在孟德尔错误的位点,那么不同人不同软件的处理方式不一样,因此得到的结果也会有差异。比如在 SF/Z JD0105001-2016 《亲权鉴定技术规范》,不符合遗传规律情形时亲权指数的计算方法如下图,图中 \(\mu\) 为平均突变率。

父权相对机会

父权相对机会(relative chance of paternity),有人也翻译为亲子关系相对机会,是将亲权指数 PI 换算为百分数后的一个指标。

参考中国大百科全书,我们设假设为 Hd 含义为候选父本不是孩子的生父,另一个假设 Hp 含义为候选父本是孩子的生父,E 是表示获得二联体或三联体遗传标记检测结果的事件,因此我们得到亲权指数可以表示为 PI = Pr(E|Hp)/Pr(E|Hd) 。父权相对机会便可以表示为 Pr(Hp | E) ,即在获得二联体或三联体遗传标记检测结果的条件下,候选父本是孩子生父的概率。根据贝叶斯公式,我们有 \[ \begin{aligned} Pr(Hp | E) &= \frac{Pr(E|Hp)Pr(Hp)}{Pr(E|Hp)Pr(Hp) + Pr(E|Hd)Pr(Hd)} \\ &=\frac{PI \ Pr(Hp)}{PI \ Pr(Hp) + Pr(Hd)} \quad \because PI = Pr(E|Hp)/Pr(E|Hd) \\ &=\frac{PI }{PI + Pr(Hd)/Pr(Hp)} \\ \end{aligned} \] 这里 Pr(Hd) 和 Pr(Hp) 分别表示候选父本不是孩子生父和候选父本是孩子生父的前概率,由于鉴定人对这两个前概率无法准确获知,故通常假设二者均为 0.5。

在 SF/Z JD0105001-2016 《亲权鉴定技术规范》中,也明确提出以下说明

如果在鉴定书里使用其他数学或词语的表达式时,应定义并解释其含义,使委托人或法庭了解其 意义。如要将亲权指数值转换为传统使用的父权相对机会,应同时给出转换时所采用的前概率。例如, 某案累计亲权指数为 10000 时,可以表述为本案累计亲权指数为 10000,在假定父权前概率为 0.5 时, 父权相对机会为 0.99 。

亲子鉴定文书规范

在 SF/Z JD0105004 - 2015《亲子鉴定文书规范》中,列出了三种出具意见,下面是三联体亲权鉴定的三种意见如下

第一种,支持意见

D19S433 等 19 个 STR 基因座均为人类的遗传标记,遵循孟德尔遗传定律,联合应用可进行亲权鉴 定,其累积非父排除概率大于 0.9999。综上检验结果分析,在每一个 STR 基因座,CC 均能提供给 BB 必需的等位基因。经计算,累积亲权指数为 XXXX(注:大于 10000)

第二种,排除意见

D19S433 等 19 个 STR 基因座均为人类的遗传标记,遵循孟德尔遗传定律,联合应用可进行亲权鉴 定,其累积非父排除概率大于 0.9999。综上检验结果分析,CC 在 XXXX、XXXX 和 XXXX 等基因座不能提 供给孩子必需的等位基因。经计算,累积亲权指数为 XXXX(注:小于 0.0001)

第三种,出现不符合遗传现象,仍表示支持意见

D19S433 等 19 个 STR 基因座均为人类的遗传标记,遵循孟德尔遗传定律,联合应用可进行亲权鉴 定,其累积非父排除概率大于 0.9999。上述检验结果表明,除 D3S1358 基因座外,CC 均能提供给孩子 必需的等位基因。在 D3S1358 基因座,AA 的基因型为“16,18”,BB 的基因型为“16,18”,CC 的基因型 为“15,15”,CC 不能提供给孩子必需的等位基因 16 或 18,不符合遗传规律。按照 GA/T965-2011《法 庭科学 DNA 亲子鉴定规范》和 SF/Z JD0105001-2015《亲权鉴定技术规范》中不符合遗传规律情形时亲权指数的计算方法,XXX 基因座的亲权指数为 XXXX。综上 19 个 STR 基因座的累积亲权指数为 XXXX(注: 大于 10000)

其实还有一种罕见但是理论上可能出现的特殊情况,那就是出现(少量的)不符合遗传现象,并且累积亲权指数低于 10000,那么就需要增加 STR 基因型,如果仍未达到认定标准,则可以出具“不排除”意见。

参考文献

  1. GB/T 37223-2018

  2. GB/T 27642-2011

  3. SF/Z JD0105001-2016 《亲权鉴定技术规范》

  4. SF/Z JD0105004 - 2015《亲子鉴定文书规范》

  5. GBT27642-2011牛个体及亲子鉴定微卫星DNA法

  6. Marshall T C, Slate J, Kruuk L E B, et al. Statistical confidence for likelihood‐based paternity inference in natural populations[J]. Molecular ecology, 1998, 7(5): 639-655.

  7. Fung W K, Chung Y, Wong D. Power of exclusion revisited: probability of excluding relatives of the true father from paternity[J]. International journal of legal medicine, 2002, 116: 64-67.

  8. Jamieson A. The genetics of transferrins in cattle[J]. Heredity, 1965, 20(3): 419-441.

  9. Jamieson A. The effectiveness of using co‐dominant polymorphic allelic series for (1) checking pedigrees and (2) distinguishing full‐sib pair members[J]. Animal Genetics, 1994, 25(S1): 37-44.

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2026 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信