测序技术基础知识学习

学习一代测序和二代测序的基础原理。

一代测序 - Sanger 测序

https://zhuanlan.zhihu.com/p/75408383

采用 ddNTP,均不含羟基,如果合成了一个 ddNTP之后,DNA合成过程就中止了。

一代测序需要4个 DNA 合成反应体系(A C G T 各一个),原理如下图

1

优点:

  • 测序读长可达1,000bp
  • 准确性高达99.999%

缺点:

  • 成本高
  • 通量低

二代测序

https://zhuanlan.zhihu.com/p/20702684

优酷视频

https://v.youku.com/v_show/id_XNzEzNzk1NTA0.html

二代测序目前的主流是 illumina 测序

建库

由于Illumina测序策略本身的问题,导致其测序长度不可能太长。

所谓的建库就是把基因组打断成一定长度的片段。

打断后,补齐末端,然后再3‘段添加一个碱基A,之后再加上 adapter

桥式PCR

这个看视频更形象一点。

最终就是在 flowcell 中 形成了一个具有完全相同序列的簇,一般叫 cluster

测序

这个也是看视频更形象一点。

它是边合成,边测序。

它用于测序的碱基有两个特殊的地方,一是脱氧核糖3号位加入了叠氮基团而不是常规的羟基,类似于一代测序的ddNTP,保证一次只能添加一个碱基;二是碱基部分添加了荧光基团,不同的碱基有不同的颜色。

在测序过程中,每1轮测序,保证只有1个碱基加入的当前测序链。这时候测序仪会发出激发光,并扫描荧光。因为一个cluster中所有的序列是一样的,所以理论上,这时候cluster中发出的荧光应该颜色一致。一个测序扫描图片如下:

1

然后洗脱多余的没有附着上的脱氧核糖和聚合酶,加入特殊试剂,将脱氧核糖3号位的—N2改变成—OH,然后切掉部分荧光基团,使其在下一轮反应中,不再发出荧光。

如此反复,测出所有reads每个位置的序列。

为什么Illumina测序会有长度限制呢

  1. 测序时,经过长时间的PCR,会有不同步的情况。通俗一点讲,比如一开始1个cluster中是100个完全一样的DNA链,但是经过1轮增加碱基,其中99个都加入了1个碱基,显示了红色,另外1个没有加入碱基,不显示颜色。这时候整体为红色,我们可以顺利得到结果。随后,在第2轮再加入碱基进行合成的时候,就变成了,之前没有加入的加入了1个碱基显示红色,剩下的99个显示绿色,这个时候就会出现杂信号。当测序长度不断延长,这个杂信号会越来越多,最后很有可能出现,50个红,50个绿色,这时候我们判断不出来到底是什么碱基被合成。
  2. 测序过程中,使用的碱基是特殊处理的,有一个非常大的荧光基团修饰。在使用DNA ploymerase的时候,酶的状态也会受到底物的影响,越来越差。

这一方面应该也说明了,每条 read 最开始的分型质量是最好的,越往后质量越差。

  • 版权声明: 本博客所有文章除特别声明外,著作权归作者所有。转载请注明出处!
  • Copyrights © 2019-2023 Vincere Zhou
  • 访问人数: | 浏览次数:

请我喝杯茶吧~

支付宝
微信