您当前所在位置: 首页 > 新闻资讯 > 国际检验 > 正文

Nat Biotech | 提升第三代测序技术的准确性——SMRT技术的优化提升

日期:2019-08-19 16:01:48 来源: BioArt 作者:617 点击:

目前,二代测序技术(Next-Generation Sequencing,NGS)已经十分成熟,测序成本低,测序结果精确度高,但是其测序长度通常小于300bp。该测序长度并不是适合从头组装、单倍型定相(haplotype phasing)和结构变异等研究。因此针对测序长度不够的问题,近年来出现了第三代测序技术即单分子测序技术。第三代测序技术原理主要有两类,一类是单分子荧光测序,其代表为美国Helicos公司的SMS技术和美国Pacific Biosciences公司的SMRT(single-molecule real-time)技术。另一类是纳米孔技术,代表公司为英国牛津纳米公司。虽然三代测序仪已经投入市场,但是三代测序技术的准确性仍然是一个问题。


2019年8月12日,美国Pacific Biosciences公司在Nature Biotechnology杂志上发表题为Accurate circular consensus long-read sequencing improves variant detection and assembly of a human genome的文章,该文章通过优化CCS测序方法 (Circular Consensus Seuqencing) 以提高SMRT测序(single-molecule real-time sequencing)准确度,并使用优化后的方法对已经被深入研究的人HG002/NA24385基因组进行测序、评估。

 


SMRT测序技术采用CCS模式测序(图1),在该测序方法下,酶读长通常大于插入片段的长度,因此酶会绕着模版进行滚环式测序,即插入片段会被多次测序,然后再通过算法进行自我纠错得到高准确度的HiFi序列(High fidelity reads)(图1a)。因此,该模式需要平衡测序中所用的酶读长和插入片段的长度。在该研究中,团队首先优化了CCS建库方法,通过测评,为了达到Q30测序质量,最终确定使用15kb长度的接头(在该方法中被称为SMRTbell)和读长为150kb的酶以对插入片段进行10次重复测序(图1b)。基于此,CCS测序最终共产生了89Gb的数据,获得了长度为13.5±1.2kb的序列(图1c)。 


图1CCS测序方法


对结果进行评估,CCS测序的错误率是Illumina NovaSeq的1/17,然而Indel的错误率却是Illumina NovaSeq的181倍。研究人员还将CCS测序结果和NGS结果匹配到人的GRCh37基因组,评估结果显示CCS比NGS测序覆盖度高 (图2) ,能够覆盖到某些NGS难以成功测序的区域,包括许多与疾病相关的基因,还能够解决复杂区域的测序,如HLA1、HLA2基因。


图2 CCS的比对情况


利用GTAK评估SNV和小插入缺失(small-indel,<50bp),SNV的准确度为99.468%,灵敏度为99.559%,插入缺失的准确度为78.988%,灵敏度为81.248%,在插入缺失方面的表现不如NGS。但是由于GTAK的模型是为NGS设计的,所以团队进一步使用了Google 的DeepVariant模型,发现结果显著提高,插入缺失的准确度和灵敏度显明显提升,分别达到97.901%和95.980%。在结构变异方面,与Illumina 2×250bp short reads(使用Manta和Delly软件检测)、10x Genomics linked reads (使用LongRanger软件检测) ,CCS在 (使用pbsv 和Sniffles软件检测) 在准确度和灵敏度上都更优。


另外,还基于FALCON、 Canu和wtdbg算法分别对序列进行了从头组装,结果显示组装质量均较高(表1),且与HG002标准结果高度一致。 


图3 基于CCS数据从头组装的结果


虽然目前三代测序的使用不如二代测序那么广泛,但是该测序技术具有连贯性、完整性等优点,适用于微生物基因组从头组装、动植物基因组连续性重构、染色体的结构变异等研究,还能够填补人类参考基因组中存在的序列间隔。该研究提升了第三代测序技术的准确性,对SMRT技术进一步广泛应用有着重要意义。


原文链接:
https://doi.org/10.1038/s41587-019-0217-9


(责任编辑:tqh)

相关阅读

站内搜索

品牌推荐

更多 >>

关闭二维码
关闭二维码