深度学习助力细菌基因组变异检测

深度学习助力细菌基因组变异检测

原创
来源:杨诗沅
2025-03-21 09:35:06
59次浏览
分享:
收藏
核心提示:近年来,牛津纳米孔测序技术(Oxford Nanopore Technologies,ONT)凭借其长读长和实时测序能力,为细菌基因组学带来了新的希望。

一、引言

在细菌基因组学中,变异检测是疾病传播集群识别、抗生素耐药性预测、系统发育树构建以及进化分析等关键应用的核心。在过去的15年里,由于短读长测序技术(如Illumina)相对较高的碱基调用精度,其已经成为细菌基因组中变异检测的主要技术;然而,传统的短读长测序技术在处理复杂基因组区域时存在局限性。近年来,牛津纳米孔测序技术(Oxford Nanopore TechnologiesONT)凭借其长读长和实时测序能力,为细菌基因组学带来了新的希望。

纳米孔测序技术的核心优势在于其长读长和便携性。与传统的短读长测序技术相比,纳米孔测序能够在近实时状态下生成数据,这对于应对传染病爆发等公共卫生事件至关重要。然而,早期纳米孔测序的基础准确性问题限制了其在细菌基因组变异检测中的应用。近年来,随着牛津纳米孔公司推出新的R10.4.1芯片和高准确性基础检测模型,这一问题得到了显著改善。特别是其“超精准碱基识别”模式(super-accuracy model),在双端(duplex)读取中表现出色,极大地提高了基础检测的准确性。

二、研究方法

该研究使用ONTIllumina测序对14种革兰氏阳性和革兰氏阴性细菌进行了单核苷酸多态性(SNP)和插入/缺失(indel)变异检测的基准测试,发现基于深度学习的变异检测工具(如Clair3DeepVariant)在准确性上显著优于传统方法,甚至超过了Illumina测序。

三、深度学习与变异检测

该研究评估了四种基于深度学习的变异检测工具(Clair3DeepVariantMedakaNanoCaller)和三种传统工具(BCFtoolsFreeBayesLongshot),发现深度学习工具在单核苷酸多态性(SNP)和插入/缺失(indel)变异检测中表现优异。特别是Clair3DeepVariant,在超精准碱基识别模式下,SNPF1分数达到了99.99%indelF1分数也超过了99%。这些结果表明,深度学习工具不仅能够处理复杂的基因组区域,还能在低深度测序数据下保持高准确性,这对于资源有限的环境具有重要意义。

1. 每个样本的最高F1分数

四、ONT测序与Illumina测序的对比

研究还比较了ONT测序和Illumina测序的准确性。结果显示,ONT测序在变异检测中的表现不仅与Illumina相当,甚至在某些情况下更为出色。Illumina测序在重复区域和变异密集区域的准确性下降主要是由于其短读长导致的比对困难。而ONT测序的长读长则能够更好地覆盖这些复杂区域,从而提高变异检测的准确性。此外,同聚物区域的错误是ONT测序的传统弱点之一,而其高准确性碱基识别模式能够有效减少这些错误。

2. 每个变异检测工具在测序数据库上的精度和召回曲线

五、研究意义

这项研究不仅证明了纳米孔测序技术在细菌基因组变异检测中的潜力,还展示了深度学习工具在提高变异检测准确性方面的巨大价值。随着技术的不断进步,纳米孔测序和深度学习的结合有望在临床和公共卫生领域发挥更大的作用。例如,在传染病爆发调查中,快速、准确的变异检测能够帮助科学家更快地追踪病原体的传播路径,从而更有效地控制疫情。此外,这种技术的便携性和实时性也使其在资源有限的环境中具有独特的优势。

  • 上一篇:5分钟双模态检测:高通量微流控平台助力耐药菌精准诊断与快速药敏分析
  • 下一篇:通过质粒的检测揭示家禽源沙门氏菌耐药性和毒力基因传播新机制
网站声明

1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。

2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。

3、转载请注明:文章转载自www.mbiosh.com

联系方式:020-87680942

评论
请先登录后发表评论~
发表评论
热门资讯