Nature communications|从基因组特征到关系网络:图神经网络如何提升细菌耐药预测能力

Nature communications|从基因组特征到关系网络:图神经网络如何提升细菌耐药预测能力

原创
来源:邹晶晶
2026-05-15 10:25:14
95次浏览
分享:
收藏
核心提示:本研究将多种基因组信息与图神经网络结合,不仅更准确预测细菌耐药,还减少了对“菌株家族标签”的依赖,为临床快速识别耐药提供了新思路。

抗菌药物耐药(AMR)已成为全球公共卫生领域的重大挑战,快速而准确地识别病原菌耐药表型,对于指导临床精准用药、减少不必要的抗菌药物暴露以及阻断医院内耐药传播具有重要意义。然而,传统基于培养的药敏试验流程繁琐,通常在样本采集后仍需等待25天才能反馈结果,难以满足临床早期决策需求。全基因组测序的普及为耐药检测提供了新的技术路径,但细菌基因组数据维度高、信息复杂,现有以规则库或已知耐药基因为基础的方法更适用于单一基因或单个位点驱动的耐药情形,对于铜绿假单胞菌这类耐药机制复杂、遗传异质性强的病原体仍存在明显不足。同时,不同基因组表示方式各有侧重,尚缺乏统一而有效的整合策略。因此,构建一种能够融合多种基因组信息、充分利用菌株间关系特征并提高复杂耐药表型预测能力的新方法,不仅具有重要的方法学价值,也为推动基于测序数据的临床快速耐药预警和精准感染管理提供了必要支撑。

本研究围绕如何利用全基因组测序更准确地预测细菌耐药这一核心问题展开,整体思路是从数据基础、特征表示、模型构建到外部验证逐步推进。首先,作者整合了本中心和9个公开数据集,建立了一个包含2515株铜绿假单胞菌、19865MIC记录并覆盖12种常见抗假单胞菌药物的大型数据集,共涉及524ST,其中ST235ST174ST111ST244为主要流行型别,内部数据集中不同药物的耐药率为13.7%63.3%,留出集为11.1%79.4%,说明研究对象具有显著的遗传多样性和真实世界复杂性(图1)。在此基础上,作者首先比较了unitigSNPFCGR三种单一基因组表示方式的预测能力,结果发现unitig12种药物中的10种上表现最佳,因此被选为后续模型的核心节点特征(图2a)。随后,研究提出AMR-GNN框架,将unitig用于描述菌株自身特征,再利用SNPFCGR构建菌株之间的关系网络,使模型能够同时学习单个菌株本身的信息菌株之间的相似关系(图1a,图2b)。结果显示,AMR-GNN12种药物中的11种上均优于unitig-only模型,其中妥布霉素预测效果最好,AUROC达到0.971,而对原本较难预测的头孢吡肟和氨曲南,AUROC分别提升了28.8%18.9%(图2b)。进一步地,作者考虑到同一MLST家族内部的高相似性可能使模型过度依赖谱系背景,于是删除同MLST组内的连边进行去耦合处理,结果所有药物的性能又进一步提高,尤以美罗培南、阿米卡星和左氧氟沙星最为明显,说明减少群体结构偏倚有助于模型更有效地学习真正的耐药规律(图2b)。为了验证模型的实际竞争力,作者又将AMR-GNN与规则法、ARDaPVAMPr进行比较,发现其在内部测试集上的F1分数和VME整体更优,在外部验证中也仍在多数药物上保持优势,说明该方法不仅精度较高,而且具备一定的泛化能力,不过在美罗培南等任务上仍受到数据分布差异的影响(图3)。最后,作者将该框架进一步扩展到大肠埃希菌、肺炎克雷伯菌、金黄色葡萄球菌和屎肠球菌,样本量分别达到10246707231952608,除大肠埃希菌的哌拉西林/他唑巴坦外,几乎所有物种和药物组合的平均AUROC均超过0.9,最高达到0.995;与ResFinder比较时,16组比较中有14组表现更优,其中屎肠球菌对利奈唑胺的F10.512显著提升至0.859,进一步证明了该框架具有较好的跨物种适用性(图4)。

综上,本研究表明,基于全基因组数据的耐药表型预测,关键不仅在于采用更复杂的算法,更在于合理整合不同层级的基因组表示并尽量降低群体结构偏倚。作者提出的AMR-GNN通过融合unitigSNPFCGR信息,并引入图神经网络与去耦合策略,在预测性能、可解释性和跨物种适用性方面体现出明显创新性,也为后续多组学整合提供了可扩展框架。但该方法仍受训练数据规模、区域性耐药变异、新特征更新、未知基因实验验证以及ST分型分辨率有限等因素制约。未来应依托更大规模、多中心、持续更新的数据资源,结合更高分辨率分型方法和前瞻性临床研究,进一步提升模型泛化能力与实际应用价值。

1  AMR-GNN工作流程及用于训练与测试的铜绿假单胞菌数据集概览。aAMR-GNN框架示意图,显示研究从全基因组序列中提取unitigSNPFCGR三类基因组表示,先比较单一表示的预测能力,再选取最优表示作为节点特征,并利用其余表示构建菌株间关系图,最终完成耐药表型预测。b2515株铜绿假单胞菌的系统发育树,内环表示菌株数据来源,外环表示多位点序列分型,反映样本具有较高的群体结构多样性。c展示内部数据集与留出数据集中各抗菌药物的样本量分布,de分别展示两类数据集中各药物敏感与耐药标签的构成。

2  单一基因组表示与AMR-GNN模型的性能评估。a展示unitigSNPFCGR三种单一基因组表示在12种抗菌药物上的AUROCF1表现,用于筛选最优基础特征;结果表明unitig整体表现最佳,因此被选为后续模型的节点特征。b比较unitig-only模型、AMR-GNN以及去除同MLST组内连边后的decoupled AMR-GNN在多项指标上的表现,并以颜色深浅表示decoupled AMR-GNN相对基线模型的性能差异。

3  AMR-GNN与规则法及公开耐药表型预测模型的性能比较。比较了AMR-GNN与基于已知耐药决定子的规则法、ARDaPVAMPr在内部测试集和留出测试集中的F1分数表现。柱状图表示10次随机划分结果的平均性能,散点表示各次独立划分的具体结果。

4  AMR-GNN在多种临床重要病原菌中的跨物种耐药预测性能评估。ad为各物种不同抗菌药物的敏感与耐药表型分布,反映跨物种预测任务的数据组成;eh为各物种-药物组合的ROC曲线及AUROC,用于评估模型在不同病原菌中的判别能力;i比较AMR-GNNResFinder在相同任务中的F1分数。

原文链接:https://doi.org/10.1038/s41467-026-69934-8

  • 上一篇:磁富集+转录放大,打造无背景泄漏的超敏CRISPR传感器
  • 下一篇:DNA纳米机器出击,30分钟“照亮”食品中的细菌
网站声明

1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。

2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。

3、转载请注明:文章转载自www.mbiosh.com

联系方式:020-87680942

评论
请先登录后发表评论~
发表评论
热门资讯