基于知识图谱嵌入和大规模蛋白质语言技术的噬菌体宿主互作预测新模型:GE-PHI
噬菌体SEP4的分离与特性:
噬菌体SEP4从禽类农场废物中分离出来,通过一系列实验步骤进行纯化和扩增。通过透射电子显微镜(TEM)观察,SEP4具有二十面体头部(直径124.56 nm)和长尾(长度66.28 nm),属于Siphoviridae科。SEP4的基因组为41,828 bp的线性双链DNA,GC含量为49.84%,包含57个开放阅读框(ORFs),没有发现抗生素或毒力因子基因。
模型优势:
GE-PHI模型通过整合多模态数据(如蛋白质序列信息和微生物网络结构信息)显著提升了噬菌体宿主互作的预测精度。MuRP算法利用双曲几何建模PHAN的层次化和多关系结构,能够更准确地保留不同实体之间的关系。ESM-2模型则通过大规模进化数据生成高维嵌入,捕捉噬菌体尾部蛋白和宿主受体结合蛋白的功能和结构特征。这种整合不仅提高了模型对低序列同源性情况下的预测能力,还为噬菌体疗法的开发提供了重要的技术支持。
生物膜的抑制与清除:
SEP4能够显著抑制沙门氏菌生物膜的形成,对宿主菌和多重耐药菌的生物膜抑制率分别达到75.70%和80.24%。在6小时的处理后,SEP4能够完全清除成熟生物膜,细胞计数显著减少。
关键发现:
1.在5折交叉验证中,GE-PHI模型的平均预测准确率达到88.55%,AUC值高达0.9453,显示出良好的泛化能力和可靠性。与现有的一些先进模型(如PHIAF、GSPHI等)相比,GE-PHI在AUC和AUPR值上均表现出显著优势,分别提升了2.45%和4.47%。生物膜。
2.以鲍曼不动杆菌(Acinetobacter baumannii)为例,模型在独立测试集上的平均准确率达到79.51%,AUC值为0.8904,显示出模型对未训练生物信息的预测能力。
结论:
GE-PHI模型为噬菌体宿主互作预测提供了一种全新的解决方案。其基于知识图谱嵌入和大规模蛋白质语言模型的设计使其能够更精准地预测噬菌体与宿主之间的相互作用。这一研究不仅为噬菌体疗法的开发提供了重要的技术支持,还为未来噬菌体研究提供了新的思路和方法。随着抗生素耐药性问题的日益严重,GE-PHI有望在医疗和公共卫生领域发挥重要作用。
参考来源:Pan J, Wang R, Liu W, et al. Predicting phage-host interaction via hyperbolic Poincare graph embedding and large-scale protein language technique[J]. iScience, 2025, 28: 111647.
上一篇:科学家改造噬菌体,轻松突破细菌“防火墙”
下一篇:"基于多模态异构知识图谱的噬菌体宿主预测新模型:PHPGAT"
1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。
2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。
3、转载请注明:文章转载自www.mbiosh.com
联系方式:020-87680942