AI预测模型在病毒组中蛋白质折叠和功能的应用

AI预测模型在病毒组中蛋白质折叠和功能的应用

原创
来源:彭文伶
2024-10-08 14:35:27
17次浏览
分享:
收藏
核心提示:2024年8月,诺贝尔奖研究团队使用ColabFold、AlphaFold等工具对4463种真核病毒物种的67715种新预测的蛋白质结构进行预测,并对与功能已知的蛋白质结构进行了匹配,建立的病毒蛋白质结构数据库为识别病毒-宿主相互作用的机制提供了新的机会。

2024年8月,诺贝尔奖研究团队使用ColabFold、AlphaFold等工具对4463种真核病毒物种的67715种新预测的蛋白质结构进行预测,并对与功能已知的蛋白质结构进行了匹配,建立的病毒蛋白质结构数据库为识别病毒-宿主相互作用的机制提供了新的机会。相关研究成果已发表在《Nature》期刊上。

image.png

即使在同一个病毒家族中,病毒蛋白也存在高度差异,限制了基于序列的相似性搜索的有效性,而且病毒蛋白在蛋白质数据库中实验确定的代表性结构有限,且AlphaFold数据库中的预测蛋白质结构并不存在。因此,研究团队建立了由真核病毒编码的蛋白质的预测结构数据库。通过将未注释的病毒蛋白与已注释的类似物联系起来,揭示了潜在的蛋白质功能。

方法

蛋白质结构预测:使用ColabFold对来自真核病毒的67715种蛋白质的结构进行了预测。

序列和结构聚类:通过序列和结构聚类方法对这些蛋白质进行分组,生成了5770个多成员和12422个单例聚类。

结构相似性搜索:通过结构相似性搜索扩大了蛋白质聚类的分类多样性,将未注释病毒蛋白质与注释类似物连接。

结构比较:比较病毒和非病毒蛋白质之间的结构,识别了人类病原体编码的蛋白质的潜在功能。

真核病毒的结构蛋白质组

研究团队将DNA病毒根据其平均基因组长度分为大、中、小组,而没有单链正义或负正义基因组的RNA病毒被归入RNA类别。研究发现,dsDNA病毒每个物种的蛋白质簇最多,尽管在数据集的132个病毒家族中仅占14个,但占病毒蛋白的大部分。RNA病毒占数据集中存在的家族的很大一部分,但在总蛋白质中占很小的比例。

image.png

图1:按基因组类型对病毒家族进行分类,并表示每个物种的蛋白质总数(d)、病毒家族(e)和蛋白质簇(f)[1]

病毒蛋白之间的相似性与非病毒蛋白的相似性

虽然蛋白序列相似性较低,但序列簇的许多代表在结构上具有相似性,如图2所示。

image.png

图2:蛋白质簇代表之间的结构和序列相似性[1]

image.png

图3:方法说明。病毒蛋白预测结构数据库与AlphaFold数据库中的生物体(核生物、细菌和古细菌)保持一致[1]

研究揭示了病毒和非病毒蛋白之间普遍的结构相似性,且在低氨基酸同一性的情况下具有高度的结构相似性。

cGAMP PDE的发现

cGAMP PDE的发现揭示了一类特殊的磷酸二酯酶,它们在结构上与RNA连接酶T相似,并在多种真核病毒中保守存在,这些酶能够水解宿主免疫激活的环状二核苷酸cGAMP,从而帮助病毒逃避宿主的先天免疫系统,且这种免疫逃逸机制在细菌、噬菌体和真核病毒中普遍存在。

总结

研究团队提出了关于人类病原体中存在的蛋白质功能的可测试假设,并为大规模研究病毒蛋白质结构提供了资源。这项研究不仅为病毒学领域提供了宝贵的知识资源,还为开发新的抗病毒疗法提供了潜在的靶点。通过理解病毒如何逃避宿主的免疫反应,科学家们可以设计出新的策略来抑制病毒的感染和传播。

参考文献:

[1]Nomburg J ,Doherty E E ,Price N , et al.Birth of protein folds and functions in the virome[J].Nature,2024,(prepublish):1-8.

  • 上一篇:机器学习和插补以表征人类诺如病毒基因型对次氯酸钠的敏感性
  • 下一篇:耶尔森菌:肠道致病菌中的隐形杀手
网站声明

1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。

2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。

3、转载请注明:文章转载自www.mbiosh.com

联系方式:020-87680942

评论
全部评论
热门资讯