当前位置: 首页 > 资讯 > 安全资讯
一个耐药基因靶标数据库:ARTS-DB
原创 发布时间:2022-08-25 浏览次数: 2365 来源: 黄嘉慧

核心提示:纵观历史,人类一直在与引起传染病的细菌作斗争。近几十年来,由于耐药菌的不断进化,已然严重威胁着人类的健康。因此,迫切需要开发新型抗生素。由生物合成基因簇 (BGC) 编码的抗生素为细菌所产生的次级代谢产物。


  纵观历史,人类一直在与引起传染病的细菌作斗争。近几十年来,由于耐药菌的不断进化,已然严重威胁着人类的健康。因此,迫切需要开发新型抗生素。由生物合成基因簇 (BGC) 编码的抗生素为细菌所产生的次级代谢产物。随着公开可用的已测序基因组数量的指数级增长以及 BGC 预测工具的进步,基因组挖掘算法已经发现了数百万个未表征的 BGC,以供进一步评估。但化合物鉴定与表征仍然是瓶颈,因此一个主要挑战是优先考虑最具前景的 BGC。最近,研究人员采用了基于自我抗性的策略,使他们能够预测由未表征的 BGC 编码的天然产物的生物活性。自2017年以来,抗生素抗性靶标搜索器 (ARTS) 促进了这种所谓的靶向基因组挖掘 (TDGM) 方法,用于对编码潜在新型抗生素的 BGC 进行优先排序。本文展示了ARTS数据库,可在 https://arts-db.ziemertlab.com/ 获得。该数据库提供了70,000个或以上的基因组和宏基因组(MAGs)数据。高级搜索查询中允许用户快速探索TDGM的基本标准,如管家基因的BGC接近度、重复和水平基因转移等。此外,ARTS 数据库提供了在整个细菌界中相互关联的结果,以及与天然产物研究中已知数据库的链接。

  次级代谢产物(SMs)为抗生素开发中的关键原料。这些所谓的天然产物是从真菌和细菌等微生物中发现并分离筛选出来的。传统的天然产物筛选方法,主要是通过测定其生物活性。基因组测序技术的出现,弥补了传统筛选方法的缺陷。目前,基因组挖掘技术可用于预测BGC编码天然产物所必需的酶。然而,BGC及其化合物的实验验证过程费时费力。此外,经过实验验证的基因组挖掘BGC的总数低于1%。

  BGC优化方法源于细菌本身的一种“进化”机制:为避免自杀,它们需要以一种对自身产生的化合物具有抗性的方式进化。该“进化机制”之一就是在BGC中找到复制和修饰抗生素的靶基因,从而提供自身抗性。研究人员可通过TDGM方法,预测由未表征的 BGC 编码的化合物的作用方式,并导致识别新的天然产物。自2017年以来,ARTS促进了TDGM方法,以便通过快速将管家基因和已知抗性基因与BGC接近、复制和水平基因转移 (HGT) 事件联系起来,优先考虑生产具有假定新作用模式的抗生素的最具潜力的菌株。

  数据库设计

  使用多层设置,ARTS 数据库使用 SQLAlchemy 工具包 (https://www.sqlalchemy.org/) 快速执行提供的查询,以在Flask框架 (https://flask.palletsprojects.com) 上进行关系映射。整个数据库最初是使用SQLite 数据库引擎(https://www.sqlite.org/)存储的。前端由 jquery、bootstrap和ajax组成,以实现不同设备和浏览器之间的高度兼容性。Web服务层面允许轻松执行打包在单个页面中的 SQL逻辑。所有ARTS结果都可以通过Web应用程序链接,并存储在 de.NBI 云盘上。

  基因组序列的主要构成

  ARTS数据中的全基因组序列,主要来源于两个不同的资源库,包含了27096条高质量细菌基因组序列,它可根据其完整度进行筛选(图1A)。数据库中包含的是经筛除细小及低质量组装的片段等处理后的contigs <100的基因组序列。经MASH去除冗余数据后,其相似度为99.6%或以上。

  此外,该数据库也涵盖了宏基因组序列的数据。在2021年最新发表的研究中,研究人员为探索来自地球周围各种栖息地及哺乳动物宿主的微生物种群结构,形成了地球微生物组 (GEM) 目录中的基因组。GEM所囊括的数据包含着大量关于微生物次级代谢生物合成潜力的最新信息。然而,为能精确搜索管家基因,ARTS依赖于使用紧密相关的分类群构建的参考数据集。因此,于候选的细菌来说,它并不能保证有较高的精确度。对于ARTS数据库,研究人员通过GTDB(图1B)根据其分类注释选择了超过43000个MAGs,这些MAGs适用于ARTS的参考数据集。


  图 1. (A) 和 (B) 分别显示了从数据源NCBI RefSeq和GEM 获得的基因组的系统发育分布。

  主要应用

  如前所述,ARTS数据库提供了两个搜索选项:“查询构建”和“目标导向搜索”。使用查询生成器,用户可以通过四个主要途径探索ARTS数据库中的可用数据源(图2A)。这些路线有:为感兴趣的基因组的初始过滤生成 ARTS 结果的统计摘要,找到符合基本 ARTS 标准的管家基因,根据感兴趣基因在不同门中的出现频率探索其重复率作为不同BGC中的必需基因功能和频率。通过使用“添加术语”按钮并添加指示搜索的高级属性的条件,可以轻松构建复杂的查询(图2B)。生成的表格也可以动态过滤、排序或搜索,从而可以轻松浏览生成的潜在目标(图2C)。

  此外,“目标导向搜索”选项可以更广泛地了解所选基因的特征,如它与不同 BGC 类型的接近程度或在哪个门中它被认为是重要的看家基因等。为了保持高水平的互操作性,ARTS 数据库提供了与 MIBiG和 BiGFAM等可用存储库的交叉链接,以分别获取有关预测的 BGC 及其集群家族的外部信息。此外,在适用的情况下,还提供了DrugBank目录,以获取相关基因与现有药物及其已知作用模式的更多关联信息。


  图 2. ARTS 数据库中的查询示例。 (A) 必须选择可用数据源之一“RefSeq”和“来自地球微生物组的基因组”以及以下探索选定数据源的四个主要途径之一。 (B) 选择主要类别后,必须使用“添加术语”按钮指定搜索选项和术语。 (C) 示例输出。

  结论

  本文展示了ARTS 数据库——目前唯一一个在所有细菌中启用基于自抗性的基因组挖掘方法快速挖掘目标序列的综合存储库的构建与使用。该数据库包含来自 NCBI 的 RefSeq 和 GEM 目录的高质量细菌基因组集,并使用 TDGM 策略处理。研究人员可快速访问预先计算的 ARTS 结果,并通过更广阔的视野探索细菌界。

  参考文献

  M.D. Mungan, K. Blin, N. Ziemert, ARTS-DB: a database for antibiotic resistant targets, Nucleic Acids Res 50(D1) (2022) D736-d740.

网站声明

1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。

2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同具观点和对具真实性负责,著作权及版权归原作者所有,转載无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。

3、转载请注明:文章转载自www.mbiosh.com

※联系方式:020-87680942

评论

直播视频

在线咨询

联系我们

回到顶部

我要留言