核心提示:为了探究物种层面金黄色葡萄球菌的泛基因组组成情况以及影响泛基因组组成的影响因素(ST、分离来源、分离国家和样本采集时间)的实际贡献,作者选取了一系列多样性丰富的菌株进行泛基因组分析。
- 摘要 -
为了探究物种层面金黄色葡萄球菌的泛基因组组成情况以及影响泛基因组组成的影响因素(ST、分离来源、分离国家和样本采集时间)的实际贡献,作者选取了一系列多样性丰富的菌株进行泛基因组分析。作者发现,在不同条件下约束的细菌群体其核心基因的分布有明显的差异并且在某些ST分型菌株中呈现出“局部核心基因区”,因此作者认为ST可能是驱动细菌基因组动态分布的主要因素。泛基因组分析表明,在金黄色葡萄球菌菌株中,多位点序列分型(MLST)的一些管家基因的携带率低于60%。因此,作者提出了一套用于金黄色葡萄球菌分类的新marker基因,这为寻找一套适用于MLST的新管家基因提供了参考。在这项研究中,作者探索了影响泛基因组组成的驱动因素的作用,为细菌泛基因组研究提供了新的见解。
- 研究背景 -
泛基因组由Tettelin等人于2005年在对无乳链球菌的基因组研究中提出,指一个生物物种的全部基因组信息。不同的菌株通过基因丢失、基因复制、基因水平转移的作用使得细菌基因组中的基因含量发生变化,从而使得基因组有一定的可塑性。虽然目前已有多项研究表明基因组可塑性与表型之间的联系,然而由于大部分研究纳入的菌株数量过少以及多样不强,从而不能全面表明一个物种层面的泛基因组的情况。并且对影响细菌可塑性的因素如分离来源、分离时间以及不同的谱系等没有进行过系统的比较。本文基于公共数据库中的基因组数据分析金黄色葡萄球菌泛基因组的分布趋势并探究影响其泛基因组可塑性的因素所起到作用的重要性,希望能过对细菌泛基因组的研究提供新的观点。
- 主要结果 -
①大规模多样性金黄色葡萄球菌的核心基因评估
作者根据MLST鉴定结果筛选了1519株金黄色葡萄球菌计算核心基因数量分布情况,结果显示以≥95%的菌株中共存为标准计算的核心基因数量一直保持在1000左右(图1A);而以≥99%为标准的核心基因在基因组数量小于300之前有明显的下降的情况,但是最终趋于稳定并保持在500左右;在以100%菌为标准的绝对核心基因数量随着基因组数量的不断增加而不断减小,虽然随着抽取的基因组数量的增加绝对核心基因数量的下降有明显放缓的趋势,但是仍有部分基因被排除在绝对核心基因的行列。另外,1519株菌的绝对核心基因(100%)中有162个基因,但是需要注意的其中仍有 62个基因为未知功能的假定蛋白(图1B)。
图1 金黄色葡萄球菌的核心基因分布情况
(A) 金黄色葡萄球菌的核心基因分布趋势;(B) 100%核心基因中基因功能的注释情况
② 核心基因在不同菌株群体中动态分布
为了探究相关影响因素对基因组的核心基因分布的影响,作者筛选菌株并按照不同ST、相同分离来源不同ST、相同ST不同分离来源、相同ST和分离来源不同分离时间进行分组,发现在不同因素限制的条件下核心基因均具有动态分布的特点(图2)。
图2 不同分组菌株的核心基因分布韦恩图
(A) ST8、ST22、ST5的菌株核心基因分布;(B) 分离自血液的ST8、ST22、ST5菌株核心基因分布;(C) 分离自血液、软组织、鼻腔的ST8菌株核心基因分布;(D) 收集于2015、2016、2017年的血液中的ST8菌株核心基因分布
③ST分型可能驱动了基因的动态分布
作者筛选了同时具有ST、分离来源、分离国家、样本采集时间的明确信息的菌株,基于泛基因组分析结果进行线性分析发现ST、分离来源与基因的动态流动性相关性最高。作者在对泛基因组全部基因的动态性进行评估时,作者发现除了全部菌株都含有的基因聚成“核心基因区”,另外出现部分菌株之间出现了“局部核心基因区”,并且这些区域的菌株大多数都是同一种ST分型(图3)。
图3 金黄色葡萄球菌的基因分布热图
然后进一步对shell gene进行主成分分析并聚类,发现聚类结果与菌株ST的分布情况高度一致,该分析结果使作者相信ST在细菌基因的动态分布中起着重要作用(图4)。
图4 shell gene的聚类情况
(A) 不同ST菌株的分布情况;(B) 聚类为不同cluster菌株的分布情况
④基因组可塑性对全基因组序列建树的影响
通过统计SNP位点的分布情况,在不限制菌株同一ST时,SNP的总数量有了量级的变化,且落在dispensable gene区域的SNP数量所占的比例也有了明显的增多。利用全基因组比对得到菌株基因组之间的SNP位点,并利用SNP位点进行系统进化分析是在一定地理区域内进行某物种的筛查及流行性分析时常用的方法,而这些落在dispensable gene区域的SNP很有可能会干扰系统进化分析,进而影响结果的可信性(图5)。

图5 对菌株进行全基因组比对后的SNP的统计
⑤新的金黄色葡萄球菌分型策略
泛基因组分析结果的计算表明,5217株金黄色葡萄球菌管家基因tpi、aroE和glpF的携带频率低于60%,作者基于图1中101个具有已知功能的核心基因中筛选了10个新的marker基因,通过验证新的marker基因的携带频率更为稳定(图6A)。从基于新的marker基因和管家基因对菌株的分组结果上看,这两种方法对菌株的分组结果大致相同,但在个别分支上有所不同(图6B)。
图6 新marker基因和管家基因的频率分布以及分型情况比较
(A) 基因携带频率分布情况;(B) 两种分型方法对菌株分组结果的对比
- 讨论 -
总之,作者通过本研究明确了金黄色葡萄球菌核心基因的分布情况,并且发现其核心基因在不同菌株群体中是动态分布的。通过评估发现ST分型可能是驱动细菌基因组动态分布的主要因素,并且提出了其在进化分析中的潜在的影响。另外本文提出的新的分型策略提示大家需要去寻找一套更加适合金黄色葡萄球菌的管家基因,以此来适应目前该物种的分类现状。
DOI:10.1128/spectrum.03117-22
原文链接: https://journals.asm.org/doi/epub/10.1128/spectrum.03117-22