CHIKVdb:基孔肯雅热病毒数据库助力疫情快速监测、识别和溯源

CHIKVdb:基孔肯雅热病毒数据库助力疫情快速监测、识别和溯源

转载
来源:生命科学前沿
2025-08-11 08:41:43
12次浏览
分享:
收藏
核心提示:基孔肯雅病毒(CHIKV)是一种由伊蚊传播的重要虫媒病毒,可引起基孔肯雅热病,其特征性的严重关节痛可能导致残疾,给公共卫生带来沉重负担。

基孔肯雅病毒(CHIKV)是一种由伊蚊传播的重要虫媒病毒,可引起基孔肯雅热病,其特征性的严重关节痛可能导致残疾,给公共卫生带来沉重负担。世界卫生组织(WHO)近日发出紧急警告,由伊蚊传播的基孔肯雅热病毒正以惊人速度在全球蔓延。截至 2025 年 7 月 25 日,已有 119个国家和地区报告病例,约 550 万人直接暴露于感染风险中。强化监测溯源与快速响应的需求日益迫切。

病毒基因组数据是理解病毒演化、追踪传播链和溯源疫情的核心资源。然而,现有公共数据库中的 CHIKV 序列数据往往存在碎片化、注释不全、分析流程繁琐等问题,尤其缺乏针对特定暴发地区(如中国)序列的集中整合与易用性分析工具,严重制约了疫情响应效率。

为此,中国科学院微生物研究所国家微生物科学数据中心在近期开发了基孔肯雅病毒数据库,旨在为当前及未来的疫情响应提供支撑。该数据库系统整合了全球 8193 条 CHIKV 核酸序列(含全长和片段序列),并设有中国专题,支持区域化防控工作;同时集成了强大的在线系统发育溯源平台,实现一站式快速分子溯源与传播链分析,大幅简化了传统复杂的工作流程,为科研人员和公共卫生机构提供高质量数据与实时分析工具,成为支持 CHIKV 精准监测与快速响应的关键技术平台。

数据融合与统计

为构建CHIKVdb,该研究团队系统性检索并筛选了所有 CHIKV 相关的序列组装数据。在此基础上精细化的提取并整合了相关元数据,确保数据集的完整性和注释准确性。此外,为进一步提升数据的可靠性与科学性,团队还系统查阅并参考了相关同行评审文献,对关键数据信息进行交叉验证与补充完善。CHIKVdb 中的所有基因组数据均按照全球病原体目录(gcPathogen)数据库的数据标准化流程,进行了元数据清洗与语义关联融合。目前,CHIKVdb 共涵盖了超过40年从全球99个国家的5个主要宿主类别中分离的 8193条核酸序列,包括2858条全长序列(≥10000 bp)和5335条片段序列(<10000 bp),其中来源于中国的有68条全长序列和95条片段序列。

数据库可视化功能界面

为方便用户直观获取数据,数据库首页(图1A)展示了这些统计数据的综合概览,每个数值指标均作为交互式链接,可跳转至“序列数据概览” 页面(图1B)。该页面详细列出了所有序列的信息,包括来源、分离株名称、序列长度、GC含量、分离来源、采样时间、采样国家、宿主及序列类型,支持高效浏览、筛选和下载。在该页面内,还设有CHIKV的“物种概览”子页面(图1C),主要展示生物学和生物信息学数据信息,以及时空分布可视化分析结果;另有“知识图谱” 子页面(图1D),提供全球CHIKV研究领域的作者协作网络、机构合作网络、文献列表及专利列表详情。此外,CHIKVdb设有CHIKV分子监测系统,通过交互式全球地图和中国地图,可视化2000-2024年CHIKV 在不同国家的分布与传播情况,提供病毒 circulation 的实时时空洞察(图 1A)。

图1. CHIKVdb可视化页面展示。A.首页。B.序列数据概览页。C.物种概览页。 D. 知识图谱页面。

为强化病毒疫情溯源与识别鉴定,CHIKVdb 还搭建了一站式分析平台(图 2A),核心工具包括溯源分析系统、SNP 分析工具和基因型鉴定工具。其中,溯源分析系统在追踪病原体传播轨迹中发挥关键作用,主要通过多序列比对和系统发育树构建来分析序列间的进化关系。操作上,用户需上传 FASTA 格式的核酸或蛋白序列文件(至少 3 条序列)及相应元数据(可自定义,包括采样时间、地点、宿主等),通过一键分析功能提交后,系统即启动溯源分析:首先使用 MAFFT工具(参数--auto)自动选择平衡高速与高精度的最优模型进行高精度多序列比对,生成ALN格式输出文件;随后利用IQ-TREE 2工具,基于广义时间可逆模型(参数- m),通过最大似然法(ML)对ALN比对文件构建系统发育树,并通过bootstrap值评估高精度分支支持率。

SNP 分析工具(图 2C)可识别精细尺度的遗传变异,对区分近缘毒株至关重要;通过iVar软件进行SNP calling,随后通过Gubbins构建核心SNP矩阵。待测序列数量必须超过3条,同时用户可选择上传对应的元数据表,进而使用 IQ-TREE 2构建系统发育树。该工具的结果页面(图 2D)会提供突变位点信息,包括基因组位置、突变碱基、突变氨基酸等。结果文件支持下载。

基因型鉴定工具(图2E)则通过将查询序列与参考序列比对,实现快速准确的病原体识别。参考序列包括327条代表性序列,共覆盖6个基因型(包括:ESCA, ESCA-IOL, African, West African, Asian和Asian-Pacific基因型)。结果页面(图2F)列出了鉴定到的基因型及其对应的参考序列,以及大洲、国家和宿主的分布图。所有这些结果均可通过 “下载” 按钮保存至本地存储。

图2. CHIKVdb 一站式分析平台界面。A.溯源分析系统操作页面。B.溯源分析系统结果展示页面。C. SNP分析操作页面。D. SNP分析结果界面。E. 基因型鉴定工具页面。F. 基因型鉴定结果展示页面。

全球 CHIKV 基因组监测与疫情防控应用

CHIKVdb 通过系统性的数据整合与专业化工具支撑,为全球CHIKV的序列分布、宿主传播、进化溯源等多维度研究提供了关键技术支撑。

在全球序列与宿主特征研究中,平台整合了来自99个国家的8193条 CHIKV序列(含全长与片段)及标准化元数据,构建了结构化的序列与宿主信息库。通过直观的统计概览与交互式筛选功能,研究者可快速获取不同国家的序列分布特征、宿主来源比例等核心数据,为解析区域传播生态学差异提供了数据基础。

针对宿主与时间动态监测,平台的分子监测系统实现了宿主-时间分布的可视化追踪,支持对人类、蚊子、蝙蝠等不同宿主的病毒检出趋势进行长时序分析。其标准化的数据清洗与语义关联流程,确保了跨年份、跨宿主数据的可比性,为识别传播关键节点(如媒介传播循环活跃度、野生动物宿主潜在作用)提供了可靠的数据支撑。

在遗传进化与传播关联研究中,平台集成的溯源分析系统成为核心工具:通过多序列比对、最大似然法进化树构建等功能,支持对高质量序列的遗传分化程度、地理传播关联及宿主适应性进化特征进行快速分析。同时,交互式进化树可视化与时空分布地图联动,助力研究者直观解析毒株区域传播路径、时间演化规律及宿主 - 进化关联,为厘清复杂传播网络提供了一站式分析能力。

综上,CHIKVdb 通过 “数据整合-工具支撑-可视化呈现” 的全流程设计,为 CHIKV 的传播规律解析、防控策略制定等研究提供了高效、精准的技术支撑,成为连接基础研究与公共卫生实践的关键平台。

  • 上一篇:复旦大学姜世勃/陆路团队首创“杠杆疫苗接种”策略,破解“原始抗原原罪”难题
  • 下一篇:巨噬细胞“攻防战”新发现:ROS竟成沙门氏菌“隐身”帮凶
网站声明

1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。

2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。

3、转载请注明:文章转载自www.mbiosh.com

联系方式:020-87680942

评论
全部评论
热门资讯