MALDI-TOF MS预测细菌耐药性靠谱吗?——来自不同医院与时间跨度的真实世界考验
MALDI-TOF MS预测细菌耐药性靠谱吗?——来自不同医院与时间跨度的真实世界考验
严重感染中,尽早启动有效抗菌治疗是降低病死率的关键,但传统药敏试验往往需要数十小时,成为精准用药的主要限制环节。近年来,机器学习结合全基因组测序预测细菌耐药性逐渐兴起,不过WGS的成本和周转时间仍难以满足常规微生物实验室的需求。相较之下,MALDI-TOF质谱已在各级医院广泛用于细菌鉴定,获取谱图本身并不增加额外负担,如果能在现有鉴定流程基础上,从同一张质谱图中推断耐药表型,就有望相对传统流程提前提供药敏相关信息,为临床用药提供辅助参考。既往研究表明,基于MALDI-TOF谱图和机器学习的模型,在多个“菌-药”组合上已取得中等偏好的预测性能,但多数工作局限于单中心、特定时间段的数据,缺乏对模型可推广性和长期稳定性的系统检验。不同医院和地区在质谱仪器与维护状态、流行克隆群和耐药机制、菌群谱和用药压力等方面存在显著差异,同一中心内部随时间推移菌株构成也会不断演化,这些因素都可能影响模型在“跨中心迁移”和“时间外推”情境下的表现。因此,有必要基于大规模真实临床数据,系统评估基于MALDI-TOF的耐药预测模型在不同医院与不同时间段中的性能变化,明确其对本地数据的依赖程度及重训练频率,为其能否作为可推广、可维护的临床决策支持工具提供证据基础。基于此背景,Niklas Wiesmann等人从两个维度来回答这个问题:医院(空间)和时间。
在空间维度上,研究收集了(1)本地数据:德国某大学医院2023–2025年的真实临床数据;(2)瑞士公开DRIAMS-A数据集(2015–2018年,瑞士巴塞尔大学医院),以3个重要病原体:大肠杆菌、肺炎克雷伯菌、金黄色葡萄球菌,以及耐药率≥10%的常见抗生素组合作为研究对象,对两边数据都用同一套MALDI-TOF预处理流程(和DRIAMS一致),提取6000维质谱特征(图1)。在每个数据集上分别训练多种模型(LR、RF、XGB、LGBM、SVM、MLP),做四种组合:(1)DRIAMS作为训练集和测试集;(2)本地数据作为训练集和测试集;(3)DRIAMS作为训练集,本地数据作为测试集;(4)本地数据作为训练集,DRIAMS作为测试集。结果显示,在各自医院内部,对某些菌–药组合(如金黄色葡萄球菌–OXA、大肠杆菌–CIP、肺炎克雷伯菌–TZP),最优模型AUROC可达约0.8,说明“在同一家医院、同一时间段内,本地训练的模型是有实用潜力的”(图2)。一旦换医院、换国家(即用瑞士模型去预测德国数据,或反过来),所有菌–药组合的性能普遍明显下降,AUROC通常下滑0.07–0.22不等(图3)。由此说明,MALDI-TOF+机器学习的耐药预测高度依赖本地数据,跨医院“通用模型”的效果明显打折,不能指望直接拿别的中心的模型来用。
在时间维度上,作者只看德国本地数据:用2023年的样本训练一个“固定模型”,不再更新;然后按时间顺序在后续约18个月的数据上测试(例如2024上半年、2024下半年、2025上半年),观察AUROC/AUPRC随时间的变化。结果显示,即使在同一个医院,模型性能也会随时间逐步下降:某些菌–药组合AUROC降幅可达约0.1–0.2甚至更高(图4)。很多情况下,耐药率本身并没有发生同等幅度的剧烈变化,说明性能下降不单纯是类别不平衡的问题,更可能与:流行克隆型更替、耐药机制谱的变化、菌群结构缓慢漂移等“隐性演化”有关。由此显示,即便在单中心,本地模型也不是“一训就够”,需要建立持续监测与定期重训机制(例如半年左右更新一次),才能维持临床可用的预测性能。
总的来说,基于MALDI-TOF质谱数据的机器学习模型在预测部分关键“菌–药”组合的耐药性方面具有较好的整体表现,有望作为加速耐药性判读的一种技术路径。然而,模型对医院和时间高度敏感,难以做到一次训练、跨中心长期通用。要想真正用于临床,这类模型更适合作为需要依托本地数据、按一定周期持续更新的“本地化工具”,而不是可以到处拷贝、长期不动的标准化成品。
图1 数据处理与建模流程示意图。(a)以临床常规检测获得的MALDI-TOF质谱图(MS)及相应的药敏结果为基础,构建研究数据集。首先从约27,000条谱图中筛选出三种目标菌种的,并进行二值化耐药标记处理,最终形成约15,000条样本。(b)建立六步预处理流程,对原始质谱数据进行处理并转换为6,000维特征向量,作为机器学习模型的输入。(c)开展模型开发、超参数优化与性能评估:采用10次随机8:2训练–测试集划分,在每次训练集中进一步进行5折交叉验证,用于选择最优模型配置并评估分类性能。
图2 不同机器学习模型在三种主要菌种及相应抗菌药物上的预测性能比较。
图3 机器学习模型的跨中心验证结果。热图展示了各类机器学习模型在不同数据集之间进行交叉验证时的预测性能。模型分别在两个互不相关的数据集上进行训练:德国单中心的本研究数据集与瑞士DRIAMS-A数据集。图中以AUROC(取10次随机训练–测试划分中最佳模型的平均值)表示不同学习器在三种菌种–抗菌药物组合上的预测表现,用于比较“在本地数据训练、外部数据测试”与“在外部数据训练、本地数据测试”等不同训练–测试数据配对方式。
图4 训练分类器随时间推移的预测性能变化。针对每一种“菌种–抗菌药物”组合,模型均仅使用2023年1月至2023年12月期间的样本进行训练。随后,将2023年中AUROC表现最优的模型固定不变,依次在三个前瞻性的半年期数据集上进行评估(2024年1–6月、2024年7–12月、2025年1–6月)。曲线给出了10次随机训练–测试划分中“最佳模型”的平均性能及标准差:实线表示AUROC,虚线表示AUPRC。
上一篇:实验提速必备!这款“无菌即用”的TSB培养基彻底解放你的双手
下一篇:水质检测再升级!这款“即用型”培养液让大肠菌群检测省时又省力
1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。
2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。
3、转载请注明:文章转载自www.mbiosh.com
联系方式:020-87680942

