利用拉曼光谱和深度学习快速鉴定致病菌
利用拉曼光谱和深度学习快速鉴定致病菌
单打独斗终有穷尽时
拉曼光谱是一种通过分析光与物质相互作用时的散射现象,来获取物质分子振动、旋转等信息的光谱技术。它广泛应用于材料科学、化学分析和生物医学领域,用于无损检测和鉴定样品的分子结构和成分。但是,部分种类的细菌细胞存在拉曼信号较弱,背景信号复杂存在干扰的情况,鉴定效果较差。这是由于拉曼光谱的散射效率低(~10−8的散射概率),导致细微的光谱差异容易被背景噪声掩盖。因此,为了达到较高的识别精度,需要较高的信噪比(SNRs),这通常要求较长的测量时间,不利于实现高通量的单细胞分析技术。压缩时间成本迫在眉睫。
强强联手方为真英雄
将深度学习与拉曼光谱相结合,可以有效克服传统方法的局限性。深度学习算法能够处理和分析复杂的拉曼光谱数据,自动提取关键特征,从而在低信噪比条件下仍能实现高精度的细菌鉴定和分类。这种结合不仅提高了分析速度和准确性,还减少了对测量时间的依赖,推动了高通量单细胞分析技术的发展。
明心见性是为真本我
与传统的深度卷积神经网络(CNN)模型不同,研究并未没有使用池化层,而是选择使用跨行卷积。在CNN中,使用跨行卷积代替池化层可以实现下采样,同时更好地保留空间信息。同样使用跨行卷积代替池化层可以有效保留拉曼光谱中峰的确切位置。这种方法通过直接在卷积操作中减少空间维度,避免了池化层可能带来的信息损失,从而更精确地保留了重要的光谱特征。跨行卷积通过可学习的权重实现降采样,简化网络结构并增强模型性能,但也可能增加计算量和过拟合的风险,在建模中明确自己的需要从而取舍才是最重要的。本研究的CNN架构是由25个一维卷积层和残差连接组成,它以一维光谱作为输入,而不是二维图像。研究参考数据集包括30个细菌和酵母菌分离株,包括革兰氏阴性和革兰氏阳性细菌的多个分离株,以及念珠菌种。参考训练数据集则由30个参考分离物的2000个光谱和3次测量的等基因MSSA组成。前期处理为了保持数据集之间的信噪比一致,研究将微调、测试和第二临床数据集的测量时间从1 s增加到了2 s。将样品进行拉曼测量后,根据计算的信噪比值对光谱进行排序,排除最有可能是非单层测量的光谱,并丢弃强度最高的25个光谱。使用的CNN架构改编自Resnet架构,它旨在解决深层神经网络训练中的梯度消失问题。它通过引入残差连接(skip connections),允许输入直接跳过一个或多个卷积层,将原始输入信息加到后续层的输出上。这种架构使得网络能够更容易地学习恒等映射,从而加快训练并提高深层网络的性能。将CNN的输出转化为30个类别的概率向量,并将最大概率作为预测类。二元MRSA/MSSA和二元等基因MRSA/MSSA分类器与30分离分类器具有相同的结构。由于光学系统长时间工作带来的测量变化,可以通过微调各项参数来避免。样本数据库的丰富度大大提高了该模型的精准度。
真金不怕火炼
通过对模型的物种鉴定和抗生素性能测试,发现该模型的精准度为:物种鉴定水平的准确率为82.2±0.3%,抗生素分组水平的准确率为97.0±0.3%。除了2%的MRSA 2被错误分类为P. aeruginosa 1和1%的链球菌被错误分类,其他的菌种都可以被该模型准确的鉴定出来。同时研究还使用使用Welch 's双样本t检验来检验CNN与SVM和LR基线的平均临床准确性差异是否具有统计学意义,结果是可观的。研究为我们打开了一种新的思路,未来质谱、核磁共振(NMR)等技术都有很大的可能与深度学习相结合,通过这种融合,能够更高效地处理复杂的光谱数据,提取关键特征,进一步提升分子鉴定、结构解析等领域的精度和速度。这种跨学科的结合有望推动科学研究和临床诊断的发展,为解决更多实际问题提供强有力的工具。
原文doi:https://doi.org/10.1038/s41467-019-12898-9
上一篇:重要突破! 我国科研人员发现能强效抑制艾滋病病毒的纳米抗体
下一篇:广微所:快速定向识别产米酵酸细菌,为国民食品安全保驾护航!
1、凡本网所有原始/编译文章及图片、图表的版权均属微生物安全与健康网所有,未经授权,禁止转载,如需转载,请联系取得授权后转载。
2、凡本网未注明"信息来源:(微生物安全与健康网)"的信息,均来源于网络,转载的目的在于传递更多的信息,仅供网友学习参考使用并不代表本网同意观点和对真实性负责,著作权及版权归原作者所有,转载无意侵犯版权,如有侵权,请速来函告知,我们将尽快处理。
3、转载请注明:文章转载自www.mbiosh.com
联系方式:020-87680942