掌桥专利:专业的专利平台
掌桥专利
首页

一种液态环境微生物浓度的智能检测方法及系统

文献发布时间:2023-06-19 19:27:02


一种液态环境微生物浓度的智能检测方法及系统

技术领域

本发明属于微生物浓度检测技术领域,具体涉及一种液态环境微生物浓度的智能检测方法及系统。

背景技术

病原微生物是威胁人类生命健康的重要因素之一。当病原微生物侵入机体并扩增到一定浓度时,可能对机体产生有害影响,通常会引起相关疾病。例如,幽门螺旋杆菌可引起胃炎和消化性溃疡病,金黄色葡萄球菌可引起机体多种感染,包括脓疱、脓肿、伤口感染、肺炎和食物中毒等,新型冠状病毒可引发肺炎、严重急性呼吸综合征、肾衰竭,甚至死亡。病原微生物广泛存在于医学、日常生活、军事、农业等领域的液态样本中,因此,判断液态样本中是否存在病原微生物,进而进行其浓度的检测至关重要。

通常,病原微生物实验室培养鉴定是最常用的检测方法,但其过于依赖培养环境和培养人员专业技术,耗时耗力,使得快速诊断液态样本是否包含病原微生物及其浓度面临巨大挑战性。例如,普通细菌定性培养需三天,定量及药敏需七天甚至更久,特殊微生物需更长的培养时间。当前,拉曼光谱是科学研究中光谱采集技术的另一种常用方法。但由于拉曼光谱需要使用激光对样本进行激发,因而可能会对样本造成破坏性影响。另外,宏基因组测序是一种新型的精确检测和表征微生物物种的DNA级别的方法,但检测仪器复杂、检测流程繁琐,因此造成检测费用昂贵且比较耗时。

发明内容

针对现有技术中存在的问题,本发明提供一种液态环境微生物浓度的智能检测方法及系统,能够有效提取液态样本高光谱数据的深度特征,很好地实现病原微生物浓度等级的分类以及具体浓度值的检测。

本发明是通过以下技术方案来实现:

一种液态环境微生物浓度的智能检测方法,包括以下步骤:

S1:采集不同浓度等级的多个源域液态样本的初始高光谱数据,并对初始高光谱数据进行位置标定;

S2:对标定后的初始高光谱数据进行坏像素点修复、空间域平滑处理、频谱域平滑处理和光谱数据校准,得到校准高光谱数据;

S3:基于校准高光谱数据进行高光谱超立方体的裁切得到源域数据集,并将源域数据集随机均衡的分成训练验证集,使用K折交叉验证方法将训练验证集划分为一一对应的K个训练集和K个验证集;

S4:在每个训练集上进行多通道联合特征提取、深度特征提取和折内浓度预测,并基于对应折验证集分别选择初始最优浓度检测模型,从而在K折上得到K个初始最优浓度检测模型;基于K个初始最优浓度检测模型通过定性分析和定量分析的集体决策机制,得到最终最优浓度检测模型。

进一步的,所述步骤S2中坏像素点修复是将一些与周围环境对比度异常高的像素替换为坏点两侧相邻列的平均值。

进一步的,所述步骤S2中空间域平滑处理采用二维中值滤波,将像素的值替换为围绕它的小窗口中的中值来去除每个波段的图像中的脉冲噪声。

进一步的,所述步骤S2中频谱域平滑处理采用预设的窗口大小移动平均滤波器以像素级的方式平滑光谱。

进一步的,所述步骤S2中光谱数据校准基于校准函数进行校准,所述校准函数为:

其中,R是校准后的图像,R∈[0,100];I

进一步的,所述步骤S4中多通道联合特征包括频谱、空间和频谱-空间的角度提取不同的特征;所述深度特征采用线性判别分析LDA算法进行提取,所述折内浓度预测采用随机森林算法进行检测;所述定性分析基于软投票机制,定量分析基于小组决策机制。

进一步的,所述定性分析采用软投票机制对五个等级的概率进行集体预测,其中每个浓度等级p[i](i∈[1,5])和预测的等级

进一步的,在所述定量分析中,使用小组决策机制对浓度具体值进行预测;首先,每折都会产生一个浮点类型的结果,记为f

同时计算出K折的集体预测概率p,使用如下公式计算预测浓度值

其中,G为浓度梯度指数向量。

一种液态环境微生物浓度的智能检测系统,包括:

采集模块,用于采集不同浓度等级的多个源域样本的初始高光谱数据,并对初始高光谱数据进行位置标定;

预处理模块,用于对标定后的初始高光谱数据进行坏像素点修复、空间域平滑处理、频谱域平滑处理和光谱数据校准,得到校准高光谱数据;

训练模块,基于校准高光谱数据进行高光谱超立方体的裁切得到源域数据集,并将源域数据集随机均衡的分成训练验证集,使用K折交叉验证方法将训练验证集划分为一一对应的K个训练集和K个验证集;

最优模型模块,用于在每个训练集上进行多通道联合特征提取、深度特征提取和折内浓度预测,并基于对应折验证集分别选择最优浓度检测模型,从而在K折上得到K个最优浓度检测模型;基于K个最优浓度检测模型通过定性分析和定量分析得到浓度集体决策结果。

与现有技术相比,本发明具有以下有益的技术效果:

本发明提供一种液态环境微生物浓度的智能检测方法及系统,采集不同浓度等级的多个源域样本的初始高光谱数据,并对初始高光谱数据进行位置标定;对标定后的初始高光谱数据进行坏像素点修复、空间域平滑处理、频谱域平滑处理和光谱数据校准,得到校准高光谱数据;基于校准高光谱数据进行高光谱超立方体的裁切得到源域数据集,并将源域数据集随机均衡的分成训练验证集,使用K折交叉验证方法将训练验证集划分为一一对应的K个训练集和K个验证集;在每个训练集上进行多通道联合特征提取、深度特征提取和折内浓度预测,并基于对应折验证集分别选择初始最优浓度检测模型,从而在K折上得到K个初始最优浓度检测模型;基于K个初始最优浓度检测模型通过定性分析和定量分析的集体决策机制,得到最终最优浓度检测模型;本申请在多个层次融入了集体智慧思想,并联合频谱域、空间域、频谱-空间域三个通道进行高维特征挖掘,能够有效提取液态样本高光谱数据的深度特征,很好地实现病原微生物浓度等级的分类(定性分析)以及具体浓度值的检测(定量分析);本发明所提出的方法能够克服液态样本特征提取和深度学习模型域迁移的困难,提升浓度检测的准确度、鲁棒性和域泛化能力;相比传统方法具有耗时短、准确性高、成本低、人力投入小的优势。

附图说明

图1为本发明一种液态环境微生物浓度的智能检测方法及系统的流程图;

图2为本发明实施例中液态样本微生物浓度检测模型的生成和使用流程图;

图3为本发明液态样本的高光谱数据获取示意图;

图4为本发明实施例中三种实验场景下五种浓度等级的高光谱曲线,其中图4(a)为HSI-A的高光谱曲线,图4(b)为HSI-B的高光谱曲线,图4(c)为HSI-C的高光谱曲线;

图5为本发明所提出的基于集体智慧的深度学习网络结构图;

图6为本发明ATT-RNN模块网络结构图;

图7为本发明2D-ResNet和3D-ResNet模块网络结构图。

具体实施方式

下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明提供一种液态环境微生物浓度的智能检测方法及系统,如图1所示,包括以下步骤:

S1:采集不同浓度等级的多个源域样本的初始高光谱数据,并对初始高光谱数据进行位置标定;

S2:对标定后的初始高光谱数据进行坏像素点修复、空间域平滑处理、频谱域平滑处理和光谱数据校准,得到校准高光谱数据;

S3:基于校准高光谱数据进行高光谱超立方体的裁切得到源域数据集,并将源域数据集随机均衡的分成训练验证集,使用K折交叉验证方法将训练验证集划分为一一对应的K个训练集和K个验证集;进一步的,源域数据集还随机均衡的分成测试集,其中测试集用于最终最优浓度检测模型的自测试;

S4:在每个训练集上进行多通道联合特征提取、深度特征提取和折内浓度预测,并基于对应折验证集分别选择初始最优浓度检测模型,从而在K折上得到K个初始最优浓度检测模型;基于K个初始最优浓度检测模型通过定性分析和定量分析的集体决策机制,得到最终最优浓度检测模型。

优选的,所述步骤S2中坏像素点修复是将一些与周围环境对比度异常高的像素替换为坏点两侧相邻列的平均值;空间域平滑处理采用二维中值滤波,将像素的值替换为围绕它的小窗口中的中值来去除每个波段的图像中的脉冲噪声;频谱域平滑处理采用预设的窗口大小移动平均滤波器以像素级的方式平滑光谱;光谱数据校准基于校准函数进行校准,所述校准函数为:

其中,R是校准后的图像,R∈[0,100];I

优选的,所述步骤S4中多通道联合特征包括频谱、空间和频谱-空间的角度提取不同的特征;所述检测溶液的浓度采用随机森林算法进行浓度检测;所述K折结果的决策包括定性分析和定量分析。

优选的,所述定性分析采用软投票机制对五个等级的概率进行集体预测,其中每个浓度等级p[i](i∈[1,5])和预测的等级

在所述定量分析中,使用决策小组机制对浓度具体值进行预测;首先,每折都会产生一个浮点类型的结果,记为f

同时计算出K折的集体预测概率p,使用如下公式计算预测浓度值

其中,G为浓度梯度指数向量。

本发明提供一种液态环境微生物浓度的智能检测系统,包括

采集模块,用于采集不同浓度等级的多个源域样本的初始高光谱数据,并对初始高光谱数据进行位置标定;

预处理模块,用于对标定后的初始高光谱数据进行坏像素点修复、空间域平滑处理、频谱域平滑处理和光谱数据校准,得到校准高光谱数据;

训练模块,基于校准高光谱数据进行高光谱超立方体的裁切得到源域数据集,并将源域数据集随机均衡的分成训练验证集,使用K折交叉验证方法将训练验证集划分为一一对应的K个训练集和K个验证集;

最优模型模块,用于在在每个训练集上进行多通道联合特征提取、深度特征提取和折内浓度预测,并基于对应折验证集分别选择初始最优浓度检测模型,从而在K折上得到K个初始最优浓度检测模型;基于K个初始最优浓度检测模型通过定性分析和定量分析的集体决策机制,得到最终最优浓度检测模型。

本发明提供一种实施例,施实例中使用的病原微生物为大肠杆菌ATCC25922,来自中国浙江省宁波明洲生物技术公司。

如图2所示,模型生成流程和模型使用流程均包括样本准备、高光谱数据获取以及模型训练或应用三个阶段。模型生成流程的场景作为本深度学习模型生成和自验证的源域,模型使用流程的场景作为检验所生成模型准确性、鲁棒性和域泛化能力的目标域。以下将分别对模型的生成和使用流程进行介绍。

(1)模型生成流程

在样本准备阶段,源域中溶液浓度分别设置为1.0×105cfu/ml,1.0×106cfu/ml,1.0×107cfu/ml,1.0×108cfu/ml五个浓度等级,1.0×109cfu/ml,记为HSI-A。

高光谱数据获取阶段包含三个步骤:

第一步,使用高光谱相机对样本进行推扫,得到初始的三维高光谱数据。如图3所示,初始高光谱数据是使用高分辨率的高光谱成像系统扫描溶液样本获得的。高光谱成像系统使用Headwall Photonics的Co-Aligned VNIR-SWIR系统。该系统采集的波长范围为900至2500nm的短波红外(SWIR)光谱图像,光谱分辨率为6nm,共产生267个波段,生成的超立方体数据的大小为W×H×L,其中W是每行的像素数,H是行数,L是波段数。

第二步,使用LabelMe软件对初始高光谱数据进行位置标注。由于盛放溶液的六孔板孔的边缘是规则的圆形,并且可以从高光谱图像中清楚地识别,我们直接使用圆形进行手动标记。

第三步,初始高光谱原始数据的处理得到校准高光谱数据,主要包括以下处理:

1)坏像素点修复。在光谱图像中,一些与周围环境对比度异常高的像素的存在被认为是坏像素点。对所有波段的原始高光谱数据进行逐层检查,一旦出现坏像素点就进行修复。修复方法为将坏点替换为坏点两侧相邻列的平均值。

2)空间域平滑处理。为了去除空间域中的噪声,我们选择了二维中值滤波,它可以通过将像素的值替换为围绕它的小窗口中的中值来去除每个波段的图像中的脉冲噪声。

3)频谱域平滑处理。为了减少谱域中的随机噪声,采用窗口大小为5的移动平均滤波器以像素级的方式平滑光谱。平滑函数定义为:

其中P

4)光谱数据校准。由于高光谱系统直接获取的原始数据是反射光信号的强度,每个像素的范围为[0,65535]。通常需要对这些信号数据进行归一化和校准。校准函数为:

其中,R是校准后的图像,R∈[0,100];I

模型训练阶段包含以下两个步骤:

第一步,源域数据集的生成。先在源域进行高光谱超立方体的裁切,将W×H×L超立方体分成小的C×C×L大小的超立方体,得到HSI-A数据集。然后,将HSI-A数据集随机均衡地分成训练集和测试集,比例为7:3。最后,应用一种分层的K-fold交叉验证方法,将该训练集进一步划分为K折训练集和K折验证集,比例为(K-1):1。本实施例中K取值为10。

第二步,在源域HSI-A的训练集中训练本发明所设计的网络结构,在验证集中选择最优模型,在测试集进行模型自测,最终得到液态样本的浓度检测模型。

(2)模型使用流程:

在样本准备阶段,目标域中设置两组溶液来模拟真实场景,一组设有不同于源域的环境变量,包括高光谱相机的扫描方向和六孔板的摆放位置,记为HSI-B,一组在细菌溶液中加入美兰试剂进行染色,记为HSI-C。

高光谱数据获取阶段处理方法与模型生成流程相同。

模型应用阶段包含以下两个步骤:

第一步,目标域数据集的生成。在目标域进行高光谱超立方体的裁切,裁切尺寸与在模型生成流程中相同,得到HSI-B和HSI-C数据集。

第二步,将目标域数据集输入至本方法所生成的浓度检测模型中,检测目标域液态样本的浓度等级和具体浓度值。

如图4所示,不同浓度的光谱曲线在某些波段表现出不规则的差异,从肉眼来看,三种设置中的五种浓度没有表现出特定的模式。因此,这是一个相对复杂的多分类问题,尤其在将模型从源域迁移到目标域数据集时更增加了检测难度。

图5为本发明所设计的深度学习网络结构,它充分模拟了集体智慧思想,以获得群体决策。该结构在三个地方体现了集体智慧的思想。首先,在联合特征提取中,应用了三种不同类型的特征提取模块,从频谱、空间和频谱-空间的角度提取不同的特征,融合三通道特征是集体智慧的一种体现。其次,在折内浓度预测中,应用了随机森林,这是一种集成学习算法,也是集体智慧的一种应用。第三,在集体决策中,将K折结果输入到投票或决策小组机制中,这也是集体智慧的典型应用。

本发明所提出的网络结构主要由三个步骤组成。步骤1是提取多通道联合特征。它接收大小为C×C×L的超立方体,然后将其分别输入至三个并行的通道以同时获取不同类型的特征,三个通道所对应模块分别为:用于提取频谱特征的ATT-RNN模块,用于提取空间特征的2D-ResNet模块,以及用于提取频谱-空间特征的3D-ResNet模块。三个通道分别输出各自提取的特征值,然后这些特征被串联在一起形成联合特征。这三个深度学习模块都是预训练良好的模块,如图6和7所示。步骤2旨在检测溶液的浓度,即多个浓度等级或特定浓度值。首先采用LDA(线性判别分析)算法从联合特征中进一步提取深层特征并降低维度,然后使用RF(随机森林算法)进行浓度检测。最后,步骤三用于做K折结果的决策,包括定性分析和定量分析。

如图6所示,ATT-RNN模块主要包含一个空间平均层和两个双向长短期记忆(BiLSTM)层以及一个注意力(Attention)机制模块。空间平均层将每个波段的空间图像平均到一个点,从而将维度从C×C×L减小到L×1。接下来,使用两层BiLSTM提取光谱特征,因为BiLSTM可以向前和向后学习,因此网络可以长时间记住上下文信息,并更好地学习波段之间的频谱规律。在最后的BiLSTM层中添加了注意力机制使得模型更加关注关键信息。BiLSTM层的输出(256×1)和注意力机制模块组合在一起成为(256×1)特征向量。最后,通过全连接(FC)层实现的分类器或回归器,得到检测结果。

如图7所示,2D-ResNet和3D-ResNet模块都是基于34层ResNet结构,区别在于它们有不同卷积核尺寸。在本发明中,基于ResNet基本结构,我们修改了第一个卷积层的内核大小和连接层的一些超参数,以使其适应我们实验数据的要求。通过一系列残差块,从两个ResNet模块输出两个(512×1)特征向量,最后应用全连接层生成检测结果。

在定性分析中,采用软投票(soft-voting)机制对五个等级的概率进行集体预测。每个浓度等级p[i](i∈[1,5])和预测的等级

在定量分析中,使用决策小组机制对浓度具体值进行预测。首先,每折都会产生一个浮点类型的结果,记为f

然后,与定性分析相似,使用公式(3)计算出K折的集体预测概率p。最后,使用如下公式计算预测浓度值

/>

其中,G为浓度梯度指数向量,在实验中取值为[5,6,7,8,9]。

定量分析实验结果:

表1:定性分析中三种数据集下五种算法的实验结果对比。结果为K折(K=10)的结果,数据的呈现方式是(均值±方差)。其中最好的结果用粗体标记,次优结果用下划线标记,分类准确率低于50%的用方框标记。P-Value是本方法与其他方法之间Kappa值的双尾学生T检验结果。其中,ns:没有显著差异;*:P<0.05;**:P<0.01;***:P<0.001;****:P<0.0001。耗时是在已训练模型上测试每个样本的平均花费时间。五个等级的浓度如下:

等级1:1.0×105cfu/ml,等级2:1.0×106cfu/ml,等级3:1.0×107cfu/ml,等级4:1.0×108cfu/ml,等级5:1.0×109cfu/ml。

从表中可以得出如下结论。首先,本发明所提出的方法相比LDA-RF、ATT-RNN、2D-ResNet和3D-ResNet这四种方法的平均准确率和Kappa值在三个数据集上都取得了最好的性能。其次,本方法在每一类的准确性上相对较为均衡,不存在某一类别分类效果很差的情况,即准确率低于50%。第三,相比其他深度学习方法,本方法的实验结果方差较小,性能比较稳定,鲁棒性高。第四,每种算法的每个样本的平均测试时间都在毫秒范围内,与传统的微生物培养方法相比时间几乎可以忽略不计。因此,实验结果证明,本方法相比其他机器学习方法分类准确性高,相比传统微生物培养方法,用时较少,且无需专业人力投入。

定性分析实验结果:

表2:定量分析中三种数据集下五种算法的实验结果对比。采用MSE(均方误差)作为评估指标。

从表中可以得出,本发明所提出方法在定量分析中仍然具有准确率高、鲁棒性好、域泛化能力强和耗时短的优势。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

相关技术
  • 一种智能控制系统中的天然气浓度检测系统
  • 一种用于智能叉车臂故障的检测系统、检测方法及其处理方法
  • 一种高效环保型浮游微生物检测装置及其微生物检测方法
  • 一种液态奶中微生物总DNA的提取方法
  • 一种检测液态食品中重金属离子浓度的智能检测装置
  • 一种智能便携式医院环境检测终端、环境检测系统及环境检测方法
技术分类

06120115918988