掌桥专利:专业的专利平台
掌桥专利
首页

一种色谱信号峰偏移对齐方法、装置和设备

文献发布时间:2024-07-23 01:35:21


一种色谱信号峰偏移对齐方法、装置和设备

技术领域

本发明涉及信号处理技术领域,尤其涉及一种色谱信号峰偏移对齐方法、装置和设备。

背景技术

色谱是一种常用的分析技术,用于分离和测定混合物中的化合物。由于其可在分离、定性、定量和结构鉴定等多方面提供有价值的信息,可满足不同领域对化合物分析的需求,因而被广泛应用于化学、生物、环境、食品等多个领域。

色谱技术主要基于样品在色谱柱之间的相互作用,实现混合物化合物的分离,并基于色谱信号中保留时间(RT, retention time)的差异对不同化合物进行定性。然而由于环境条件、气体流速、柱子的老化等因素影响,同一种化合物的保留时间在多次的采样中可能会发生变化,产生峰偏移问题。峰偏移将导致对物质的错误定性,并最终影响谱图的分析结果,因此,将多个样本中相同化合物的色谱峰进行对齐是色谱信号分析的关键步骤。

现有的峰对齐方法是基于传统符号学,即基于一组形式化的数学规则实现峰对齐。这些方法针对特定类型的数据或问题设计,以解决具有明确规则的问题,具有通用性问题和噪声敏感性问题,通用性问题使得方法应用场景受到限制,噪声敏感性问题使得方法稳定性受到影响。因此,解决色谱信号峰偏移对齐方法的通用性问题和噪声名感性问题,是本领域技术人员亟待解决的技术问题。

发明内容

本发明提供了一种色谱信号峰偏移对齐方法、装置和设备,用于解决现有的色谱信号峰偏移对齐方法受到通用性限制和易因噪声敏感影响稳定性的技术问题。

有鉴于此,本发明第一方面提供了一种色谱信号峰偏移对齐方法,包括:

获取标准谱图信号并配置信号峰最大允许偏移量;

基于标准谱图信号和信号峰最大允许偏移量,构建输入为谱图信号,输出为谱图信号每个峰偏移量的归一化预测值的深度卷积神经网络模型,深度卷积神经网络模型包括卷积层、池化层和全连接层,全连接层的激活函数为双正切函数;

对深度卷积神经网络模型进行训练和测试,得到色谱信号峰偏移量检测模型;

将待测谱图信号输入色谱信号峰偏移量检测模型,得到待测谱图信号每个峰偏移量的归一化预测值;

根据待测谱图信号每个峰偏移量的归一化预测值和信号峰最大允许偏移量,对待测谱图信号每个峰进行对齐。

可选地,根据待测谱图信号每个峰偏移量的归一化预测值和信号峰最大允许偏移量,对待测谱图信号每个峰进行对齐,包括:

根据待测谱图信号每个峰偏移量的归一化预测值判断待测谱图信号每个峰的偏移方向;

根据待测谱图信号每个峰的偏移方向,将待测谱图信号每个峰往偏移方向反向移动

可选地,用于深度卷积神经网络模型训练的损失函数为:

其中,

可选地,在深度卷积神经网络模型训练过程中,在卷积层或全连接层之后添加批归一化层。

可选地,在深度卷积神经网络模型训练过程中,在深度卷积神经网络模型的层与层之间添加dropout层。

可选地,使用梯度下降法训练深度卷积神经网络模型的模型参数。

可选地,采用自适应矩估计优化算法调整训练深度卷积神经网络模型学习率和更新模型参数。

本发明第二方面提供了一种色谱信号峰偏移对齐装置,包括:

获取模块,用于获取标准谱图信号并配置信号峰最大允许偏移量;

模型构建模块,用于基于标准谱图信号和信号峰最大允许偏移量,构建输入为谱图信号,输出为谱图信号每个峰偏移量的归一化预测值的深度卷积神经网络模型,深度卷积神经网络模型包括卷积层、池化层和全连接层,全连接层的激活函数为双正切函数;

训练模块,对深度卷积神经网络模型进行训练和测试,得到色谱信号峰偏移量检测模型;

偏移量预测模块,用于将待测谱图信号输入色谱信号峰偏移量检测模型,得到待测谱图信号每个峰偏移量的归一化预测值;

峰对齐模块,用于根据待测谱图信号每个峰偏移量的归一化预测值和信号峰最大允许偏移量,对待测谱图信号每个峰进行对齐。

可选地,峰对齐模块具体用于:

根据待测谱图信号每个峰偏移量的归一化预测值判断待测谱图信号每个峰的偏移方向;

根据待测谱图信号每个峰的偏移方向,将待测谱图信号每个峰往偏移方向反向移动

本发明第三方面提供了一种色谱信号峰偏移对齐设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行第一方面任一种所述的色谱信号峰偏移对齐方法。

从以上技术方案可以看出,本发明提供的色谱信号峰偏移对齐方法具有以下优点:

本发明提供的色谱信号峰偏移对齐方法,利用深度卷积神经网络直接实现从谱图信号到峰偏移量的自动预测,有效地弥补了人为提取谱图特征的缺陷,适用于不同的应用场景,不受通用性限制,同时,深度卷积神经网络模型基于大量的数据训练,对噪声等随机干扰因素的抵抗能力更强,具有更强的稳定性,通过深度卷积神经网络模型输出的峰偏移量的归一化预测值,结合信号峰最大允许偏移量对待测谱图信号每个峰进行对齐,提高了信号峰对齐效果,解决了现有的色谱信号峰偏移对齐方法受到通用性限制和易因噪声敏感影响稳定性的技术问题。

附图说明

为了更清楚的说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例中提供的一种色谱信号峰偏移对齐方法的流程示意图;

图2为本发明实施例中提供的深度卷积神经网络模型的结构示意图;

图3为本发明实施例中提供的深度卷积神经网络模型的全连接层结构示意图;

图4为本发明实施例中提供的根据峰偏移估计值校正RT示意图;

图5为本发明实施例中提供的色谱信号峰偏移对齐方法的对齐效果示意图;

图6为本发明实施例中提供的一种色谱信号峰偏移对齐装置的结构示意图;

图7为本发明实施例中提供的一种色谱信号峰偏移对齐设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了便于理解,请参阅图1,本发明提供了一种色谱信号峰偏移对齐方法的实施例,包括:

步骤101、获取标准谱图信号并配置信号峰最大允许偏移量。

需要说明的是,先确定标准谱图信号,标准谱图信号中有k个谱图峰信号需要关注,保留时间分别为

步骤102、基于标准谱图信号和信号峰最大允许偏移量,构建输入为谱图信号,输出为谱图信号每个峰偏移量的归一化预测值的深度卷积神经网络模型,深度卷积神经网络模型包括卷积层、池化层和全连接层,全连接层的激活函数为双正切函数。

需要说明的是,深度卷积神经网络模型的结构如图2所示,主要为谱图信号编码器和全连接层两部分。谱图信号编码器实现从原始谱图信号到峰信息的提取,全连接层则实现从峰信息到峰偏移量的映射。谱图信号编码器包括卷积层和池化层。

卷积层:包含多个卷积核,输入为原始色谱信号。通过卷积计算处理一维序列数据,分离并提取出谱图中不同位置的峰形曲线。随着层数的增加,卷积核尺寸减小,卷积核数量数量增多。

池化层:对每个卷积核提取的峰信号片段,通过最大池化操作获取峰顶点所在位置。需注意的是此处如使用原始形式的池化层,返回结果实际是峰高信息,此处自定义一个索引池化层,返回的结果是最大值所对应的位置。

全连接层:与传统卷积网络类似,通过卷积层、池化层完成谱图中的峰信息提取后,通过全连接层实现从峰位置信息到峰偏移量的连接。全连接层的结构如图3所示,注意该全连接层输出层的神经元数量为k,对应谱图中的峰数量k,每个神经元的激活值表示对应峰的偏移量。使用双正切函数

对深度卷积神经网络模型输出的每个峰偏移量进行归一化处理,峰偏移量为0表示完全对齐,为-1表示左偏,为1表示右偏。

步骤103、对深度卷积神经网络模型进行训练和测试,得到色谱信号峰偏移量检测模型。

需要说明的是,利用海量的谱图信号样本数据对深度卷积神经网络模型进行训练和测试。对于一个包含k个峰的谱图信号样本,每个峰的实际偏移量记为

其中,

对于训练过程中的任意参数,均可通过梯度下降法训练参数,求使损失函数达到极小的参数收敛值,主要步骤包括:

①为参数设定初始值:权值w和偏置项b;

②前向传播,计算模型预测值

③反向传播,计算损失函数对参数的梯度

④根据梯度更新参数,假设学习率为

对网络层中的所有参数,均可通过上述方法完成训练,求使峰偏移量预测值与真实值最接近的参数。

为避免大量参数导致的收敛过慢问题,参数训练过程采用自适应矩估计优化算法Adam(Adaptive Moment Estimation)。Adam的超参数包括学习率

①在梯度下降过程中,记录对权值w导数dw的一阶指数加权平均

②在训练开始时,初始化

其中,

③最后,在更新权重的过程中,通过引入一阶和二阶矩的指数加权平均估计,对参数的更新值进行修正:

超参数取值如下:学习率

在卷积层或全连接层之后添加批归一化层,以稳定训练过程并加速收敛,并减少梯度消失或梯度爆炸问题。批归一化的过程如下:

①归一化:对于每个特征,批归一化计算其在当前批次(batch)中的均值和方差;

②缩放和偏移:使用这些均值和方差对特征进行规范化,使其具有零均值和单位方差。此外,批归一化引入了两个可学习的参数,用于缩放和偏移规范化后的数据,以便网络可以恢复那些对于学习任务有用的原始分布特征;

③训练过程中的更新:在训练过程中,批归一化根据每个批次的数据更新均值和方差的估计值。

为防止神经网络过拟合,使用随机丢弃的正则化方法减少对训练集的过度依赖。其主要原理是在训练过程中随机移除网络中的一部分神经元及其连接,从而减少网络对于特定训练样本的依赖,并鼓励网络学习更加稳定的特征。在本发明中的深度卷积神经网络模型中,在层与层之间添加dropout层,以提升模型在测试集的表现。

在完成对深度卷积神经网络模型的训练后,利用测试集对深度卷积神经网络模型进行测试。为评估模型性能,在10000例模拟样本中,将80%的样本划分为训练集,20%的样本作为测试集。由于该模型用于预测峰偏移量,为衡量预测偏移量与真实偏移量间的差距,评估指标采用均方误差根(Root Mean Squared Error, RMSE)。已知每个峰的真实偏移量为

步骤104、将待测谱图信号输入色谱信号峰偏移量检测模型,得到待测谱图信号每个峰偏移量的归一化预测值。

需要说明的是,在得到色谱信号峰偏移量检测模型后,将待测谱图信号输入色谱信号峰偏移量检测模型,得到待测谱图信号每个峰偏移量的归一化预测值。

步骤105、根据待测谱图信号每个峰偏移量的归一化预测值和信号峰最大允许偏移量,对待测谱图信号每个峰进行对齐。

需要说明的是,根据待测谱图信号每个峰偏移量的归一化预测值判断待测谱图信号每个峰的偏移方向,如前述的峰偏移量为0表示完全对齐,为-1表示左偏,为1表示右偏。根据待测谱图信号每个峰的偏移方向,将待测谱图信号每个峰往偏移方向反向移动

本发明提供的色谱信号峰偏移对齐方法,利用深度卷积神经网络直接实现从谱图信号到峰偏移量的自动预测,有效地弥补了人为提取谱图特征的缺陷,适用于不同的应用场景,不受通用性限制,同时,深度卷积神经网络模型基于大量的数据训练,对噪声等随机干扰因素的抵抗能力更强,具有更强的稳定性,通过深度卷积神经网络模型输出的峰偏移量的归一化预测值,结合信号峰最大允许偏移量对待测谱图信号每个峰进行对齐,提高了信号峰对齐效果,解决了现有的色谱信号峰偏移对齐方法受到通用性限制和易因噪声敏感影响稳定性的技术问题。

为了对本发明提供的色谱信号峰偏移对齐方法的效果进行体现,本发明中提供了具体的应用例:

数据准备:

使用模拟的谱图信号验证上述模型的对齐效果,使用高斯曲线模型生成峰信号,高斯模型可按如下表示:

其中,h为信号高度,

以一个包含7个高斯峰的谱图作为标准谱图,通过随机生成的值修改参数h,

模型构建与训练:

随机选取8000条谱图作为训练集,剩余2000条谱图作为测试集。根据图2结构构建深度卷积网络模型,以原始谱图作为输入,将模型的目标输出设定为每个峰的归一化偏移量

当一个峰相较于标准谱图左偏T时,相对偏移量为-1;

当RT与标准谱图完全一致时,相对偏移量为0;

当一个峰相较于标准谱图右偏T时,相对偏移量为1。

使用均方误差作为损失函数Loss,衡量峰偏移量估计值与实际峰偏移量的误差。将训练周期epoch设为200,损失函数在训练150次基本达到收敛。

峰对齐效果测试:

通过上述的模型,可以从原始谱图中获取相对于标准谱图的峰偏移量估计值,结合标准谱图中每个峰的已知RT信息,即可校正每个谱图的峰RT,以消除不同谱图间的RT偏移。如图4所示,图中的每个散点表示谱图中的峰RT,假设纵轴是标准谱图,散点在纵轴的坐标值表示峰在标准谱图中的RT时间。

当模型估计的峰偏移量

当模型估计的峰偏移量

图5展示了其中一个谱图的对齐效果,宽峰信号为标准谱图,窄峰信号为存在峰偏移的待校正谱图,图5的上图为未对齐的谱图比较,可以看到待校正谱图相较于标准谱图有明显偏移;图5的下图为峰偏移校正后的效果,可以发现尽管峰高、峰宽和标准谱图存在差异,但7个峰均已标准谱图对齐。

在2000条测试谱图上,使用上述模型估计出每条谱图的峰偏移量,并比较其与真实的峰偏移值的误差。按照谱图中每条谱图偏移量的平均值(左偏或者右偏均取其偏移量的绝对值),对谱图的偏移程度进行划分:①0-25s;②25-35s;③35-50s,并使用均方误差根RMSE评估不同程度的峰偏移谱图下,该回归模型的性能。表1 为峰偏移量效果评估结果。

表1

从表1中不难看出:

①该模型对于存在0-25s内小幅峰偏移的谱图而言,可以准确地估计出峰偏移情况,偏移量预测值与真实值的RMSE稳定在1.11左右;

②对于绝对偏移量在25s-35s范围的谱图而言,该模型同样也可以给出准确的预测值,偏移量预测值与真实值的RMSE稳定在1.33左右;

③相较前两组,该模型对偏移量在35s-50s的谱图的偏移量预测值,与真实值的误差RMSE明显增大。其主要原因是随机生成的数据中,偏移量在35-50s范围的样本量非常少,无论是在训练集中还是预测集中其占比均不足1%。模型对于数量少的样本通常会倾向于给出保守的预测,因此导致了其对极端样本预测效果较差。在实际使用时,需考虑增强数据,扩大极端样本在训练集中的占比,增强模型的泛化能力。

综上所述,基于本发明所实现的色谱信号峰偏移对齐方法,可有效预测谱图中峰的偏移情况实现峰对齐,无需人为实现谱图特征的提取,且不受峰高、峰宽等随机因素的影响,具有较强的鲁棒性。

为了便于理解,请参阅图6,本发明中还提供了一种色谱信号峰偏移对齐装置的实施例,包括:

获取模块,用于获取标准谱图信号并配置信号峰最大允许偏移量;

模型构建模块,用于基于标准谱图信号和信号峰最大允许偏移量,构建输入为谱图信号,输出为谱图信号每个峰偏移量的归一化预测值的深度卷积神经网络模型,深度卷积神经网络模型包括卷积层、池化层和全连接层,全连接层的激活函数为双正切函数;

训练模块,对深度卷积神经网络模型进行训练和测试,得到色谱信号峰偏移量检测模型;

偏移量预测模块,用于将待测谱图信号输入色谱信号峰偏移量检测模型,得到待测谱图信号每个峰偏移量的归一化预测值;

峰对齐模块,用于根据待测谱图信号每个峰偏移量的归一化预测值和信号峰最大允许偏移量,对待测谱图信号每个峰进行对齐。

进一步地,峰对齐模块具体用于:

根据待测谱图信号每个峰偏移量的归一化预测值判断待测谱图信号每个峰的偏移方向;

根据待测谱图信号每个峰的偏移方向,将待测谱图信号每个峰往偏移方向反向移动

进一步地,用于深度卷积神经网络模型训练的损失函数为:

其中,

进一步地,在深度卷积神经网络模型训练过程中,在卷积层或全连接层之后添加批归一化层。

进一步地,在深度卷积神经网络模型训练过程中,在深度卷积神经网络模型的层与层之间添加dropout层。

进一步地,使用梯度下降法训练深度卷积神经网络模型的模型参数。

进一步地,采用自适应矩估计优化算法调整训练深度卷积神经网络模型学习率和更新模型参数。

为了便于理解,请参阅图7,本发明中提供了一种色谱信号峰偏移对齐设备的实施例,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行本发明中提供的色谱信号峰偏移对齐方法。

本发明中提供的色谱信号峰偏移对齐装置和设备,用于执行本发明中提供的色谱信号峰偏移对齐方法,其原理与所取得的技术效果与本发明中提供的色谱信号峰偏移对齐方法相同,在此不再赘述。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 侧信道信号的信号对齐方法及装置
  • 一种声音采集设备及其信号处理方法、装置、设备
  • 工业色谱仪谱峰信号量程切换点信号平滑处理方法
  • 工业色谱仪谱峰信号量程切换点信号平滑处理方法
技术分类

06120116678068