掌桥专利:专业的专利平台
掌桥专利
首页

基于多项式校正去除光谱检测中操作者误差的方法

文献发布时间:2023-06-19 18:34:06


基于多项式校正去除光谱检测中操作者误差的方法

技术领域

本发明涉及光谱检测技术领域,特别涉及一种基于多项式校正去除光谱检测中操作者误差的方法。

背景技术

现有技术中,实验室内常需采用气相色谱-质谱法和外标法测量一些样本中的指标参数。其中,气相色谱-质谱法简称为色谱—质谱分析,气相色谱对有机化合物具有有效的分离、分辨能力,而质谱则是准确鉴定化合物的有效手段;由两者结合构成的色谱—质谱联用技术,可以在计算机操控下,直接用气相色谱分离复杂的混合物(如原油、岩石抽提物)样品,使其中的化合物逐个地进入质谱仪的离子源,可用电子轰击,或化学离子化等方法,使每个样品中所有的化合物都离子化。外标法是与内标法相对,指按梯度添加一定量的标准品(对照品)于空白溶剂中制成对照样品,与未知试样平行地进行样品处理并检测,不同浓度的标准品进样,以峰面积为值绘制成标准曲线,从而推算出未知试样中被测组分浓度的定量方法。

由于国家已经针对上述检测方法指定了相应的标准,因此测试人员可以规范地按照标准对样本进行检测。实际操作时,气相色谱-质谱法和外标法都较为复杂,需要特定的、昂贵的仪器设备,测量过程也比较耗时,不适用于大批量样本的检测。

随着科技的发展,光谱检测技术和机器学习开始逐步被引入到样本检测中。光谱检测技术依据物质与辐射相互作用的性质,一般可分为反射光谱法、吸收光谱法、拉曼散射光谱法等类型;光谱检测技术选择性强、灵敏度高、分析范围广,样品一般不需预处理,操作方便。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科;机器学习已被成功应用于光谱分析领域,支持向量机(Support VectorMachine,SVM)、随机森林(Random Forest,RF)、偏最小二乘法(Partial Least Squares,PLS)和卷积神经网络(Convolutional Neural Networks,CNN)等算法模型受到了业内操作者的广泛认可,如何构建一种基于机器学习的光谱分析技术是急需要解决的问题。同时,光谱测量容易受到某些不可避免的外部因素的干扰,例如测量环境、仪器和操作者,导致光谱分析模型失效;特别是操作者导致的干扰,测量时由于操作者不同引发的的操作者误差是一个普遍存在的问题,严重影响检测效果。

发明内容

本发明的目的在于提供一种基于多项式校正去除光谱检测中操作者误差的方法,能够消除操作者、环境、仪器等引起的误差。

为实现以上目的,本发明采用的技术方案为:一种基于多项式校正去除光谱检测中操作者误差的方法,包括如下步骤:标准操作者获取样本的光谱数据参考值X

与现有技术相比,本发明存在以下技术效果:本方法只需少量校正样本即可缓解操作者误差对光谱分析的影响,并且该方法还有望校准由其他因素引起的光谱分析差异,例如测量仪器或环境;通过该方法可以提升光谱在食品测定、药物鉴定和植物病害检测方面的应用效果,确保了测量结果的准确性。

附图说明

图1是本发明的流程图;

图2是采用自适应多项式校正后的流程图;

图3是本发明应用于山嵛酸光谱分析实验时操作者所采集的反射光谱图。

具体实施方式

下面结合图1至图3,对本发明做进一步详细叙述。

参阅图1,本发明公开了一种基于多项式校正去除光谱检测中操作者误差的方法,包括如下步骤:标准操作者获取样本的光谱数据参考值X

现有技术中,操作人员可以规范地按照标准对样本进行检测从而获得指标参数,但考虑到这种检测方式人力物力成本都很高,且不是很方便。因此提出了通过测量光谱数据,并根据光谱数据来计算指标参数,这种方案测量简单、成本低,但光谱数据的采集有很多不足之处:没有规范的操作流程,不同的操作人员进行采集时会出现操作者误差;测量结果同时还受到环境因素影响。因此,本发明提出了上述基于多项式校正去除光谱检测中操作者误差的方法,该方法中,回归模型主要用于建立光谱数据和指标参数之间的映射关系,k阶校正多项式主要用于消除操作者和环境带来的误差,保证测量结果的准确性。这些步骤,针对某类样本,回归模型只需要构建一次,针对每个新的操作者,需要重新构建一次k阶校正多项式;回归模型和k阶校正多项式确定以后,针对某类样本,当由已建立k阶校正多项式的操作者来说,其只需要按照自己的操作方式测量光谱数据,然后程序会自动对其光谱数据进行处理和校正,进而得到较为准确的指标参数。

进一步地,本发明中的回归模型主要用于构建光谱数据和指标参数的映射关系。所述的回归模型通过偏最小二乘回归算法(Partial Least Squares Regression,可简写为PLSR)、或者支持向量回归算法(Support Vector Regression,可简写为SVR)、或者随机森林算法(Random Forest,可简写RF)、或者卷积神经网络算法(Convolutional NeuralNetworks,可简写为CNN)建立。当然,随着技术的发展,会有越来越多的其他算法也能实现上述功能,其均可以采用,这里列举的只是当下最常用的算法,这些算法都很成熟,本领域技术人员很清楚的知道如何利用这些算法构建回归模型,因此这里不再详细赘述回归模型的构建过程。

进一步地,所述的k阶校正多项式通过如下步骤获得:应用操作者获取同类样本的光谱数据X

式中,x

参阅图2,多项式校正是一种基于预测结果的线性或非线性响应的标定传递方法,用于解决不同环境下的模型迁移问题,校正多项式的系数和偏差很容易拟合,校正多项式的最佳阶数k难以确定,因为k无法直接计算。因此,提出了阶数自适应多项式校正(OAPC)方法。本发明中优选地,所述的根据指标参数参考值Y

下面结合食用植物油中山嵛酸的光谱分析实验对本发明的效果做进一步的说明:

(1)由标准操作者(A组)获取待训练的植物油反射光谱,由应用操作者(B组)获取待分析的植物油反射光谱,所测量的光谱如图3所示,图中以波长为横坐标、反射比为纵坐标,GroupA对应颜色浅灰色曲线,位于多个曲线的偏下位置,GroupB对应颜色较深的曲线,位于多个曲线的偏中上位置。为了消除噪声和其他干扰,应用乘法散射校正对光谱数据进行预处理。采用气相色谱-质谱法和外标法并结合相应的国家测量标准定量测量食用油中的山嵛酸浓度。

(2)采用PLSR、SVR、RF或CNN建立回归模型,并采用确定系数(R

(3)利用Kennard-Stone算法选取有代表性的校正样本,样本的选择比例设置为5%。

(4)利用OAPC和校正样本得到最优的k阶校正多项式参数。

(5)将应用操作者所采集的其他样本光谱输入训练好的回归模型中,再利用最优校正参数对结果进行多项式校正,得到样本光谱的最终分析结果。OAPC对山嵛酸预测结果的影响如表1所示。

表1 OAPC对山嵛酸预测结果的影响

结果表明,使用OAPC后,上述四种模型得到的偏差值变小,因此,OAPC可以缓解操作者误差对光谱分析模型的影响。

进一步地,本发明还公开了一种计算机可读存储介质和一种电子设备,其中一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如前所述的基于多项式校正去除光谱检测中操作者误差的方法。一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如前所述的基于多项式校正去除光谱检测中操作者误差的方法。

相关技术
  • 一种全光谱水质检测中窗口误差校正的测量方法及装置
  • 一种基于离散正交多项式的共相位误差校正方法
技术分类

06120115611320