掌桥专利:专业的专利平台
掌桥专利
首页

一种基于机器学习的藕粉产地判别方法

文献发布时间:2023-06-19 12:22:51


一种基于机器学习的藕粉产地判别方法

技术领域

本发明涉及食品分析领域,特别是一种基于机器学习的藕粉产地判别方法。

背景技术

藕粉,是我国传统的保健食品,藕粉及其相关产品深受国内外消费者的喜爱和食品研究者的关注。莲藕中含有多巴、儿茶酚、没食子酸、儿茶素,是一种具有开发价值的天然抗氧化剂。随着食用藕粉的不断推广,市场份额不断扩大,藕粉的品质面临以下问题:由于不同产地的莲藕品质不一,需对高品质产地和低营养产地的藕粉样品实现有效鉴别。因此,有效鉴别藕粉产地对维护消费者权益、保障合理市场秩序具有重要意义。传统检测藕粉产地的技术有其局限性,通过外观鉴别的方法存在主观性强、误差大的缺点;差示扫描量热法对于实验条件的选择要求高,选择不同的实验条件对结果有很大影响,实验人员必须掌握足够的经验,在应用的广泛性上存在不足。因此,开发一种无损、方便、高效的藕粉产地辨别方法非常有意义。

综上所述,为了拓展藕粉品质检测在食品领域中的应用,急需开发一种快速、简单的鉴别藕粉产地的方法。

发明内容

有鉴于此,本发明的目的是提供一种基于机器学习的藕粉产地判别方法,能够简单、快捷地检测出藕粉的产地归属。

本发明采用以下方案实现:一种基于机器学习的藕粉产地判别方法,包括以下步骤:

步骤S1:于网上购得不同产地的鲜藕,制备纯藕粉;

步骤S2:不同产地藕粉样品的制备,供上机使用;

步骤S3:采集不同产地藕粉样品的光谱数据;

步骤S4:基于步骤S3获得的光谱数据,以此建立用于预测的机器学习分类模型;

步骤S5:基于步骤S4建立的分类模型,对待测藕粉样品进行产地预测。

进一步地,步骤S1中所述网上购得鲜藕来自多个产地,纯藕粉的制备按照GB/T25733-2010中规定的工艺流程进行。

进一步地,所述步骤S2中将多个产地的藕粉置于电热恒温鼓风干燥箱60℃中自然烘干,用研钵进行研磨,接着过60目筛,每个产地的样品分为20份,依次编号,保存备用。

进一步地,步骤S3中采用ANTARISⅡ傅里叶变换近红外光谱仪采集不同产地藕粉样品的近红外光谱数据。

进一步地,所述步骤S4的具体内容为:

采用一阶导数、标准正态变换(SNV)、多元散射校正(MSC)3种方法对原始光谱进行预处理,并用相关系数法提取特征波长,最后建立了偏最小二乘判别分析(PLS-DA)、线性判别分析(LDA)以及支持向量机(SVM)3种机器学习分类器。

进一步地,所述步骤S5的具体内容为:

取待测藕粉样品,约5g,对样品进行烘干、研磨、过筛,然后用傅里叶变换近红外光谱仪采集其近红外光谱,将所得光谱数据进行预处理与特征波长提取,最后将待测藕粉样品的特征波长信息输入训练好的PLS-DA、LDA或SVM模型,模型会预测出该待测藕粉样本属于哪个产地,并将其作为输出。

与现有技术相比,本发明具有以下有益效果:

本发明通过采集不同产地的藕粉样品的近红外光谱数据,作为原始的数据集,以此建立PLS-DA、LDA及SVM模型,模型能有效识别出藕粉样品的产地归属。该方法检测简单、快捷,可以显著提升检测效率,为简化藕粉品质鉴别提供新的方法,具有很强的实用性和广阔的应用前景。

附图说明

图1为本发明实施例的一种基于机器学习的藕粉产地判别方法流程图。

图2为本发明实施例的不同产地藕粉样品的原始光谱图。

图3为本发明实施例的不同方法预处理后的藕粉样品光谱示意图,其中,图3(a)为一阶导数图,图3(b)为SNV图,图3(c)为MSC图。

图4为本发明实施例的相关系数图,其中,图4(a)为原始光谱与产地类别的相关系数图,图4(b)为一阶导数处理过后的光谱与产地类别的相关系数图,图4(c)为SNV处理过后的光谱与产地类别的相关系数图,图4(d)为MSC处理过后的光谱与产地类别的相关系数图。

图5为本发明实施例的特征波长可视化示意图,其中,图5(a)为原始光谱图,图5(b)为一阶导数图,图5(c)为SNV图,图5(d)为MSC图。

图6为本发明实施例的主成分分析得分图。

图7为本发明实施例的建立的PLS-DA模型。

图8为本发明实施例的建立的LDA模型。

图9为本发明实施例的建立的SVM模型。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示,本实施例提供一种基于机器学习的藕粉产地判别方法,包括以下步骤:

步骤S1:于网上购得不同产地的鲜藕,制备纯藕粉;

步骤S2:不同产地藕粉样品的制备,供上机使用;

步骤S3:采集不同产地藕粉样品的光谱数据;

步骤S4:基于步骤S3获得的光谱数据,以此建立用于预测的机器学习分类模型;

步骤S5:基于步骤S4建立的分类模型,对待测藕粉样品进行产地预测。

在本实施例中,步骤S1中所述网上购得鲜藕来自多个产地,纯藕粉的制备按照GB/T 25733-2010中规定的工艺流程进行。

在本实施例中,所述步骤S2中将多个产地的藕粉置于电热恒温鼓风干燥箱60℃中自然烘干,用研钵进行研磨,接着过60目筛,每个产地的样品分为20份,依次编号,保存备用。

在本实施例中,步骤S3中采用ANTARISⅡ傅里叶变换近红外光谱仪采集不同产地藕粉样品的近红外光谱数据。

在本实施例中,所述步骤S4的具体内容为:

采用一阶导数、标准正态变换(SNV)、多元散射校正(MSC)3种方法对原始光谱进行预处理,并用相关系数法提取特征波长,最后建立了偏最小二乘判别分析(PLS-DA)、线性判别分析(LDA)以及支持向量机(SVM)3种机器学习分类器,模型最终的分类精度均为100%。

在本实施例中,所述步骤S5的具体内容为:

取待测藕粉样品,约5g,对样品进行烘干、研磨、过筛,然后用傅里叶变换近红外光谱仪采集其近红外光谱,将所得光谱数据进行预处理与特征波长提取,最后将待测藕粉样品的特征波长信息输入训练好的PLS-DA、LDA或SVM模型,模型会预测出该待测藕粉样本属于哪个产地,并将其作为输出。

较佳的,在本实施例中,

(1)于网上购得不同产地的鲜藕,制备纯藕粉。

在本实施例中,鲜藕来自5个不同产地(福建、湖北、四川、山西、河南),纯藕粉的制备按照GB/T 25733-2010中规定的工艺流程进行。

(2)不同产地藕粉样品的制备,供上机使用。

在本实施例中,将5个产地的藕粉置于电热恒温鼓风干燥箱(60℃)中自然烘干,用研钵进行研磨,接着过60目筛,每个产地的样品分为20份,依次编号,保存备用。

(3)采集不同产地藕粉样品的光谱数据。

在本实施例中,采用ANTARISⅡ傅里叶变换近红外光谱仪采集藕粉样品的近红外光谱。

(4)基于步骤(3)获得的光谱数据,以此建立用于预测的机器学习分类模型。

在本实施例中,采用一阶导数、SNV、MSC等3种方法对原始光谱进行预处理,并用相关系数法提取特征波长,最后建立了PLS-DA、LDA以及SVM等3种机器学习分类器,模型最终的分类精度均为100%。

(5)基于步骤(4)建立的分类模型,对待测藕粉样品进行产地预测。具体方法为:

取5g左右的待测藕粉样品,用傅里叶变换近红外光谱仪采集其近红外光谱,将光谱数据导入预先编写好的程序中,程序会自动对光谱进行预处理与特征波长提取,最后将藕粉的特征波长信息输入训练好的PLS-DA、LDA及SVM模型,模型会预测出该藕粉样品属于哪一个产地,并将其作为输出。

下面对本实施例作进一步说明。

1、如图2所示为不同产地藕粉样品在4000~10000cm

2、由图2可看出,藕粉样品的近红外原始图谱中含有较多噪声,这会对模型的准确性造成干扰,现采用一阶导数、SNV、MSC等3种方法对原始光谱进行预处理,降低噪声,提高信噪比,如图3所示。

3、采用相关系数法提取特征波长,如图4所示分别为原始光谱、一阶导数、SNV以及MSC处理后的相关系数图,从图中可以看出,经过预处理后相关系数明显提高,说明光谱数据预处理很有必要。设置分割阈值为0.9,在图中用两条分割直线进行分割,截取相关系数图中正负两侧大于0.9的波数,相关系数绝对值大于0.9的波长用“*”标记,即为筛选出用于建模的特征波长变量。

4、统计不同预处理方法下,相关系数绝对值大于0.9的波长点数,结果见表1所示。

表1不同预处理方法结果对比

由表1可知,原始光谱的的特征波长点数为0,一阶导数预处理后光谱的特征波长点数为38,SNV预处理后光谱的特征波长点数为303,MSC预处理后光谱的特征波长点数为305。因此,选择MSC作为光谱的最佳预处理方法。最后,在原始光谱图中,用红色线条对不同预处理方法提取到特征波长进行标注,结果如图5所示。

5、为了对不同产地的藕粉有个更直观的认知,构建了主成分分析模型,观察其空间分布,如图6所示。模型中前三个主成分的贡献率分别为85.8282%、96.0595%、97.538%,说明前三个特征值可以代表光谱集合。从图中可以看出,5个产地的藕粉样品集中4个区域,但是河南和山西产地的藕粉出现了聚集现象,说明需要进一步建立模型去区分它们。

6、采用PLS-DA算法建立分类模型,结果如图7所示。从图中可以看出,同一产地的藕粉相互聚集,不同产地的藕粉区别非常明显,尤其是河南和山西产地的藕粉,在主成分分析模型中较难区分,但在PLS-DA分类器中具有明显的区分度,最终5个产地的藕粉样品的识别正确率为100%,分类效果满意。

7、随机取200条光谱用作训练集,剩余100条光谱用作测试集,建立LDA分类器,结果如图8所示。横坐标代表测试集样本编号:0~100,每个类别中随机选取20个样本作为测试集,纵坐标代表测试集样本类别:5个类别,“1”代表四川,“2”代表山西,“3”代表河南,“4”代表湖北,“5”代表福建。从图中可以看出,模型分类精度为100%。

8、随机取200条光谱用作训练集,剩余100条光谱用作测试集,建立基于RBF核函数的SVM分类器,结果如图9所示。横坐标代表测试集样本编号:0~100,每个类别中随机选取20个样本作为测试集,纵坐标代表测试集样本类别:5个类别,“1”代表四川,“2”代表山西,“3”代表河南,“4”代表湖北,“5”代表福建。从图中可以看出,模型分类精度为100%。

最后,就可以用得到的机器学习分类模型对未知藕粉样品进行产地归属判别了。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

相关技术
  • 一种基于机器学习的藕粉产地判别方法
  • 一种基于Python数据融合的藏药全缘叶绿绒蒿产地判别方法
技术分类

06120113269444