掌桥专利:专业的专利平台
掌桥专利
首页

基于高光谱成像深度分析的白芷饮片质量预测方法

文献发布时间:2023-06-19 11:32:36


基于高光谱成像深度分析的白芷饮片质量预测方法

技术领域

本发明涉及中药质量检测技术领域,具体涉及一种基于高光谱成像深度分析的白芷饮片质量预测方法。

背景技术

中药凭借其完整的体系和良好的治疗效果在全球传统医学中独树一帜、应用广泛。同时,中药治疗过程中的安全性事件也引起了全球的密切关注,产品质量合格、规范和标准等问题尚待解决。白芷是伞形科植物白芷或杭白芷的干燥根,属于伞形科当归属植物。因其具有解热、抗菌、镇痛、抗肿瘤以及消炎等多种药理作用,常用于治疗感冒头痛、鼻塞流涕、牙痛、肠炎以及肝炎等症。白芷主要活性成分为香豆素类的欧前胡素和异欧前胡素,对于欧前胡素的质量研究是白芷质量控制中的重要一项。目前,对白芷饮片中欧前胡素含量检测的研究以高效液相色谱法手段为主。然而,这样的传统质量控制方法大都需要经过有机溶剂的前处理才能对样本进行检测,不仅可能会影响待测样本理化性质,而且需要花费大量人力物力,也不能获取大规模样本的信息。进一步寻找和使用快速、绿色以及能够大规模科学获取中药材信息的检测方法是当代中药产业发展并和国际接轨的迫切需求。

高光谱成像(Hyperspectral Image,HSI)技术融合了传统的成像技术以及光谱技术的优点,不仅能够获取样本的空间信息还能够获取样本的原子、分子光谱等信息,是一种能够同时分析样品的化学性质和物理性质的强大而独特的技术,用于捕获样本中的某成分的空间分布。该技术不仅对环境友好,也降低了有机溶剂对中药有效成分产生不良影响的可能性,效率高且仪器操作难度低,能实现在线监测。

目前,高光谱在中药领域的研究还比较少,大都以分类为主,定量分析较少。在测量样本光谱数据的过程中,容易受到仪器或环境的影响产生一些噪声。更多地,采集样本的光谱信息时,是一整个连续的波长范围的信息,包含数百甚至上千个光谱数据。大量冗余的信息可能影响分析结果。因此,将HIS技术应用于白芷饮片中欧前胡素含量检测,通过选择有效的光谱特征波段,建立准确有效的光谱数据与测试样本期望属性之间的深度学习模型进行多变量数据分析,是亟需解决的问题。

发明内容

为了通过从共线性和含噪声的光谱数据与建立期望属性之间的关系,进行制剂含量的定性和定量分析,本发明提出一种基于深度置信网络(Deep Belief Net,DBN)的白芷饮片中欧前胡素含量预测的方法。该方法充分利用深度学习方法DBN的特征学习能力优势,建立有效的预测模型对白芷饮片中欧前胡素含量实现快速、准确的检测。

本发明解决其技术问题所采用的技术方案是:

一种基于高光谱成像深度分析的白芷饮片质量预测方法,所述方法包括以下步骤:

步骤1)获取白芷粉末样品

首先获得白芷饮片样本,然后用粉碎机粉碎白芷饮片样品,粉末过筛,收集白芷细粉末用于高光谱信息的采集。

步骤2)获取白芷粉末样品的数据信息

收集白芷细粉末用于高效液相色谱法的欧前胡素含量测定和高光谱信息的采集,从而获取多个白芷样本的不同红外波长下光谱反射率值。

步骤3)高光谱数据预处理

在测量样本光谱数据的过程中,容易受到仪器或环境的影响产生噪声;在建立定性或定量模型分析时,采用能够消除光谱数据的噪声以及基线漂移的预处理方法。

步骤4)特征波段选择与异常样本剔除,准备建模数据集

首先,对高光谱数据进行特征波段选择以去除冗余信息并提取有效特征;之后,光谱数据预处理并剔除掉其中的异常样本,将剩余的样本用于后续研究;最终,取每个样本的反射率值作为预测模型的输入变量,欧前胡素含量作为输出变量,形成方法建模用的数据集。

步骤5)划分数据集并建立预测模型

将全部的高光谱数据划分为训练集和测试集。预测模型包括底层深度特征提取的DBN架构与监督学习的反向传播神经网络(BPNN)的顶层架构用于实现回归预测;为了寻找高效的预测模型,选择全波段和不同特征选择方法挑选的特征波长进行建模。

步骤6)模型表现评估

采用预测集相关系数(R

进一步,所述步骤2的过程为:

步骤2.1:高效液相色谱法检测

A、对照品溶液的制备:称定欧前胡素对照品10.93g,加入1mL甲醇制成欧前胡素对照品溶液;B、供试品溶液的制备:称定白芷样品粉末0.4000g,放置于50mL的容量瓶中,加入45mL甲醇,超声处理l小时。将容量瓶取出,待室温下放冷,加入甲醇至容量瓶刻度,摇匀,置于0.25m的微孔滤膜过滤,取续滤液;C、液相色谱仪色谱条件:色谱柱为CAPCELL PAK C18,流动相为甲醇-水,检测波长为300nm;分别精密吸取对照品溶液与供试品溶液各20L,注入高效液相色谱液,测定。

步骤2.2:高光谱成像获取白芷样品高光谱信息

黑白图像校正后,将白芷粉末样品同一水平放置于电控位移平台上。电控移动平台移动速度为16mm/s,工作距离为20.5cm,曝光时间为4ms,按照上述参数条件采集在874-1734nm范围内的高光谱数据信息。

进一步,所述步骤3的过程为:

步骤3.1:数据去噪

平滑算法能够在不减少变量数目的前提下减少数据中的噪声。采用移动平均平滑算法对光谱数据进行去噪。

步骤3.2:基线校正和标准化算法

基线校正算法用于通过将数据调整到数据中的最小点或根据两个用户定义的变量进行线性校正来调整光谱偏移。标准化算法是一组按采样方式进行计算的变换处理方法。变量标准化通过对每个单独的光谱进行缩放来消除散射效应。变量标准化一般用于消除被测样品表面散射等因素所带来的误查。

进一步,所述步骤4的过程为:

步骤4.1:特征波段的提取

分别采用随机蛙跳(RF)、竞争性自适应重加权抽样(CARS)、蒙特卡罗无信息变量消元法(MC-UVE)、基于反向传播神经网络的平均影响值(MIV-BP)算法提取特征波段,后续根据不同的特征波段建模以选择最优的建模特征组合。

步骤4.2:异常样本剔除方法

采用蒙特卡罗方法对异常样本进行检测,并从数据集中删除,将剩余的样本组合成数据集。

进一步,所述步骤5的过程为:

步骤5.1:数据集归一化

为了加快模型的训练速度,对光谱数据进行最大最小归一化处理,具体公式如下所示:

式中表示x′归一化后得到的样本数据;x表示通过测量数据,x

步骤5.2:采用Kennard-Stone(KS)方法划分数据集

KS划分步骤为:假设有一个矩阵,行为样本,作为样本的参数列出,Kennard-Stone算法将从中选择预定数量的样本。(a)首先计算两个样本之间的距离,然后选择距离最大的两个样本;(b)然后分别计算剩余样本与两个选定样本之间的距离;(c)对于每个剩余的样本,选择距所选择的样本最短的距离,然后选择与这些最短距离中的最长距离相对应的样本作为第三样本;(d)重复步骤(c),直到选择的样本数量等于预先确定的数量。

由于模型预测时,超参数为固定值,故未分离部分数据作为验证集,使得训练集的数据更加充分。

步骤5.3:建立基于BPNN的DBN预测模型DBN-BP

DBN是一个概率生成模型,主要由用于接收输入的显性神经元和用于提取特征的隐性神经元构成,生成模型是建立一个观察数据和标签之间的联合分布。通过训练其神经元间的权重,能够让整个神经网络按照最大概率来生成训练数据。在DBN的最后一层设置BPNN,接收受限玻尔兹曼机的输出特征向量作为它的输入特征向量,有监督地训练(又称监督学习,是一个机器学习中的方法)实体关系分类器。而且每一层玻尔兹曼机网络只能确保自身层内的权值对该层特征向量映射达到最优,并不是对整个DBN的特征向量映射达到最优,所以BPNN接收玻尔兹曼机的输出特征向量作为其输入特征向量将错误信息自顶向下传播至每一层玻尔兹曼机,微调整个DBN网络,直到达到全局最优。

构建好DBN-BP网络模型,在根据RF、CARS、MC-UVE、MIV-BP算法选择的特征波长以及全波长数据集上分别测试,选择最佳性能的预测模型。

进一步,所述步骤6的过程为:

回归分析模型评价指标是预测集相关系数(R

式中x

本发明的有益效果主要表现在:本发明利用深度置信网络与多样化高光谱图像的波长特征选择方法结合进行建模,找到最高效的预测模型,以便于能够对多种白芷饮片中欧前胡素含量进行快速量化,有助于辅助产品分级和生产决策。

附图说明

图1是本发明的深度置信网络欧前胡素预测;

图2是本发明基于全波长测试集欧前胡素含量预测直线拟合图;

图3是本发明基于全波长测试集欧前胡素含量预测直线拟合图;

图4是本发明基于MIV-BP特征波长选择的DBN模型欧前胡素含量预测结果对比图;

图5是本发明基于MIV-BP特征波长选择的DBN模型欧前胡素含量预测直线拟合图。

具体实施方式

下面结合附图对本发明作进一步描述。

参照图1~图2,一种基于高光谱成像深度分析的白芷饮片质量预测方法,所述方法包括以下步骤:

步骤1、获取白芷粉末样品

首先获得白芷饮片样本,然后用高速多功能粉碎机粉碎白芷饮片样品1分钟,粉末过三号筛。收集白芷细粉末用于高光谱信息的采集。为了获取较大欧前胡素含量浓度范围的白芷粉末样品,建立普适性更好的模型,部分白芷粉末样品进行了潮解处理。

步骤2、获取白芷粉末样品的数据信息

收集白芷细粉末用于高效液相色谱法的欧前胡素含量测定和HIS的高光谱信息的采集,从而获取多个白芷样本的不同红外波长下光谱反射率值。

步骤2.1:高效液相色谱法检测

A、对照品溶液的制备:精密称定欧前胡素对照品10.93g,加入1mL甲醇制成欧前胡素对照品溶液;B、供试品溶液的制备:精密称定白芷样品粉末0.4000g,放置于50mL的容量瓶中,加入45mL甲醇,超声处理l小时。将容量瓶取出,待室温下放冷,加入甲醇至容量瓶刻度,摇匀,置于0.25m的微孔滤膜过滤,取续滤液;C、液相色谱仪色谱条件:色谱柱为CAPCELLPAK C18(4.6mm×250mm,5m),流动相为甲醇-水(55:45,v:v),检测波长为300nm。分别精密吸取对照品溶液与供试品溶液各20L,注人高效液相色谱仪,测定。

步骤2.2:高光谱成像获取白芷样品高光谱信息

黑白图像校正后,将白芷粉末样品同一水平放置于电控位移平台上。电控移动平台移动速度为16mm/s,工作距离为20.5cm,曝光时间为4ms,按照上述参数条件采集在874-1734nm范围内的高光谱数据信息。

步骤3、高光谱数据预处理

在测量样本光谱数据的过程中,容易受到仪器或环境的影响产生一些噪声。由于散射或荧光等影响,也会造成基线漂移。在建立定性或定量模型分析时,采用能够消除光谱数据的一些噪声以及基线漂移的预处理方法十分重要。

步骤3.1:数据去噪

平滑算法能够在不减少变量数目的前提下减少数据中的噪声。采用移动平均平滑算法对光谱数据进行去噪。

步骤3.2:基线校正和标准化算法

基线校正算法用于通过将数据调整到数据中的最小点或根据两个用户定义的变量进行线性校正来调整光谱偏移。标准化算法是一组按采样方式进行计算的变换处理方法。变量标准化通过对每个单独的光谱进行缩放来消除散射效应。变量标准化一般用于消除被测样品表面散射等因素所带来的误差。

步骤4、特征波段选择与异常样本剔除,准备建模数据集

首先,对高光谱数据进行特征波段选择以去除冗余信息并提取有效特征;之后,光谱数据预处理并剔除掉其中的异常样本,将剩余的样本用于后续研究;最终,取每个样本的反射率值作为预测模型的输入变量,欧前胡素含量作为输出变量,形成方法建模用的数据集。

步骤4.1:特征波段的提取

分别采用随机蛙跳(RF)、竞争性自适应重加权抽样(CARS)、迭代地保留信息变量(IRIV)、基于反向传播神经网络的平均影响值(MIV-BP)算法提取特征波段,后续根据不同的特征波段建模以选择最优的建模特征组合。不同算法下的波长组合如表1所示。

表1

步骤4.2:异常样本剔除方法

采用蒙特卡罗方法对异常样本进行检测,并从数据集中删除,将剩余的样本组合成数据集。在全部的212个样本去除异常样本后,将剩余的200个样本用于后续研究。

步骤5、划分数据集并建立预测模型

将全部的高光谱数据划分为训练集和测试集。DBN预测模型包括底层深度特征提取的DBN架构与监督学习的反向传播神经网络(BPNN)的顶层架构用于实现回归预测。为了寻找高效的预测模型,选择全波段和不同特征选择方法挑选的特征波长进行建模。

步骤5.1:数据集归一化

为了加快模型的训练速度,对光谱数据进行最大最小归一化处理,具体公式如下所示:

式中表示x′归一化后得到的样本数据;x表示通过测量数据,x

步骤5.2:采用Kennard-Stone(KS)方法划分数据集

KS划分步骤为:假设有一个矩阵,行为样本,作为样本的参数列出,KS算法将从中选择预定数量的样本。(a)首先计算两个样本之间的距离,然后选择距离最大的两个样本;(b)然后分别计算剩余样本与两个选定样本之间的距离;(c)对于每个剩余的样本,选择距所选择的样本最短的距离,然后选择与这些最短距离中的最长距离相对应的样本作为第三样本;(d)重复步骤(c),直到选择的样本数量等于预先确定的数量。

由于模型预测时,超参数为固定值,故未分离部分数据作为验证集,使得训练集的数据更加充分。

步骤5.3:建立基于BPNN的DBN预测模型DBN-BP

DBN是一个概率生成模型,主要由用于接收输入的显性神经元和用于提取特征的隐性神经元构成,生成模型是建立一个观察数据和标签之间的联合分布。通过训练其神经元间的权重,能够让整个神经网络按照最大概率来生成训练数据。在DBN的最后一层设置BPNN,接收受限玻尔兹曼机的输出特征向量作为它的输入特征向量,有监督地训练实体关系分类器。而且每一层玻尔兹曼机网络只能确保自身层内的权值对该层特征向量映射达到最优,并不是对整个DBN的特征向量映射达到最优,所以BPNN接收受限玻尔兹曼机的输出特征向量作为其输入特征向量将错误信息自顶向下传播至每一层玻尔兹曼机,微调整个DBN网络,直到达到全局最优。

构建好DBN-BP网络模型,在根据RF、CARS、MC-UVE、MIV-BP算法选择的特征波长以及全波长数据集上分别测试,选择最佳性能的预测模型。

步骤6、模型表现评估

采用预测集相关系数(R

式中x

表2比较了各种波长选择方法下的DBN-BP结果,从对比结果中清楚地看到,相对与其他特征提取方法而言,DBN-BP模型与MIV-BP特征波长提取方法结合具有更好的测试性能,利用少量特征波长即能够白芷饮片中欧前胡素含量预测,大大减少了模型的输入变量,加快了模型的运算效率。这表明MIV-DBN-BP是一种用于白芷饮片中欧前胡素含量的可行且出色的方法。

表2

本发明方法利用深度置信网络与基于反向传播神经网络变量选择结合形成的DBN-BP模型提取高相关度高光谱图像的特征波长,能够在多种白芷饮片中欧前胡素含量实现快速、准确的检测,有助于辅助产品分级和生产决策。

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

相关技术
  • 基于高光谱成像深度分析的白芷饮片质量预测方法
  • 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法
技术分类

06120112967645