掌桥专利:专业的专利平台
掌桥专利
首页

一种基于神经网络的道地性分析方法

文献发布时间:2024-04-18 19:53:33


一种基于神经网络的道地性分析方法

技术领域

本发明涉及数据挖掘领域,尤其涉及一种基于神经网络的道地性分析方法。

背景技术

中药材的鉴别在传统医学界一直是一个核心的问题。因为药材的鉴别往往极度依赖人工,药材的道地性也很难直接辨别。近年来,近红外光谱技术迅速发展,而且具有环保、高效、成本低、对样品无破坏、无需化学试剂等优点受到了工业界和学术界的广泛关注。基于药材光谱数据的神经网络进行分析,可以提高鉴别中药材的准确性与效率。同时由于它的简单、无损化、检测速度快,相比于中药化学指纹图谱以及含量测定、组织形态三维定量分析、DNA分子遗传标记、生物效价评价等分析方法而言拥有更大的优势。使用基于奇异值SVD分解协方差矩阵进行降维可以简化数据,去除噪声,提高算法的结果。建立全连接神经网络提高结果的准确性,同时运用softmax函数使计算更为方便。利用神经网络对药材的道地性进行分析在药材领域有着广阔的需求,对形成一套道地性药材评判体系也具有重要的指导意义。可运用在分析药材道地性等领域。

发明内容

本发明所要解决的技术问题是提高针对药材的光谱分析的准确性,提供一种基于神经网络的道地性分析方法,重点从使用基于SVD奇异值分解处理协方差矩阵实现的主成分分析PCA对数据进行降维处理,随后通过elkan K-Means来对数据进行聚类并进行相关分析,以及从统计学角度分析数据的统计特性。建立全连接神经网络将附件二中的数据以3:7划分为测试集与训练集,将输出层输出的11个特征输入到柔性最大值Si中计算得出结果。使用交叉熵损失函数定义该网络的代价函数并求导。使用批量梯度下降来对函数求得最小值后迭代1000次得到结果。

本发明为解决上述技术问题采用以下技术方案:

一种基于神经网络的道地性分析方法,包含以下步骤,:

步骤1),对于待处理数据的光谱信息,通过使用基于SVD奇异值分解处理协方差矩阵实现的主成分分析(PCA)法对数据进行降维预处理

步骤2),采用全连接神经网络对数据进行特征提取,该神经网络由4层全连接层组成,第一层由512个神经元组成,第二层由256个神经元组成,第三层由128个神经元组成,第四层由17个神经元组成,所有神经元采用tanh作为激活函数。

步骤3),将输出的17个值进行softmax运算,最后输出17个类别的概率。

步骤4),根据数据实际类别,使用交叉墒计算训练、测试结果的损失大小,经过反向传播将损失反馈给网络,不断调整、优化目标函数,学习模型参数;

步骤5),利用优化好的网络参数,奖数据输入到该神经网络中,取出最大概率的种类位置,即为该药物的分类。

前述的一种基于神经网络的道地性分析方法中对于待处理数据的光谱信息,其特征在于所诉步骤1)中的具体内容为:

将整个矩阵构建成R

①构建H矩阵

②利用构建的H矩阵计算协方差矩阵

将第一行与第一列展开有

可知,

③通过SVD计算协方差矩阵的特征值与特征向量。

U,S,V=svd(V)

④取出V的前k个特征作为新构成的特征矩阵。

⑤通过S计算等效误差,并保留原数据0.99的特征

降维的特征选择,通过枚举算法来求得第一个保留程度大于0.99的时候,取值为130维。在完成PCA降维后,通过elkan K-Means来对数据进行聚类,从簇内的稠密程度和簇间的离散程度来评估聚类的效果,使用到的方法共有两种一个是手肘法Elbow Nethod,手肘法的核心指标是SSE(sum of the squared errors,误差平方和)当选择的k值小于真正的时,k每增加1,损失值就会大幅的减小;当选择的k值大于真正的K时,k每增加1,损失值的变化就不会那么明显。

前述的基于神经网络的道地性分析法,其特征在于,所述步骤2)中,采用全连接神经网络对数据进行特征提取,该神经网络由4层全连接层组成,第一层由512个神经元组成,第二层由256个神经元组成,第三层由128个神经元组成,第四层由17个神经元组成,所有神经元采用tanh作为激活函数,前向传播主要包含以下步骤:

Y=σ(Θ·X+b)

σ=tanh(x)

Y表示预测的矩阵,Θ是全连接层边的权重,σ是激活函数

前述的基于神经网络的道地性分析法,其特征在于,所述步骤3)中其输出的17个值进行softmax运算,最后输出17个类别的概率:

Z:上一层的输出,softmax的输入,维度为C

y

softmax运算的目的是把所有输出的概率变成0-1之间的概率,并且17个类别的总和是1

前述的基于神经网络的道地性分析法,其特征在于,所述步骤4)中,据数据实际类别,使用交叉墒计算训练、测试结果的损失大小,经过反向传播将损失反馈给网络,不断调整、优化目标函数,学习模型参数;

Loss是交叉熵损失:

M:类别的数量

y

P

最小化代价函数,得到最优的函数权重值:

前述的基于神经网络的道地性分析法,其特征在于,所述步骤5)利用优化好的网络参数,得到一个较为精准的预测中药的道地性的模型,根据预测的结果得到中药的产地。

附图说明

图1是本发明一种基于神经网络的道地性分析方法的流程示意图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围:

本发明公开了一种基于神经网络的道地性分析方法,包含以下步骤:

本发明为解决上述技术问题采用以下技术方案:

一种基于神经网络的道地性分析方法,其特征在于,包含以下步骤,:

步骤1),对于待处理数据的光谱信息,通过使用基于SVD奇异值分解处理协方差矩阵实现的主成分分析(PCA)法对数据进行降维预处理

步骤2),采用全连接神经网络对数据进行特征提取,该神经网络由4层全连接层组成,第一层由512个神经元组成,第二层由256个神经元组成,第三层由128个神经元组成,第四层由17个神经元组成,所有神经元采用tanh作为激活函数。

步骤3),将输出的17个值进行softmax运算,最后输出17个类别的概率。

步骤4),根据数据实际类别,使用交叉墒计算训练、测试结果的损失大小,经过反向传播将损失反馈给网络,不断调整、优化目标函数,学习模型参数;

步骤5),利用优化好的网络参数,将数据输入到该神经网络中,取出最大概率的种类位置,即为该药物的分类。

前述的一种基于神经网络的道地性分析方法中对于待处理数据的光谱信息,其特征在于所诉步骤1)中的具体内容为:

将整个矩阵构建成R

①构建H矩阵

②利用构建的H矩阵计算协方差矩阵

将第一行与第一列展开有

可知,

③通过SVD计算协方差矩阵的特征值与特征向量。

U,S,V=svd(V)

④取出V的前k个特征作为新构成的特征矩阵。

⑤通过S计算等效误差,并保留原数据0.99的特征

降维的特征选择,通过枚举算法来求得第一个保留程度大于0.99的时候,取值为130维。在完成PCA降维后,通过elkan K-Means来对数据进行聚类,从簇内的稠密程度和簇间的离散程度来评估聚类的效果,使用到的方法共有两种一个是手肘法Elbow Method,手肘法的核心指标是SSE(sum ofthe squared errors,误差平方和)当选择的k值小于真正的时,k每增加1,损失值就会大幅的减小;当选择的k值大于真正的K时,k每增加1,损失值的变化就不会那么明显。

前述的基于神经网络的道地性分析法,其特征在于,所述步骤2)中,采用全连接神经网络对数据进行特征提取,该神经网络由4层全连接层组成,第一层由512个神经元组成,第二层由256个神经元组成,第三层由128个神经元组成,第四层由17个神经元组成,所有神经元采用tanh作为激活函数,前向传播主要包含以下步骤:

Y=σ(Θ·X+b)

σ=tanh(x)

Y表示预测的矩阵,Θ是全连接层边的权重,σ是激活函数

前述的基于神经网络的道地性分析法,其特征在于,所述步骤3)中其输出的17个值进行softmax运算,最后输出17个类别的概率:

Z:上一层的输出,softmax的输入,维度为C

y

softmax运算的目的是把所有输出的概率变成0-1之间的概率,并且17个类别的总和是1

前述的基于神经网络的道地性分析法,其特征在于,所述步骤4)中,据数据实际类别,使用交叉墒计算训练、测试结果的损失大小,经过反向传播将损失反馈给网络,不断调整、优化目标函数,学习模型参数;

Loss是交叉熵损失:

M:类别的数量

y

P

最小化代价函数,得到最优的函数权重值:

前述的基于神经网络的道地性分析法,其特征在于,所述步骤5)利用优化好的网络参数,得到一个较为精准的预测中药的道地性的模型,根据预测的结果得到中药的产地。

本技术领域技术人员可以理解的是,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120116336346