掌桥专利:专业的专利平台
掌桥专利
首页

一种基于Cycle-GAN的光谱粒度效应降低方法

文献发布时间:2024-01-17 01:21:27



【技术领域】

本发明为一种基于Cycle-GAN的光谱粒度效应降低方法,属于光谱数据分析技术领域。

【背景技术】

生成对抗网络(Generative Adversarial Network,GAN)具有强大生成能力,被成功地应用于众多领域,特别是在风格迁移领域中表现出色。2017年,科学家Zhu等结合GAN和对偶学习的思想提出了循环一致性生成对抗网络(Cycle Generative AdversarialNetwork,Cycle-GAN),其思想是使用两个生成器和两个判别器完成两种风格域之间环形转换,通过添加循环一致性损失来保留样本的内容信息。该方法支持使用非成对数据集训练模型,解决了风格迁移模型因成对数据集导致其适用范围受限的问题。

光谱分析技术研究表明,样本的颗粒度是影响其光谱特性的重要因素。Salisbury等实验发现矿物样本基频振动带强度与粒径的大小呈负相关关系,并指出这种负相关关系来自孔隙率;Carli以及Hatcher等进一步指出试样的光谱反射率会随着颗粒度的减小而呈指数型增长;中国中医药大学研究表明,多类中药材的近红外光谱不同波段受粒径的影响不同,在组合频区和一级倍频区的近红外吸收光谱强度与粒径成正比,而且随着波长增大,受粒径的影响越大,而在二级倍频区,近红外吸收光谱强度与粒径成反比。因此,在采用光谱法测量样本理化参数的时候,经常通过粉碎样本来提高测量的精度。另外,对于粉碎装样误差的考察结果表明,当粉碎目数大于60时,装样误差较小。综合考量样本制备工作量和装样误差两方面因素,实际样本测量中会采用60目粉碎粒度。可见近红外光谱测量中,粉碎并过60目是常规的标准化操作。

光谱测量技术仅需要对样本进行必要的物理处理,是一种快速、便捷和低成本的方法,对比需要化学处理的传统国标测量方法,光谱测量法体现了测量手段的进步。本发明提出使用Cycle-GAN,针对60目粉末样本的近红外吸收光谱(目标光谱)和完整样本的近红外吸收光谱(原光谱)进行对偶域训练,建立一种基于原光谱的目标光谱迁移模型。本发明无需对样本进行任何化学和物理处理,是一种完全的无损、快速测量方法;对比常规光谱测量方法,基于Cycle-GAN的光谱粒度效应降低方法有益于完整样本光谱测量精度的提高

【发明内容】

考虑转换过程中背景对训练结果的影响,为使特征迁移仅作用于光谱信号,提出首先对原光谱和目标光谱进行预处理,包括噪声去除和基线去除操作;考虑到Cycle-GAN广泛适用于二维图像数据风格迁移,提出将一维光谱信号转换成二维时频谱;最后基于Cycle-GAN建立原光谱时频谱和目标光谱时频谱之间的迁移模型,用于实现基于原光谱的目标光谱生成。

为实现以上目的,本发明是通过以下步骤来实现的:

(1)首先预处理原光谱和目标光谱,包括去噪声、去基线;

(2)然后按照组合频区(2050-2500nm)、一级倍频区(1650-2000nm)、二级倍频区(1150-1600nm)和三级倍频区(700-1150nm),将光谱切割成4个片段谱进行数据集扩容;

(3)基于希尔伯特黄变换方法获得原光谱和目标光谱的二维时频谱;

(4)最后将预处理后的原光谱和目标光谱的时频谱作为输入矩阵送入CycleGAN模型,训练后获得原光谱到目标光谱的迁移器。

【具体实施方式】

下面结合实施案例1对本发明内容做进一步的说明。

所有算法操作是在Matlab2019b中实施,包括小波分解去噪、多项式拟合去趋势、希尔伯特黄变换、CycleGAN训练。

实施例1大豆光谱迁移步骤如下:

(1)搜集大豆样本,共计11个品种。

(2)通过Bruker公司TANGO近红外光谱仪,采用连续旋转扫描方式获取完整大豆近红外光谱,以及获取碾磨60目大豆粉末近红外光谱,其中光谱扫描范围4000-11520cm

(3)采用db3作为小波母函数进行5层分解,应用软阈值处理小波系数,完成近红外光谱去噪,应用6阶多项式拟合去除光谱趋势,按照组合频、一级倍频、二级倍频和三级倍频切割光谱进行数据集扩容,对去噪声、去趋势的光谱进行希尔伯特黄变换,获得原光谱和目标光谱的时频谱图;

(4)将原光谱和目标光谱的时频谱图,作为输入矩阵送入CycleGAN的生成器中,结合生成器中的残差网络提高谱图传输时的准确性,利用两个判断器判断生成的谱图是否一致;最后通过对原光谱的时频谱图进行特征迁移得到目标光谱的时频谱图。

(5)采用结构相似度和均方误差两类指标评价原时频谱与目标时频谱之间的迁移效果,结构相似度数值范围为-1~1,数值越大表示两幅图像的分布结构越相似,图像的质量越高;均方误差是参数估计值与参数真实值之间差异程度的一种度量,数值越小表示与原图像的差距越小。实施案例1中,获得了结构相似度范围为0.14~0.18,平均均方误差为3662.1。

(6)施案例1中,采用预处理后完整豆粒光谱进行豆种分类识别,获得了90.21%识别准确率;采用预处理后60目粉末光谱进行豆种分类识别,获得了92.46%识别准确率;采用预处理后完整豆粒时频谱进行豆种分类识别,获得了89.53%识别准确率;采用预处理后完整豆粒时频谱的迁移谱进行豆种分类识别,获得了91.95%识别准确率,与预处理后60目粉末光谱模型相似。

2.关键技术

2.1训练样本处理

神经网络模型的精准度对于样本的数据量有着较高的要求,实施案例1中分别获取1228条预处理后的原光谱和目标光谱。另外,按照组合频区(2050-2500nm)、一级倍频区(1650-2000nm)、二级倍频区(1150-1600nm)和三级倍频区(700-1150nm),将光谱切割成4个片段谱将数据集扩容到9824条。采用7:2:1的比例将数据划分为训练集、验证集、测试集。对时频谱图进行归一化处理,将谱图转化为256像素×256像素尺寸,然后才能输入网络中进行训练。

2.2Cycle-GAN配置

Cycle-GAN是对抗生成网络(Generative Adversarial Networks,GAN)的一种改进结构,为了实现两个域间的数据转换,构造了两个核心生成器,即Cycle-GAN使用了两套标准GAN网络,每个生成器都与一个鉴别器关联,分别是Generator A/B,Generator B/A,Discriminator A,Discriminator B四个部分。

生成器是由编码器、转化器和解码器构成,其中编码器由3层卷积网络构成,转化器由6层Resnet网络构成,解码器由3层卷积网络构成。首先编码器中的卷积神经网络对输入时频谱进行特征提取,将高维度的图像压缩为低维度特征向量;然后转换器组合原时频谱和目标时频谱中的不相近特征,将原时频谱的特征向量分布转换为目标时频谱中的特征向量分布。生成器各层参数如下:①编码器网络类型Conv1,Conv2,Conv3;卷积核7×7,3×3,3×3;步长1,2,3;深度32,64,128;归一化方法IN,IN,IN;激活函数Relu,Relu,Relu。②转化器网络类型Resnet1,Resnet2,Resnet3;Resnet4,Resnet5,Resnet6;卷积核3×3,3×3,3×3,3×3,3×3,3×3;步长1,1,1,1,1,1;深度256,256,256,256,256,256;归一化方法IN,IN,IN,IN,IN,IN;激活函数Relu,Relu,Relu,Relu,Relu,Relu。③解码器网络类型Deconv1,Deconv2,Deconv3;卷积核7×7,3×3,7×7;步长2,2,1;深度32,64,128;归一化方法IN,IN,无;激活函数Relu,Relu,Tanh。

鉴别器用来将生成的目标时频谱和真实目标时频谱作为输入,对输入判断其为原始真实时频谱还是生成的虚假时频谱。鉴别器具有5层卷积层,能够将时频谱经过卷积后生成1个一维向量,加上1个偏置向量后,通过Sigmod概率计算实现真伪判断。鉴别器参数如下:网络类型Conv1,Conv2,Conv3,Conv4,Conv5;卷积核4×4,4×4,4×4,4×4,4×4;步长2,2,2,2,1;深度64,128,256,512,1;归一化方法BN,BN,BN,BN,BN;激活函数LeakyRelu,LeakyRelu,LeakyRelu,LeakyRelu,Sigmod。

Cycle-GAN的损失函数L(G,F,D

L(G,F,D

式中,L

G:X→Y的对抗。

L

式中y为真实目标时频谱,x为生成目标时频谱,D

F:Y→X的对抗。

L

式中d为真实原时频谱,e为生成原时频谱,D

G追求最小化目标,D最求最大化目标,因此满足min

循环一致损失函数L

批处理batch_size为100,训练次数为90000,每1000次保存一次权重,学习率初始为0.0002,训练100000次后线性衰减至0。

本发明的有益效果是:①提供了一种光谱粒度效应降低方法;②提供了按照组合频、一级倍频、二级倍频、三级倍频划分近红外谱带区域,进行光谱数据集扩容的方法;③建立了一种从原光谱到目标光谱的迁移模型。

本发明适合基于光谱技术的定性判断和定量计算。

以上所述仅为本发明的较佳实施案例,并不用以限制本发明,凡在本发明的精神和原则之内所做的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

技术分类

06120116158016