掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明属于电子鼻信号处理技术,具体设计一种基于领域自适应卷积神经网络的电子鼻漂移补偿方法。

背景技术

电子鼻(也称人工嗅觉系统)在诸如食品安全、环境质量监测、生物医药等多个领域中应用广泛,但由于其制造工艺和材料本身存在问题,长期使用的传感器仍不可避免的会出现不可预测且非线性的漂移现象,这就需要使用漂移补偿算法抑制漂移对识别精度带来的损害。

抑制电子鼻漂移的方法主要分为两类:一类为传统方法,例如领域正则化主成分分析(domain regularized component analysis)、跨域子空间学习(cross-domaindiscriminant subspace learning method)、跨域极限学习机(cross-domain extremelearning machine)等。另一类为基于深度学习的方法,例如自编码器(autoencoder)、深度置信网路(deep belief network)、长短期记忆(long short-term memory)等。

现有方法的不足:现有方法的建模大都需要目标域样本的参与,以学习目标域的分布来达到域对齐。而在实际工程应用场景下,无法获取大量均匀分布的目标域数据,实用性不足。

且现有电子鼻漂移补偿方法中尚未有基于卷积神经网络的漂移补偿方法。

发明内容

为了解决上述技术问题,本发明提出了一种基于领域自适应卷积神经网络的电子鼻漂移补偿方法:Target-domain-free Domain Adaptation Convolutional NeuralNetwork(TDACNN,无目标域的领域自适应卷积神经网络),设计了一种多分支多分类器结构,通过同时使用多个分类器,以及加入基于最大均值差异(maximum mean discrepancy,MMD)的分类器集成方法,使分类器能够充分利用网络中不同等级的特征,并加入了优化后的损失函数辅助训练,以达到在不使用目标域数据进行建模的情况下实现决策层面的漂移补偿,并且弥补了基于卷积神经网络的漂移补偿方法在电子鼻漂移补偿领域的空缺。本发明的技术方案如下:

一种基于领域自适应卷积神经网络的电子鼻漂移补偿方法:

首先,K路电子鼻传感器系统在环境中检测到待测气体后,传感器系统产生电流信号或电压信号,各自独立处理成电阻响应曲线后,每个信号样本经过信号调理电路进行滤波、放大,再经AD转换,生成有效的气体数字信号。

其次,步骤A1:将气体数字信号送入处理器,处理器提取响应曲线的特征,获取电子鼻的原始数据,在电子鼻的漂移补偿问题中,传感器发生漂移之前采集的数据属于源域,称为源域样本;发生漂移之后采集的数据属于目标域,称为目标域样本。

步骤A2:对源域样本和目标域样本数据分别进行批次归一化(BatchNormalization);

步骤A3:按照传感器维度将两组样本归一化后的数据各自分为k组,k为传感器数量;

步骤A4:将k组数据分别输入k个分支,在每个分支上通过三个卷积块(Convolutional Block)的卷积路径对数据进行卷积操作;

步骤A5:将所有分支上同等级的卷积块的输出通过宽度拼接方式(WidthConcatenate)进行连接;

第一卷积路径:将所有卷积块A(Convolutional Block A)的输出进行宽度拼接后连接至分类器1(Classifier 1);

第二卷积路径:将所有卷积块B(Convolutional Block B)的输出进行宽度拼接后连接至分类器2(Classifier 2),该卷积块B(Convolutional Block B)的输出还连接至卷积块D(Convolutional Block D),该卷积块D的输出进行宽度拼接后连接至分类器3(Classifier 3);

第三卷积路径:将所有卷积块C(Convolutional Block C)的输出进行宽度拼接后连接至分类器4(Classifier 4);

步骤A6:所有所述分类器分别对卷积后的特征重新投影,之后各自将结果以概率的形式输出;

步骤A7:通过基于最大均值差异(MMD)的分类器集成方法融合不同分类器的结果,得到最终输出,即对输入气体样本做出判断,得出该气体的种类。

四个所述分类器结构相同:由两个100单元的全连接层,以及一个Softmax依次连接层组成。在预测过程中,对同一个气体输入样本,四个分类器可能会得出不同的结果,这时就需要评估不同结果的可靠程度以得出网络的最终输出。

所述步骤A6中:

步骤B1:分类器接收来自卷积块的宽度拼接后的特征之后,通过两个拥有一百个单元的全连接层(fully connected layer,fc 100)进行非线性投影;

步骤B2:全连接层输出特征矩阵传入Softmax层,以概率形式输出结果,并选取概率最高的类别作为伪标签,第n个分类器得到的伪标签为

步骤B3:全连接层输出特征矩阵用于计算当前目标域样本与源域样本间的最大均值差异(MMD),计算源域s和目标域t之间的MMD需要分别获取源域和目标域中所有类别气体的全部样本:

其中,

其中,

步骤B4:通过本专利提出一种归一化的sigmoid函数(SS(x)),将步骤B3中得到的最大均值差异(MMD)映射到与步骤B2中得到的Softmax输出一致的分布上:

其中,x表示函数输入,x

步骤B5:通过加权可信度分数WCS(Weighted Credibility Score)融合最大均值差异(MMD)和Softmax输出,以在多个分类器得到结果不一致时选出最可信的结果,设C为分类器预测得到的伪标签域,定义伪标签为c(c∈C)的样本的加权可信度分数WCS

其中,

步骤B6:因为更高的WCS意味着该伪标签具有更高的可信度,在完成所有伪标签的WCS计算之后,选取WCS最高的伪标签作为算法的最终结果,也就是当前检测气体为样本气体C这一概率值的可信度大小,可信度越大,推算出的概率值就越准确。

处理器经人机交互机构输出气体分类结果。

有益效果:本发明设计了一种基于领域自适应卷积神经网络的电子鼻漂移补偿方法,采用多分支多分类器结构,通过同时使用多个分类器,以及加入基于最大均值差异(maximum mean discrepancy,MMD)的分类器集成方法,使分类器能够充分利用网络中不同等级的特征,并加入了优化后的损失函数辅助训练,以达到在不使用目标域数据进行建模的情况下实现决策层面的漂移补偿,不仅简化了数据,并且弥补了基于卷积神经网络的漂移补偿方法在电子鼻漂移补偿领域的空缺。

在多个公开数据集的多种实验设定上达到了优于传统方法的效果,且无需使用目标域数据建模,相较大部分传统方法具有更高的实用价值。具体优点如下:1、无需使用目标域数据建模,更加实用;2、在决策层实现漂移补偿,无需额外计算;3、网络结构可定制,具有较强灵活性;4、使用特殊设计的损失函数,能够更好的训练网络。

附图说明

图1为TDACNN网络结构图。

图2为TDACNN工作流程图。

图3为分类器集成图。

具体实施方式

如图2所示,一种基于领域自适应卷积神经网络的电子鼻漂移补偿方法,包括:

步骤A1:获取电子鼻的原始数据,在电子鼻的漂移补偿问题中,传感器发生漂移之前采集的数据属于源域,称为源域样本;发生漂移之后采集的数据属于目标域,称为目标域样本;

步骤A2:对源域样本和目标域样本数据分别进行批次归一化(BatchNormalization);

步骤A3:按照传感器维度将两组样本归一化后的数据各自分为k组,k为传感器数量;

如图1所示,步骤A4:将k组数据分别输入k个分支,在每个分支上通过三个卷积块(Convolutional Block)的卷积路径对数据进行卷积操作;

步骤A5:将所有分支上同等级的卷积块的输出通过宽度拼接方式(WidthConcatenate)进行连接;

第一卷积路径:将所有卷积块A(Convolutional Block A)的输出进行宽度拼接后连接至分类器1(Classifier 1);

第二卷积路径:将所有卷积块B(Convolutional Block B)的输出进行宽度拼接后连接至分类器2(Classifier 2),该卷积块B(Convolutional Block B)的输出还连接至卷积块D(Convolutional Block D),该卷积块D的输出连接至分类器3(Classifier 3);

第三卷积路径:将所有卷积块C(Convolutional Block C)的输出进行宽度拼接后连接至分类器4(Classifier 4);

步骤A6:所有所述分类器分别对卷积后的特征重新投影,之后各自将结果以概率的形式输出;

步骤A7:通过基于最大均值差异(MMD)的分类器集成方法融合不同分类器的结果,得到最终输出,即对输入气体样本做出判断,得出该气体的种类。

四个所述分类器结构相同:由两个100单元的全连接层,以及一个Softmax依次连接层组成。

如图3所示,所述步骤A6中:

步骤B1:不同分类器分别接收来自不同卷积块的特征,即分类器1接收来自卷积块A的宽度拼接后的特征,分类器2接收来自卷积块B的宽度拼接后的特征,分类器3接收来自卷积块D的特征,分类器4接收来自卷积块C的宽度拼接后的特征,之后通过两个拥有一百个单元的全连接层(fully connected layer,fc 100)进行非线性投影;

步骤B2:全连接层输出特征矩阵传入Softmax层,以概率形式输出结果,并选取概率最高的类别作为伪标签,第n个分类器得到的伪标签为

步骤B3:全连接层输出特征矩阵用于计算当前目标域样本与源域样本问的最大均值差异(MMD),计算源域s和目标域t之间的MMD需要分别获取源域和目标域中所有类别气体的全部样本:

其中,

步骤B4:通过归一化的sigmoid函数(SS(x)),将步骤B3中得到的最大均值差异(MMD)映射到与步骤B2中得到的Softmax输出一致的分布上:

其中,x表示函数输入,x

步骤B5:通过加权可信度分数WCS(Weighted Credibility Score)融合最大均值差异(MMD)和Softmax输出,以在多个分类器得到结果不一致时选出最可信的结果,设C为分类器预测得到的伪标签域,定义伪标签为c(c∈C)的样本的加权可信度分数WCS

其中,

步骤B6:选取WCS最高的伪标签作为算法的最终结果,也就是当前检测气体为样本气体C这一概率值的可信度大小,可信度越大,推算出的概率值就越准确。

本发明结合带有参数动态调整策略的加性角度间隔Softmax损失函数,能够优化网络训练。通过将特征向量和网络权重的差异使用角度进行几何层面的直观表示来直接对角度进行优化,相比其他方法更加直接,能够使特征实现类内聚合以及类间分离。易于编程实现,且复杂性低。

所述步骤B5中,带有参数动态调整策略的加性角度间隔Softmax损失函数包含以下调整步骤:

步骤C1:将特征向量xi和网络权重Wj归一化,使用θ表示特征向量和网络权重的夹角:

其中,

步骤C2:使用m表示加性角度间隔惩罚,加性角度间隔Softmax损失函数写作如下形式:

其中s表示归一化的特征向量||xi||的缩放幅度,N表示Softmax层的单元数量,C表示训练样本中的种类数量,c表示当前样本所属于的气体种类。

步骤C3:为了避免在训练末期产生较大的无法下降的损失值,本发明针对参数m加入了一种动态调节策略,利用所述步骤C3中:利用加性角度间隔惩罚m表示施加在角度上的惩罚,更大的m意为着更大的损失值,使用如下公式对m的值进行动态调节:

其中,e指当前训练轮数,v表示变化率,m

所述步骤C3中:基于带有参数动态调整策略的加性角度间隔Softmax损失函数,对神经网络的训练过程如下:

步骤D1:获取带有标记的来自源域的电子鼻数据集样本;

步骤D2:建立前文所述的无目标域的领域自适应卷积神经网络(TDACNN);

步骤D3:建立前文所述的带有参数动态调整策略的加性角度间隔Softmax损失函数,并确定m

步骤D4:确定损失函数的终止训练阈值以及迭代次数阈值;

步骤D5:从打乱的来自源域的电子鼻数据集中获取训练样本并输入TDACNN中,依据步骤C1~步骤C3在四个分类器上分别使用带有参数动态调整策略的加性角度间隔Softmax损失函数计算得到各分类器上的损失值,之后将四个分类器的损失值相加得到总损失值,使用该损失值训练TDACNN,得到更新之后的网络权重值;

步骤D6:判断总损失值是否小于终止训练阈值,如果是则转至步骤D8,如果否则转至步骤D7;

步骤D7:判断网络训练的迭代次数是否大于迭代次数阈值,如果是转步骤D8,否则转步骤D5;

步骤D8:保存当前权重值作为最终权重值。

本实施例选取了两个典型电子鼻漂移数据集进行了验证。为了分别模拟长期漂移和短期漂移,设置了两种实验设定:

1)批次1作为源域,k为目标域(k=2,3,…,10);

2)依次使用批次k-1作为源域,批次K作为目标域(K=2,3,…,10)。

1、数据集A

来自于UC Irvine Machine Learning Repository,由Vergara采集,包含了三年间收集的数据,包含16个金属氧化物电子鼻传感器,总共选用了6种气体样本,包括不同浓度的氨,丙酮,乙烯,乙醛,乙醇和甲苯。每个传感器拥有8个特征维度,每个样本均为128维。

数据集根据时间先后划分为10个批次:

2、数据集B

由重庆大学的Tao Liu采集,包含了四个月间收集的数据,包含32个电子鼻传感器,选择七种饮料作为实验样本,包括不同浓度的啤酒,红茶,绿茶,

白酒,乌龙茶,普洱茶和葡萄酒。数据集包含传感器在180s内的电压原始相应曲线,即每个样本的数据维度为32×180。

数据集根据月份划分为3个批次:

3、实验结果

选取了一些典型算法作为对比,在数据集A和数据集B上分别进行了两种实验。实验结果如下所示:

可见,无目标域的领域自适应卷积神经网络(TDACNN)在两个数据集的两种实验设定下均取得了相对其他对比方法最好的识别精度,证明其对不同数据集均有良好适应性,在长期漂移或短期漂移的场景下均能取得良好效果,且建模无需使用目标域数据,实用性高于对比方法。

技术分类

06120113821604