掌桥专利:专业的专利平台
掌桥专利
首页

基于ConvNeXt网络的气溶胶新粒子形成事件自动识别方法

文献发布时间:2024-04-18 19:58:53


基于ConvNeXt网络的气溶胶新粒子形成事件自动识别方法

技术领域

本发明属于气溶胶新粒子检测技术领域,涉及基于深度学习的气溶胶新粒子形成类型的视觉认知与图像识别技术,具体涉及一种基于ConvNeXt网络的气溶胶新粒子形成事件自动识别方法。

背景技术

气溶胶数浓度及其粒径分布对于揭示气溶胶的来源、动力学和化学过程具有重要意义。长期连续在线观测气溶胶粒径谱不仅有助于了解其季节特性,还能够深入探究气溶胶粒径谱特征对污染控制的响应,从而为科学防治细颗粒污染提供有益信息。其中,新粒子形成(NPF)作为气溶胶数浓度最主要的来源之一,对全球气候、区域环境质量以及人体健康产生重要影响。

近年来,随着新粒子及其SO

现有的数据驱动的新粒子形成事件识别方法较少。其中,Joutsensaari等人首次将深度学习的方法应用于长期气溶胶粒径分布数据NPF事件的自动识别,开发了一种深度学习的方法来分析气溶胶新粒子形成事件,该方法使用经过预训练的卷积神经网络AlexNet,通过迁移学习对气溶胶粒径分布图进行分类,但该方法准确率较低,事件日的准确率约为80%。Su等人使用一种目标检测技术来识别NPF事件,该方法使用Mask R-CNN实例分割模型来自动识别NPF事件发生时在粒径分布图上出现的“香蕉型”特征,该方法还可以自动确定NPF事件的增长率、开始时间和结束时间,时间日的准确率在阈值0.2时为90.57%,识别精度仍有待提升。

发明内容

为了克服上述现有技术的不足,本发明提供一种基于ConvNeXt网络的气溶胶新粒子形成事件自动识别方法。基于ConvNeXt网络构建气溶胶新粒子形成事件识别模型,自动对气溶胶新粒子形成事件进行分类,提升气溶胶新粒子形成事件分类精度。

本发明提供的技术方案是:

一种基于ConvNeXt网络的气溶胶新粒子形成自动识别方法,包括:数据处理、模型搭建及训练、模型测试步骤;具体过程包括:

1)数据处理:

根据公式

然后逐日绘制气溶胶粒径谱分布图,形成气溶胶粒径谱分布图数据集;

将气溶胶粒径谱分布图数据集按事件发生标准分为多个类别,包括:事件日(Class_E)、非事件日(Class_NE)、未定义日(Class_0)、成核日(Class_N)和坏数据日(Class_BD)。然后使用整数标签来表示上述五个类别,分别为:Class_E(0)、Class_NE(1)、Class_0(2)、Class_N(3)、Class_BD(4)。

在每一类别数据集中选取相同比例的图像,共选取M幅气溶胶粒径谱分布图,并构成训练集,将训练集中第i类的第j个图像记为I

2)构建气溶胶新粒子形成事件识别模型并训练:

基于ConvNeXt网络构建气溶胶新粒子形成事件识别模型并训练模型。构建的模型包括输入层、隐藏层和输出层;隐藏层由4个阶段(stage1到stage4)组成;每个阶段主要是堆叠ConvNeXt网络结构块(ConvNeXt Block),stage1到stage4的堆叠次数为(3,3,9,3),各阶段堆叠的ConvNeXt Block的输入通道数分别为C={96,192,384,768},在stage2到stage4之前都先进行下采样操作。

2_1)构建模型的输入层用于接收集合J中的图像,提取图像的R、G、B三通道分量并输出给隐藏层;对于输入层,输入层的输入端接收一幅宽度为W,高度为H的原始输入图像并提取图像的R、G、B三通道分量,输入层的输出端输出原始输入图像的R、G、B三通道分量给隐藏层。

2_2)隐藏层第一阶段(stage1)由卷积层、标准化层(Layer Normalization,LN)和3个串联的ConvNeXt Block组成,每个ConvNeXt Block的输入特征层与输出特征层的宽高一致。隐藏层中的卷积层的输入端接收输入层输出的粒径分布图的R通道分量、G通道分量和B通道分量,卷积核大小为4×4,步距为4,输出96幅特征图,将96幅特征图构成的集合记为R

ConvNeXt Block由深度卷积(Depthwise)层、LN层、卷积层、GELU层、卷积层、层尺度调整操作(Layer Scale层)和随机失活(Dropout)层组成,具体步骤为:

特征图集合R

2_3)隐藏层stage2到stage4结构相似,都是由1个下采样操作与ConvNeXt Block组成,stage2的ConvNeXt Block数量为3,stage3的ConvNeXt Block数量为9,stage4的ConvNeXt Block数量为3,下采样操作将前一stage的输出特征图的高和宽变为原来的

下采样操作由1个LN层和1个卷积层组成。LN层输入端接收前一个stage的输出R

输出层由1个全局平均池化层、1个LN层和1个全连接层组成。全连接层输入channel数量为768,输出channel数为5。

2_4)将训练集中的每幅原始的粒径谱分布图作为原始输入图像,输入到步骤2)构建的模型中进行训练,得到训练集中的每幅原始的粒径谱分布图的分类结果,构成分类结果集合,记为J′。计算J与J′之间的损失函数记为LOSS(J,J′)。具体实施时,采用交叉熵损失函数获得J与J′之间的损失值。

2_5)重复步骤2_4)N次,得到气溶胶新粒子形成事件识别模型,并共得到M×N个损失函数值;然后从M×N个损失函数值中找出值最小的损失函数值;其中,N>1;接着将值最小的损失函数值对应的权值矢量和偏置项作为气溶胶新粒子形成事件识别模型训练对应的最优权值矢量和最优偏置项,对应记为W

3)模型测试:令I′

通过上述步骤,即可实现自动对新粒子形成事件类别(即步骤1)中所述5类事件)的识别。

与现有技术相比,本发明的优点在于:

本发明提供了一种基于ConvNeXt网络自动识别大气气溶胶颗粒新粒子形成事件的方法,通过数据集处理以及基于ConvNeXt网络搭建识别模型和评价实现了新粒子形成事件的高效准确分类,能够满足大气科学技术领域中对新粒子形成事件识别准确率的需求,可推广到不同污染程度城市的粒径分布数据集。

附图说明

图1为本发明方法的流程框图。

图2为本发明方法构建的神经网络模型的组成结构框图。

图3为本发明实例分类结果。

具体实施方式

下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。

本发明提出的一种基于ConvNeXt网络的气溶胶新粒子形成自动识别方法,其总体实现框图如图1所示,其包括训练阶段和测试阶段两个过程。

所述的训练阶段过程的具体步骤为:

1根据公式

2构建气溶胶新粒子形成事件识别模型并训练:

基于ConvNeXt网络构建气溶胶新粒子形成事件识别模型并训练模型。构建的模型包括输入层、隐藏层和输出层;隐藏层由4个阶段(stage1到stage4)组成;每个阶段主要是堆叠ConvNeXt网络结构块(ConvNeXt Block),stage1到stage4的堆叠次数为(3,3,9,3),各阶段堆叠的ConvNeXt Block的输入通道数分别为C={96,192,384,768},在stage2到stage4之前都先进行下采样操作。

2_1)构建模型的输入层用于接收集合J中的图像,提取图像的R、G、B三通道分量并输出给隐藏层;对于输入层,输入层的输入端接收一幅宽度为W,高度为H的原始输入图像并提取图像的R、G、B三通道分量,输入层的输出端输出原始输入图像的R、G、B三通道分量给隐藏层;在本实例中图像高和宽为224。

2_2)隐藏层第一阶段(stage1)由卷积层、标准化层(Layer Normalization,LN)和3个串联的ConvNeXt Block组成,每个ConvNeXt Block的输入特征层与输出特征层的宽高一致。卷积层的输入端接收输入层输出的粒径分布图的R通道分量、G通道分量和B通道分量,卷积核大小为4×4,步距为4,输出96幅特征图,将96幅特征图构成的集合记为R

ConvNeXt Block由Depthwise卷积层、LN层、卷积层、GELU层、卷积层、Layer Scale层和Dropout层组成,具体步骤为:

特征图集合R

2_3)隐藏层stage2到stage4结构相似,都是由1个下采样操作与ConvNeXt Block组成,stage2的ConvNeXt Block数量为3,stage3的ConvNeXt Block数量为9,stage4的ConvNeXt Block数量为3,下采样操作将前一stage的输出特征图的高和宽变为原来的

下采样操作由1个LN层和1个卷积层组成。LN层输入端接收前一个stage的输出R

输出层由1个全局平均池化层、1个LN层和1个全连接层组成。全连接层输入channel数量为768,输出channel数为5。

2_4)将训练集中的每幅原始的粒径谱分布图作为原始输入图像,输入到步骤2)构建的模型中进行训练,得到训练集中的每幅原始的粒径谱分布图的分类结果,构成分类结果集合,记为J′。计算J与J′之间的损失函数记为LOSS(J,J′)。具体实施时,采用交叉熵损失函数获得J与J′之间的损失值。

2_5)重复步骤2_4)N次,得到气溶胶新粒子形成事件识别模型,并共得到M×N个损失函数值;然后从M×N个损失函数值中找出值最小的损失函数值;其中,N>1;接着将值最小的损失函数值对应的权值矢量和偏置项作为气溶胶新粒子形成事件识别模型训练对应的最优权值矢量和最优偏置项,对应记为W

所述的测试阶段过程的具体步骤为:

令I′

为了进一步验证本发明方法的可行性和有效性,进行试验。

使用基于python的深度学习库Pytorch2.0搭建气溶胶新粒子形成事件识别模型的架构。采用布达佩斯、莱比锡和德布雷顿城市背景监测站数据集来分析利用本发明方法预测粒径谱分布图的类别效果如何。这里利用图像分类准确率作为评价指标,来评价模型的分类性能。

利用本发明对测试集中每幅图像进行分类,得到每幅图像的预测类别,反应本发明图像分类性能的准确率如表1所示,准确率越高,代表模型效果越好。从表1中可以看出,本发明对事件日的识别效果较好,表明利用本发明方法来识别新粒子形成事件是具有可行性且有效的。

表1利用本发明方法在测试集上的评测结果

图3给出了选取一幅粒径谱分布图利用本发明进行预测分类得到的分类概率以及原始图像类别,可以看出预测结果比较理想。

需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

相关技术
  • 用于大气气溶胶新粒子形成与生长的流动反应装置
  • 用于大气气溶胶新粒子形成与生长的流动反应装置
技术分类

06120116513426