掌桥专利:专业的专利平台
掌桥专利
首页

一种基于离散余弦变化的频域注意力机制的图像去雾方法

文献发布时间:2023-06-19 19:27:02


一种基于离散余弦变化的频域注意力机制的图像去雾方法

技术领域

本发明涉及图像的去雾技术,具体涉及一种基于离散余弦变化的频域注意力机制的图像去雾方法。

背景技术

空气中的灰尘、烟雾漂浮颗粒会吸收和散射阳光,导致视频监控中的图像质量下降,影响目标检测、图像分割等计算机视觉任务的性能。因此,图像去雾是一种关键的图像预处理技术,可以通过恢复图像质量,减少雾霾天气对图像质量的干扰。

随着深度学习在计算机视觉领域取得的巨大成功,基于深度学习的图像去雾也逐渐成为主流,但是多数方法采用卷积神经网络。卷积神经网络通过多层结构,从底层的边缘特征开始逐级提取图像特征,可以看做是对频率域的隐式建模。离散余弦变化(discretecosine transform,DCT)通过将空域信号转换到频率域,在图像压缩领域取得了广泛引用。

因此本专利发明了一种基于离散余弦变化的频域注意力机制的图像去雾方法,显式得在频域对图像进行建模,获得了更好的图像细节信息。

发明内容

本发明要解决的技术问题是提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,设计了一种融入离散余弦变化(DCT)和多层感知机(MLP)的基本网络模块,使得在频域对图像进行建模,获得了更好的图像细节信息。

为解决上述技术问题,本发明的实施例提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,包括以下步骤:

S1、构建基于频域的注意力模块;

S2、构建基础网络模块:由若干个残差模块、一个基于频域的注意力模块和一个3×3卷积层组成;

S3、构建去雾网络模型:由一个3×3卷积层、一个降采样层、若干个基本网络模块、一个升采样层和一个3×3卷积层构成;

S4、设计损失函数:由平滑L

S5、利用有雾图像和无雾图像对去雾网络模型进行训练,得到去雾网络模型的模型参数;

S6、在去雾网络模型中导入步骤S3训练好的模型参数,输入有雾图像,输出得到无雾图像。

其中,步骤S1中,所述基于频域的注意力模块包含两个3×3卷积层、两个离散余弦变化网络层DCT和包含一个隐藏层的多层感知机MLP,通过Sigmoid激活函数融合而成。

其中,所述离散余弦变化网络层将输入特征f

其中,步骤S2中,所述残差模块由一个3×3卷积层、ReLU激活函数、一个3×3卷积层组成。

其中,去雾网络模型中,降采样层与升采样层之间进行短连接,基本网络模块之间进行短连接。

其中,所述基本网络模块数量设置为奇数,以保证网络模型对称,并通过短连接将低层网络的特征引入高层网络,提高特征表达。

其中,步骤S4中,平滑L

其中,

其中,步骤S5中,对去雾网络模型进行训练的步骤为:

(1)选取有雾-无雾的图像对样本集,各12000张,测试图像1200对;

(2)优化函数为Adam,参数β

(3)训练200轮,每20轮测试一次结果,测试结果采用峰值信噪比和结构相似性进行度量,选择最好的结果保存模型参数。

本发明上述技术方案的有益效果如下:

本发明提出一种基于离散余弦变化的频域注意力机制的图像去雾方法,设计了一种融入离散余弦变化(DCT)和多层感知机(MLP)的基本网络模块,用于提取图像特征,并通过平滑L

附图说明

图1为本发明中去雾网络模型图;

图2为本发明中基于频域的注意力模块结构图;

图3为本发明中残差模块结构图;

图4为本发明中基本网络模块结构图;

图5为本发明实施例一中图像去雾前后对比图;

图6为本发明实施例二中图像去雾前后对比图。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

本发明的实施例提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,包括以下步骤:

S1、构建基于频域的注意力模块(见图2);

S2、构建基础网络模块(见图4):由若干个残差模块、一个基于频域的注意力模块和一个3×3卷积层组成;

S3、构建去雾网络模型(见图1):由一个3×3卷积层、一个降采样层、若干个基本网络模块、一个升采样层和一个3×3卷积层构成;

S4、设计损失函数:由平滑L

S5、利用有雾图像和无雾图像对去雾网络模型进行训练,得到去雾网络模型的模型参数;

S6、在去雾网络模型中导入步骤S3训练好的模型参数,输入有雾图像,输出得到无雾图像。

所述基于频域的注意力模块包含两个3×3卷积层、两个离散余弦变化网络层DCT和包含一个隐藏层的多层感知机MLP,通过Sigmoid激活函数融合而成。

所述离散余弦变化网络层将输入特征f

步骤S2中,所述残差模块由一个3×3卷积层、ReLU激活函数、一个3×3卷积层组成。结构如图3所示。

所述基本网络模块数量设置为奇数,以保证网络模型对称,并通过短连接将低层网络的特征引入高层网络,提高特征表达。

所述基本网络模块输入为待去雾图像,经过一个3×3卷积层预处理后,通过一个降采样降低特征维度以减小计算量,然后通过若干个步骤2中的基本网络模块提取特征,最后通过升采样层恢复特征维度,并采用一个3×3卷积层进行后处理得到复原图像。

步骤S4中,平滑L

其中,

其中,步骤S5中,对去雾网络模型进行训练的步骤为:

(1)选取有雾-无雾的图像对样本集,各12000张,测试图像1200对;

(2)优化函数为Adam,参数β

(3)训练200轮,每20轮测试一次结果,测试结果采用峰值信噪比(PSNR)和结构相似性(SSIM)进行度量,选择最好的结果保存模型参数。

为了验证本发明的创新性,进行测试,测试结果为:采用峰值信噪比(PSNR)和结构相似性(SSIM)进行度量,在RESIDE的室内测试集上PSNR=36.62,SSIM=0.9901,室外测试上PSNR=34.71,SSIM=0.9904,结果均好于现有方法。去雾后的可视化效果如图5、图6所示。

其中,图5a和图6a为去雾前图像,图5b和图6b为去雾后图像。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 一种基于离散余弦变换的伪装隐蔽水声通信方法
  • 一种基于注意力机制的单图像去雾方法
  • 一种基于混合卷积的通道注意力机制和分层学习的神经网络图像去雾方法
技术分类

06120115918054