掌桥专利:专业的专利平台
掌桥专利
首页

一种水体耀斑检测方法和系统

文献发布时间:2024-04-18 19:52:40


一种水体耀斑检测方法和系统

技术领域

本发明属于水体耀斑检测领域,尤其涉及一种水体耀斑检测方法和系统。

背景技术

无人机遥感技术具有时效性强、成本低、便携性好等特点,弥补了传统卫星遥感空间分辨率低、重访周期长、易受云雾影响等方面的不足,已被广泛应用于地表生态系统的观测。水体的颜色主要取决于水中叶绿素、悬浮物和有色溶解性有机物等物质对光的吸收散射特性,而太阳耀斑的发生严重干扰了水体自身的光谱信号,给遥感地物分类、离水反射率估算、水环境遥感监测等造成巨大困难。

在强光照射下,非匀质物体表面容易发生镜面发射而出现光谱异常的现象。当目标对象为水体时,水面镜面反射太阳辐射从而形成耀斑。利用无人机获取地面影像的过程中,当水体、太阳和镜头三者构成镜面反射条件时,影像内的水体部分会含有大量的耀斑。此外,根据视点、光源位置的不同,耀斑产生的位置也有差异,飞机沿航线运动拍摄过程中可能会导致耀斑出现在水面的各个区域,单张影像经拼接后会形成大量的光谱饱和区。然而由于影像拍摄的光照环境复杂、地物类别多样,现有的耀斑检测去除算法很难直接应用于无人机影像当中。

现有技术一:

单张无人机影像水体高光自动检测与补偿方法[J]:利用无人机影像中的高光分量来近似高光程度,取红、绿、蓝中的最小值作为高光分量。对原始影像建立多尺度高斯金字塔,计算每个尺度的高光分量和HSV空间的饱和度分量。然后利用这两个分量的金字塔影像进行阈值分割。

现有技术二:

专利CN111932651A提供了一种水面耀斑的提取方法及装置,其中,方法包括:获取待提取遥感图像;待提取遥感图像为哨兵2遥感图像;确定待提取遥感图像中各个波段的遥感反射率,得到遥感反射率图像;从遥感反射率图像中提取包含水面耀斑的水体区域,得到提取后的遥感反射率图像;确定提取后的遥感反射率图像中第三波段遥感反射率大于预设阈值的像元为水面耀斑像元;依据水面耀斑像元,生成水面耀斑分布图。即本申请能够从待提取遥感图像中提取出水面耀斑。

现有技术的缺陷

现有技术一:该方法除了分离出实际高光区域外还含有较多非水体地物构成的误检测。

现有技术二:该方法提供一种哨兵2号卫星影像水面耀斑提取方法,然而本研究所针对的研究对象为无人机可见光影像。传感器之间存在巨大差异,而且在波段设置上可见光影像缺少近红外波段信息,这给耀斑提取造成了更大的不确定性。

发明内容

为解决上述技术问题,本发明提出一种水体耀斑检测方法的技术方案,以解决上述技术问题。本发明第一方面公开了一种水体耀斑检测方法,所述方法包括:步骤S1、采集水体影像图,并对所述水体影像图进行标注,生成训练集、验证集和测试集;

步骤S2、设计水体耀斑检测的深度神经网络模型;

步骤S3、应用所述训练集和验证集对所述深度神经网络模型进行训练和调参;

步骤S4、应用所述测试集和评价指标验证训练好的深度神经网络模型的准确性;

步骤S5、应用训练好的深度神经网络模型对采集的单张水体图像进行水体耀斑检测。

根据本发明第一方面的方法,在所述步骤S2中,所述深度神经网络模型包括:编码单元和解码单元;

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图;

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图。

根据本发明第一方面的方法,在所述步骤S2中,所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图的方法包括:

所述编码单元包括5个编码层:编码level1层、编码level2层、编码level3层、编码level4层和编码level5层;

将所述水体影像图输入所述编码level1层,经两次连续卷积,得到第一编码输出;

将所述第一编码输出进行最大池化操作后,输入所述编码level2层,经两次连续卷积,得到第二编码输出;

将所述第二编码输出进行最大池化操作后,输入所述编码level3层,经两次连续卷积,得到第三编码输出;

将所述第三编码输出进行最大池化操作后,输入所述编码level4层,经两次连续卷积,得到第四编码输出;

将所述第四编码输出进行最大池化操作后,输入所述编码level5层,经两次连续卷积,得到水体耀斑特征编码输出图。

根据本发明第一方面的方法,在所述步骤S2中,所述连续卷积的方法为:

首先进行第一3×3二维卷积,之后对第一3×3二维卷积的输出进行第一批量标准化,在后将第一批量标准化的输出输入第一ReLU激活函数,然后对第一ReLU激活函数的输出进行第二3×3二维卷积,之后对第二3×3二维卷积的输出进行第二批量标准化,在后将第二批量标准化的输出和第一3×3二维卷积的输出共同输入残差模块,进行特征图的相加操作,得到残差后的输出,最后将所述残差后的输出输入第二ReLU激活函数,得到两次连续卷积的结果。

根据本发明第一方面的方法,在所述步骤S2中,将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图的方法包括:

所述解码单元包括5个解码层:解码level1层、解码level2层、解码level3层、解码level4层和解码level5层;

将所述水体耀斑特征编码输出图输入解码level5层,经上采样卷积操作,得到第一解码输出;

在所述解码level4层,将所述第一解码输出与所述第四编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第二解码输出;

在所述解码level3层,将所述第二解码输出与所述第三编码输出进行跳跃连接后,输入解码level3层的CBAM注意力机制,所述解码level3层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第三解码输出;

在所述解码level4层,将所述第三解码输出与所述第二编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第四解码输出;

在所述解码level5层,将所述第四解码输出与所述第一编码输出进行跳跃连接后,输入解码level5层的CBAM注意力机制,所述解码level5层的CBAM注意力机制的输出经两次连续卷积后,输入1×1卷积,生成通道数为2的耀斑检测结果图。

根据本发明第一方面的方法,在所述步骤S2中,所述上采样卷积操作的方法为:

首先进行上采样,之后对上采样的输出进行一次3×3二维卷积。

根据本发明第一方面的方法,在所述步骤S2中,所述编码level1层的第一3×3二维卷积和第二3×3二维卷积的卷积核有32个;

所述编码level2层的第一3×3二维卷积和第二3×3二维卷积的卷积核有64个;

所述编码level3层的第一3×3二维卷积和第二3×3二维卷积的卷积核有128个;

所述编码level4层的第一3×3二维卷积和第二3×3二维卷积的卷积核有256个;

所述编码level5层的第一3×3二维卷积和第二3×3二维卷积的卷积核有512个。

本发明第二方面公开了一种水体耀斑检测系统,所述系统包括:

第一处理模块,被配置为,采集水体影像图,并对所述水体影像图进行标注,生成训练集、验证集和测试集;

第二处理模块,被配置为,设计水体耀斑检测的深度神经网络模型;

第三处理模块,被配置为,应用所述训练集和验证集对所述深度神经网络模型进行训练和调参;

第四处理模块,被配置为,应用所述测试集和评价指标验证训练好的深度神经网络模型的准确性;

第五处理模块,被配置为,应用训练好的深度神经网络模型对采集的单张水体图像进行水体耀斑检测。

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述深度神经网络模型包括:编码单元和解码单元;

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图;

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图。

采用本发明水体耀斑检测方法,检测水体耀斑的Precision达到0.835,Recall达到0.887,F1达到0.836,IOU达到0.747

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图包括:

所述编码单元包括5个编码层:编码level1层、编码level2层、编码level3层、编码level4层和编码level5层;

将所述水体影像图输入所述编码level1层,经两次连续卷积,得到第一编码输出;

将所述第一编码输出进行最大池化操作后,输入所述编码level2层,经两次连续卷积,得到第二编码输出;

将所述第二编码输出进行最大池化操作后,输入所述编码level3层,经两次连续卷积,得到第三编码输出;

将所述第三编码输出进行最大池化操作后,输入所述编码level4层,经两次连续卷积,得到第四编码输出;

将所述第四编码输出进行最大池化操作后,输入所述编码level5层,经两次连续卷积,得到水体耀斑特征编码输出图。

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述连续卷积为:

首先进行第一3×3二维卷积,之后对第一3×3二维卷积的输出进行第一批量标准化,在后将第一批量标准化的输出输入第一ReLU激活函数,然后对第一ReLU激活函数的输出进行第二3×3二维卷积,之后对第二3×3二维卷积的输出进行第二批量标准化,在后将第二批量标准化的输出和第一3×3二维卷积的输出共同输入残差模块,进行特征图的相加操作,得到残差后的输出,最后将所述残差后的输出输入第二ReLU激活函数,得到两次连续卷积的结果。

根据本发明第二方面的系统,所述第二处理模块,被配置为,将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图包括:

所述解码单元包括5个解码层:解码level1层、解码level2层、解码level3层、解码level4层和解码level5层;

将所述水体耀斑特征编码输出图输入解码level5层,经上采样卷积操作,得到第一解码输出;

在所述解码level4层,将所述第一解码输出与所述第四编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第二解码输出;

在所述解码level3层,将所述第二解码输出与所述第三编码输出进行跳跃连接后,输入解码level3层的CBAM注意力机制,所述解码level3层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第三解码输出;

在所述解码level4层,将所述第三解码输出与所述第二编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第四解码输出;

在所述解码level5层,将所述第四解码输出与所述第一编码输出进行跳跃连接后,输入解码level5层的CBAM注意力机制,所述解码level5层的CBAM注意力机制的输出经两次连续卷积后,输入1×1卷积,生成通道数为2的耀斑检测结果图。

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述上采样卷积操作为:

首先进行上采样,之后对上采样的输出进行一次3×3二维卷积。

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述编码level1层的第一3×3二维卷积和第二3×3二维卷积的卷积核有32个;

所述编码level2层的第一3×3二维卷积和第二3×3二维卷积的卷积核有64个;

所述编码level3层的第一3×3二维卷积和第二3×3二维卷积的卷积核有128个;

所述编码level4层的第一3×3二维卷积和第二3×3二维卷积的卷积核有256个;

所述编码level5层的第一3×3二维卷积和第二3×3二维卷积的卷积核有512个。

本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本公开第一方面中任一项的一种水体耀斑检测方法中的步骤。

本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本公开第一方面中任一项的一种水体耀斑检测方法中的步骤。

本发明提出的方案,针对基于水体的无人机可见光影像存在的耀斑,提出了Res_AUnet卷积神经网络,对耀斑进行精准提取。通过添加注意力机制使模型专注于水体耀斑的提取,减少了其他地物的误检测现象。适当减少每一层的卷积核个数并添加残差模块,减轻过拟合现象,使检测的水体耀斑更加准确。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为根据本发明实施例的一种水体耀斑检测方法的流程图;

图2为根据本发明实施例的实验方法流程图;

图3为根据本发明实施例的数据集示例图;

图4为根据本发明实施例的Res_AUnet网络结构图;

图5为根据本发明实施例的连续卷积结构图;

图6为根据本发明实施例的CBAM注意力机制结构图;

图7为根据本发明实施例的通道注意力机制结构图;

图8为根据本发明实施例的空间注意力机制结构图;

图9为根据本发明实施例的Res_AUnet网络、Unet网络模型以及阈值分割方法在随机挑选的三张无人机照片上的水体耀斑检测结果;

图10为根据本发明实施例的无人机影像上的水体耀斑检测结果对比;

图11为根据本发明实施例的一种水体耀斑检测系统的结构图;

图12为根据本发明实施例的一种电子设备的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明第一方面公开了一种水体耀斑检测方法。图1为根据本发明实施例的一种水体耀斑检测方法的流程图,如图1和图2所示,所述方法包括:

步骤S1、采集水体影像图,并对所述水体影像图进行标注,生成训练集、验证集和测试集;

步骤S2、设计水体耀斑检测的深度神经网络模型;

步骤S3、应用所述训练集和验证集对所述深度神经网络模型进行训练和调参;

步骤S4、应用所述测试集和评价指标验证训练好的深度神经网络模型的准确性;

步骤S5、应用训练好的深度神经网络模型对采集的单张水体图像进行水体耀斑检测。

在步骤S1,采集水体影像图,并对所述水体影像图进行标注,生成训练集、验证集和测试集。

具体地,使用无人机搭载的可见光相机拍摄水体的可见光影像,无人机飞行高度设置为300m。经过对河流的拍照,得到大量水体影像图,影像图的大小为5472×3648。

在一些实施例中,具体地,使用ENVI软件对水体影像图进行标注,将原始无人机照片(5472×3648)和标注文件(5472×3648)使用Python编程语言裁剪为统一的256×256大小,共生成1764组图像。

具体步骤如下:

1)使用ENVI标注水体影像图(5472x3648);

2)Python裁剪影像照片和标注文件(这两个都是5472x3648),裁剪后大小为256x256

3)裁剪后一共生成1764组图像。

然后,根据7:2:1的比例,划分训练集、测试集和验证集,其中1232组图像用于新构建的深度神经网络模型的训练,176组图像对用于训练过程中模型精度的验证,防止过拟合现象,356组图像对用于训练结束后网络模型效果的测试。数据集示例如图3所示。图片右侧标注文件中,白色代表标注的耀斑区域,黑色代表非耀斑区域。

在步骤S2,设计水体耀斑检测的深度神经网络模型。

在一些实施例中,在所述步骤S2中,所述深度神经网络模型包括:编码单元和解码单元;

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图;

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图。

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图的方法包括:

所述编码单元包括5个编码层:编码level1层、编码level2层、编码level3层、编码level4层和编码level5层;

将所述水体影像图输入所述编码level1层,经两次连续卷积,得到第一编码输出;

将所述第一编码输出进行最大池化操作后,输入所述编码level2层,经两次连续卷积,得到第二编码输出;

将所述第二编码输出进行最大池化操作后,输入所述编码level3层,经两次连续卷积,得到第三编码输出;

将所述第三编码输出进行最大池化操作后,输入所述编码level4层,经两次连续卷积,得到第四编码输出;

将所述第四编码输出进行最大池化操作后,输入所述编码level5层,经两次连续卷积,得到水体耀斑特征编码输出图。

所述连续卷积的方法为:

首先进行第一3×3二维卷积,之后对第一3×3二维卷积的输出进行第一批量标准化,在后将第一批量标准化的输出输入第一ReLU激活函数,然后对第一ReLU激活函数的输出进行第二3×3二维卷积,之后对第二3×3二维卷积的输出进行第二批量标准化,在后将第二批量标准化的输出和第一3×3二维卷积的输出共同输入残差模块,进行特征图的相加操作,得到残差后的输出,最后将所述残差后的输出输入第二ReLU激活函数,得到两次连续卷积的结果。

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图的方法包括:

所述解码单元包括5个解码层:解码level1层、解码level2层、解码level3层、解码level4层和解码level5层;

将所述水体耀斑特征编码输出图输入解码level5层,经上采样卷积操作,得到第一解码输出;

在所述解码level4层,将所述第一解码输出与所述第四编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第二解码输出;

在所述解码level3层,将所述第二解码输出与所述第三编码输出进行跳跃连接后,输入解码level3层的CBAM注意力机制,所述解码level3层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第三解码输出;

在所述解码level4层,将所述第三解码输出与所述第二编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第四解码输出;

在所述解码level5层,将所述第四解码输出与所述第一编码输出进行跳跃连接后,输入解码level5层的CBAM注意力机制,所述解码level5层的CBAM注意力机制的输出经两次连续卷积后,输入1×1卷积,生成通道数为2的耀斑检测结果图。

所述上采样卷积操作的方法为:

首先进行上采样,之后对上采样的输出进行一次3×3二维卷积。

所述编码level1层的第一3×3二维卷积和第二3×3二维卷积的卷积核有32个;

所述编码level2层的第一3×3二维卷积和第二3×3二维卷积的卷积核有64个;

所述编码level3层的第一3×3二维卷积和第二3×3二维卷积的卷积核有128个;

所述编码level4层的第一3×3二维卷积和第二3×3二维卷积的卷积核有256个;

所述编码level5层的第一3×3二维卷积和第二3×3二维卷积的卷积核有512个。

具体地,基于Unet提出了一个全新的卷积神经网络:Res_AUnet,如图4所示。由于水体耀斑的特征相对简单,Unet网络中过多的卷积核个数和连续卷积会造成过拟合现象,降低检测精度,因此在经过多次实验验证后,将卷积核的个数降为Unet网络的一半,并在连续卷积之间加入了残差模块,如图5所示。UNet网络在特征的跳跃连接时加入了过多无效特征,因此本申请在编码阶段的每次跳跃连接之后加入CBAM(Convolutional BlockAttention Module)注意力机制(图6),在通道和空间两个方向上专注于耀斑特征的提取,抑制其他无效的非耀斑特征,提高网络的检测精度。

深度神经网络模型,即Res_AUnet包括:编码单元和解码单元;

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图;

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图。

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图的方法包括:

如图4所示,所述编码单元包括5个编码层:编码level1层、编码level2层、编码level3层、编码level4层和编码level5层;

将大小为256×256×3的水体影像图输入所述编码level1层,经两次连续卷积,得到第一编码输出,大小为256×256×32;

将所述第一编码输出进行最大池化操作后,输入所述编码level2层,经两次连续卷积,得到第二编码输出,大小为128×128×64;最大池化操作降低网络的参数量,第一编码输出进行最大池化操作后,特征图大小变为第一编码输出的一半,为128×128×32;

将所述第二编码输出进行最大池化操作后,输入所述编码level3层,经两次连续卷积,得到第三编码输出,大小为64×64×128;

将所述第三编码输出进行最大池化操作后,输入所述编码level4层,经两次连续卷积,得到第四编码输出,大小为32×32×256;

将所述第四编码输出进行最大池化操作后,输入所述编码level5层,经两次连续卷积,得到水体耀斑特征编码输出图,大小为16×16×512。

如图5所示,所述连续卷积的方法为:

首先进行第一3×3二维卷积,之后对第一3×3二维卷积的输出进行第一批量标准化,在后将第一批量标准化的输出输入第一ReLU激活函数,然后对第一ReLU激活函数的输出进行第二3×3二维卷积,之后对第二3×3二维卷积的输出进行第二批量标准化,在后将第二批量标准化的输出和第一3×3二维卷积的输出共同输入残差模块,进行特征图的相加操作,得到残差后的输出,最后将所述残差后的输出输入第二ReLU激活函数,得到两次连续卷积的结果。

所述编码level1层的第一3×3二维卷积和第二3×3二维卷积的卷积核有32个;

所述编码level2层的第一3×3二维卷积和第二3×3二维卷积的卷积核有64个;

所述编码level3层的第一3×3二维卷积和第二3×3二维卷积的卷积核有128个;

所述编码level4层的第一3×3二维卷积和第二3×3二维卷积的卷积核有256个;

所述编码level5层的第一3×3二维卷积和第二3×3二维卷积的卷积核有512个。

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图的方法包括:

如图4所示,所述解码单元包括5个解码层:解码level1层、解码level2层、解码level3层、解码level4层和解码level5层;

将所述水体耀斑特征编码输出图输入解码level5层,经上采样卷积操作,得到第一解码输出,大小为32×32×256;

在所述解码level4层,将所述第一解码输出与所述第四编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第二解码输出,大小为64×64×128;跳跃连接可将两个特征图进行通道维度的合并,以获得最初层次的水体耀斑特征,提高检测精度;

在所述解码level3层,将所述第二解码输出与所述第三编码输出进行跳跃连接后,输入解码level3层的CBAM注意力机制,所述解码level3层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第三解码输出,大小为128×128×64;

在所述解码level4层,将所述第三解码输出与所述第二编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第四解码输出,大小为256×256×32;

在所述解码level5层,将所述第四解码输出与所述第一编码输出进行跳跃连接后,输入解码level5层的CBAM注意力机制,所述解码level5层的CBAM注意力机制的输出经两次连续卷积后,输入1×1卷积,生成通道数为2的耀斑检测结果图。在结果图中,一个通道表示预测为耀斑的概率,另一个为非耀斑的概率,通过最大值操作对比一个像素点两个通道数值的大小,判断当前像素点是否为耀斑,完成网络模型对水体耀斑的检测。

所述上采样卷积操作的方法为:

首先进行上采样,之后对上采样的输出进行一次3×3二维卷积。

CBAM注意力机制,如图6所示,进行通道和空间维度的耀斑特征重组,获取重要的水体耀斑特征,去除耀斑之外的无关特征,以进一步提升检测精度。CBAM注意力机制由通道注意力机制和空间注意力机制组成,特征输入CBAM注意力机制后,首先进行通道维度的重要特征提取,如图7所示。再进行空间维度的重要特征提取,如图8所示。在通道注意力机制中,首先进行全局平均池化操作和最大池化操作,获得通道维度的两个特征权重系数,再进行多层感知机操作,使权重系数具有非线性特征。将两个特征权重系数相加,进行Sigmoid激活函数操作得到不同通道的权重系数,将权重系数与原始特征图相乘,最终得到有不同通道重要信息的特征图。在空间注意力机制中,同样进行全局平均池化操作和最大池化操作,获得空间维度的两个特征权重系数,将两个权重系数串联,进行一次卷积操作,使其具有非线性特征。之后进行Sigmoid激活函数操作,得到不同空间特征的权重系数,将权重系数与原始特征图相乘,得到有不同空间重要信息的特征图。

在步骤S3,应用所述训练集和验证集对所述深度神经网络模型进行训练和调参。

具体地,Res_AUnet是基于PyTorch深度学习库构建的,编程环境为PyCharm,编程语言为Python。在模型训练过程中,训练周期设置为100个世代,数据输入批次大小为10,初始学习率为0.001。学习率采用等间隔调整策略(StepLR)进行调整,每迭代10个世代,学习率就减少到原来的一半。

在步骤S4,应用所述测试集和评价指标验证训练好的深度神经网络模型的准确性。

具体地,选取了Precision(P)、Recall(R)、F1分数(F1)和IOU(Intersection overUnion)四个指标来验证所提模型的准确性。四个指标的计算方法如下所示。

其中,TP代表实际为耀斑并且模型检测为耀斑的像素点,TN代表实际不是耀斑并且模型检测为不是耀斑的像素点,FP代表实际不是耀斑但模型检测为耀斑的像素点,FN代表实际是耀斑但模型检测为不是耀斑的像素点。

综上,本发明提出的方案能够针对基于水体的无人机可见光影像存在的耀斑,提出了Res_AUnet卷积神经网络,对耀斑进行精准提取。通过添加注意力机制使模型专注于水体耀斑的提取,减少了其他地物的误检测现象。适当减少每一层的卷积核个数并添加残差模块,减轻过拟合现象,使检测的水体耀斑更加准确。图9为训练好的Res_AUnet网络、Unet网络模型以及阈值分割方法在随机挑选的三张无人机照片上的水体耀斑检测结果。综合结果来看,本文提出的水体耀斑检测方法与其余方法相比,可准确地进行水体耀斑的快速、高精度检测,避免误检测,具有很强的普适性。图中白色区域代表神经网络模型检测出的水体耀斑,可以看出,Res_AUnet检测出的水体耀斑更加完整准确,同时误检测现象较少。表1为各指标的对比结果。

表1

从表1的数据可得,本文提出的Res_AUnet深度神经网络模型取得了更优的效果,Precision提升了1.07%,Recall提升了1.17%,F1提升了2.07%,IOU提升了2.06%。

图10中,白色代表检测出的水体耀斑,可以看出,训练好的Res_AUnet网络模型在其他无人机影像上也表现出了良好的检测效果,准确地检测出了水体耀斑,误检测现象较Unet网络和阈值分割方法大幅降低。

本发明第二方面公开了一种水体耀斑检测系统。图11为根据本发明实施例的一种水体耀斑检测系统的结构图;如图11所示,所述系统100包括:

第一处理模块101,被配置为,采集水体影像图,并对所述水体影像图进行标注,生成训练集、验证集和测试集;

第二处理模块102,被配置为,设计水体耀斑检测的深度神经网络模型;

第三处理模块103,被配置为,应用所述训练集和验证集对所述深度神经网络模型进行训练和调参;

第四处理模块104,被配置为,应用所述测试集和评价指标验证训练好的深度神经网络模型的准确性;

第五处理模块105,被配置为,应用训练好的深度神经网络模型对采集的单张水体图像进行水体耀斑检测。

根据本发明第二方面的系统,所述第二处理模块102,被配置为,所述深度神经网络模型包括:编码单元和解码单元;

所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图;

将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图。

根据本发明第二方面的系统,所述第二处理模块102,被配置为,所述编码单元对所述水体影像图进行水体耀斑特征提取,得到水体耀斑特征编码输出图包括:

所述编码单元包括5个编码层:编码level1层、编码level2层、编码level3层、编码level4层和编码level5层;

将所述水体影像图输入所述编码level1层,经两次连续卷积,得到第一编码输出;

将所述第一编码输出进行最大池化操作后,输入所述编码level2层,经两次连续卷积,得到第二编码输出;

将所述第二编码输出进行最大池化操作后,输入所述编码level3层,经两次连续卷积,得到第三编码输出;

将所述第三编码输出进行最大池化操作后,输入所述编码level4层,经两次连续卷积,得到第四编码输出;

将所述第四编码输出进行最大池化操作后,输入所述编码level5层,经两次连续卷积,得到水体耀斑特征编码输出图。

根据本发明第二方面的系统,所述第二处理模块102,被配置为,所述连续卷积为:

首先进行第一3×3二维卷积,之后对第一3×3二维卷积的输出进行第一批量标准化,在后将第一批量标准化的输出输入第一ReLU激活函数,然后对第一ReLU激活函数的输出进行第二3×3二维卷积,之后对第二3×3二维卷积的输出进行第二批量标准化,在后将第二批量标准化的输出和第一3×3二维卷积的输出共同输入残差模块,进行特征图的相加操作,得到残差后的输出,最后将所述残差后的输出输入第二ReLU激活函数,得到两次连续卷积的结果。

根据本发明第二方面的系统,所述第二处理模块102,被配置为,将所述水体耀斑特征编码输出图输入所述解码单元,得到耀斑检测结果图包括:

所述解码单元包括5个解码层:解码level1层、解码level2层、解码level3层、解码level4层和解码level5层;

将所述水体耀斑特征编码输出图输入解码level5层,经上采样卷积操作,得到第一解码输出;

在所述解码level4层,将所述第一解码输出与所述第四编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第二解码输出;

在所述解码level3层,将所述第二解码输出与所述第三编码输出进行跳跃连接后,输入解码level3层的CBAM注意力机制,所述解码level3层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第三解码输出;

在所述解码level4层,将所述第三解码输出与所述第二编码输出进行跳跃连接后,输入解码level4层的CBAM注意力机制,所述解码level4层的CBAM注意力机制的输出经两次连续卷积和上采样卷积操作后,得到第四解码输出;

在所述解码level5层,将所述第四解码输出与所述第一编码输出进行跳跃连接后,输入解码level5层的CBAM注意力机制,所述解码level5层的CBAM注意力机制的输出经两次连续卷积后,输入1×1卷积,生成通道数为2的耀斑检测结果图。

根据本发明第二方面的系统,所述第二处理模块102,被配置为,所述上采样卷积操作为:

首先进行上采样,之后对上采样的输出进行一次3×3二维卷积。

根据本发明第二方面的系统,所述第二处理模块,被配置为,所述编码level1层的第一3×3二维卷积和第二3×3二维卷积的卷积核有32个;

所述编码level2层的第一3×3二维卷积和第二3×3二维卷积的卷积核有64个;

所述编码level3层的第一3×3二维卷积和第二3×3二维卷积的卷积核有128个;

所述编码level4层的第一3×3二维卷积和第二3×3二维卷积的卷积核有256个;

所述编码level5层的第一3×3二维卷积和第二3×3二维卷积的卷积核有512个。

本发明第三方面公开了一种电子设备。电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时,实现本发明公开第一方面中任一项的一种水体耀斑检测方法中的步骤。

图12为根据本发明实施例的一种电子设备的结构图,如图12所示,电子设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、近场通信(NFC)或其他技术实现。该电子设备的显示屏可以是液晶显示屏或电子墨水显示屏,该电子设备的输入装置可以是显示屏上覆盖的触摸层,也可以是电子设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图12中示出的结构,仅仅是与本公开的技术方案相关的部分的结构图,并不构成对本申请方案所应用于其上的电子设备的限定,具体的电子设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

本发明第四方面公开了一种计算机可读存储介质。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,实现本发明公开第一方面中任一项的一种水体耀斑检测方法中的步骤中的步骤。

请注意,以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

技术分类

06120116335890