掌桥专利:专业的专利平台
掌桥专利
首页

基于像元时域分布学习的低信噪比运动点目标检测方法

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及低信噪比运动点目标检测领域,具体涉及一种基于像元时域分布学习的低信噪比运动点目标检测方法。

背景技术

运动点目标检测在遥感、工业、安防等领域具有重要应用,也是国内外的研究热点。为了监测和跟踪高威胁动态目标,需要探测设备尽可能扩大监视范围,提升探测距离,但同时远距离大视场探测下的运动目标成像后像元占比会变小、信噪比会变低。当目标的像元占比、信噪比在一定阈值以下时即可定义为暗弱运动点目标。运动点目标由于图像空域特性少、强度弱,难以利用强度、纹理、尺寸、几何特征等空域特征将目标与背景进行区分。

传统的检测算法有背景建模法、帧间差分法、光流法、局部对比度法、先检测后追踪、先跟踪后检测等方法。上述方法在目标快速运动和背景复杂的情况下无法实现低信噪比运动点目标检测的问题。同时,这些方法以空域信息为主,仅引入时域信息进行辅助,没有充分利用运动目标在时域上的运动特性。近些年来,深度学习在图像目标检测领域取得巨大进展,逐渐成为主流的检测方法。基于深度学习的弱小目标检测算法一般通过改进经典的目标检测网络模型和增强目标特征的思路进行目标检测,但该方法仍然利用的是目标纹理、尺寸、轮廓等空域视觉信息,存在训练样本少、泛化能力差、易错检漏检等缺点,无法应用到目标尺寸小、信噪比低的缺乏空域特征的运动点目标检测场景中。

本文从目标的时域运动信息入手,将基于强度、形状、尺寸等空域特征的目标检测问题转化为在时域上对像元时序信号中微弱瞬态扰动信号检测问题。然而低信噪比运动点目标信号无论在信号强度、形状纹理、还是时间占比,目标信号的信息量都极少。而信号中背景和噪声大量存在,它们的信息量远远大于目标信息量。因为背景和噪声的信息量极多,目标信息量极少,目标的信息量会淹没背景和噪声中,所以训练的过程中会出现目标特征提取困难的问题。本文转换思路,忽略微弱的目标信号,转向对信息量极多的背景像元时序信号和噪声像元时序信号的特征提取,构建一种像元时域分布学习的网络模型去学习像元时域分布特性,然后通过差分得到目标信号。

针对低信噪比运动点目标空域特征信息很少,难以检测等难题,本文提出一种基于像元时域分布学习的低信噪比运动点目标检测方法,将基于强度、形状、尺寸等空域特征的目标检测问题转化为在时域上对像元时序信号中微弱瞬态扰动信号检测问题。通过训练像元时域分布学习网络,实现了低信噪比下瞬态扰动信号的检测,进而实现低信噪比运动点目标检测。

发明内容

为了解决低信噪比运动点目标检测问题,本文申请提出一种基于像元时域分布学习的低信噪比运动点目标检测方法,所述方法首先采集不同场景的视频数据,获取真实像元时序信号数据和仿真像元时序信号数据,并建立训练数据集和测试数据集;然后构建像元时域分布学习的网络模型;之后使用训练数据集,采取mask加权MSE作为损失函数,设置模型训练的相关参数对网络模型进行训练;最后,把测试数据集输入训练后的像元时域分布学习模型,对运动点目标进行检测。

作为上述技术方案的改进之一,所述方法建立像元时域信号训练数据集和测试数据集、构建像元时域分布学习网络模型、对网络模型进行训练及测试的过程包括如下步骤:

步骤A:使用相机远距离拍摄不同场景的视频数据,将视频数据的每一个像元时序信号,作为真实像元时序信号数据;利用高斯随机函数产生仿真像元时域信号数据,生成不同信号长度、形状和强度的一维瞬态信号;真实像元时序信号数据和仿真像元时域信号数据作为背景信号,一维瞬态信号作为目标信号,将目标信号叠加在背景信号数据上,以此构建训练数据集和测试数据集;

步骤B:构建像元时域分布学习的网络模型,所述网络模型包括两个阶段:下采样时域分布特性提取阶段和上采样时序信号重构阶段,每个阶段都是由多个conv1D_Block层堆叠而成;

步骤C:采取mask加权MSE作为损失函数,设置网络模型的训练参数,所述参数包括:学习率、训练轮数和训练批次,对像元时域分布学习网络模型进行训练,获取训练好的模型参数;

步骤D:创建像元时域分布学习网络模型,加载已经训练好的模型参数;把测试数据集输入像元时域分布学习模型,对运动点目标进行检测。

作为上述技术方案的改进之一,所述步骤A具体过程包括:

步骤A1:使用相机远距离拍摄不同场景的视频数据,将视频数据的每一个像元时序信号,作为真实像元时序信号数据;

步骤A2:在真实像元时序信号数据上叠加一维瞬态信号,建立真实像元时序信号数据集;一维瞬态信号的目标类型为钟形或矩形;目标信号长度为8 ~32帧;目标信噪比为-3 dB 到2 dB;

步骤A3:使用高斯随机函数产生仿真像元时域信号数据,在仿真像元时序信号数据上叠加一维瞬态信号,建立仿真像元时序信号数据集;仿真像元时序信号的背景生成方式为定值和线性变换,仿真时域信号的噪声包括高斯白噪声、有色噪声和相关噪声;一维瞬态信号的目标类型为钟形或矩形;目标信号长度为8~32帧;目标信噪比为-3 dB 到2 dB;

步骤A4:通过设置像元时序信号的背景数据类型、一维瞬态信号类型、一维瞬态信号长度和一维瞬态信号信噪比,制作出不同背景类型、形状、长度和信噪比的多组训练数据集和测试数据集,分别均包括真实像元时序信号数据集和仿真像元时序信号数据集。

作为上述技术方案的改进之一,所述一维瞬态信号的类型为钟形时,表达式为:

其中,

所述一维瞬态信号的类型为矩形时,表达式为:

作为上述技术方案的改进之一,所述一维瞬态信号的类型为钟形时,信号最大强度值

其中,

所述一维瞬态信号的类型为矩形时,信号最大强度值

作为上述技术方案的改进之一,所述步骤B具体过程包括:

步骤B1:下采样时域分布特性提取阶段先使用一个conv1D_Block提取像元时域分布特征;然后使用三次conv1D_Block提取像元时域分布的高维分布特征,同时每次conv1D_Block后接一个下采样操作;

步骤B2:上采样的时序信号重构阶段使用了三次conv1D_Block重构像元时序信号,每次conv1D_Block后接一个上采样操作;将上采样阶段的特征图和下采样阶段的同层特征图进行融合,融合策略采用特征图逐元素相加;最后再经过一个conv1D_Block重构像元时序信号;

步骤B3:通过网络模型输出得到背景像元时序信号

作为上述技术方案的改进之一,所述conv1D_Block具体为:

一个conv1D_Block包括4个一维卷积层(conv-1D卷积层)、2个Relu激活函数、3条残差连接;其中卷积核的大小是1*3,padding是1,步长是1。

作为上述技术方案的改进之一,所述步骤C具体过程包括:

步骤C1:损失函数使用带加权mask的MSE损失;

步骤C2: 采用Adam优化器更新网络模型参数,初始时学习率lr是1e-5,训练批次(batchsize)是16;训练过程包括两部分:先以学习率lr是1e-5,训练不少于60轮,直到收敛;然后再降低学习率lr为1e-6,训练不少于20轮,进行模型微调。

作为上述技术方案的改进之一,所述步骤C1中损失函数

其中,

作为上述技术方案的改进之一,所述方法在使用测试集数据对训练完成的网络模型进行测试或使用模型对待测数据进行检测时,将测试数据或待测数据输入网络模型得到输入信号

所述目标像元时序信号的强度最大值的表达式为:

其中,max(·)为求最大值函数;abs(·)为求绝对值函数。

相比于传统运动点目标方法相比,基于像元时域分布学习的运动点目标检测方法具有以下优势:

1.该方法主要在时域上进行处理,通过学习有目标出现的像元和没有目标出现的像元对应的时域分布特性,实现目标检测。

2.针对目标信号特征弱,难以直接学习其分布特性的难题,设计了像元时域分布特性学习的网络模型,间接实现了瞬态扰动信号的检测。

3.使用带mask的加权的MSE损失,通过权重凸显了的微弱目标信号的信息,使得目标像元和背景像元二者的损失达到平衡。

附图说明

图1是本发明方法中像元时域分布学习的网络结构示意图;

图2是本发明方法中像元时域分布学习的网络结构中的conv1D_Block示意图;

图3是本发明方法中对不同信噪比的信号检测结果(仿真背景);

图4是本发明方法中对不同信噪比的信号检测结果(真实背景)。

具体实施方式

以下结合实施例进一步说明本发明所提供的技术方案。

本发明提供一种基于像元时域分布学习的低信噪比运动点目标检测方法,将基于强度、形状、尺寸等空域特征的目标检测问题转化为在时域上对像元时序信号中微弱的一维瞬态信号检测问题。通过学习像元时序信号的时域分布特性,得到了输入像元时序信号的背景像元时域分布,间接得到了目标像元时序信号,进而确定了运动点目标是否存在。本方法可以有效解决低信噪比运动点目标检测难题,提高检测准确率,同时降低虚警率。

为了解决低信噪比运动点目标检测问题,本文申请提出一种基于像元时域分布学习的低信噪比运动点目标检测方法,包括如下步骤:

步骤A:使用相机远距离拍摄不同场景的视频数据,将视频数据的每一个像元时序信号,作为真实像元时序信号数据。利用高斯随机函数产生仿真像元时域信号数据。生成不同信号长度、形状和强度的一维瞬态信号。真实像元时序信号数据和仿真像元时域信号数据作为背景信号,一维瞬态信号作为目标信号。将目标信号叠加在背景信号数据上,以此构建训练数据集和测试数据集。

步骤B:构建像元时域分布学习的网络模型,所述网络模型包括两个阶段:下采样时域分布特性提取阶段和上采样时序信号重构阶段,每个阶段都是由多个conv1D_Block堆叠而成。

步骤C:采取mask加权MSE作为损失函数,设置学习率、训练轮数和训练批次网络模型的训练参数,对像元时域分布学习网络模型进行训练。

步骤D:创建像元时域分布学习网络模型,加载已经训练好的模型参数。把测试数据集输入像元时域分布学习模型,对运动点目标进行检测。

为了使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明实施方案做进一步的详细描述。

本发明方案由四个部分组成:首先采集不同场景的视频数据,获取真实像元时序信号数据和仿真像元时序信号数据,并建立训练数据集和测试数据集;然后构建像元时域分布学习的网络模型;之后使用训练数据集,采取mask加权MSE作为损失函数,设置学习率、训练批次等参数对网络模型进行训练;最后,把测试数据集输入训练后的像元时域分布学习模型,对运动点目标进行检测。(本文采集是图像数据,但处理的并不是一帧一帧的图像,而是像元时序信号。)具体地,本方法包括以下步骤:

第一步:制作数据集

步骤A:使用相机远距离拍摄不同场景的视频数据,将视频数据的每一个像元时序信号,作为真实像元时序信号数据。利用高斯随机函数产生仿真像元时域信号数据。生成不同信号长度、形状和强度的一维瞬态信号,作为目标信号。并将一维瞬态信号叠加在真实像元时序信号数据和仿真像元时序信号数据上,以此构建训练数据集和测试数据集。

步骤A1:使用相机远距离拍摄不同场景的视频数据,将视频数据每一个像元的时序信号,作为真实像元时序信号数据。每个场景拍摄10组数据,所使用的相机帧频不低于500fps, 每组的视频数据的帧数不少于10000帧。

步骤A2:在真实像元时序信号数据上叠加不同尺寸、强度、信噪比的一维瞬态信号,建立真实像元时序信号数据集。一维瞬态信号的参数设置如表1所示,钟形信号如式(1)所示,矩形信号如式(2)所示,一维瞬态信号的幅值计算公式如式(5)或(6)所示。

表1 参数设置

式(1)中:

式(2)中:

式(3)中,

式(4)中,

钟形信号最大强度值表达式为:

式(5)中,

矩形信号最大强度值表达式为:

步骤A3:利用高斯随机函数产生仿真像元时域信号数据,在仿真像元时序信号数据上叠加不同尺寸、强度、信噪比的一维瞬态信号,建立仿真像元时序信号数据集。仿真像元时序信号数据的参数设置如表2所示,钟形信号如式(1)所示,矩形信号如式(2)所示,一维瞬态信号的幅值计算公式如式(5)或(6)所示。

表2 参数设置

步骤A4:通过设置像元时序信号的背景数据类型、一维瞬态信号类型、一维瞬态信号长度、一维瞬态信号信噪比不同的参数,制作出不同背景、形状、长度、信噪比的多组训练数据集和测试数据集,均包括真实像元时序信号数据集和仿真像元时序信号数据集。每个数据集包括不少于20000对训练数据,不少于5000对测试数据。

第二步:构建网络模型

步骤B:构建像元时域分布学习的网络模型。该网络模型包括两个阶段:下采样时域分布特性提取阶段和上采样时序信号重构阶段,每个阶段都是由多个conv1D_Block堆叠而成,如图1所示。具体过程包括:

步骤B1:网络模型组成的基本单元是conv1D_Block,如图2所示,由4个conv-1D、2个Relu激活函数、3条残差连接组成。其中卷积核的大小是1*3,padding是1,步长是1。conv1D_Block中的4个一维conv-1D卷积层次堆叠,加深了网络的层数,有利于学习时序信号中的数据分布的高维特性;3条残差连接增强了浅层信息向深层网络的流动,有助于缓解梯度消失的问题。每经过一次conv1D_Block,像元时域分布特性都进一步得到凝练。由时序信号的局部均值、强度、方差、对比度等浅层分布特性逐步学习到深层的抽象的时序分布高维特性。

步骤B2:下采样特征提取阶段先使用一个conv1D_Block提取像元时域分布特征,然后使用三次conv1D_Block提取像元时域分布的高维分布特征。每次conv1D_Block后接一个下采样操作,每次下采样后特征图尺寸减半,通道数翻倍,如公式(7)-(10)所示。一共经过4次conv1D_Block,3次下采样,信号长度变为原来的1/8。

式中:convB(·)表示一次conv1D_Block操作; Down(·)表示一次下采样操作。

步骤B3:上采样的数据重构阶段使用了三次conv1D_Block重构像元时序信号,每次conv1D_Block后接一个上采样操作,每次上采样后特征图尺寸翻倍,通道数减半。上采样阶段的特征图和下采样阶段的同层特征图进行融合,再经过一个conv1D_Block重构像元时序信号,如公式(11)-(14)。

融合策略采用的是特征图逐元素相加。两个阶段的特征图融合减少了下采样过程中信息损失,有助于在上采样过程中重构出更加精确的像元时序信号。上采样阶段的输出

式中: up(·)表示一次上采样操作;

步骤B4:通过网络模型输出得到背景像元时序信号

第三步:训练网络

步骤C:采取mask加权的MSE损失函数,设置学习率、训练轮数和训练批次网络模型的训练参数,对像元时域分布学习网络模型进行训练,具体过程包括:

步骤C1:损失函数使用带加权mask的MSE损失,如公式(16)-(18)所示。

目标像元时域分布的损失:

背景像元时域分布的损失:

总损失:

其中,

步骤C2:采用Adam优化器更新网络模型参数,初始时学习率lr是1e-5,训练批次(batchsize)是16。初始化训练参数,加载训练集和验证集,创建网络模型,对网络进行训练。训练过程包括两部分:先以学习率lr是1e-5,训练不少于60轮,直到收敛;然后再降低学习率lr为1e-6,训练不少于20轮,进行模型微调。

第四步:检测

步骤D:把测试数据集输入训练后的像元时域分布学习网络模型,对运动点目标进行检测,具体过程包括:

步骤D1:创建像元时域分布学习网络模型,加载训练好的网络模型参数。将测试集输入到网络模型中,经过网络模型处理得到输入信号的背景像元时序信号

步骤D2:将检测结果保存到mat文件中,通过matlab计算得到不同虚警率下的检测率,用ROC曲线评估检测的性能。检测性能如图3和图4所示。

图3是在仿真像元时序信号下进行运动点目标检测的ROC曲线。图4是在真实像元时序信号下进行运动点目标检测的ROC曲线。从图3和图4可以看出,对目标的检测性能与信噪比有关,随着信噪比的降低,检测性能下降。10%的虚警率下,检测率都能达到80%以上。

从上述对本发明的具体描述可以看出,本发明有效解决了低信噪比运动点目标检测难题,提高了检测准确率,同时降低了虚警率。

最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

相关技术
  • 基于像元时域分布学习的低信噪比运动点目标检测方法
  • 基于深度学习的低信噪比下雷达RD图像目标检测方法
技术分类

06120114730821