掌桥专利:专业的专利平台
掌桥专利
首页

一种基于无监督对比学习的无人机智能空中目标分群方法

文献发布时间:2024-04-18 19:59:31


一种基于无监督对比学习的无人机智能空中目标分群方法

技术领域

本发明涉及无人机技术,具体涉及一种基于无监督对比学习的无人机智能空中目标分群方法。

背景技术

随着大量低成本、小型化无人机的投入运用,空中作战规模不断扩大,态势瞬息万变,人类的认知速度已经难以跟上战场数据的增长和变化。利用人工智能技术处理空情态势,挖掘深度信息辅助指挥决策,可以为无人机作战平台提供快速准确的态势认知,赢得空战胜利的先机。态势认知的本质是把握复杂战场要素之间的模糊关系,识别出敌方的作战意图和战术欺骗,加快信息在指挥链条上的流转速度。空中战斗目标分群是态势感知阶段的关键内容,其目的在于将敌方空中参战力量按一定层次结构划分为不同的空间群和相互作用群,有助于减少态势信息的冗余,降低态势评估难度。基于此,已经有大量研究旨在提高空中目标自动分群的准确性、稳定性、敏捷性。闫孟达等提出基于cell的密度聚类算法,可以在未知簇类数目的情况下对流形分布的大规模飞机编队有较好的聚类效果(闫孟达,杨任农,左家亮等.基于深度学习的空空导弹多类攻击区实时解算[J].兵工学报,2020,41(12):2466-2477.)。马钰棠等引入流形距离,通过自适应选取聚类中心,并通过密度峰值算法完成空中目标自动分群(马钰棠,孙鹏,张杰勇等.基于MDk-DPC的空中目标自动分群方法[J/OL].北京航空航天大学学报:1-14[2023-10-16].DOI:10.13700/j.bh.1001-5965.2022.0797.)。但是上述兵力聚合方法均为对于静态环境目标的分群方法,抛弃了历史飞行数据的巨大信息量。薛俊杰等建立了全景卷积长短期记忆网络进行空中目标战术意图识别,在训练集上有不错的识别准确率(Xue J,Zhu J,Xiao J,et al.PanoramicConvolutional Long Short-Term Memory Networks for Combat IntensionRecognition of Aerial Targets[J].IEEE Access,2020,8:183312–183323.)。但是该方法属于有监督的分类方法,需要大量空中目标分群的标签数据,数据获取很难解决。因此,需要一种无监督的、具备提取历史特征的高准确度无人机目标分群方法。基于此,本发明提出了一种强历史记忆能力、高准确度和时间敏感性的基于无监督对比学习的空中目标自动分群方法。

发明内容

针对现有技术存在的问题,本发明提供一种基于无监督对比学习的智能空中目标分群方法,具体包括下列步骤:

步骤1:构建聚类友好的无监督对比学习网络;

无监督对比学习网络包括特征提取模块、时间序列生成模块;

特征提取模块,其使用一维卷积Conv1d层用于时间序列数据的平滑和压缩,将长时间段的飞行特征数据压缩到较小规模作为时间序列生成模块和聚类器的输入;

时间序列生成模块,其采用对比预测编码中的正样本构建方法,构建由循环神经网络RNN作为主体的多层神经网络,自回归地生成预测正样本;使用长短时记忆网络LSTM单元提取和传递历史飞行数据,以保留历史数据提取单元的信息;在长短时记忆网络之后添加多个全连接FC层,提升预测向量p

此外,网络构建过程中加入退出Dropout层、正则化BN层和激活RELU层以加速训练、缓解可能存在的过拟合问题;

步骤2:设计无监督的正负样本选择方法;

以训练想定中同一时刻的飞机互为负样本,以时间序列生成模块生成的预测样本作为预测正样本;

随机多个负样本与生成的预测正样本构成对比对;在神经网络训练过程中,不断扩大负样本间距使得压缩样本特征差距变大,提升压缩特征的聚类效果;

步骤3:构建三元组对比预测损失;

将压缩样本特征作为锚点,预测样本作为正样本,同一时刻其他飞机作为负样本,得到对比预测损失如下:

式中:g

式中,MSELoss表示平均平方误差损失函数,

步骤4:引入实时微调器调整模型;

在无监督对比学习网络的基础上加入一个实时微调器用于测试集和聚类过程;该实时微调器对于网络的微调发生在模型测试和使用阶段;

步骤5:使用聚类器对压缩特征进行聚类;

用层次聚类作为聚类器,设置与负样本损失相互耦合的距离超参数;层次聚类的距离超参数与负样本损失的耦合关系如下:

式中:D

在本发明的一个具体实施例中,实时微调器在每个想定测试的初始阶段对无监督对比学习网络以10

在本发明的另一个具体实施例中,γ为0.5-0.8。

本方法是一种基于无监督对比学习的无人机空中目标自动分群方法,与现有技术相比,本发明的优点在于:

1.在原有网络基础上加入通用性的实时微调器,针对作战场景进行网络微调,大大解决了作战环境复杂、训练数据不足的问题。

2.构建与层次聚类标准相互耦合的正负样本对。以生成正样本和多随机负样本作为对比组,在训练效果和聚类结果上显著好于其它正负样本选择方式。

3.针对特征提取和聚类问题设置新的聚类友好型损失函数,并与几种无监督损失函数和相似度度量方法进行对比,特征提取效果显著提升。

附图说明

图1示出无监督对比学习网络的示意图;

图2示出无监督网络训练过程中压缩特征的聚类指标变化情况;

图3示出在空战推演平台中,使用本方法的一架无人机进行空中目标分群时6个时刻分群状态的示意图,其中图3(a)示出在初始时刻,基于静态飞行数据能够正确识别编队信息;图3(b)示出模型能够根据短持续时间飞行数据识别起始飞行编队;图3(c)示出当编队位置非常接近的情况下,能准确分辨双机及多机编队;图3(d)示出当编队位置极其接近时,模型具备识别出处于中间位置执行截击任务的编组的能力;图3(e)示出模型展现出良好的历史信息记忆能力,在没有敌我识别信息和位置极度接近的情况下,准确区分辨红蓝双方飞机;图3(f)示出在大规模群体对抗情况下,模型能够根据历史信息和飞机状态实现准确分群。

具体实施方式

下面结合附图详细描述本发明。

本发明提供一种基于无监督对比学习的智能空中目标分群方法,具体包括下列步骤:

步骤1:构建聚类友好的无监督对比学习网络;

无监督对比学习网络包括特征提取模块、时间序列生成模块。

特征提取模块,其使用一维卷积(Conv1d)层用于时间序列数据的平滑和压缩,将长时间段的飞行特征数据压缩到较小规模作为时间序列生成模块和聚类器的输入。

时间序列生成模块,其采用对比预测编码中的正样本构建方法(

此外,网络构建过程中大量加入退出(Dropout)层、正则化(BN)层和激活(RELU)层以加速训练、缓解可能存在的过拟合问题。模型中的无监督对比学习网络如图1所示。在网络构建过程中加入退出(Dropout)层、正则化(BN)层和激活(RELU)层的方法为本领域技术人员熟知,不再累述。

步骤2:设计无监督的正负样本选择方法;

以训练想定中同一时刻的飞机互为负样本,以时间序列生成模块生成的预测样本作为预测正样本。

随机多个负样本与生成的预测正样本构成对比对。在神经网络训练过程中,不断扩大负样本间距使得压缩样本特征差距变大,提升压缩特征的聚类效果。

步骤3:构建三元组对比预测损失;

将压缩样本特征作为锚点,预测样本作为正样本,同一时刻其他飞机作为负样本,即得到对比预测损失,具体表达式如下:

式中,g

式中,MSELoss表示平均平方误差损失函数,

步骤4:引入实时微调器调整模型;

在无监督对比学习网络的基础上加入一个实时的微调器用于测试集和聚类过程。在预训练模型上进行微调的操作在深度学习领域已大量使用,但本发明中使用的实时微调器的不同之处在于其对于网络的微调是发生在模型测试和使用阶段,实时微调器的引入可以极大提升模型的分群效果,并且由于模型构建过程时控制了无监督对比学习网络大小,因此实时微调器的引入并不会过多降低算法的时间敏感性。在本发明的一个实施例中,实时微调器在每个想定测试的初始阶段对无监督对比学习网络以10

步骤5:使用聚类器对压缩特征进行聚类;

用层次聚类(Hierarchical Clustering)作为聚类器,设置与负样本损失相互耦合的距离超参数。层次聚类的距离超参数与负样本损失的耦合关系如下:

式中,D

图1示出无监督对比学习网络的示意图。图2示出无监督网络训练过程中压缩特征的聚类指标变化情况,从神经网络训练结果可知,所提出的无监督对比学习方法能够通过扩大负样本之间的距离更好地将长时序特征数据映射到低维空间,进而起到更好的聚类效果。

具体实施例

根据本发明技术方案的具体实施步骤,给出如下一个实施例。

步骤1:构建聚类友好的无监督对比学习网络

特征提取模块,其使用一维卷积(Conv1d)层用于时间序列数据的平滑和压缩,将长时间段的飞行特征数据压缩到较小规模作为时间序列生成模块和聚类器的输入。

时间序列生成模块,其借鉴对比预测编码中的正样本构建方法(

此外,网络构建过程中大量加入退出(Dropout)层、正则化(BN)层和激活(RELU)层以加速训练、缓解可能存在的过拟合问题。模型中的无监督对比学习网络如图1所示。

步骤2:设计无监督的正负样本选择方法

将压缩样本特征作为锚点,预测样本作为正样本,同一时刻其他飞机作为负样本,即得到对比预测损失,具体表达式如下:

式中:g

步骤4:采用实时微调器调整模型

在无监督对比学习网络的基础上加入一个实时的微调器用于测试集和聚类过程。具体来说,在每个想定测试的初始阶段对无监督对比学习网络以10

步骤5:使用聚类器对压缩特征进行聚类

用层次聚类(Hierarchical Clustering)作为聚类器,设置与负样本损失相互耦合的距离超参数。层次聚类的距离超参数与负样本损失的耦合关系如下:

式中:D

图3示出在空战推演平台中,使用本方法的一架无人机进行空中目标分群时6个时刻分群状态的示意图,图3(a)示出在初始时刻,基于静态飞行数据能够正确识别编队信息;图3(b)示出模型能够根据短持续时间飞行数据识别起始飞行编队;图3(c)示出当编队位置非常接近的情况下,能准确分辨双机及多机编队;图3(d)示出当编队位置极其接近时,模型具备识别出处于中间位置执行截击任务的编组的能力;图3(e)示出模型展现出良好的历史信息记忆能力,在没有敌我识别信息和位置极度接近的情况下,准确区分辨红蓝双方飞机;图3(f)示出在大规模群体对抗情况下,模型能够根据历史信息和飞机状态实现准确分群。

相关技术
  • 电子设备端口类型检测方法、装置、检测电路及电子设备
  • 光电检测装置及其制备方法、心率检测装置和电子设备
  • 一种液位检测装置和包含其的设备以及液位检测方法、电子设备及计算机可读存储介质
  • 图片相似度检测方法、装置、介质及电子设备
  • 多副本数据的一致性检测方法和装置以及电子设备
  • 牵引车与挂车之间的角度检测方法、装置和电子设备
  • 挂车角度检测方法、装置及电子设备
技术分类

06120116516664