掌桥专利:专业的专利平台
掌桥专利
首页

一种多算法的ADS-B辐射源个体识别方法及系统

文献发布时间:2024-04-18 19:54:45


一种多算法的ADS-B辐射源个体识别方法及系统

技术领域

本发明涉及辐射源个体识别技术领域,特别是涉及一种多算法的ADS-B辐射源个体识别方法及系统,具体为一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别方法及系统。

背景技术

广播式自动相关监视系统(ADS-B系统)是集成无线数据通信技术和卫星导航定位技术于一体的自动化监视系统,广泛应用于各种飞行设备。近年来随着空中交通的快速发展,飞行设备与日俱增,准确识别ADS-B信号辐射源个体,实现飞行动态监视,可以有效避免空域安全事故的发生,进而为相关人员研判不明目标的属性、分析定位目标、还原空情态势提供有价值的判定依据。然而随着空域流量的激增,且信道环境日趋复杂,ADS-B辐射源个体识别的稳定性显著降低,该问题已成为该领域急需攻克的难题之一。

目前辐射源个体识别技术飞速发展,涌现了一大批较好的辐射源个体识别新方法,例如:利用改进后的极限学习机(Extreme Learning Machine,ELM)来训练辐射源信号的复杂度特征的方法,能够较为准确地识别信号类别,然而随着辐射源个体数量的增加识别效果不佳。

随着卷积神经网络(Convolutional Neural Network,CNN)的兴起和成熟,通常将CNN与星座图特征相结合,利用卷积神经网络对星座图进行特征提取,在识别效果上得到了较大的提升,例如:使用残差网络(Residual Network,ResNet)对I路数据、Q路数据进行综合特征提取的方法,以此提高数据的利用率,得到了较高的准确率;在深度残差网络模型中引入注意力机制和软阈值函数的方法,使改进后的残差网络模型(Deep ResidualShrinkage Networks,DRSN)具有较高的识别准确率和抗噪声性能;基于矢量图的SEI方法,利用神经网络提取矢量图中的特征进行识别,取得了较好的识别效果;直接输入IQ数据进行端到端的个体识别的方法,虽然有很好的识别效果但是由于所提取特征的不确定性,模型的泛化性能较差。

以上方法虽然在一定程度上提高了模型的识别效果,但是在实际应用中其识别性能均随着辐射源个体数量的增加显著下降。因此提高模型的稳定鲁棒性,使之能够在不同的辐射源个体数量情况下依旧保持较高的准确率就变得至关重要。

发明内容

本发明的目的是提供一种多算法的ADS-B辐射源个体识别方法及系统,在辐射源个体数量增加的情况下依旧能够保持较高的识别率。

为实现上述目的,本发明提供了如下方案:

本发明提供了一种多算法的ADS-B辐射源个体识别方法,包括:

获取目标ADS-B辐射源信号,并对所述目标ADS-B辐射源信号进行预处理;

将预处理后的所述目标ADS-B辐射源信号输入至ADS-B识别模型中,得到所述目标ADS-B辐射源信号对应的ADS-B辐射源个体;

所述ADS-B识别模型的训练过程为:

获取原始样本数据集;所述原始样本数据集包括多个样本数据,所述样本数据包括输入数据以及对应的标签数据;所述输入数据为样本ADS-B辐射源信号,所述标签数据为所述样本ADS-B辐射源信号对应的ADS-B辐射源个体;

对所述原始样本数据集中的样本数据进行预处理,得到预处理后的样本数据集;所述预处理后的样本数据集包括多个预处理后的样本数据,预处理后的样本数据包括样本ADS-B信号特征图以及对应的标签数据;

利用预处理后的样本数据集训练集成模型,得到ADS-B识别模型;其中,所述集成模型是利用集成算法将神经网络算法和随机森林算法进行集成后得到的网络。

本发明还提供了一种多算法的ADS-B辐射源个体识别系统,包括:

数据获取模块,用于获取目标ADS-B辐射源信号,并对所述目标ADS-B辐射源信号进行预处理;

预测模块,用于将预处理后的所述目标ADS-B辐射源信号输入至ADS-B识别模型中,得到所述目标ADS-B辐射源信号对应的ADS-B辐射源个体;

所述ADS-B识别模型的训练过程为:

获取原始样本数据集;所述原始样本数据集包括多个样本数据,所述样本数据包括输入数据以及对应的标签数据;所述输入数据为样本ADS-B辐射源信号,所述标签数据为所述样本ADS-B辐射源信号对应的ADS-B辐射源个体;

对所述原始样本数据集中的样本数据进行预处理,得到预处理后的样本数据集;所述预处理后的样本数据集包括多个预处理后的样本数据,预处理后的样本数据包括样本ADS-B信号特征图以及对应的标签数据;

利用预处理后的样本数据集训练集成模型,得到ADS-B识别模型;其中,所述集成模型是利用集成算法将神经网络算法和随机森林算法进行集成后得到的网络。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明提供了一种多算法的ADS-B辐射源个体识别方法及系统,其涉及的集成模型是利用集成算法将神经网络算法和随机森林算法进行集成后得到的网络,相较于单一的神经网络,识别准确率有了较为明显的提升,且在辐射源个体数量增加的情况下依旧能够保持较高的识别率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别方法的流程示意图;

图2为本发明实施例提供的ADS-B识别模型训练过程示意图;

图3为本发明实施例提供的ADS-B辐射源信号波形格式图;

图4为本发明实施例提供的两架飞机ADS-B辐射源信号的I、Q路数据图;

图5为本发明实施例提供的两类不同ADS-B辐射源信号的I、Q数据拼接图;

图6为本发明实施例提供的一个样本数据扩增后的数据结果图;

图7为本发明实施例提供的集成模型的结构示意图;

图8为本发明实施例提供的DRSN网络的结构示意图;

图9为本发明实施例提供的硬投票集成原理图;

图10为本发明实施例提供的集成模型的训练损失和验证损失随迭代次数变化的曲线图;

图11为本发明实施例提供的五种不同网络模型及集成模型的准确率的对比图;

图12为本发明实施例提供的随辐射源种类增加集成模型的准确率示意图;

图13为本发明实施例提供的一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别系统的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

集成学习(Ensemble Learning)能综合各个模型的优点,使得模型的鲁棒性更强,已被用于文本和图像识别领域,并取得较好的识别效果。例如,一种轻量化的增量式集成学习算法,实现了关于类别数量的线性计算复杂度,在降低训练成本的同时在一定信噪比范围内依然能保持相对较高的准确率。再例如一种基于蚁群特征选择并行分类集成学习的孪生辐射源个体识别方法,由二分类扩展到多分类,提高了模型的适用性,获得了较好的识别效果。结合集成学习的思想,本发明实施例提供了一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别方法,构建的集成模型VRDGD-RF(ensemble model of VGG19,ResNet34,DenseNet,GoogleNet,DRSN18and Random Forest)相较于单一的神经网络,识别准确率有了较为明显的提升,且在辐射源个体数量增加的情况下依旧能够保持较高的识别率。

如图1所示,本发明实施例提供的一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别方法,具体包括如下步骤。

步骤100:获取目标ADS-B辐射源信号,并对所述目标ADS-B辐射源信号进行预处理。

步骤200:将预处理后的所述目标ADS-B辐射源信号输入至ADS-B识别模型中,得到所述目标ADS-B辐射源信号对应的ADS-B辐射源个体。

其中,如图2所示,所述ADS-B识别模型的训练过程为:

步骤A:获取原始样本数据集;所述原始样本数据集包括多个样本数据,所述样本数据包括输入数据以及对应的标签数据;所述输入数据为样本ADS-B辐射源信号,所述标签数据为所述样本ADS-B辐射源信号对应的ADS-B辐射源个体。

在本发明实施例中,原始样本数据集的输入数据为基于1090ES数据链中的ADS-B辐射源信号,工作在1090MHz的ADS-B辐射源信号由报头和数据位两部分组成,8us的报头共计有4个脉冲,脉冲的宽度是0.5us,4个脉冲的位置固定,分别间隔1.0us,3.0us,4.5us。数据位分别由5位的下行链路格式字段(DF)、3位的附加标识符段(CA)、24位的唯一标识符段(ICAO)、56位扩展的消息段(ME)以及24位的奇偶校验字段(PI)构成,具体如图3所示。

数据位采用的是脉冲位置调制(PPM),由于数据速率为1Mbps,因此每条消息存在时间为120μs。为了排除地址模式对识别结果的影响以及保护数据隐私,数据已根据信号的帧结构去除了唯一标识符(ICAO)对应的信号片段。

步骤B:对所述原始样本数据集中的样本数据进行预处理,得到预处理后的样本数据集。

首先为了降低数据幅度对特征的影响,需要对样本ADS-B辐射源信号进行归一化处理;每个样本ADS-B辐射源信号的数据维度为2*4800的I路数据、Q路数据,画出该I路数据、Q路数据的二维图片;其中,图4为两架飞机ADS-B辐射源信号的I路数据图、Q路数据图。图4的横坐标是采样点,图4纵坐标的单位为伏特;图4的(a)为第一类I路数据图,图4的(b)为第一类Q路数据图,图4的(c)为第二类I路数据图,图4的(d)为第二类Q路数据图。

其次,在归一化之后,通过对归一化后的I路数据、Q路数据的观察发现,归一化后的I路数据、Q路数据之间的关系存在着某些共性和差异性,且归一化后的I路数据、Q路数据均为样本ADS-B辐射源信号的特征数据,为提高数据的利用率,采用左右拼接的方式将归一化后的I路数据、Q路数据整合在一起形成I、Q路数据拼接图,得到如图5所示两类不同ADS-B辐射源信号的I、Q路数据拼接图,具体为:将样本ADS-B辐射源信号的I路数据、Q路数据的时间为横轴,归一化后的I路数据、Q路数据为纵轴,将归一化后的I路数据、Q路数据以左右拼接的形式拼接在一起,得到I、Q数据拼接图,也称为样本ADS-B信号特征图。其中,图5的(a)为第一类拼接数据图,图5的(b)为第二类拼接数据图。

最后,为了防止出现过拟合现象,应当在不产生失真的情况下对已存在的样本数据进行扩增,本发明实施例使用的样本数据扩增方法为由亮度增强、旋转(90°和180°)、翻转(90°和180°)、灰暗和对比度增强相结合的方法。在使用以上方法进行扩增后,样本ADS-B辐射源信号可以扩增到原来的12倍。以其中一个样本数据为例,扩增后的数据结果如图6所示。具体为:采用样本数据扩增方法,对样本ADS-B信号特征图进行扩增处理,得到预处理后的样本数据集。所述预处理后的样本数据集包括多个预处理后的样本数据,预处理后的样本数据包括样本ADS-B信号特征图以及对应的标签数据。图6的(a)为原图,图6的(b)为对原图进行高斯模糊后得到的图,图6的(c)为对原图进行亮度增强后得到的图,图6的(d)为对原图进行逆时针旋转90度后得到的图,图6的(e)为对原图进行灰暗后得到的图,图6的(f)为对原图进行水平翻转后得到的图,图6的(g)为对原图依次进行水平翻转、垂直翻转后得到的图,图6的(h)为对原图进行垂直翻转后得到的图,图6的(i)为对原图依次进行水平翻转、垂直翻转、灰暗后得到的图,图6的(j)为对原图依次进行垂直翻转、高斯模糊后得到的图,图6的(k)为对原图依次进行顺时针旋转180度、亮度增强后得到的图,图6的(m)对原图依次进行顺时针旋转180度、高斯模糊后得到的图。

步骤C:利用预处理后的样本数据集训练集成模型,得到ADS-B识别模型;其中,所述集成模型是利用集成算法将神经网络算法和随机森林算法进行集成后得到的网络。具体为:

将预处理后的样本数据集按照8:1:1划分为训练集、验证集和测试集。

利用集成算法将神经网络算法和随机森林算法进行集成,以构建集成模型。

利用训练集和验证集训练集成模型,得到训练好的集成模型。

利用训练好的集成模型训练得到的参数对训练好的集成模型的性能进行评估,并将性能满足设定条件的训练好的集成模型确定为ADS-B识别模型。

所述集成模型包括网络输入端、神经网络集成模块、随机森林集成模块、投票模块以及网络输出端;

所述网络输入端分别与所述神经网络集成模块的输入端和所述随机森林集成模块的输入端连接;所述投票模块的输入端分别与所述神经网络集成模块的输出端和所述随机森林集成模块的输出端连接;所述投票模块的输出端与所述网络输出端连接。

进一步地,所述神经网络集成模块包括bootstrap算法模块以及与所述bootstrap算法模块的输出端分别连接的VGG网络、DRSN网络、ResNet网络、GoogleNet网络和DenseNet网络;所述网络输入端与所述bootstrap算法模块的输入端连接;所述投票模块的输入端分别与所述VGG网络的输出端、所述DRSN网络的输出端、所述ResNet网络的输出端、所述GoogleNet网络的输出端和所述DenseNet网络的输出端连接。

所述DRSN网络包括依次连接的输入层、卷积层、残差收缩层、归一化层、激活函数层、平均池化层、全连接层以及输出层;所述残差收缩层是在ResNet残差模块的基础上添加注意力机制算法和软阈值函数后构建的层。

所述随机森林集成模块包括bootstrap算法模块和多个相同的随机森林;所述网络输入端与所述bootstrap算法模块的输入端连接;所述bootstrap算法模块的输出端分别与每个所述随机森林的输入端连接;所述投票模块的输入端分别与每个所述随机森林的输出端连接。

所述投票模块内置有相对多数投票法。

本发明实施例提供的集成模型VRDGD-RF的框架如图7所示,整体框架由五种神经网络和随机森林构成。本发明实施例在设计集成模型框架时,尝试用多种不同的深度神经网络搭配来构建集成模型,综合考虑集成模型收敛情况和识别率性能,最终确定由VGG19、DRSN18、ResNet34、GoogleNet、DenseNet121来构建集成模型VRDGD-RF,神经网络名称后面的数字代表该网络对应的层数。图7中bootsraping表示将样本多次重复抽样来建立新的样本,类似于重采样,可以提高模型的鲁棒性;block1、block2、block3、block4、block5分别表示上述五种神经网络;block6则由五个相同的随机森林RF构成。

通过以上的集成模型框架可以看出,首先将数据集使用bootstrap算法将数据进行重复抽样,形成新的数据样本,这样可以有效提高模型的鲁棒性,然后将分别送入神经网络模块和随机森林模块进行识别分类,每个block包含5个子神经网络,每个子神经网络都会输出一个预测结果,集成模型VRDGD-RF在这一阶段会获得30(6*5)个预测结果,再将这些预测结果使用多数投票法(voting)进行投票,得到集成模型的最终识别结果。

在本发明实施例中,集成模型中的主要分为神经网络模块和随机森林两个模块。其中神经网络模块中的VGG、ResNet、DenseNet、GoogleNet已较为熟知在此不做赘述,主要介绍DRSN18模块,其网络结构如图8所示。其中输入图片规格为120*120,通道数为3。Conv为卷积层,BN为归一化层,Relu为激活函数,K为卷积核,S为步长,Avgpool为平均池化层,FC为全连接层,RS-Block为残差收缩模块,RS-block主要是在ResNet残差模块的基础上添加了注意力机制算法和软阈值函数,可以有效提高模型的抗噪声性能和鲁棒性。

另一模块为随机森林模块,主要作用是能够随机采样和随机特征提取,可以通过大量的基础树模型找到最稳定可靠的结果,以此提高模型的鲁棒性和泛化性能。

对集成模型进行优化,即是对整个集成模型中的子学习器的组合进行优化,本发明实施例使用集成进化算法在模型融合过程中选择最优的子学习器组合。本发明实施例将神经网络和随机森林作为子学习器,对6种子学习器的输出结果进行多数投票得到最终分类结果,其系统结构如图9所示。

本发明实施例采用相对多数投票法(pluralityvoting),其数学模型为:

式(1)中的

其中,步骤100中的所述对所述目标ADS-B辐射源信号进行预处理,具体包括:

对目标ADS-B辐射源信号进行归一化处理;所述目标ADS-B辐射源信号的数据维度为2*4800的I路数据、Q路数据。

以目标ADS-B辐射源信号的I路数据、Q路数据的时间为横轴,以归一化后的I路数据、Q路数据为纵轴,将归一化后的I路数据、Q路数据以左右拼接的形式拼接在一起,得到目标ADS-B信号特征图。

所述目标ADS-B信号特征图为预处理后的所述目标ADS-B辐射源信号。

下面通过一个示例来验证本发明实施例提供的技术方案。

本示例使用的ADS-B数据集来自100架某民航客机的ADS-B辐射源信号,在训练集和测试集中每种类别的样本数量大致相同,每架飞机大约120个ADS-B数据样本,每个样本为数据维度2*4800的I/Q数据。训练集、验证集和测试集样本的比例设置为8:1:1,且每种样本的数据在训练集、验证集和测试集中都大致相等。集成模型的训练和测试则使用Pytorch框架,运行系统为Windows11,GPU为NVIDIARTXA6000,初始学习率设置为0.001,且每20个epoch进行一次更新,损失函数采用的是交叉熵损失函数Crossentr-opyLoss,优化器选用Adam。

损失收敛分析

图10为集成模型的训练损失和验证损失随迭代次数变化的曲线,从图10中可以看出,集成模型的训练损失在0.03处收敛,而集成模型的验证集损失则在0.19处收敛。由此可以看出集成模型在测试集上的表现较好,集成模型的收敛性能良好。

识别率对比分析

为了验证所提模型的有效性,仿真了集成模型VRDGD-RF和五种不同神经网络模型对30类ADS-B信号进行分类识别性能,其结果如图11所示。从图中可以看出集成模型的识别效果最佳,准确率高达94.52%。其次为DR SN18和ResNet34,两者准确率相差无几,最高准确率分别为91.21%和90.56%,稍差一点的VGG19则保持在80%,而DenseNet121的性能较集成模型弱将近18%,只有77%左右的准确率,效果最差的网络为GoogleNet,准确率只有70%不到。说明集成模型的性能相对于单一深度神经网络有较大提升。

识别率随辐射源个体数量影响分析

为了验证所提模型识别性能随辐射源个体数量的变化情况,仿真了不同数量辐射源个体情况下,集成模型VRDGD-RF的识别性能,其结果如图12所示。由图12可见,随着辐射源个体数量的增加,虽然集成模型的准确率呈下降趋势,但在辐射源个数增长至50时,集成模型的准确率仍能达到80%以上。由此可见,集成模型VRDGD-RF的泛化能力良好,在辐射源个体数量增加的情况下依旧能保持较高的识别率,且识别率的下降较为平缓。

综合指标对比分析

为了评估集成模型VRDGD-RF的综合性能,通过对准确率Acc、精确率P、召回率R和F1值多个评估指标对集成模型的性能进行衡量,同时与单一神经系统进行比较,各指标的计算公式如下:

式中tp,fp,tn,fn分别为真正类、假正类、真负类和假负类的样本数量。其中真正类(truepositive,tp)表示样本标签和预测结果都预测为正的样本;真负类(truenegative,tn)表示样本标签和预测结果都预测为负类的样本;假负类(falsenegative,fn)表示样本标签为正而预测结果的样本;假正类(falsepositive,fp)表示样本标签为负类而预测结果为正类的样本。

表1所示为采用集成模型上和单一模型对30架飞机的辐射源个体进行识别的性能参数。

表1不同网络的性能对比表

由上表可见,集成模型的各项性能指标较任一深度神经网络模型的性能指标均有所提升。其中集成模型VRDGD-RF的准确率Acc较DRSN18、VGG、ResNet34、GoogleNet、DenseNet121分别提高了3.31%、18.09%、5.96%、15.86%和4.75%;其F1值较其他五种模型分别提高了3.79%、15.95%、5.39%、12.19%和5.96%,其中精确度和召回率都比单一的神经网络的效果更佳,证实在经过集成后的识别效果在识别率、精确率、召回率和F1值都较单一的神经网络有了更为明显的提升。

实施例二

为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种基于神经网络算法和随机森林算法的ADS-B辐射源个体识别系统。

如图13所示,该系统包括:

数据获取模块1,用于获取目标ADS-B辐射源信号,并对所述目标ADS-B辐射源信号进行预处理。

预测模块2,用于将预处理后的所述目标ADS-B辐射源信号输入至ADS-B识别模型中,得到所述目标ADS-B辐射源信号对应的ADS-B辐射源个体。

所述ADS-B识别模型的训练过程为:

获取原始样本数据集;所述原始样本数据集包括多个样本数据,所述样本数据包括输入数据以及对应的标签数据;所述输入数据为样本ADS-B辐射源信号,所述标签数据为所述样本ADS-B辐射源信号对应的ADS-B辐射源个体;

对所述原始样本数据集中的样本数据进行预处理,得到预处理后的样本数据集;所述预处理后的样本数据集包括多个预处理后的样本数据,预处理后的样本数据包括样本ADS-B信号特征图以及对应的标签数据;

利用预处理后的样本数据集训练集成模型,得到ADS-B识别模型;其中,所述集成模型是利用集。

针对辐射源个体识别中单一神经网络随着辐射源个体数量的增加,模型的识别准确率显著下降的问题,本发明提供了一种多算法的ADS-B辐射源个体识别方法及系统,具体为一种基于深度神经网络和随机森林集成模型的ADS-B辐射源个体识别方法及系统。本发明利用多种深度神经网络模型和随机森林对增强数据集进行训练,然后利用集成学习方法中的硬投票方法对各网络模型和随机森林识别得到的结果进行集成表决,使得识别结果更具有说服力,在辐射源个体数量增加的情况下模型依旧能保持较高的识别率。实验结果表明,在融合了DRSN、VGG、ResNet、GoogleNet、DenseNet五类神经网络和随机森林后,相比于单一的神经网络,识别准确率能够提升了3%-20%,且在辐射源个体数量增加的情况下依然能保持较高的识别准确率。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种基于自适应黑蜘蛛猴算法的辐射源个体识别方法
  • 一种通信辐射源时频特征提取与个体识别方法及系统
技术分类

06120116380714