掌桥专利:专业的专利平台
掌桥专利
首页

面向开放环境的辐射源个体识别方法

文献发布时间:2024-04-18 19:58:21


面向开放环境的辐射源个体识别方法

技术领域

本发明属于辐射源个体识别技术领域,具体涉及一种面向开放环境的辐射源个体识别方法。

背景技术

现有的基于射频指纹的辐射源个体识别研究,大多数都关注于信号变换、特征提取以及分类器的选择等步骤,目标是提高辐射源个体识别系统在闭集识别任务上的模型精度。然而,现实开放环境中的辐射源个体识别任务则是更为复杂的跨信道的开放集场景。

首先,在不同的部署环境中由于环境因素、信号接收机的不同以及其他发射器的干扰,信号中携带的信道信息也会有所不同并相互产生混淆,使得在不同信道环境下采集到信号的射频指纹呈现出分布差异。这导致训练使用的信号数据与推理时的信号数据之间无法满足传统机器学习中要求的训练集和测试集独立同分布的假设,进一步使得在跨信道的辐射源识别场景中模型性能大幅度下降。虽然基于深度学习的SEI(Specific EmitterIdentification,SEI)研究已经解决了许多挑战,但大部分工作都是基于一个封闭集分类的假设,即训练集信号和测试集信号都是来自一组已知的发射器集合。无论这个已知类别发射器集合有多大,如果在推理测试阶段出现任意未见过的发射器其信号都会被错误分类,最终导致安全漏洞。通过四个已知设备的射频指纹信息训练的模型,无法在预测阶段中识别或区分另外三个未知个体新设备,使模型的推理结果变得不可信。这种安全漏洞对于任何部署在开放空间中的系统都是致命的,因为这种漏洞破坏了系统的“自治性”(Autonomy),即系统在复杂且不可预测的环境中在人为最少干预的情况下完成目标的能力。

当下,保证开放系统的高度自治性是亟待解决的问题。开放环境中的SEI模型会同时遭遇由于信道变化导致的类别信息混淆,以及未知类别引起的模型可信度降低的问题。由数据驱动的SEI系统在内集(In-Set)输入上将按预期运行,但在近集(Near-Set)输入上的输出就不可预测,在处理所有外集(Out-of-Set)输入时将必然不正确;同时环境中的外集数据与近集数据对于任务的影响并不是简单的加性求和,两者会同时作用导致知识迁移和开集识别的难度增加,因此,最终的解决方案并不能是无监督域适应和开放集识别的简单拼接。

现有的研究采用独立的方法来解决开放环境中的困难。首先,为了解决开放空间中跨信道导致的SEI模型精度下降的问题,已有的研究使用了两种主要策略。第一种策略是基于信号数据,通过分析目标信号特征,使用额外硬件或者其他信道信息,提高模型在跨信道下的泛化能力。2019年,Sankhe等人通过研究发射链路中的硬件中心特征(Hardware-Centric Feature),发现了一种基于反馈驱动的修改发射器端的方法,该方法通过使用接收器的信道估计来提高CNN分类器的精度。然而,这些基于信号数据的策略会受信号数据本身的类型、传输协议等影响,也使用到了信号外的冗余信息,难以在复杂多变的信号场景大规模使用。另一种策略是无监督域适应(Unsupervised Domain Adaption,UDA),UDA是迁移学习的子领域之一,是通过将有标注的源域上学习到的知识迁移至无标注的目标域上,从而降低两个域的差异,来提高模型在目标域上的性能表现的一种重要手段。2022年,Ye等人提出基于Wasserstein距离的无监督对抗域适应(Adversarial Domain Adaptation withWasserstein Distance,ADAW)的方法来解决跨时期的辐射源识别精度下降问题。同时,对于解决开放空间中的未知类别产生的问题,已有的研究使用生成式的方法来主动拒绝未知类别;还有学者利用余弦距离来表示已知与未知的边界。2020年Hanna等人的研究使用了多组不同的开集识别分类头解决这个问题,并发现了如果测试数据与训练数据不是同一天捕获的,模型的识别性能显著地下降;虽然Hanna等人在研究过程中意识到了神经网络提取到的指纹信息更可能来自于信道,但是他们并没有着手去解决这个问题。

发明内容

本发明的发明目的在于:针对上述存在的问题,提出了基于最大间距开放边界(Maximum Interval Open Boundary,MIOB)的开放集辐射源个体识别方法,在缓解跨信道引入混淆的前提下实现对未知类别的识别。

本发明采用的技术方案如下:

面向开放环境的辐射源个体识别方法,该方法包括以下步骤:

步骤1,基于信号接收设备采集多种已知辐射源个体一段时期内的辐射信号数据,定义n表示采集的辐射源个体的类别数;

并对采集的各个辐射信号数据进行数据预处理,得到每个辐射源个体的多个数据样本以及每个数据样本的辐射源个体类别标签,所有的带标签数据样本构成源域数据集D

其中,数据预处理为:截取M秒的辐射源信号数据作为一个数据样本,并根据信号接收设备的参数设置判断该数据样本属于哪一类已知的辐射源个体,为数据样本设置真实分类标签,其中,M为预设值;

步骤2,基于信号接收设备采集m+k种辐射源个体一段时期内的辐射信号数据,并对采集的各个辐射信号数据按M秒时间长度进行截取,得到每个辐射源个体的多个数据样本,所有的数据样本构成目标域数据集D

其中,m种辐射源个体的类别为源域的共享类别,即m≤n;k种辐射源个体的类别为源域中未出现过的未知类别;

步骤3,基于源域和目标域数据集对辐射源个体识别模型进行训练;

所述辐射源个体识别模型包括一个特征提取器和一个双分类器,其中,双分类器包括一个闭集softmax分类器和一个一对多分类器,且一对多分类器包括n个子分类器,且子分类器编号与辐射源个体的类别编号对应;

特征提取器用于提取辐射源信号的特征信息,再将提取到的辐射源信号特征输入双分类器;

双分类器用于输出辐射源个体的预测分类标签,取Softmax分类器中分类概率最高的类别c,再取一对多分类器中的第c个子分类器的输出,得到输入样本属于第c类的概率,当概率小于指定阈值时,则认为该输入样本属于未知类别,反之则c类作为双分类器输出的预测分类标签;

步骤4,实时采集目标辐射源个体在不同时期的信号数据作为待识别数据,所述待识别数据的长度与训练集样本相同;

将当前采集的待识别数据输入到训练好的辐射源个体识别模型中,基于输出的预测分类标签确定目标辐射源个体的识别结果,即目标辐射源个体属于已知类别还是未知类别。

进一步的,步骤3中,特征提取器为混合感受野深度网络,该网络使用具有三组不同大小的卷积核提取不同感受野下的信号特征,并引入自注意力机制对卷积核施加注意力,使网络能够自适应地调整其不同大小卷积核的占比。

进一步的,所述特征提取器具体为:

输入的特征图首先经过三个卷积核大小不同卷积块,得到三个特征图U

按元素尺度求和融合特征图U

基于得到的各个卷积核上的注意力权重,对特征图U

进一步的,步骤3中,使用带标签的源域数据来监督训练Softmax分类器,其中,Softmax的分类监督损失为:

其中,D

进一步的,步骤3中,一对多分类器在训练时采用边界损失,具体为:

选择

每个子分类器的输出是一个二维向量,用于表征样本是已知和未知类别的概率,定义y

其中,X

进一步的,步骤3中,辐射源个体识别模型在训练时的总损失为:

L

其中,L

其中,

类别i对另外任意类别j之间的混淆程度

其中,B表示目标域训练时一批训练数据量的大小(Batch Size),

本发明提供的技术方案至少带来如下有益效果:

本发明采用基于自注意力机制的混合感受野深度网络,使用了多组具有自适应权重的不同大小卷积核,提取不同感受野下的信号特征,相较于现有的辐射源个体研究中使用的手工特征或者普通的深层特征,能够更充分的表征信号的射频指纹信息;同时,本发明基于一多对分类器实现了未知类和已知类的分类边界的构建,通过双分类器的协作实现开放集识别,相较于现有算法,能够免除拒绝未知样本阈值的手动设置;最后,本发明通过在特征空间对齐源域信号和目标域信号,实现最大化类别间距,缓解跨信道导致的类别间的特征混淆;相较于现有研究,本发明能够在开放环境中同时解决跨信道带来的特征混淆和未知类别导致的模型不可信问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的面向开放环境的辐射源个体识别方法的处理流程图;

图2是本发明实施例提供的一种基于最大间距开放边界的开放集辐射源个体识别模型结构示意图;

图3是本发明实例采用的双分类器结构协作实现拒绝未知类别样本方法示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种面向开放环境的辐射源个体识别方法,该方法首先通过在特征空间对齐源域信号和目标域信号,实现最大化类别间距,缓解了跨信道导致的类别间的特征混淆;同时,基于一多对分类器实现了未知类和已知类的分类边界的构建。在开放环境中同时解决跨信道带来的特征混淆和未知类别导致的模型不可信问题。

如图1、图2所示,本发明实施例提供的一种面向开放环境的辐射源个体识别方法的具体处理过程包括下列步骤:

步骤S1,采集源域数据样本,并设设置样本的真实分类标签;

基于信号接收设备采集n(n>1)种已知辐射源个体一段时期内的辐射信号数据,并对采集的各个辐射信号数据进行数据预处理,得到每个辐射源个体的多个数据样本以及每个数据样本的辐射源个体类别标签,所有的带标签数据样本构成源域数据集D

数据预处理为:截取M秒的辐射源信号数据作为一个数据样本,并根据信号接收设备的参数设置判断该数据样本属于哪一类已知的辐射源个体,为数据样本设置真实分类标签,其中,M为预设值;

步骤S2,采集目标域数据样本,其中目标域数据的部分数据样本的类别属于源域共享类别;

基于信号接收设备采集m+k种辐射源个体一段时期内的辐射信号数据,其中m个类别是与源域的共享类别,即m≤n,同时还存在k个在源域中未出现过的未知类别,并对采集的各个辐射信号数据按M秒时间长度进行截取,得到每个辐射源个体的多个数据样本,所有的数据样本构成目标域数据集D

步骤S3,基于源域和目标域数据集对辐射源个体识别模型进行训练;

辐射源个体识别模型包括一个特征提取器和一个双分类器,其中,双分类器包括一个闭集softmax分类器和一个一对多(One-vs-All,OvA)分类器;

特征提取器用于提取辐射源信号的特征信息,再将提取出的辐射源信号特征输入双分类器;

双分类器用于输出辐射源个体的预测分类标签,首先取Softmax分类器中分类概率最高的类别c,然后取OvA分类器组中的第c个,得到输入样本属于第c类的概率,当概率小于指定值(优选设置为0.5)时则认为该输入样本属于未知类别,反之则c类作为双分类器输出的预测分类标签;

步骤S4,采集目标辐射源个体的信号数据,基于辐射源个体识别模型获取目标辐射源个体的类别。

实时采集目标辐射源个体在不同时期的信号数据作为待识别数据,所述待识别数据的长度与训练集样本相同;

将当前采集的待识别数据输入到步骤S3训练得到的辐射源个体识别模型,得到辐射源个体预测分类标签,从而判断目标辐射源个体属于已知类别还是未知类别。

作为一种可能的实现方式,步骤S3中,辐射源个体识别模型的具体训练为:

如图2所示,对于给出的特征图X∈R

F

F

F

其中,F

本实施例中,F

特征提取器的目标是使神经元能够根据特征输入,自适应地调整其不同大小卷积核的占比。基本思想是基于自注意力机制,混合不同感受野的多个分支信息输出到下一层神经元。为了达成这一目标,网络需要融合来自所有不同感受野分支的特征数据。首先按元素尺度(Element-wise)求和来简单融合了多个分支的输出:

步骤S3,然后,使用了全局平均池化将全局信息嵌入生成了压缩向量z,其中z∈R

其中,F

然后,通过在压缩向量z上使用基于通道尺度的注意力,从而自适应地选择空间尺度的信息。具体来说就是将Softmax运算符应用在各通道的数值上,记a

V

其中,V=[V

这样的设计一方面可以让特征提取器通过大小不同的卷积核结构获取到信号在不同感受野上的特征信息;另一方面,在不同的卷积核上引入了注意力机制,通过少量的网络参数增加使网络可以自适应地获取卷积核权重,通过这两个方式使得特征提取器能够提取更鲁棒的信号特征。

为了实现对未知类别样本的拒绝,现有算法会根据先验知识或预先定义的未知样本比率来手动设置拒绝未知样本的阈值,但在真实场景应用中这种策略不切合实际。本发明实施例引入一种双分类器结构,如图3所示。考虑到源域中的类间距离本身是决定目标域中已知或未知之间的良好阈值,设计了一个Softmax闭集分类器以外,还使用标注的源域数据为每个类训练了一对多(One-vs-All)分类器。

对于模型训练完成后的测试阶段,测试输入样本

OvA分类器组中的第k个分类器中的第一个值代表输入样本属于第k类为真的概率(称为已知类别分数),第二个值代表不属于第k类的概率。

在最终推理阶段:首先取Softmax分类器中分类概率最高的类别,记为第c类;然后取OvA分器类组中的第c个,得到其属于第c类的概率(已知类别分数),当概率小于0.5时则认为该输入样本属于未知类别,反之则认为输入样本属于第c类。通过这样的设计就实现了免除手动阈值设置,只使用了双分类器协作来拒绝未知类别样本。

在训练过程中,使用带标签的源域数据来监督训练Softmax分类器。Softmax的分类监督损失具体为:

其中,D

在监督学习中交叉熵损失常用来衡量分类器预测输出值与真实值之间的差异。设y表示真实标签,p(y|x)表示Softmax分类器的输出,则交叉熵损失表示为:

其中,y表示标签,x表示样本数据,下标i表示样本编号。

在其他工作中,为了构建开放集识别边界,会为OvA分类器组使用n个二分类交叉熵(Binary Cross Entropy,BCE)的和作为监督训练的损失。但是由于监督训练的强拟合作用,会导致目标域上无标签数据的开集识别效果进一步变差。

为了提高双分类器在目标域上协作拒绝未知类别的效率,通过带标签的源域数据构建OvA分类器组的开放分类边界的方法,实现更强泛化性的开放集识别。

使用有标签的源域数据从头OvA分类器组的每个已知类别和异常值之间的边界。

选择了部分与样本标签类别不同但是更相关的类别作为负向类别,优化有限个OvA子分类器,而不是每一个源域样本都对所有OvA分类器起作用。

权衡了目标域测试集上的开放集识别效果以及域适应分类效果,选择[n/2](其中n是源域类别数量)个最相关的近邻类别作为每个OvA子分类器的负向样本类别来从头构建开放边界。

开放集OvA分类器由w个子分类器组成,子分类器输出是一个二维向量,其中每个维度分别显示样本是类别内值和异常值的概率。

OvA分类器作用于提取的特征之上,记z

其中,X

引入了类间混淆来描述分类器推理结果的不确定性:

其中,C

W

其中,n是源域类别总数,B是目标域训练时一批训练数据量的大小(Batch Size),

C

其中,X

因此,训练阶段的总体损失函数为:

L

其中,λ是最大间距损失的平衡系数(一个超参)。

本发明实施例提供了一种面向开放环境的辐射源个体识别方法,其实用性高,在开放环境中同时解决跨信道带来的特征混淆和未知类别导致的模型不可信问题。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

以上所述的仅是本发明的一些实施方式。对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

相关技术
  • 基于深度学习的开放集辐射源个体识别方法
  • 一种面向辐射源个体的开集识别方法
技术分类

06120116484773