掌桥专利:专业的专利平台
掌桥专利
首页

一种基于KD的信号对抗样本检测方法

文献发布时间:2023-06-19 10:27:30


一种基于KD的信号对抗样本检测方法

技术领域

本发明涉及人工智能对抗的信号安全领域,尤其涉及一种基于核密度(KernelDensity,KD)的信号对抗样本检测器的设计方法。

背景技术

近年来,无线电信号在许多领域广泛使用,如无人机,船舶和空中管制,卫星远程测量以及物联网等。所以无线电准确的信号分类成为了有个重要问题。与此同时,对无线电信号分类的对抗攻击也日益增多。因此,对信号的对抗样本检测技术也至关重要。

随着深度学习在图像分类、纹理分析、语音识别、图挖掘等方面的成功应用,深度神经网络也逐渐成为信号识别的首选方法。深度学习模型,特别是卷积神经网络(CNNs),可以根据任务目标自动从各种数据集中提取特征,在很多情况下明显优于人工提取特征。由于其强大的特征学习能力,CNNS被越来越多的研究者应用于信号识别。尽管神经网络对噪声输入具有鲁棒性,但它们也被证明会被特殊制作的对抗样本所“欺骗”。如果对手截获了发射机站发射的信号并且进行了微小的改动也即成为对抗信号,然后再次发射出去则会使接收端分类错误并造成损失。所以如何检测出对抗信号成为了关键问题。

易平、胡嘉尚等人所公开一种对抗样本检测方法,根据普通样本生成对抗样本,并要对所有样本进行特征提取,然后把距离估计值作为样本的特征对分类器进行训练,训练后的分类器即为检测器,用于检测对抗样本。所述的距离估计值,是通过对距离上下界的估计从而把样本到决策边界的距离缩小到一个比较精确的范围,其中距离上界使用基于攻击的距离计算方法得到,距离下界使用交叉李普希茨极值方法计算得到。此方法的缺点就是所谓的距离值是由距离上界和距离下界估计出来的一个范围,并不精准。

发明内容

本发明为解决所述现有技术存在的对抗样本检测不准确的问题,提供了一种基于KD的信号对抗样本检测方法。

本发明直接计算出原始样本和对抗样本在核密度估计上的不同,提高检测结果的准确性,本发明的基于KD的信号对抗样本检测方法,具体步骤包括:

S1:获取信号训练集和信号测试集,构建神经网络分类模型,并通过信号训练集对神经网络分类模型进行训练,得到信号调制分类器和信号调制分类器的参数,使用信号调制分类器对信号训练数据集和测试集进行分类,根据分类结果对信号测试集进行调整,得到原始样本数据集;

S2:基于快速梯度下降法,根据信号调制分类器的参数,攻击原始样本数据集,得到对抗样本数据集;

S3:根据信号训练集,信号调制分类器和信号调制器的参数,对原始样本数据集、对抗样本数据集进行计算,得到原始样本数据集、对抗样本数据集的核密度估计值,对所述核密度估计值进行整合,得到特征数据集;

S4:将特征数据集分为特征训练集和特征测试集,基于逻辑回归算法构建逻辑回归分类器,使用特征训练集对逻辑回归分类器进行训练,使用特征测试集对逻辑回归分类器进行分类测试,得到检测结果。

优选的,所述S1,所述使用信号调制分类器对信号训练数据集和测试集进行分类,根据分类结果对信号测试集进行调整的方法为:

f(X)=X

f(y

其中,f()为信号调制分类器,X表示信号训练集,X

优选的,所述S2中,攻击原始样本数据集具体步骤为:

基于快速梯度下降法,根据信号调制分类器的参数,将原始样本数据集中的数据做梯度方向的调整,将调整后的原始样本数据集中的数据输入信号调制分类器,使信号调制分类器分类错误,保留调整后的原始样本集中的数据,得到对抗样本数据集。

优选的,所述S2中,得到对抗样本数据集的具体方法为:

其中M

优选的,所述S3中,得到原始样本数据集、对抗样本数据集的核密度估计值具体方法为:

K(x,X

优选的,所述S3中,得到特征数据集的具体方法为:

基于原始样本数据集、对抗样本数据集中数据的核密度估计值,得到原始样本特征数据集M

D

将M

优选的,所述S4中,使用逻辑回归分类器进行分类测试方法如下:

其中g

优选的,所述S4中,检测结果用接受者操作特征曲线ROC和准确率ACC指标衡量。

本发明首先得到了原始样本和对抗样本的核密度估计值组成特征数据集,再用逻辑回归算法进行分类,得到检测结果,有效利用原始样本和对抗样本的核密度估计值明显不同的特点以高效,准确的检测出对抗样本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的方法流程图;

图2为本发明实施例提供的对抗样本生成流程图;

图3为本发明实施例提供的信号调制分类器结构图;

图4为本发明实施例提供的原始样本和对抗样本的KD估计值对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参照图1,为了更好的识别出对抗样本,本发明提供了一种基于KD的信号对抗样本检测方法。具体包括以下步骤:

S1:获取信号训练集和信号测试集,构建神经网络分类模型,并通过信号训练集对神经网络分类模型进行训练,得到信号调制分类器和信号调制分类器的参数,使用信号调制分类器对信号训练数据集和测试集进行分类,根据分类结果对信号测试集进行调整,得到原始样本数据集;

信号训练集为data.mat数据文件,根据信号调制类别,使用信号调制分类器对信号训练数据集和测试集进行分类,信号调制类别具体包括相移键控调制、频移键控调制、正交幅度调制、脉冲振幅调制,共12个小类别:BPSK、QPSK、8PSK、OQPSK、2FSK、4FSK、8FSK、16QAM、32QAM、64QAM、4PAM和8PAM。信号训练集和信号测试集是随机生成的,以保证传输比特的概率相等。信号训练集和信号测试集生成的过程中采用脉冲整形滤波器,脉冲整形滤波器采用升余弦滤波器和滚转系数,在[0.2,0.7]范围内提取一个随机值。相位偏差在[-π,π]范围内随机选择,归一化载波频率偏移在[-0.1,0.1]范围内随机选择。每个调制类别的信噪比从-20dB均匀分布到30dB。每个原始样本都是IQ信号,包含64个符号,每个符号的采样点数为8,因此每个原始样本的采样点数为512。信号训练集和信号测试集的大小分别为312,000和156,000,每类调制信号样本量相同,信号调制分类器模型结构参照图2,

所述使用信号调制分类器对信号训练数据集和测试集进行分类,根据分类结果对信号测试集进行调整的方法为:

f(X)=X

f(y

其中,f()为信号调制分类器,X表示信号训练集,X

参照图3,S2:基于快速梯度下降法,根据信号调制分类器的参数,攻击原始样本数据集,得到对抗样本数据集;

基于快速梯度下降法,根据信号调制分类器的参数,将原始样本数据集中的数据做梯度方向的调整,将调整后的原始样本数据集中的数据输入信号调制分类器,使信号调制分类器分类错误,保留调整后的原始样本集中的数据,得到对抗样本数据集。

快速梯度下降法FGSM通过求出信号调制分类器对原始样本数据集的导数

得到对抗样本数据集的具体方法为:

其中M

S3:根据信号训练集,信号调制分类器和信号调制器的参数,对原始样本数据集、对抗样本数据集进行计算,得到原始样本数据集、对抗样本数据集的核密度估计值,对所述核密度估计值进行整合,得到特征数据集;

根据信号训练集,信号调制分类器和信号调制器的参数,对原始样本数据集、对抗样本数据集进行计算,将计算得到的核密度值整合在一起,其中原始样本数据集的核密度估计值数据添加标签0,对抗样本数据集的核密度估计值数据添加标签1,得到特征数据集。

得到原始样本数据集、信号对抗样本数据集的核密度估计值具体方法为:

K(x,X

基于原始样本数据集M和对抗样本数据集M

整合数据集得到D

D

其中D

S4:将特征数据集分为特征训练集和特征测试集,基于逻辑回归算法构建逻辑回归分类器,使用特征训练集对逻辑回归分类器进行训练,使用逻辑回归分类器对特征测试集进行分类测试,得到检测结果。

将特征数据集D

所述使用逻辑回归分类器进行分类测试方法如下:

其中g

利用FGSM攻击方法得到对抗样本,利用上述公式(4)得到原始样本和对抗样本的KD值。最后用逻辑回归分类器进行分类。检测结果用接受者操作特征ROC和准确率ACC指标衡量。

表1

从表1基于FGSM攻击方法生成的对抗样本检测结果,可以看出,基于KD的信号对抗样本检测器可以有效的检测出对抗样本。

表2为KD和BU检测对抗样本效果的比较,是本文提出的KD方法和基于贝叶斯不确定性(BU)检测对抗样本的效果对比,保持其他条件相同的情况下。

表2

从图4提供的原始样本(original)和对抗样本(fgsm方法生成)的KD估计值(部分)对比图可以看出KD方法效果要强于BU方法。

本发明用于检测信号对抗样本,为解决现有技术问题所采用的技术方案:根据信号数据信息设计信号调制分类神经网络模型,利用Fast Gradient Sign Method(FGSM)对抗攻击方法结合设计好的信号调制分类器制作信号对抗样本生成器并生成对抗样本。根据训练集和信号调制分类器计算出原始样本和信号对抗样本的核密度估计值,最后根据核密度估计值设计一个逻辑回归分类器用于检测对抗样本。本发明可以直接计算出原始信号样本和信号对抗样本在核密度估计上的不同,从图4可以直接看出原始信号样本和信号对抗样本之间明显的不同。

本发明的设计原理:许多高维数据集,被认为位于一个低维流形上,只能在训练数据的小流形附近正确运行。更深层提供了比输入空间更线性和“未包裹”的流形。在最后一层隐含层的特征空间中进行核密度估计以建立每个类的子流形的模型。同时计算出信号的原始数据和对抗样本对于相应类别的子流形距离,也即KD估计值。

本发明首先得到了原始样本和对抗样本的核密度估计值组成特征数据集,再用逻辑回归算法进行分类。有效利用原始样本和对抗样本的核密度估计值明显不同的特点以高效检测出对抗样本。

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

相关技术
  • 一种基于KD的信号对抗样本检测方法
  • 一种基于样本鲁棒性差异的对抗样本检测方法
技术分类

06120112553132