掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的干扰信号识别方法

文献发布时间:2024-04-18 20:01:55


一种基于深度学习的干扰信号识别方法

技术领域

本发明属于通信技术领域,尤其涉及一种基于深度学习的干扰信号识别方法。

背景技术

人类生活在一个充满复杂且庞大的通信网络中,日常生产生活都与无线通信技术密切相关,随着通信业务需求量的猛增,信道、频谱等无线通信资源日渐匮乏,此外,在实际应用中,无线通信系统的信号传输质量还会受到多径传播、频率变化和噪声干扰等因素的影响,这些随机因素使得传输信号产生畸变,也有因人为恶意破坏释放的电磁干扰信号,这使得降低了无线通信系统的安全性和可靠性,因此如何有效的提高无线通信系统的安全性受到了普遍的关注;在复杂的电磁环境中,为保证收信机和发信机之间安全可靠通信,学者们对通信抗干扰技术进行了广泛的研究,常见的通信抗干扰技术包括干扰检测,干扰抑制,干扰对消和干扰躲避等;而在进行这些抗干扰技术手段前,首先要对干扰信号进行分析和识别,因此,无线干扰识别(Wireless Interference Identification,WII)是通信抗干扰技术的基础,并为这些通信抗干扰技术提供先验信息,如在干扰对消和干扰参数估计前,首先要确定干扰信号类型;无线干扰识别技术的目的在于盲识别通信中的非合作方的无线干扰信号类型,实现无需任何先验信息对干扰信号进行分析,从而使得该识别信息为后续的通信抗干扰技术提供先验;无线干扰识别技术在民用通信和军用通信领域都有广泛的应用,如在在民用无线通信中,无线干扰识别技术可以对未授权的频谱资源分析从而达到用户随机接入的目的以提高频谱利用率;在军用通信领域中,无线干扰识别技术是通信电子战不可或缺的技术手段。

现有公开的无线干扰识别方法主要有:

1)基于最大似然(Maximum Likelihood,ML)的干扰识别方法:该方法根据贝叶斯最小误判准则构建检验统计量并与最优决策门限进行比较来获得干扰的类型,然而,该方法很难在实际通信场景中得到应用,因为方法需要获得无线信道的精确冲击响应信息,这在大多数通信场景中是很难获得的;

2)基于特征提取(Feature Extract,FE)干扰识别方法:由于不同的信号的内在特性不同,该方法通过提取信号的时域,频域和变换域特征来区分不同的干扰信号,常见的特征包括高阶累积量,幅度和相位,小波变换等,然后根据这些提取得到的特征应用支持向量机或者决策树等分类器进行分类;然而,这类方法由于独立的优化特征提取和分类器,这造成了该方法无法达到全局最优的性能,并且该方法需要专家知识和手动制定人工特征。

3)基于深度学习(Deep Learning,DL)干扰识别方法:该方法采用一系列最新的机器视觉领域的深度神经网络如卷积神经网络(Convolutional Neural Networks,CNN)来实现干扰识别,该方法通过训练神经网络使得网络可以自动提取干扰信号的特征并通过反向传播算法迭代更新所有可训练参数,达到了端到端的优化方式大大提高的干扰信号的识别性能,该方法的识别精度远远优于基于特征提取干扰识别方法,然而该方法存在成百上千的参数,使得网络规模和计算成本开销巨大,对于计算资源有限的设备来说是难易部署的。

综上所述,在这些现有的无线干扰识别方案中,基于最大似然的干扰识别方法需要信道的先验信息,难以在实际中应用;相比基于特征提取的方法,现有基于深度学习的干扰识别方法可极大的提升识别精度;但基于深度学习的方法往往需要更大的网络模型来换取精度的提升,这对于资源有效的设备来说是无法承受的;因此对于在几乎不增加网络的计算复杂度的同时提高识别精度,这对于深度学习的方法而言有重要的意义。

发明内容

为解决现有技术的不足,进一步降低基于CNN的干扰识别网络的计算成本并保持高精度,本发明设计了一种低复杂度多分支卷积神经网络(Low-complexity Multi-branchConvolutional Neural Networks,LMCNN)的干扰信号识别方案,该网络可以降低计算成本需求,且保持高识别精度;提出的低复杂度多分支卷积神经网络干扰识别网络主要原理为:为每个卷积层提供了多套权重,每套权重独立存储,在网络前向传播时,每一个卷积层的多套权重通过矩阵加法运算得到合成的权重赋值给该卷积层,在反向传播时,每一层卷积的每一套权重独立更新,这样采用了多套权重后经过计算,使得在数学模型与多分支神经网络数学等价,有效的汲取了多分支网络的识别性能优势,而在计算复杂度方面避免了多分支网络每条分支独立计算的复杂度,从本质上将特征图计算复杂度转化为了卷积核间计算复杂度,使得模型达到了精度和计算复杂度的平衡。

下面给出多参数化卷积神经网络干扰识别的方法设计。

低复杂度多分支卷积神经网络具体步骤如下:

S1、准备训练集记为

S2、搭建低复杂度多分支卷积神经网络作为干扰识别网络,设置多分支卷积的层数为K个,每层多分支卷积后添加了批量归一化(Batch Normalization,BN)和ReLU函数作为激活函数σ,其中ReLU(x)=max(x,0),最后网络通过一个全局平均池化和一个全连接层作为网络的输出,全连接层的激活函数都采用了softmax函数作为激活函数,其中

其中X表示输入,Y表示多分支卷积的输出,W

S3、设置训练循环次数为E,批量大小为B,构造由交叉熵组成的损失函数表示为

S4、行干扰识别时,为网络加载保存的网络模型和权重W

本发明的有益效果是:

本发明设计了一种低复杂度多分支卷积神经网络的干扰识别方案,设计的网络引入了低复杂度方案下的多分支卷积计算,该网络可以降低计算成本需求,且保持高识别精度;具体来说发明的网络中每一层多分支卷积都包含若干个独立存储的权值,在网络前向传播时,每一个卷积层的多套权重通过矩阵加法运算得到合成的权重赋值给该卷积层,使得网络提取特征的多样性明显增加,且由于矩阵运算只在卷积核间进行,使得计算复杂度几乎没有增加;本发明的干扰识别低复杂度优化设计与传统的深度学习方法相比,具有显著优势,而且本发明易于实现,具有很强的应用价值。

附图说明

图1是各个干扰的时频图;

图2是传统单分支卷积结构示意图,其中(a)是单个卷积层结构,(b)是多个单卷积层构成的卷积分支;

图3是传统多分支卷积结构示意图;

图4是传统多分支卷积结构中单个分支的结构示意图;

图5是本发明的低复杂度多分支卷积神经网络示意图;

图6是本发明的低复杂度多分支卷积神经网络中的那个分支的结构示意图;

图7是单分支、传统两分支和传统三分支网络干扰识别精度仿真对比示意图;

图8是低复杂度两分支和三分支卷积神经网络与传统方法识别精度仿真对比示意图;

具体实施方式

下面结合实施方案和附图,详细描述本发明的技术方案。

本发明考虑信道类型为AWGN信道,干扰信号的样式包含10种:调幅(AmplitudeModulation,AM)、二进制频域键控(Binary Frequency Shift Keying,BFSK),二进制相移键控(Binary Phase Shift Keying,BPSK)、梳状谱噪声(Comb Spectrum Noise,CSN),单音干扰(Single-Tone,ST)、窄带噪声(Narrow Band Noise,NBN)、多音干扰(Multiple Tone,MT)、噪声调幅(Noise Amplitude Modulation,NAM)、部分频带噪声(Partial Band Noise,PBN)、线性调频(Linear Frequency Modulation,LFM);网络的输入为干扰信号的时频图,分辨率为50×50,具有1个输入通道,即灰度图像;训练和测试时,每个INR的每个干扰类别的样本数分别为400和100,其中INR的范围从-30dB到30dB,间隔为2dB,每个样本的干扰参数在Matlab中随机生成。

在表1展示了传统CNN模型的结构,从表中可以看出,使用3个卷积层作为主干网络,Conv(3,16,3×3)表示具有3个输入通道和16个输出通道的3×3卷积,在第一和第三层卷积之后插入两个中间输出层,BN和ReLU激活函数层也加入到网络中,最后采用了全局平均池化(global average pooling,GAP)和全连接层(fully connected layer,FC)用于分类;为了比较,表1中的网络称为CNN网络;将每一个卷积层并联若干参数完全一致的网络称之为多分支网络;替换表中的卷积层为低复杂度多分支卷积,即为设计的低复杂度多分支卷积神经网络;与CNN网络相比,设计的低复杂度多分支卷积神经网络没有增加在每秒浮点运算(Floating-point Operations Per Second,FLOPs)上几乎没有增加,训练阶段使用动量为0.9且权重衰减为0.0005的优化器,批量的大小设置为64,学习率初始化为0.001。

表1网络结构

图1显示了每个干扰干扰信号的时频图,包括(a)AM,(b)BFSK,(c)BPSK,(d)CSN,(e)NBN,(f)CW,(g)LFM,(h)MT,(i)NAM,(j)PBN。

图2给出了普通卷积层的结构和普通卷积网络的结构,普通CNN是一个单一的分支,普通卷积层由一个卷积层、一个BN层和一个激活函数构成,使用ReLU作为激活函数,FC层表示全连接层。

图3给出了多分支层的结构和多分支网络,多分支层将多个卷积层平行连接起来,变换是一种卷积操作,每个分支有相同大小的卷积核,用W

图4给出了设计的多分支卷积层和LCMN,每个卷积核(W

低复杂度多分支卷积神经网络的干扰识别方法具体步骤为:

S1、准备训练集记为

S2、搭建低复杂度多分支卷积神经网络,设置多分支卷积的层数为K个,每层多分支卷积后添加了批量归一化(Batch Normalization,BN)和ReLU函数作为激活函数σ,其中ReLU(x)=max(x,0),最后网络通过一个全局平均池化和一个全连接层作为网络的输出,全连接层的激活函数都采用了softmax函数作为激活函数,其中

其中X表示输入,Y表示多分支卷积的输出,W

S3、设置训练循环次数为E,批量大小为B,构造由交叉熵组成的损失函数表示为

S4、测试时,为网络加载保存的网络模型和权重W

在图5比较了普通CNN和多分支CNN的识别性能,从图中可以看出:随着INR的增加,三个模型的识别精度逐渐提高;当INR较低时,噪声的功率远大于干扰信号的功率,识别干扰变得很困难;多分支卷积网络的识别性能优于普通CNN,当INR为-14dB时,三分支卷积网络和两分支卷积网络分别比普通CNN好10%和5%,这说明多分支网络对样本具有更强的提取能力;当多分支网络加入更多分支时,识别性能将逐渐接近。

接下来,评估了普通CNN、LCMN、SENet和JRNet的识别性能,这些模型的FLOPs大约等于72Millon,图6显示了这些网络在不同INR下的识别性能,可以从图中发现:随着INR的增加,两个LCMN模型的识别性能逐渐提高;当INR等于0dB时,两支LCMN和三支LCMN都达到了接近100%的识别率;设计的LCMN网络的识别性能优于其他模型;当INR为12dB时,三分支LCMN的识别性能超过二分支LCMN的1%,JRNet的2%,SEnet的10%和plainCNN的12%,这进一步证明了所提出的LCMN的有效性;随着虚拟分支的增加,其识别性能逐渐接近,在某些INR值下,双分支LCMN的识别精度要高于三分支LCMN,推断这一现象的原因是,随着分支数量的增加,优化网络变得更加困难,这导致了在某些INR值下,二分支LCMN的识别准确率高于三分支LCMN。

技术分类

06120116566398