掌桥专利:专业的专利平台
掌桥专利
首页

一种双重信息不确定的IRS通信对抗干扰策略分析系统和方法

文献发布时间:2023-06-19 19:30:30


一种双重信息不确定的IRS通信对抗干扰策略分析系统和方法

技术领域

本发明涉及一种双重信息不确定的IRS通信对抗干扰策略分析系统和方法,属于网络通信技术领域。

背景技术

随着现代通信科技的发展,信息化建设对于维护国家安全的重要性日益凸显,上世纪90年代电子战进入了飞速发展的阶段。目前现代国防体系中的各个主战装备都不是单一的个体,他们都是嵌入进现代化指挥系统中的节点,这些节点与后方的指挥单位一起构成了一个信息网络,节点之间利用电磁信号进行交互,从而发挥武器系统的最大效能,能否取得电磁领域的主导权是决定现代战争的能否取得胜利的基石。各主要大国高度重视本国电子战部队的建设,加大对于电磁频谱对抗方面的研究,不断地完善电子战相关理论,着力构建电磁频谱新型作战体系,积极地开发新型的电子战技术装备,将人工智能,高功率微波技术,无人机技术融合进自身的作战体系中。

在作战编制上,从2021年起,美军加速推进自身电磁作战规划,意图在全领域拥有开展电子战的能力。在作战装备上,定向能武器受到高度重视,作为电子战领域的重点,在试验中利用微波发射设备向靶标无人机群发射高功率信号让靶标无人机群失效。全球其他国家也在积极地发展新型电子战设备。

由于各国不断地在人员编制,设备硬件上推陈出新使得电磁对抗环境变得日益复杂。电子对抗的环境是实时变化的,在电子对抗中需要对环境进行感知。传统的干扰决策方式面对新的对抗形式越来越力不从心。

发明内容

本发明目的在于针对上述现有技术的不足,提供了一种双重信息不确定的IRS通信对抗干扰策略分析系统和方法,该方法结合认知电子战和IRS通信,采用学习信道信息(与波束带宽)和感知频谱两种学习方式,考虑两种信息不确定设定对干扰方的干扰策略进行了研究。本发明首先假设干扰方不确定满功率波束到达接收端的信号功率,在无人机数量受限情况下,研究了如何分配干扰无人机以实现被干扰方终端接收信号总功率最小化的问题。之后在此基础上进一步假设干扰方不确定各波束最大占用带宽的确切值,在双重信息不确定情况下研究如何分配数量有限的干扰无人机来最小化敌方接收信号总功率的问题。

本发明解决其技术问题所采用的技术方案是:一种双重信息不确定的IRS通信对抗干扰策略分析系统,该系统包括认知电子支持CES、系统评估、认知电子攻击CEA、动态知识库及反馈回路五个模块。其中,认知电子支持CES模块主要功能为环境感知与信号模式识别;认知电子攻击CEA模块的主要功能为设计认知电子干扰决策。在认知电子战中,干扰机首先在认知电子支持CES模块根据侦察目标信号完成对目标工作状态的识别。然后,在系统评估模块中评估当前干扰动作的效果,建立干扰目标的各种状态与现有干扰动作的最佳对应关系。最后在认知电子攻击CEA模块针对目标的不同状态智能生成最优干扰策略,指导后续的干扰资源调度。目前认知电子战技术主要可以总结为侦察技术,建模技术,干扰技术和效能评估技术。

本发明还提供了一种双重信息不确定的IRS通信对抗干扰策略分析方法,该方法包括如下:

在信号侦察方面首先需要对信号进行截获,其次,截获信号后需要对其进一步处理,实现更深层次的信息感知,包括:参数测量,信号分选,辐射源分类和个体识别等。

环境建模技术需要对整个对抗场景环境进行数学建模,通过数学模型来描述环境中不同的参量,探索环境中各种动态条件(例如:信号带宽、频率、功率、波形特征等)对于结果和决策的影响,常用动态规划,Monte Carlo,Q-学习等强化学习算法学习周边的电磁环境,从而匹配最佳的干扰样式和动作,提高认知电子战系统的作战效率。

当目标受到电磁干扰后,干扰方观察目标接受干扰前后的信号特征变化,比如分析目标群体发射信号的频率,信号功率,信干比,误码率等指标来对己方的本次实施的干扰策略的有效性进行评估。效能评估技术需要对各个干扰目标当前所处的状态,以及不同状态时被侦测到的信号特征进行详细地分析,总结和合理的推测,从而为后续优化干扰决策提供数据指导。

有益效果:

1、本发明为描述通信干扰场景,提出一种包含干扰方和通信方各自决策模型的框架,在该框架中干扰方的决策被描述为序列决策问题,将每一阶段的干扰决策建模为一个多层规划模型,而将通信方的决策建模成线性规划。

2、本发明在不确定波束到达终端功率的情况下,给出了基于两种学习方式的贪婪及鲁棒干扰策略。干扰方通过两种学习方式分别了解被干扰方各波束到达终端的功率与通信方决策向量,可以确保在干扰方利用现有信息最小化敌方终端接收功率的同时能够对于敌方的不确定集合进行探索。

3、本发明在不确定满功率单波束到达终端的功率的情况下(信息不确定情况下),将每阶段干扰方的多层规划决策模型等价转换为混合整数线性规划问题,严格证明了贪婪及鲁棒策略的收敛性以及最终决策的最优性,同时给出了干扰方实时判断己方是否做出最优决策的标准。

4、本发明在不确定满功率单波束到达终端的功率和各方向上波束最大占用带宽情况下(双重信息不确定情况下),将干扰方的每一阶段决策模型转化为等价的双层规划,并对原问题进行求解,仿真验证了该场景下干扰策略的收敛性和全局最优性。

附图说明

图1为本发明的认知电子战系统框图。

图2为本发明的认知调整流程。

图3为本发明的干扰效果评估示意图。

图4为本发明的蓝方通信系统俯视图。

图5为本发明的基于信道信息学习的贪婪及鲁棒干扰策略图。

图6为本发明的基于频谱感知学习的贪婪及鲁棒干扰策略图。

图7为本发明的不同初始集红方基于信道信息学习方式做出最佳决策所需迭代次数图。

图8为本发明的不同初始集红方基于频谱感知学习方式做出最佳决策所需迭代次数图。

图9为本发明的红蓝方决策选择图。

具体实施方式

下面结合说明书附图对本发明创造作进一步地详细说明。

如图1所示,认知电子战的系统架构包含认知电子支持CES、系统评估、认知电子攻击CEA、动态知识库及反馈回路五个模块。其中,认知电子支持CES模块主要功能为环境感知与信号模式识别;认知电子攻击CEA模块的主要功能为设计认知电子干扰决策。在认知电子战中,干扰机首先在认知电子支持CES模块根据侦察目标信号完成对目标工作状态的识别。然后,在系统评估模块中评估当前干扰动作的效果,建立干扰目标的各种状态与现有干扰动作的最佳对应关系。最后在认知电子攻击CEA模块针对目标的不同状态智能生成最优干扰策略,指导后续的干扰资源调度。目前认知电子战技术主要可以总结为侦察技术,建模技术,干扰技术和效能评估技术。

如图2所示,信号侦察技术是认知电子战的关键因素之一,在认知电子支持CES模块实现。在信号侦察方面首先需要对信号进行截获,其次,截获信号后需要对其进一步处理,实现更深层次的信息感知,包括:参数测量,信号分选,辐射源分类和个体识别等,常见的解决方法利用AI领域的卷积神经网络,支持向量机,Random forest,Decision Tree等技术进行分析和管理。

环境建模技术同样属于认知电子支持CES模块。在实战环境下,电磁环境复杂,各类辐射源繁杂且发射信号各异,为了提高感知准确度和效率,需要对整个对抗场景环境进行数学建模,通过数学模型来描述环境中不同的参量,探索环境中各种动态条件(例如:信号带宽、频率、功率、波形特征等)对于结果和决策的影响,常用动态规划,Monte Carlo,Q-学习等强化学习算法学习周边的电磁环境,从而匹配最佳的干扰样式和动作,提高认知电子战系统的作战效率。

如图3所示,认知电子战技术中的效能实时评估是认知电子战(OODA)环路的重要组成部分。当目标受到电磁干扰后,干扰方观察目标接受干扰前后的信号特征变化,比如分析目标群体发射信号的频率,信号功率,信干比,误码率等指标来对己方的本次实施的干扰策略的有效性进行评估。效能评估技术需要对各个干扰目标当前所处的状态,以及不同状态时被侦测到的信号特征进行详细地分析,总结和合理的推测,从而为后续优化干扰决策提供数据指导。

认知电子干扰决策是认知电子战中的关键环节,主要在认知电子攻击CEA模块实现。干扰决策方法有基于博弈论、决策支持系统、群体智能优化算法及启发式算法等。

如图5所示,考虑通信方(后文称蓝方)基站发射波束到达终端处最大功率不确定情况下的干扰方(后文称红方)干扰决策制定的问题。在障碍较多的地区,蓝方有一个可移动基站以及若干配备了IRS的移动中继(下文统称IRS中继),基站通过IRS中继转发波束与前方的终端建立通信。由于最大可用带宽、发射功率,以及可同时发射的波束数量等性能限制,移动基站会根据当前所有可用链路的信道状态,选择其中损耗最小的几条信道与前方建立联系。红方则配置数架干扰无人机对准蓝方的IRS中继进行干扰(干扰无人机处于基站与IRS中继之间的位置),利用同频高功率噪声并采取与基站发射波束相同的入射角辐射IRS面板以大幅降低转发信号的信噪比,导致终端处的接收信号的信噪比低于正确解调信号的最小信噪比,造成该链路的数据传输失败,迫使敌方选择其余损耗较大的信道,降低敌方终端的接收信号总功率,从而达到降低敌方通信系统数据传输速率的目的。

该场景中存在红蓝双方。蓝方的移动基站处于后方,由于障碍物的遮挡,它与前方终端无法建立直连链路,利用装备IRS的中继与前方的信息终端群建立通信链路,蓝方的整个系统中所装备的IRS中继车的数量为I,IRS中继的序列集合为I={1,…,i,…,I},移动基站有E个可供选择的方向发射波束,对这些方向进行编号,这些可发射波束的方向的序列集合为E={1,…,e,…E},在本场景中当基站向e方向发射波束时需要利用该方向上的IRS中继车i辅助转发通信,所以I=E。蓝方移动基站的发射总带宽为B,其发射信号的功率谱密度保持恒定。

为方便计算,假设蓝方终端使用一根总接收天线接收来自IRS中继i转发的波束。假设基站发射天线阵列的发射单元数量为M,IRS上的反射单元数量为N,令移动基站向e方向发射的波束赋形向量

采用与距离有关的路径损耗模型如下:

其中,C

公式中的β

通过设置IRS和终端间的路径损失因子以及莱斯因子为α

对于红蓝双方的决策分别进行建模,定义红方策略λ∈∧(∧是干扰策略集合)为贪婪及鲁棒干扰策略,干扰策略的贪婪性体现在每次它要实施干扰的时候目的在于迫使蓝方终端接收信号总功率降到最低,而鲁棒性体现在红方会预测蓝方在面临最糟糕的情况时试图最大化终端接收信号总功率。在t时刻,红方已经发现了蓝方一部分IRS中继,这部分IRS中继构成集合I

将t时刻被红方知晓的确定量u

其中S

假设红方每干扰一条通信链路,就需要一架无人机,令红方配置数量为R的干扰无人机,则其干扰决策会受到干扰无人机的数量限制,所以红方决策模型中关于干扰资源的约束条件如下:

(r

r

蓝方基站对于每个发射波束有最大带宽限制,若基站选择在方向e上发射波束,那么该波束信号最大占用带宽为b

由于x

同时红方假设蓝方基站在面临最糟糕的情况时试图将自方终端接收到的信号总功率P

定义

为简化起见

当红方实施干扰决策x

定义g

为了分析信息不完整情况下红方所要解决的问题,需要引入红方掌握蓝方全部信息时的干扰模型。令g

上式中r为全1向量,且

而此时红方的决策x的可行集为X,其表达式如下:

X={x∈Z

在红方不掌握全局信息时,需要根据己方掌握的信息计算干扰决策并预测蓝方接收功率

定理1:

定理1对于红方具有重要的现实意义,由于红方无法知晓蓝方的全部信息,在红方实施干扰后无法判断实施的干扰决策是否与完全掌握蓝方信息时做出的全局最优决策一致。如果g

命题1:

命题1说明,如果红方可以确定蓝方终端接收各方向波束的最大功率值u

1.1不同学习方式下问题求解

由于红方在实际干扰过程中获取信息的能力不同,所以红方会采取不同的学习方式来更新己方关于蓝方的不确定集合。在本节中,将红方获取信息能力分为学习信道信息与学习蓝方基站发射波束频谱信息。第一种学习方式为红方学习蓝方信道信息,进而计算出若利用该信道传输信号蓝方波束到达终端时的功率;而第二种方式为红方通过了解波束的频谱信息来学习蓝方基站的通信决策向量。由于红方必须了解到t时刻蓝方终端接收信号的实际总功率才能判断实施的干扰是否是全局最优干扰决策,所以红方采取不同学习方式时都需要监测蓝方终端接收信号总功率。

1.1.1干扰方决策模型计算

在本小节中对于红方每个阶段的干扰决策进行计算。若直接对红方的干扰决策模型进行求解,在红蓝方数据规模比较大的情况下计算时间会过于冗长,所以需要对红方的决策模型进行等价变换,将原决策模型转化为等价的混合整数线性规划(Mixed IntegerProgramming,MIP)。结合前文,红方的决策模型

/>

为了方便后文将多层优化转变为单层优化,需要对原有的约束条件进行合并,将决策可行集Y

p≥0 公式15-4

将上述KKT条件代入第二层优化,得到如下公式:

定义公式16的部分Lagrange函数为:

当第二层优化取得最优值时,需要满足如下KKT条件:

D

(D

y

q

结合条件:公式18-1,公式18-4,可以得到等式

得到不等式

由约束条件y

由于非线性互补松弛约束条件的存在,上述公式并不是一个线性混合整数规划问题,所以需要将互补松弛约束条件线性化,通过引入二进制向量

同理引入二进制向量

其中,等价约束条件中矩阵

为了方便后续小节论述,需要对红方的行动做进一步补充。蓝方基站与终端建立通信时,红方会发现蓝方基站利用哪些IRS中继转发信号到终端,同样的也就发现了基站可以选择向这些方向发射波束。由于红方已经对于蓝方的移动基站本身的性能和工作机制了解,在发现不属于集合I

1.1.2基于信道信息学习的问题求解

在本小节中红方会学习在t时刻蓝方基站向哪些方向发射波束,以e方向上信道为例,通过学习信道信息红方了解蓝方移动基站和IRS中继i之间的信道矩阵

在红方发现在t时刻并没有做出最优的干扰决策时,它会这样更新己方关于蓝方的不确定集合:

根据鲁棒优化不确定集合,可以得知U

为了方便下文证明,我们将红方知晓的蓝方基站可发射波束方向的集合E

引理1:

定理2:

证明:在时刻t,若满足

1.1.3基于频谱感知学习的问题求解

在本小节中考虑的情况是红方采用频谱感知方式学习蓝方基站在t时刻发射波束所占用的带宽。结合蓝方基站向各方向发射波束时最大的波束占用带宽b

结合在终端群监测的接收信号总功率,红方对于蓝方的不确定集的更新方式如下:

/>

当红方没有发现蓝方新的发射波束的方向,且此时红方已经知晓了不确定变量

引理2:

1.2仿真和性能分析

为了验证基于两个不同学习方式的干扰策略的有效性,在本节中将使用MatlabR2019a仿真平台和cplex中MILP工具包对于本章红方干扰策略进行仿真,并对数据进行分析验证该算法的有效性。

1.2.1仿真场景参数设定

在本场景中,假设蓝方一共配置了16个中继车,所以基站车可以向16个方向发射波束则I=E={1,2,…,16},展开干扰前,红方对于蓝方的情况一无所知,即

随机生成144个相位θ

1.2.2数值结果分析

如图5所示,描述了采用信道信息学习方式时,拥有不同数量干扰无人机的红方干扰迭代次数与终端接收功率曲线图。从图可知,干扰前对于蓝方信息一无所知的红方在采取基于信道信息学习的贪婪及鲁棒干扰策略后,对于红方装备3~6台无人机的情况,都是经过3次干扰决策迭代就可以迫使蓝方终端实际的接收信号总功率和它预测的蓝方终端接收信号总功率相等。根据定理1,我们可知此时红方做出的干扰决策就是全局最优干扰决策。同时,从纵坐标上来看,红方配置的干扰无人机数量越多,干扰能力越强,可以干扰的信道数量越多,那么蓝方终端接收到的信号总功率就越小。

如图6所示,采用频谱感知学习方式时,拥有不同数量干扰无人机的红方干扰迭代次数与终端接收信号总功率的曲线图。从图可知,一开始对于蓝方信息一无所知的红方在采取基于频谱感知学习的贪婪及鲁棒干扰策略后,对于红方装备3~6台干扰无人机的时候,经过3~5次迭代做出的干扰决策,即可使蓝方终端实际的接收信号总功率和红方对于蓝方终端接收信号总功率的预测值相等。对比图5和图6,可以得知基于频谱感知学习时,红方做出最佳干扰所需要的迭代次数比基于信道信息学习所需要的迭代次数要多,但是基于频谱感知学习方式比起基于信道信息学习方式实际的操作难度要小。

图7和图8分别描述了采用信道信息学习和频谱感知学习方式时,掌握不同初始信息集合的红方干扰迭代次数与终端接收功率曲线图。图7与图8中初始信息集E1,E2,E3,E4分别代表干扰前红方初始信息集合为

如图9所示,以红方配置4台干扰无人机为例,描述了蓝方基站向各发射方向满功率发射波束时到达终端的功率柱状图,其中,柱的高低代表接收信号功率的大小(也体现了该方向上信道损耗的大小)。深蓝柱代表该发射方向上的IRS中继被干扰无人机的噪声所辐射,而浅蓝部分是蓝方基站选择向该方向发射波束。由图9可知,红方阻塞的4个方向上的信道损耗最小,而蓝方只能从其他未被干扰的方向中挑选信道损耗较小的5个用来发射波束,体现贪婪及鲁棒干扰策略的有效性。

表1.1红方配置不同数量无人机时蓝方最大传输速率下降比率

表1.1描述了装备不同数量干扰无人机的红方在做出最佳干扰决策后,蓝方最大传输速率的下降比率,可以看出,随着干扰机数量从3增加至6,速率下降比率从40.8%下降至82.3%。

对于本领域技术人员而言,本发明不限于上述所述的示范性实施例,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及构思加以替换或改变,都应涵盖在本发明技术的保护范围内。

相关技术
  • 一种干扰信息不确定时的扩展目标检测方法与系统
  • 一种干扰信息不确定时的扩展目标检测方法与系统
技术分类

06120115935591