掌桥专利:专业的专利平台
掌桥专利
首页

基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统

文献发布时间:2023-06-19 19:30:30


基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统

技术领域

本发明涉及空战对抗博弈策略与最优化算法领域,尤其涉及基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统。

背景技术

空战对抗博弈的决策结果是现代空战场指挥决策的重要参考信息之一。随着当前空战要素的智能化与复杂化以及空战任务的多样性,每个空战任务需要多个我方要素去完成,而一个要素有时也要兼具多个空战任务。但是空战要素是有限的,尤其是在对战双方要素数量接近的情况下,我方要素往往是无法满足所有的空战任务请求的。在此背景下,如何合理的根据双方对战态势进行对抗博弈以对我方要素进行任务分配,是战场对抗的关键。

目前大部分空战场对抗博弈策略寻优系统都难以实现快速、精确的策略寻优,因此难以在现实战场中为指挥决策提供有效帮助,因此,本发明在空战场对抗博弈场景的仿真数学建模的前提下,利用多种群进化算法高效寻找最优的博弈策略,能够在我方空战要素有限的情况下,实现博弈对抗的收益最大化,提供了一种快速、精准、稳定的空战对抗博弈策略寻优系统。

发明内容

针对当前空战对抗博弈决策速度慢、精确度低以及寻优结果不稳定等问题,本发明的目的在于提供一种快速、精准、稳定的空战对抗博弈策略寻优系统,通过空战对抗博弈仿真模块对战场要素任务进行综合考虑,构建空战对抗博弈的数学仿真模型;通过空战任务约束模块对仿真模型进一步改进,保证最终策略的合理性;通过多种群进化寻优模块来选择满足约束的最优策略,实现空战任务的收益最大化;最后通过最优策略输出模块将找到的最优策略输出到各空战要素中以指导其完成相应任务。解决了传统空战对抗博弈策略最优化难以实现的问题,提供了一种快速、精准、稳定的空战对抗博弈策略寻优系统。

本发明的目的是通过以下技术方案来实现的:一种基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统,其特征在于,包括以下模块:空战对抗博弈仿真模块、空战任务约束模块、多种群进化寻优模块、最优策略输出模块。

所述空战对抗博弈仿真模块根据一体化空战战场要素与作战任务对抗的运动规律,构建了对抗双方的动力学模型:

x(t

其中,

其中,模型中变量下标A和B分别表示我方和敌方,支付函数J

在此基础上,空战任务约束模块根据战场背景环境耦合捷变的特征规律,构建了战场对抗博弈的复杂约束条件:

u

t∈[t

其中,E表示表示战场对抗规范等式约束函数

进一步的,多种群进化寻优模块采用一种新颖的基于局部中心选取的分层级粒子群算法寻找空战最优博弈策略,能够满足所有战场环境与任务约束,同时最大化我方收益。采用过程如下:

1)随机产生第1代初始粒子得到初始解的速度和位置;

v

r

其中o=1,2,…,s,s为群规模,p分别对应待寻优的参数,v

2)计算第o个粒子的适应度fit

其中,fit

3)划分多种群拓扑:

SP

SP

其中nei

4)更新惯性权重系数μ(t):

其中μ

5)更新粒子的速度和位置,产生新的群体;

r

其中,P

6)自适应矫正全面学习因子

对于一个粒子种群X而言,其粒子适应度为f,种群规模N,问题维度Dim。想要找到其全面学习因子pbest

步骤一:按上述公式对种群每个粒子分配线性递增的学习概率P

步骤二:对每个粒子i,对其每个维度而言,在种群中随机选择两个粒子a,b,取两个粒子中适应度较高的粒子的该维度值为候选值。

步骤三:对粒子i的每个维度,取随机数rand(0,1)与该维度的P

步骤四:若最终所有的维度值均为粒子i的历史最优值,则随机选取两个维度设置为第二步中的候选值。

采用本发明上述新的自适应的矫正技术,可以保证算法在寻优过程中依据进化位置,有目的性的矫正学习因子,避免的早熟收敛。

最后,最优策略输出模块将多种群进化寻优模块中得到的全局最优解,即最优对战策略,输出战场要素执行。

本发明的技术构思为:通过空战对抗博弈仿真模块对战场要素任务进行综合考虑,构建空战对抗博弈的数学仿真模型;通过空战任务约束模块对仿真模型进一步改进,保证最终策略的合理性;通过多种群进化寻优模块来选择满足约束的最优策略,实现空战任务的收益最大化;最后通过最优策略输出模块将找到的最优策略输出到各空战要素中以指导其完成相应任务。解决了传统空战对抗博弈策略最优化难以实现的问题,从而建立了一种快速、精准、稳定的空战对抗博弈策略寻优系统。

本发明的有益效果主要表现在:1、空战对抗博弈仿真模块与空战任务约束模块对空战对抗博弈的数学仿真与约束进行建模,实现了接近真实的空战对抗博弈场景。2、改进的多种群进化寻优模块,局部适应度较高的粒子能够被选取出来,同时选取的粒子相互距离较远,保证了种群的多样性,之后采用了本发明上述新的自适应矫正技术,避免了早熟收敛能够选择满足约束的博弈策略,并确保策略最优化,从而最大化空战对抗博弈的收益。

附图说明

图1一种基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统的连接图。

具体实施方式

下面根据附图和实施例进一步说明本发明:

参考图1,基于多种群自适应矫正进化算法的空战对抗博弈策略寻优系统,包括空战对抗博弈仿真模块1、空战任务约束模块2、多种群进化寻优模块3、最优策略输出模块4,空战对抗博弈仿真模块1、空战任务约束模块2、多种群进化寻优模块3、最优策略输出模块4依次相连。

所述空战对抗博弈仿真模块1根据一体化空战战场要素与作战任务对抗的运动规律,构建了对抗双方的动力学模型:

x(t

其中,

其中,模型中变量下标A和B分别表示我方和敌方,支付函数J

在此基础上,空战任务约束模块2根据战场背景环境耦合捷变的特征规律,构建了战场对抗博弈的复杂约束条件:

u

t∈[t

其中,E表示表示战场对抗规范等式约束函数

进一步的,多种群进化寻优模块3采用一种新颖的基于局部中心选取的分层级粒子群算法寻找空战最优博弈策略,能够满足所有战场环境与任务约束,同时最大化我方收益。采用过程如下:

1)随机产生第1代初始粒子得到初始解的速度和位置;

v

r

其中o=1,2,…,s,s为群规模,p分别对应待寻优的参数,v

2)计算第o个粒子的适应度fit

其中,fit

3)划分多种群拓扑:

SP

SP

其中nei

4)更新惯性权重系数μ(t):

其中μ

5)更新粒子的速度和位置,产生新的群体;

r

其中,P

6)自适应矫正全面学习因子

对于一个粒子种群X而言,其粒子适应度为f,种群规模N,问题维度Dim。想要找到其全面学习因子pbest

步骤一:按上述公式对种群每个粒子分配线性递增的学习概率P

步骤二:对每个粒子i,对其每个维度而言,在种群中随机选择两个粒子a,b,取两个粒子中适应度较高的粒子的该维度值为候选值。

步骤三:对粒子i的每个维度,取随机数rand(0,1)与该维度的P

步骤四:若最终所有的维度值均为粒子i的历史最优值,则随机选取两个维度设置为第二步中的候选值。

采用本发明上述新的自适应的矫正技术,可以保证算法在寻优过程中依据进化位置,有目的性的矫正学习因子,避免的早熟收敛。

最后,最优策略输出模块4将多种群进化寻优模块中得到的全局最优解,即最优对战策略,输出战场要素执行。

上述实施例用来解释说明本发明,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

技术分类

06120115936586