掌桥专利:专业的专利平台
掌桥专利
首页

一种面向指挥决策的多智能体对抗演化方法

文献发布时间:2024-04-18 19:54:45


一种面向指挥决策的多智能体对抗演化方法

技术领域

本发明涉及计算机仿真技术领域,特别涉及一种多智能体对抗仿真演化方法。

背景技术

智能体具备一定的“智慧”,甚至可以进行一定程度决策,场地地位逐渐上升为“人类伙伴”。每个智能体的“智慧”不如人类,但通过一定方式的人机之间交互作用和协同行为,人的优势与智能体优势相辅相成实现互补,使得整体可以完成复杂任务,达到“1+1>2”的效果,实现对抗效益的最大化。

一般而言,人类擅长逻辑推理和临场判断,如归纳、决策、指挥等,创造力和自主性极高,但缺点是容易受到其他因素的影响,如恶劣环境、疲劳恐惧等;智能体具有稳定性、快速性与重复性等特点,适合单调、烦琐和危险的任务,但缺点是依靠算法、无法临场决断等。人与智能体协同对抗可以实现优缺点互补,提高对抗中的生存率。因此如何有效地实现人与机的协同对抗以及探索人机如何协同演化具有重要意义。

近年来,国内外学者从人机协同对抗体系架构、人机协同对抗关键技术、人机协同对抗演化仿真、有人/无人协同等角度展开了研究。然而,现有研究在演化仿真方面存在局限性,集中于利用传统模型如兰彻斯特方程来模拟人机协同对抗,对于智能体类型和人机协同对抗方式过于简化,忽视了人机协同对抗的复杂性,没有结合具体对抗行动研究涌现机理。

发明内容

为了解决上述技术问题,本发明构建了一种面向指挥决策的多智能体对抗演化方法。通过人机协同对抗方式及过程的研究,构建了人机协同对抗演化仿真系统和方法,为人机协同对抗策略制定提供参考。

本发明的技术方案为:一种面向指挥决策的多智能体对抗演化方法,包括以下步骤:

步骤1.构建面向指挥决策的多智能体对抗演化系统;

步骤2.收集数据,进行参数设定;

步骤3.进行仿真实验结果数据,分析比较不同参数对结果的影响。

进一步的,所述步骤1包括:

1-1)确定系统中场地空间时间的仿真策略;

1-2)设计单智能体仿真系统和多智能体仿真系统的程序及流程;

1-3)设计单智能体仿真系统和多智能体仿真系统的界面。

进一步的,所述步骤2包括:

2-1)收集整理对抗数据;通过不同手段收集对抗相关数据,包括对抗兵力数量及配置,各类主体的对抗参数;

2-2)根据对抗数据初始化系统的各项参数。

进一步的,所述步骤3包括:

3-1)基于实验数据解释不同指挥决策对人机协同对抗进程的影响;

3-2)根据实验结果和解释,为人机协同对抗策略制定提供参考;

3-3)当有多套数据时,对多套数据的实验结果进行比较分析。

进一步的,所述步骤1中,人机协同对抗演化仿真系统的界面包括:

(1)属性设置组:通过滑块和选择器,对全局和Agent的参数进行设置;

(2)仿真控制按钮:setup为初始化,用于场地环境和Agent的生成;go控制程序启动/暂停,分为持续运行和运行一个时间步两种形式;

(3)模拟显示界面:界面对仿真过程进行动态演示,依时间步更新;

(4)数据监控:曲线图统计红蓝双方总数量随着时间的变化;监视器分别实时显示红方、蓝方的对抗效率。

进一步的,所述步骤3包括:

(1)对比不同智能体类型,分析在有或者没有引导型智能体时,Agent的攻击效率;

(2)对比不同智能体类型下的人机比例,人机比例的最优参数;

(3)对于不同智能体类型,分析通信半径产生的影响。

有益效果:

本发明相对于现有技术具有如下优点:

1、相较于以往,本系统具有获得数据成本低、时效快、可重复的特点。

2、基于可靠系统,为人机协同对抗策略制定提供参考,对于探索人机协同对抗发展具有促进作用。

3、这个系统具有一般性,可以应用于不同对抗环境和场景,也可以扩展到其他对抗方式,甚至其他的冲突行为研究中去。

本发明的运用多主体模型(Multi-agentmodel),搭建了人机协同对抗演化仿真系统并进行了仿真实验,对比典型人机协同类型(引导、支援、防御)下不同对抗参数的对抗效率,为人机协同对抗策略的制定提供参考。

附图说明

图1程序流程图;

图2单智能体人机协同对抗演化仿真系统展示图;

图3多智能体人机协同对抗演化仿真系统展示图。

图4仿真结果图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅为本发明的一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域的普通技术人员在不付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。

本发明基于程序设计、仿真系统,构建了一种面向指挥决策的多智能体对抗演化方法和系统。主要包括提出一个单智能体人机协同对抗演化仿真系统和多智能体人机协同对抗演化仿真系统。系统所有参数都是可调的,用户可以根据需要对对抗参数进行个性化设置并模拟不同的指挥决策,根据系统模拟结果为有关人员辅助决策。

下面结合附图具体说明本发明技术方案,以100人的人机协同力量对抗为例对本发明的技术方案进行详细说明。

本发明的一种面向指挥决策的多智能体对抗演化方法,具体程序流程图如图1所示,包括以下步骤:

步骤1.构建一种面向指挥决策的多智能体对抗演化系统;

具体过程如下:场地的抽象形式主要包括抽象度较低的连续场地和抽象度较高的离散场地。本文采用抽象度较低连续场地,模拟5km×5km范围的场地环境且不考虑地形地貌的影响,Agent可以按自己的移动规则在场地上任意移动。红方阵地为场地左边一半,蓝方阵地为场地右方一半。由于是遭遇战,红蓝双方Agent在对抗开始时随机分布于各自阵地区域。场地环境的时间则直接采用系统内建的计数器ticks。

人机协同对抗演化仿真系统的界面主要由4部分组成,如图2和图3所示,包括:

(1)属性设置组:通过滑块和选择器,对全局和Agent的参数进行设置,参数的中英文对照见表1。

表1参数中英文对照

(2)仿真控制按钮:setup为初始化,用于场地环境和Agent的生成;go控制程序启动/暂停,分为持续运行和运行一个时间步两种形式。

(3)模拟显示界面:界面对仿真过程进行动态演示,依时间步更新。单智能体人机协同对抗演化仿真系统中,圆形代表人、五角星智代表能体。多智能体人机协同对抗演化仿真系统中,圆形代表人、三角形代表引导型智能体、矩形代表支援型智能体、五角星代表防御型智能体。

(4)数据监控:曲线图统计红蓝双方总数量随着时间的变化。监视器分别实时显示红方、蓝方的对抗效率。

步骤2.收集数据,进行参数设定;

通过不同手段收集对抗相关数据,包括对抗兵力数量及配置,各类主体的对抗参数等。

以单智能体人机协同对抗为例,蓝方为对照组,兵力全为人类,没有人机协同,具体参数设置见表2。红方具体参数设置见表3。

表2蓝方参数设置

表3红方参数设置

步骤3.进行仿真实验结果数据,分析比较不同参数对结果的影响

本实施例的仿真实验的结果如图4所示,对结果数据分析如下:

(1)对比不同智能体类型,在没有引导型智能体时,Agent选择随机打击攻击范围的敌方,相当于攻击有一定程度的分散;有引导型智能体时,Agent选择攻击敌方血量最少的,导致致死攻击增多,进而下一轮受到的伤害减少,最终使对抗效率提高。反观支援型智能体,在没有目标引导的情况下,在一定范围内增加己方的攻击力基本是无效的,攻击会被分散。这说明了在对抗过程中探测的重要性,识别敌方明确目标会大大提高胜率。防御型智能体则是从另一方面来提高对抗效率,减少己方所受到的伤害包括致死攻击,所以防御型智能体也是非常有效的。

(2)对比不同智能体类型下的人机比例,一个共同点就是人机比例过大或过小都会产生负面影响。人机比例过大则智能体数量少,人机协同只在小范围内产生,不利于对抗效率的提高。人机比例过小即人的数量太少,对智能体的支持不足导致对抗效率下降,所以人机比例要选择一个合适的配比,让人机协同的相互提升达到最优。

(3)对于不同智能体类型,通信半径产生的影响不同。对于引导型智能体,通信半径过大,由于通信能力的限制会导致无法与通信范围内所有己方单位协同,探测信息可能无法准确传达到对抗地区,导致前线对抗失利。

尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,且应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

相关技术
  • 一种面向海空对抗的多智能体分布式协同决策方法
  • 面向兵力博弈对抗的BC-QMIX离在线多智能体行为决策建模方法
技术分类

06120116381005