掌桥专利:专业的专利平台
掌桥专利
首页

预设时间下的无人机集群博弈纳什均衡搜索方法及系统

文献发布时间:2024-04-18 19:58:26


预设时间下的无人机集群博弈纳什均衡搜索方法及系统

技术领域

本发明属于无人机自主控制领域,具体涉及预设时间下的无人机集群博弈纳什均衡搜索方法及系统。

背景技术

随着计算机技术和通信技术的飞速发展,智能电网、传感器网络以及无人机集群等多智能体系统的协调控制技术与优化问题受到了广泛的关注。其中,多智能体系统的非合作博弈问题成为了近年来的研究热点。在非合作博弈问题中,每个智能体致力于使自身利益最大化,其目标函数依赖于其他智能体的决策。

实际中,大多数系统都是复杂的非线性系统,欧拉-拉格朗日系统作为一种典型的非线性系统被广泛研究,它可以描述无人艇、机械臂以及无人机等复杂的动力学系统,其中四旋翼无人机因为其结构简单、机动性好、操作方便等特点使其被广泛应用于航空摄影、地质勘察、环境评估、反恐侦查等领域。通过将四旋翼无人机集群的动力学系统推广到一般的欧拉-拉格朗日系统[Y.Naidoo,R.Stopforth,and G.Bright,“Quad-rotor unmannedaerial vehicle helicopter modelling and control,”Int.J.Adv.Robot.Syst.,vol.8,no.4,pp.139-149,2011.],设计合适的集群协调控制算法,可以使多架四旋翼无人机实现协同飞行、任务分配和快速决策等功能。

目前,关于无人机集群博弈纳什均衡搜索算法的研究主要围绕如何使智能体的状态渐近或指数收敛到纳什均衡点,但是对收敛时间如何实现精确控制的研究较少。在实际空战背景中,收敛时间的控制对作战结果至关重要,无人机集群需要在精确时间内完成任务。为了解决该问题,目前提出了一种基于有限或固定时间理论的方法使得智能体可以将收敛时间控制在有限范围内[P.Lin,W.Ren,and J.A.Farrell,“Distributed continuous-time optimization:Nonuniform gradient gains,finite-time convergence,andconvex constraint set,”IEEE Trans.Autom.Control,vol.62,no.5,pp.2239-2253,2017],但是该方法受智能体的初始状态和系统参数的影响并且不能预知。因此,为了解决上述问题,本发明提出了一种基于预设时间下的无人机集群博弈纳什均衡搜索方法及系统。

发明内容

针对现有技术的不足,本发明的目的在于提供预设时间下的无人机集群博弈纳什均衡搜索方法及系统,解决了现有技术中的问题。

本发明的目的可以通过以下技术方案实现:

预设时间下的无人机集群博弈纳什均衡搜索方法,包括以下步骤:

分析四旋翼无人机的动力学模型,并推广至欧拉-拉格朗日系统;

基于推广至欧拉-拉格朗日系统的无人机的动力学模型,构建具有欧拉-拉格朗日非线性动力学的无人机集群博弈模型;

基于欧拉-拉格朗日系统和无人机集群博弈模型,通过引入时基发生器,提出基于预设时间收敛的部分信息下的纳什均衡搜索算法,来控制收敛时间。

进一步地,所述四旋翼无人机动力学模型构建需要满足以下前提条件:

1)无人机的机体是刚体且严格对称;

2)机体坐标系的原点与无人机的质心重合;

3)桨叶没有挥舞运动。

进一步地,第i架四旋翼无人机的二阶动力学模型为:

其中,x

进一步地,四旋翼无人机的四个控制输入分别为:

其中,F

进一步地,考虑具有欧拉-拉格朗日非线性动力学的无人机集群,第i架无人机的动力学模型可表示为:

其中,η

进一步地,所述无人机集群博弈模型为:

无人机集群中共有n架无人机,每架无人机利用局部信息调整自己的决策使得其成本函数最小,描述为:

其中f

在博弈过程中,如果

进一步地,所述时基发生器为:

T(t,t

其中,σ是一个足够小的参数;t

0<σ<<1,

g(t,σ)-g(t

进一步地,所述纳什均衡搜索算法设计如下:

式中,η

预设时间下的无人机集群博弈纳什均衡搜索系统,包括:

动力学模型构建模块:分析四旋翼无人机的动力学模型,并推广至欧拉-拉格朗日系统;

无人机集群博弈模型构建模块:基于推广至欧拉-拉格朗日系统的无人机的动力学模型,构建具有欧拉-拉格朗日非线性动力学的无人机集群博弈模型;

以及,搜索算法构建模块:基于欧拉-拉格朗日系统和和无人机集群博弈模型,通过引入时基发生器,提出基于预设时间收敛的部分信息下的纳什均衡搜索算法,来控制收敛时间。

一种计算机存储介质,存储有可读程序,当程序运行时,能够执行上述搜索方法。

本发明的有益效果:

本发明可以实现对无人机集群博弈算法收敛时间的精确控制,通过预先设定时间基函数保证无人机集群在特定时间内收敛到纳什均衡点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明中的搜索方法流程图;

图2是本发明中单架四旋翼无人机的结构图;

图3是本发明中四架无人机的通信示意图;

图4是本发明中四架无人机追踪时变目标的三维轨迹示意图;

图5是本发明中四架无人机博弈轨迹的x方向坐标预设时间收敛示意图;

图6是本发明中四架无人机博弈轨迹的y方向坐标预设时间收敛示意图;

图7是本发明中四架无人机博弈轨迹的z方向坐标预设时间收敛示意图;

图8是本发明中无人机集群的通信示意图;

图9是本发明中无人机集群追踪目标的三维轨迹示意图;

图10是本发明中无人机集群博弈轨迹的x方向坐标预设时间收敛示意图;

图11是本发明中无人机集群博弈轨迹的y方向坐标预设时间收敛示意图;

图12是本发明中无人机集群博弈轨迹的z方向坐标预设时间收敛示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

如图1所示,预设时间下的无人机集群博弈纳什均衡搜索方法,包括以下步骤:

S1,分析四旋翼无人机的动力学模型,并将其推广到一般的欧拉-拉格朗日系统;具体步骤包括:

S11,无人机集群均为四旋翼无人机集群,为了简化四旋翼无人机动力学模型,需要对系统模型做出一些基本假设:首先,无人机的机体是刚体且严格对称。其次,机体坐标系的原点与无人机的质心重合。最后,桨叶没有挥舞运动。在上述假设条件下,可以将四旋翼无人机动力学模型拆分为位置动力学和姿态动力学两部分。

假设无人机集群共有n架无人机,第i架四旋翼无人机的二阶动力学模型如下,其中i∈{1,…,n}。

其中,x

此外,四旋翼无人机的四个控制输入分别为:

其中,F

上述动力学模型中,u

S12,定义变量

系统中的M

u

其中,O

S13,将四旋翼无人机动力学抽象为一般的欧拉-拉格朗日系统,考虑具有欧拉-拉格朗日非线性动力学的无人机集群,第i架无人机的动力学模型可以表示如下:

其中η

S2,基于S1中推广至欧拉-拉格朗日系统的无人机的动力学模型,构建具有欧拉-拉格朗日非线性动力学的无人机集群博弈模型;具体步骤为:

S21,构建无人机集群博弈模型;

考虑无人机集群中共有n架无人机,每架无人机利用局部信息调整自己的决策使得其成本函数最小,该问题可描述为:

其中f

在博弈过程中,如果没有任意一架无人机可以通过单方面改变自己的策略来使得自己的收益更小,则达到纳什均衡点,即如果

S22,为了保证所设计的算法的收敛性,下面给出一些基本假设:

假设一:通信拓扑图

假设二:智能体i的目标函数f

假设三:目标函数的梯度

假设四:对于任意的

假设五:存在一个常数h>0,使得

在上述非合作博弈问题中,假设每架无人机只能获得邻居的信息,不能获得非邻居无人机的动作信息,因此每架无人机都会对其他无人机的动作产生一个估计值,并利用与邻居之间的信息交流来更新其估计值。

S3,基于S1中的欧拉-拉格朗日系统和S2中的无人机集群博弈模型,通过引入时基发生器,提出了一种基于预设时间收敛的部分信息下的纳什均衡搜索算法,实现对收敛时间的精确控制;

具体步骤为:

S31,为了使算法实现预设时间收敛,并保证控制行为的连续性或平滑性,我们引入了时基发生器,具体表示如下:

T(t,t

其中,σ是一个足够小的参数;t

0<σ<<1,

g(t,σ)-g(t

S23,在S31的时基发生器的作用下,通过设计算法可以使一个系统实现预设时间收敛,下面引入一个系统实现预设时间收敛的定义。对于任意初始状态η(0),存在0<δ=δ(η(0))<<1满足下列三个条件:

则称系统在时刻t

S33,利用无人机的梯度信息以及一致性协议,第i架四旋翼无人机的控制输入设计如下:

其中η

将上述控制输入代入到S13的欧拉-拉格朗日系统中,整体算法设计如下:

式中,v

S4,通过李雅普诺夫稳定性理论证明上述算法收敛;具体步骤包括:

S41,令τ=εt,则上述算法可以转换为如下紧凑格式:

其中,L是图

S42,利用李雅普诺夫稳定性理论证明上述欧拉-拉格朗日系统在控制输入的作用下可以在预设时间收敛到纳什均衡点,具体表述为如下定理:

如果S22中的假设均成立,则存在一个正数ε

其中

证明:令ε=0,则由S22中的假设一可知,

记θ=η-η

对上述李雅普诺夫函数关于时间t求导,得:

由S22中假设二保证的F的李普希茨连续性可知,||F(η)-F(η

综上,

定义矩阵A如下:

显然,当

对上式两边分别从0到τ求积分得:

当τ→t

针对空战背景下无人机集群博弈问题进行数值仿真,进一步证实算法的有效性;对本发明的搜索方法进行仿真验证:

考虑一个无人机集群领空编队跟踪问题,采用python仿真验证所提出控制策略的有效性。仿真对象采用ASCTEC公司生产的Hummingbird drones,无人机集群参数以及控制器参数如下:

表1无人机集群和控制器参数设置

每架无人机的目标函数可以表示为如下形式:

显然,由于无人机集群不能同时沿着同一轨迹飞行,无人机之间的个体目标是相互冲突的。本实验的目的是控制无人机集群在预设时间内达到纳什均衡位置,以平衡群体目标和无人机的个体目标;本实验选取的时基发生器如下:

其中,

下面通过两个实施例来验证所提出的算法可以在上述时基发生器的作用下实现在0.2s内收敛到纳什均衡解。

实施例1

考虑n=4的情形,四架无人机之间的通信图如图3所示。此外,设置无人机追踪的时变目标为η

实施例2

为了进一步验证算法的有效性,将无人机的数量进行推广。

考虑n=52的情形,无人机集群之间的通信图设计为一个连边概率为0.4的ER随机网络如图8所示,无人机集群共被分为四簇,它们的追踪目标为η

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

相关技术
  • 对抗环境下无人机智能决策的纳什均衡博弈方法及系统
  • 对抗环境下无人机智能决策的纳什均衡博弈方法及系统
技术分类

06120116495980