掌桥专利:专业的专利平台
掌桥专利
首页

一种多智能体系统领导跟随实用二分一致性控制方法

文献发布时间:2023-06-19 19:30:30


一种多智能体系统领导跟随实用二分一致性控制方法

技术领域

本发明涉及一种多智能体系统领导跟随实用二分一致性控制方法,具体涉及在动态事件触发机制下,针对存在数据量化、通信资源有限、状态不可观测以及带有竞争和合作关系的多智能体系统领导跟随实用二分一致性控制方法,属于多智能体技术领域。

背景技术

多智能体系统控制在近些年来发展迅速,广泛应用于无人机编队飞行、多导弹联合攻击、机器人蜂拥控制等,一致性作为协同控制的基础,成为多智能体系统研究中的核心问题。近年来,学者们对多智能体系统不同类型的一致性进行了大量的研究,大部分的一致性成果主要集中在使智能体状态误差趋于零,但是在实际系统中,存在执行器偏差、计算误差以及恶劣环境,使得多智能体系统出现外部干扰、通信约束以及未知耦合等情况,若仍要求在控制协议下智能体的运动状态偏差趋于零,这是难以实现的。基于此,学者们开始研究将状态误差控制在一个确定区间的实用一致性。

Ding L,Zheng W X(Network-based practical consensus of heterogeneousnonlinear multiagent systems[J].IEEE Transactions on cybernetics,2016)(异构非线性多智能体系统的实用一致性)研究了在固定拓扑和切换拓扑下满足Lipschitz条件的非线性动力学特性的异构多智能体系统领导跟随实用一致性问题,考虑了系统存在通信时滞的情况,针对每个跟随者,设计了领导跟随实用一致性控制协议,使得跟随者与领导者间的误差在固定拓扑和切换拓扑下呈指数收敛至有界区域。Deng C,Yang G H(Distributedadaptive consensus for linear multi-agent systems with quantised information[J].International Journal of Solids&Structures,2017)(带数据量化的线性多智能体系统的分布式自适应一致性)考虑了多智能体系统存在数据量化的情况,在自适应控制律中引入投影运算,设计了一种基于均匀量化器的分布式自适应状态反馈控制协议,使线性多智能体系统在该控制协议下实现实用一致性。

以上关于实用一致性的文献大部分考虑的是非理想网络环境中智能体之间的合作关系,即用非负权重的通信拓扑图来表示,但在实际系统中,合作和竞争关系同时存在的情况更为常见。Zhu Y,Li S,Ma J(Bipartite Consensus in Networks of Agents WithAntagonistic Interactions and Quantization[J].IEEE Transactions on Circuits&Systems II Express Briefs,2018)(具有竞争合作和量化的智能体网络二分一致性)研究了存在数据量化以及带有竞争和合作关系的多智能体系统二分一致性问题。所设计的基于结构平衡拓扑假设下的控制协议,针对任意精度的对数量化器,多智能体系统能够实现渐进二分一致性。Li K,Hua C,You X(Output feedback predefined-time bipartiteconsensus control for high-order nonlinear multiagent systems[J].IEEETransactions on Circuits and Systems I:Regular Papers,2021)(高阶非线性多智能体系统的输出反馈预定义时间二分一致性)研究了带有向符号拓扑的不确定非线性多智能体系统的预定义时间二分一致性,所有智能体都具有时变Lipschitz增长条件的高阶不确定非线性动态特性,假设多智能体的部分状态信息不可以测量,首先,利用每个跟随者的相关输出信息来构造其带时变增益的预定义时间补偿器;其次,通过补偿器为每个跟随者设计基于输出反馈的预定义时间领导跟随二分一致性控制协议,在该控制协议下,每个多智能体系统能够在预定义时间实现二分一致性。陈世明,姜根兰,张正(通信受限的多智能体系统二分实用一致性[J/OL].自动化学报,2022)研究了存在量化数据、通信时滞等通信约束以及带有合作和竞争关系的多智能体系统二分实用一致性。采用结构平衡拓扑假设和矩阵变换,将二分实用一致性问题转换为一般实用一致性问题,在此基础上设计分布式控制协议,使得多智能体系统实现二分实用一致性。

在多智能体系统的传统控制策略中,假设智能体可以连续的测量或更新控制器,这是基于理想的计算和通信资源所做的假设,但实际系统的计算资源和通信带宽都是有限的,考虑如何减少计算和通信,事件触发机制是解决上述问题的有效方式。在事件触发机制中,当且仅当事件触发函数满足一定条件,称之为事件触发,此时更新采样值与控制器并且和邻居进行通信,因此,该机制可以有效地减少多智能体系统的计算资源和通信资源。Zhang Z,Lin Z,Fei H(Leader-Following Consensus for Linear and LipschitzNonlinear Multiagent Systems With Quantized Communication[J].IEEETransactions on Cybernetics,2017)(带数据量化的线性和李普希茨非线性多智能体系统的领导跟随一致性)研究了存在数据量化的线性和Lipschitz非线性多智能体系统的领导跟随一致性问题,引入组合测量误差,设计了分布式事件触发机制,使多智能体系统在能实现领导跟随一致性的前提下减少智能体与邻居间的通信和控制器的更新次数。X Ai,Wang L(Distributed fixed-time event-triggered consensus of linear multi-agentsystems with input delay[J].International Journal of Robust and NonlinearControl,2021)(带输入延迟的线性多智能体系统的分布式固定时间事件触发一致性)研究了具有输入延迟的线性多智能系统的分布式固定时间事件触发一致性问题。采用Artstein-Kwon-Pearson简化方法将输入延迟系统转换为无输入延迟系统,在无输入延迟的基础上,利用智能体之间的状态误差,设计了分布式事件触发机制,避免了邻居间的连续通信和控制器的持续更新。Girard A(Dynamic triggering mechanisms for event-triggered control[J].IEEE Trans.Autom.Control,2015)(事件触发控制的动态事件触发机制)提出了一种包含内部动态变量的动态事件触发机制,该内部动态变量可以看作一个滤波器,过滤掉某些不满足触发条件的值,相比静态事件触发机制,能更有效地减少事件触发的次数。Du S,Liu T,Ho D(Dynamic Event-Triggered Control for Leader-Following Consensus of Multiagent Systems[J].IEEE Transactions on Systems,Man,and Cybernetics:Systems,2018)(基于动态事件触发的多智能体系统领导跟随一致性)研究了事件触发机制下线性多智能体系统的领导跟随一致性问题。首先提出了集中式事件触发机制,其次通过引入内部动态变量,设计了分布式动态事件触发机制。在集中式事件触发机制中,每个智能体需要知道多智能体系统的全局信息,而分布式动态事件触发机制中,每个智能体只需要知道自己和邻居的状态信息。Ruan X,Xu C,Feng J(Adaptivedynamic event-triggered control for multi-agent systems with matcheduncertainties under directed topologies[J].Physica A:Statistical Mechanicsand its Applications,2022)(有向拓扑下带不确定匹配的多智能体系统的动态事件触发控制)研究了在有向拓扑下带不确定性匹配的线性多智能体系统的一致性问题。假设多智能体的状态不可以测量,设计了基于观测器的自适应分布式控制协议,提出的时变耦合增益自适应σ可以使控制增益更小,调节效果更好。此外设计了具有正下界动态阈值的动态事件触发机制,能使多智能体系统使用更少的通信成本达到一致性。

发明内容

本发明的目的是,为了使存在数据量化、通信资源有限、状态不可观测以及带有合作和竞争关系的多智能体系统能实现领导跟随实用二分一致性,提供一种基于双动态事件触发机制的多智能体系统领导跟随实用二分一致性控制方法。

本发明实现的技术方案如下,一种基于双动态事件触发机制的多智能体系统领导跟随实用二分一致性控制方法,多智能体系统存在数据量化、通信资源有限、状态不可观测、包含一个领导者和多个跟随者,跟随者之间存在合作与竞争关系。其中领导者只能发送信息给跟随者,不能接收跟随者的信息,跟随者之间的通信是无向的,且以通信拓扑权重的正负来表示智能体间的合作和竞争关系。所述方法针对上述多智能体系统,设计合适的状态观测器和基于均匀量化器的控制协议;所述状态观测器利用输出量来观测系统状态值,控制协议基于结构平衡拓扑假设和矩阵变换,将领导跟随实用二分一致性问题转换为一般领导跟随实用一致性问题,在该控制协议下,多智能体系统能实现领导跟随实用二分一致性;所述方法还设计合理的双动态事件触发机制,第一个事件触发机制使得多智能体系统避免邻居间的连续通信,第二个事件触发机制在第一个事件触发机制的基础上减少控制器的更新次数,有效地节约通信资源。

所述方法步骤如下:

(1)考虑含有1个领导者和多个跟随者的多智能体系统通信拓扑图结构,其中对于每个跟随者,至少存在一条通往领导者的路径,领导者只能发送信息给跟随者,不能接收跟随者的信息,跟随者之间的通信是无向的,以通信拓扑权重的正负来表示智能体间的合作和竞争关系。

(2)设计合适的状态观测器,利用智能体与其邻居智能体的状态观测误差以及智能体与领导者之间的状态观测误差设计基于均匀量化器的控制协议,使多智能体系统实现领导跟随实用二分一致性。

(3)在满足多智能体系统能够实现领导跟随实用二分一致性的控制条件下,设计合理的双动态事件触发机制,当满足第一个事件触发机制时,智能体才会与其邻居智能体进行通信;满足第二个事件触发机制时,控制器进行更新;在双动态事件触发机制下,多智能体系统避免了邻居间的连续通信以及减少了控制器的更新次数,且系统不会出现芝诺行为。

所述多智能体系统的通信拓扑图结构确定方法如下:

在多智能体系统中,领导者没有邻居智能体,但存在从领导者出发的边,跟随者有邻居智能体;其中对于每个跟随者,至少存在一条通往领导者的路径,领导者只能发送信息给跟随者,不能接收跟随者的信息,跟随者间的位置通信是无向的,以通信拓扑权重的正负来表示智能体间的合作和竞争关系;

使用应用图论的方法来表示由智能体构成的通信网络:

用于描述由一个领导者和N个跟随者组成的通信拓扑图;G=(V,E,A)用于描述N个跟随者组成的通信拓扑图;

其中,V={1,2,...,N}为点集,

G的拉普拉斯矩阵为:

的拉普拉斯矩阵H=L+A

在拓扑图G中,智能体i的位置邻居集合可被表示N

拓扑图G为结构平衡图,当且仅当节点集V可分为两个非空集合V

(2)若

(3)若

定义正交矩阵D={d

所述基于均匀量化器的控制协议、状态观测器和双动态事件触发机制设计如下:

考虑含有一个领导者和N个跟随者的线性系统,每个跟随者的动力学模型可以被描述为:

y

其中,

则智能体i的状态观测器为:

其中,

智能体i的状态观测误差为:

领导者的动力学模型为:

y

其中,

智能体i与领导者的一致性误差为:

e

智能体的通信测量误差为:

其中,

控制器更新的测量误差为:

其中,a

针对存在数据量化、通信资源有限、状态不可观测以及带有竞争和合作关系的多智能体系统,基于均匀量化器的控制协议的设计如下:

其中,u

(2)智能体通信的动态事件触发机制设计如下:

其中,

b

η

其中,η

(3)智能体控制器更新的动态事件触发机制设计如下:

其中,

η

其中,η

所述方法针对存在数据量化、通信资源有限、状态不可观测以及带有竞争和合作关系的多智能体系统,设计合适的状态观测器和基于均匀量化器的控制协议,多智能体系统能实现领导跟随实用二分一致性,且在双动态事件触发机制下,多智能体系统避免了邻居间的连续通信以及减少控制器的更新次数,有效地节约了通信资源。

本发明的有益效果在于,本发明将图论与多智能体系统网络、领导跟随实用二分一致性控制、状态观测器以及双动态事件触发机制相结合,形象直观地表示了由多智能体位置组成的系统网络拓扑结构、状态观测值、内部动态变量以及控制输入之间的关系。本发明根据系统收敛应满足的条件,设计了状态观测器和基于均匀量化器的控制协议,能使多智能体系统实现领导跟随实用二分一致性;本发明设计的双动态事件触发机制与静态事件触发机制相比,能更有效地减少智能体与邻居间的通信次数,与单动态事件触发机制相比,能更有效地减少控制器的更新次数。

附图说明

图1是本发明构造的多智能体系统的通信拓扑图;

图2是本发明各跟随者智能体1维位置轨迹;

图3是本发明各跟随者智能体2维位置轨迹;

图4是本发明各跟随者智能体与领导者智能体的1维一致性误差;

图5是本发明各跟随者智能体与领导者智能体的2维一致性误差;

图6是本发明各智能体观测器的位置观测值与各智能体位置实际值的1维一致性误差;

图7是本发明各智能体观测器的位置观测值与各智能体位置实际值的2维一致性误差;

图8是本发明各智能体与邻居智能体通信的触发时刻;

图9是本发明各智能体控制器更新的触发时刻;

图10是本发明第一个事件触发中各智能体的内部动态变量的更新;

图11是本发明第二个事件触发中各智能体的内部动态变量的更新;

图12是本发明方法的步骤框图;

图2、3、4、5、6、7、10、11中的曲线1为智能体1,曲线2为智能体2,曲线3为智能体3,曲线4为智能体4,曲线5为智能体5,曲线6为智能体6。

具体实施方式

如图12所示,本发明一种基于双动态事件触发机制的多智能体系统领导跟随实用二分一致性控制方法的具体实施步骤如下:

本实施例

(1)考虑含有1个领导者和多个跟随者的多智能体系统通信拓扑图结构,其中对于每个跟随者,至少存在一条通往领导者的路径,领导者只能发送消息给跟随者,不能接收跟随者的消息,跟随者间的位置通信是无向的,以通信拓扑权重的正负来表示智能体间的合作和竞争关系。

(2)设计合适的状态观测器,利用智能体与其邻居智能体的状态观测误差以及智能体与领导者之间的状态观测误差设计基于均匀量化器的控制协议,使多智能体系统实现领导跟随实用二分一致性。

(3)在满足多智能体系统能够实现领导跟随实用二分一致性的控制条件下,设计合理的双动态事件触发机制,当满足第一个事件触发机制时,智能体才会与其邻居智能体进行通信,满足第二个事件触发机制时,控制器进行更新。在双动态事件触发机制下多智能体系统避免了邻居间的连续通信以及减少了控制器的更新次数。

考虑含有一个领导者和N个跟随者的线性系统,每个跟随者的动力学模型可以被描述为:

y

其中,

领导者智能体的动力学模型可以被描述为:

y

其中,

用于描述由一个领导者和N个跟随者组成的通信拓扑图,G=(V,E,A)用于描述N个跟随者组成的通信拓扑图,其中V={1,2,...,N}为点集,/>

对角元素a

G的拉普拉斯矩阵为:

的拉普拉斯矩阵H=L+A

拓扑图G为结构平衡图,当且仅当节点集V可分为两个非空集合V

(2)若

(3)若

定义矩阵D={d

图1考虑了由6个跟随者和1个领导者构成的多智能体系统,该通信拓扑图满足结构平衡条件,其中有2个跟随者能直接获取到领导者的位置信息,图中两个子群分别为V

图2是各跟随者智能体1维位置轨迹,图3是各跟随者智能体2维位置轨迹。从图2和图3可以看出跟随者的位置在设计的控制协议下逐渐收敛到与领导者位置相同或相反的可控区间。

图4是各跟随者智能体与领导者智能体的1维一致性误差,图5是本发明各跟随者智能体与领导者智能体的2维一致性误差。从图4和图5可以看出跟随者位置的模与领导者位置的模之间的误差收敛到一个较小的常数范围内。

图6是各智能体观测器的位置观测值与各智能体的位置实际值之间的1维误差,图7是各智能体观测器的位置观测值与各智能体的位置实际值之间的2维误差,从图5和图6可以看出,各智能体的位置观测值与位置实际值之间的误差收敛到一个较小的常数范围内,即设计的观测器能在较小的范围误差内观测到智能体的位置。

图8是各智能体与邻居智能体通信的触发时刻,图9是各智能体控制器更新的触发时刻;从图8和图9可以看出双动态事件触发机制下,多智能体系统避免了邻居间的连续通信,减少了控制器的更新次数,有效地节约了通信资源。

图10是第一个事件触发中各智能体的内部动态变量的更新,图11是第二个事件触发中各智能体的内部动态变量的更新;从图10和图11可以看出两个动态事件触发中各智能体的内部动态变量收敛到一个较小的常数范围内。

技术分类

06120115933455