掌桥专利:专业的专利平台
掌桥专利
首页

一种多智能体有限时间的编队路径跟踪控制方法及系统

文献发布时间:2023-06-19 11:22:42


一种多智能体有限时间的编队路径跟踪控制方法及系统

技术领域

本发明涉及多智能体协同控制领域,尤其涉及一种多智能体有限时间的编队路径跟踪控制方法。

技术背景

随着科技的进步和社会的发展,人们对于机器人的要求越来越高,机器人的工作环境也越来越复杂,仅仅采用单一机器人越来越难以解决实际环境中的复杂问题。多智能体系统应运而生,目前多智能体系统(MAS)已发展成为一种新兴的复杂系统学科,并逐渐渗透到社会生活的各个领域。一致问题(即,设计一个基于局部信息的分布式控制器,使所有智能体的状态最终收敛到相同值)是对多智能体进行分布式控制的基础,从理论和实践的角度都引起了极大的关注。而编队问题作为多智能体一致领域的重要应用在理论和实践方面都吸引了广泛的关注,如无人驾驶、无人机编队和卫星编队等方面。

在实际的环境中,多智能体系统本身及其环境往往不能处于理想状态,可能会受到各种各样的约束。如输入饱和约束,输入饱和是机器人系统普遍存在的一种控制约束,它是由智能体的驱动能力有限引起的。如果处理不当,会导致多智能体系统的性能下降,甚至不稳定。因此,必须设计一种控制器以消除输入饱和约束所导致的多智能体系统的性能下降、保证安全可靠的执行任务。

目前针对受输入饱和约束的多智能体编队控制器,往往只能实现渐进收敛。而实际环境中,往往对多智能体系统时间编队的收敛时间有要求,需要有限时间内实现编队。目前针对输入饱和约束下的多智能体有限时间编队路径跟踪的研究较少。如中国专利申请“一种基于多智能体系统的有限时间编队控制方法(CN109144047A)”中,虽然解决了多智能体的有限时间编队问题,但没有考虑实际环境中多智能体系统广泛存在的输入饱和约束,同时仅能实现编队,无法以编队的形式跟随给定路径。

发明内容

为了克服上述现有技术的不足,本发明提供了一种输入饱和约束下的多智能体有限时间编队路径跟踪控制方法和系统。旨在解决当多智能体系统受输入饱和约束时,如何设计一种分布式控制器,使多智能体系统能够抵消输入饱和约束对系统的影响,并在有限时间内完成编队路径跟踪任务。

为了实现本发明目的,本发明提供一种多智能体有限时间的编队路径跟踪控制系统,包括视觉定位系统、控制器、WIFI模块和多个移动机器人,

所述视觉定位系统,使用摄像头识别固定在移动机器人上的定位标签,并将各个机器人的状态信息发送给控制器;

所述控制器根据视觉定位系统获得的各个机器人之间的相对位置信息以及给定的编队目标计算控制器的输出;

所述WIFI模块将控制器的控制信号传递给移动机器人;

多个所述移动机器人根据接收的控制信号调整两轮轮速,完成编队任务。

本发明还提供一种多智能体有限时间的编队路径跟踪控制方法,包括以下步骤:

将期望的同步轨迹作为虚拟领导者智能体的状态,建立虚拟领导者智能体的模型,选用受输入饱和约束的二阶系统描述跟随智能体系统的动力学模型;

将不同的智能体作为不同的节点并根据图论原理建立多智能体之间的通信拓扑,并结合虚拟领导者智能体的模型和跟随智能体系统的动力学模型来确定编队误差;

根据多智能体之间的相对位置、相对速度信息以及编队目标设计控制器;

通过所述控制器获得控制信号,将控制信号发送给各个智能体,各个智能体根据控制信号和机器人运动学模型获得车轮的轮速,并根据所述轮速进行运动。

进一步地,所述虚拟领导者智能体的模型为:

其中,x

进一步地,所述跟随智能体系统的动力学模型为:

其中,x

进一步地,所述建立多智能体之间的通信拓扑,确定领导者的编队误差,具体包括:

使用无权无向图G=(V,E,A)描述智能体间的相互通信结构,其中顶点V=v

定义度矩阵D=diag(d

对于无向图G,定义Laplacian矩阵L=D-A=[l

令B=diag{b

假设跟随者对应的通信拓扑图是连通的,并且至少有一个跟随者能够接收到虚拟领导者的信息,则

第一跟随者的编队误差为:

第二跟随者的编队误差为:

式中,e

进一步地,所述多智能体之间的相对位置的获得方式如下:

对视觉定位系统中的摄像头进行标定,获得相机的内参矩阵;

摄像头拍摄各个机器人的定位标签,获得各个机器人的摄像头画面;

提取摄像头画面中的感兴趣区域;

从摄像头画面的中心开始向四周开始识别,识别出摄像头画面上的每个机器人的定位标签;

进行坐标变换,将相机坐标系下的定位标签位置转化为物理坐标系下的位置,并通过像素与物理尺寸的关系,获得各机器人在物理坐标系下的定位,根据各机器人的定位获得机器人之间的相对位置。

进一步地,所述控制器的控制输入u

其中,tanh()为双曲正切函数,h

h

其中,p=1,…,N,常数κ<0。

进一步地,所述控制信号的发送是采用TCP方式基于WIFI模块传递给不同的智能体。

进一步地,各个智能体根据控制信号和机器人运动学模型进行运动,具体包括:

各个智能体接收控制信号;

通过机器人运动学模型将控制信号转化为机器人左右车轮的轮速;

各个智能体在所述轮速下进行编队跟踪运动。

进一步地,所述机器人运动学模型为:

其中,[x

与现有技术相比,本发明的有益效果是:通过摄像头识别定位标签来对多机器人系统进行定位,同时考虑了实际环境中多智能体广泛存在的输入饱和约束的情况,通过虚拟的领导者作为期望的跟踪路径,解决了智能体受输入饱和约束的编队路径跟踪问题。并通过有限时间一致理论,提高了编队跟踪的收敛速度,在控制器的设计上,通过引入单饱和函数解决了饱和度在位置和速度状态量分布不一致的情况。

附图说明

图1是本发明技术方案总体流程图。

图2是本发明平台通信原理图。

图3是本发明多智能体系统的通讯拓扑图。

图4是本发明机器人运动学模型图。

图5为本发明实施例得到的多智能体编队情况的轨迹仿真图。

具体实施方式

为使本发明的目的、技术方案更加清晰明确,以下结合附图1-4并举实施例对本发明作进一步详细描述。

本实施例提供的一种多智能体有限时间的编队路径跟踪控制系统,包括视觉定位系统、控制器、WIFI模块和多个移动机器人,

视觉定位系统,使用摄像头识别固定在移动机器人上的定位标签,并将各个机器人的状态信息发送给控制器;

控制器根据视觉定位系统获得的各个机器人之间的相对位置信息以及给定的编队目标计算控制器的输出;

WIFI模块将控制器的控制信号传递给移动机器人,本实施例采用的WIFI模块为ESP32,可以理解的是,在其他实施例中可以采用其他型号的WIFI模块;

多个所述移动机器人根据接收的控制信号调整两轮轮速,完成编队任务。

本实施例还提供前述控制系统的控制方法。

一种多智能体有限时间的编队路径跟踪控制方法,包括以下步骤:

步骤S1:将期望的同步轨迹作为虚拟领导者智能体的状态,建立虚拟领导者智能体的模型,选用受输入饱和约束的二阶系统描述跟随智能体系统的动力学模型。

本步骤中,对于一个由一个虚拟的领导者和N个受输入饱和约束的二阶同构智能体组成的多智能体系统,其第i个受输入饱和约束的跟随智能体的动力学模型可以描述为:

其中x

将期望的编队跟踪路径视为虚拟的领导者的状态,其虚拟领导者智能体的模型为:

其中,x

步骤S2:将不同的智能体作为不同的节点并根据图论原理建立多智能体之间的通信拓扑,并结合虚拟领导者智能体的模型和跟随智能体系统的动力学模型来确定编队误差。具体包括:

使用无权无向图G=(V,E,A)描述智能体间的相互通信结构,其中顶点(Vertex)V=v

对于无向图G,定义Laplacian矩阵L=D-A=[l

根据拉普拉斯矩阵的定义,拉普拉斯矩阵中的每一行的行和为零。如果从任意智能体到其他任意智能体都存在一条路径,则无向图G是连通的。

令B=diag{b

对第一跟随者,其编队误差为:

对第二跟随者,其编队误差为:

式中,e

步骤S3:根据多智能体之间的相对位置、相对速度信息以及编队目标设计控制器。

本步骤中,具体包括:

(1)将摄像头架设在场地正上方,并采用matlab中的Camera Calibrator视觉工具箱对摄像头进行标定,获得相机的内参矩阵,并将内参矩阵输入视觉定位系统的视觉定位程序中;

(2)摄像头拍摄各个机器人的定位标签,获得各个机器人的摄像头画面;

(3)将摄像头和视觉定位系统连接,视觉定位系统进行图像处理,识别设置在每个机器人顶面的定位标签的位置(本实施例中,每个机器人顶面设置有3个呈等腰三角形排布的定位标签),并通过坐标转化将相机坐标系下的定位转换为物理坐标系的位置及航向从而对机器人进行定位,分别获得每个机器人的位置,进而可以获得机器人之间的相对位置。

步骤(3)具体包括:

步骤(3.1):在视觉定位程序界面手动划定感兴趣区域,并依据划定感兴趣区域的顺序对机器人进行编号;

具体的,本步骤中:

步骤(3.1.1):通过视觉定位系统中的定位软件界面使用鼠标分别框选每个机器人上的定位标签所在位置,即提取摄像头画面中的感兴趣区域并对感兴趣区域进行灰度化处理;

步骤(3.1.2):采用双边滤波突出感兴趣区域中定位标签的特征并消除无用的干扰信息;

步骤(3.1.3):从图像的中心开始向四周开始识别,识别定位标签上以等腰三角形方式排列的三个黑色实心圆,三个圆的相对位置确立质心以完成对机器人的定位,并对机器人进行编号;

步骤(3.2):视觉定位软件对不同感兴趣区域中的标签进行识别和跟踪,将相机坐标系下的定位标签位置转化为物理坐标系下的位置,并通过像素与物理尺寸的关系,获得各机器人在物理坐标系下的定位,根据各机器人的定位获得机器人之间的相对位置。

(4)控制器接收各个移动机器人自身传感器获得机器人速度信息,进而获得相对速度信息。

通过移动机器人自身的传感器获得机器人的速度信息,然后根据移动机器人之间的通信拓扑获得移动机器人间的相对速度信息。

(5)设计得到的控制器的控制输入u

其中,tanh()为双曲正切函数,h

h

r

控制器的输入中引入了单饱和函数

sig(x)

步骤S4:通过控制器根据虚拟领导者的状态、跟随者智能体系统的实际位置以及编队误差计算出各个跟随者智能体的控制量,获得控制信号,将控制信号发送给各个智能体,各个智能体根据控制信号和机器人运动学模型获得车轮的轮速,并根据所述轮速进行运动。控制信号的发送采用TCP方式基于WIFI模块传递给不同的智能体。

如图4中的机器人运动学模型过程如下:

为了方便做建模分析,假设机器人为刚体;机器人始终在水平面上运动;机器人左右轮与地面纯滚动,无相随滑动。令[x

机器人驱动轮受非完整约束,非完整约束系统系统无法通过连续的静态状态反馈稳定,故采用机器人车头位置的笛卡尔坐标[x

其中,l是机器人前头位置和惯性位置之间的距离,

此外机器人左右车轮的转速与机器人的线速度和角速度有以下关系:

其中,r为左右车轮半径,d为左右轮轮距。v、ω分别代表机器人的线速度和角速度。

故机器人的运动学模型最终可以描述为以下形式:

通过仿真对本实施例提供的控制方法进行验证(以x

四个跟随者者智能体的初始位置分别为:x

虚拟的领导者智能体选择正弦轨迹;

选择控制器参数为h

如图5所示(横坐标代表时间),通过本实施例提供的控制方法对四个跟随者智能体进行控制,且四个跟随者智能体能以编队的形式跟踪虚拟的领导者智能体。

以上所述,仅是本发明的实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以实施例揭露如上,然而并非用于限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

相关技术
  • 一种多智能体有限时间的编队路径跟踪控制方法及系统
  • 一种基于多智能体系统的有限时间编队控制方法
技术分类

06120112902207