掌桥专利:专业的专利平台
掌桥专利
首页

基于稳定性分析模型的多智能体系统的网络拓扑优化方法

文献发布时间:2023-06-19 19:28:50



技术领域

本发明属于移动通信技术领域,具体的说是涉及一种基于稳定性分析模型的多智能体系统控制的网络拓扑优化方法。

背景技术

工业互联网是全球工业体系智能化变革的重要推手,是智能制造部署实施的重要基石。近年来,多智能体系统受到了广泛的关注,随着多智能体技术的不断发展,多智能体编队在军事、工业等领域的应用尤为突出。在工业方面,物流是企业竞争力的驱动力,对经济增长起着至关重要的作用。然而,目前物流行业仍然面临着成本高、效率低的问题。智能物流的发展为解决这些问题带来了机遇。传统仓储物流系统大量使用人力来搬运和装卸物资,使得总体的工作效率低下,一致性差,不能保证良好的协同合作。工业互联网将工业系统、互联网、感知技术及边缘计算等进行融合,重构了工业体系,从而提高工业园区的工作效率。在5G工业互联网场景下,自动导引运输车(Automated Guided Vehicle,AGV)在物流搬运方面扮演越来越重要的角色,AGV小车减少了人工搬运的繁杂工作,提高了整个工业园区物料运送的效率。单个AGV小车在执行任务时因为自身硬件条件的约束,会影响任务的执行效率;若任务分配信息发送给每个小车,也会浪费资源。于是引入了多智能体编队协同完成任务。

多智能体系统的核心思想是分而治之,将复杂的动态系统分解为相对独立的子系统,并通过子系统之间的协作来完成复杂的任务。多智能体系统需要实现不同生产环节的有机联动,各个智能体可调用的资源以及设计的技术指标不尽相同。因此,多智能体系统的研究主要着眼于多个智能体之间的组织和协调以及整个网络的稳定性。

虽然编队控制和避障控制作为经典控制的两大方面,在控制领域的研究已经逐渐成熟,但是对于多智能体,特别是AGV小车编队通信拓扑的研究较少,且大多没有在考虑编队和避障的同时细化系统中存在的时延问题,也没有考虑拓扑结构对系统稳定性的影响。

因此,需要综合考虑信道条件和网络拓扑对控制性能的影响,以及探究保证系统稳定所需要的信道条件。

发明内容

为了探究信道条件对网络拓扑的影响,进而探究对控制性能的影响,本发明提供了基于稳定性分析模型的多智能体系统控制的网络拓扑优化方法,全面考虑时延以及避障需求后系统保持稳定的条件,优化拓扑以提高系统的性能,并提出信道应该满足的条件。

为了达到上述目的,本发明是通过以下技术方案实现的:

本发明是一种基于稳定性分析模型的多智能体系统控制的网络拓扑优化方法,包括以下步骤:

步骤S1、结合信道衰落、天线增益等信道环境设定AGV间以及簇头与基站间建立连接的条件,来判断不同信道环境下AGV之间、簇头与基站的拓扑连接情况;

步骤S2、考虑各簇的AGV将信息通过簇头传输给MEC进行并在MEC中排队的时延、MEC将计算的数据通过5G传输到簇头控制器的时延以及簇头控制器将控制信息传输到各个AGV执行器的时延;

步骤S3、通过设置每个簇内AGV与簇头的理想距离和人工势场函数来实现分离和聚合原则,在保证系统的稳定性的前提下完成运输任务;

步骤S4、利用Lyapunov稳定性定理分析上述系统达到稳定性的条件,使用LMI计算符合条件的参数;

步骤S5、通过最大化拉普拉斯矩阵第二小特征值来优化系统性能,为了防止智能体在最大化目标中任意互相接近而发生碰撞,以及考虑到现实生活中外部避障功能的需要,所以将拓扑优化问题施加一些约束;

步骤S6、通过仿真从单个簇内和考虑两个簇信息交互两种情况下分析步骤S1-S3建立模型的可行性,以及不同信道环境下对系统拓扑和性能的影响。最后使用步骤S4的算法得出优化后的拓扑与之前拓扑的性能进行对比,验证优化算法的可行性。

进一步地,所述步骤S1中,簇内AGV之间的通信质量矩阵元素定义为:

其中,d

而对于簇头与基站的连接,采用香农公式来计算第i个簇的簇头和第k个基站的信道容量:

进一步地,所述步骤S2中,每个智能体都通过通信网络进行远程操作,每一个小车i的信息由车内的采样器以h为周期进行采样,采样数据可以Zigbee或Wi-Fi发送给其他的小车,以及通过簇头用5G发送给MEC,然后经过MEC计算后,再将信息发送给簇头的控制器,最后由簇头控制器将控制信息发送给小车i内的执行器。第k个采样时刻记为t

④当前小车通过车内采样器发送数据包到邻居节点,也会通过簇头发送给MEC,邻居节点接收到数据包后也通过自己的采样器将自己的数据通过簇头传输到MEC进行计算,因此需要经过MEC中队列排队,再经过计算之后再发送给簇头控制器。此过程中存在在MEC中排队的时延。

⑤MEC将计算的数据通过5G网络传输到簇头控制器过程中存在的时延

⑥簇头控制器将控制信息传输到小车内执行器之间也需要整合信息,这个过程也包含时延

所以总时延就是

进一步地,所述步骤S3中,设置了人工势场函数。考虑一组由N个小车组成的多智能体系统,其中每个小车的动力学方程如下:

其中,x

通过设置与簇头的理想距离进行编队控制,并利用人工势场函数进行避障控制,得到的AGV状态方程如下:

其中,t

对上式求负梯度,得

其中,μ

AGV间簇内避障函数如下:

其中,μ

内部避障控制输入定义为:

其中,||x

进行外部避障时,即小车和障碍物之间的避障控制。为了方便计算,设置所有障碍物为质点,ob={o

其中,μ

其中,N

进一步地,所述步骤S4中,令

Δ=De-A

D=col{0,0,...,0,1)

其中De为节点度矩阵,A为节点通信质量矩阵,Δ为拉普拉斯矩阵。x(t)表示各个智能体在t时刻的位置信息矩阵,r表示各个智能体与簇头的相对距离矩阵,u

Δ

V(t)=V

其中,

V

其中,P>0,Q

经证明,得到稳定性条件如下:

设d

其中,

Ξ=BH

证明:

对于t∈[t

其中,

定义

ψ(t)=[x

引理1:如果存在常数矩阵R>0且R∈R

引理2:对于给定的正整数n,m,区间(0,1)中的标量η,以及给定矩阵R>0,两个矩阵W

如果存在一个矩阵S∈R

/>

由引理1和引理2,可以得到:

所以

进一步地,步骤S5中,考虑编队拓扑邻接矩阵拉普拉斯矩阵Δ的第二小特征值是一个影响系统控制稳定性的重要指标。Δ=De-A。为了防止智能体在最大化目标中任意互相接近而发生碰撞,以及考虑到现实生活中外部避障功能的需要,所以将拓扑优化问题转化为如下问题:

其中,i=1,2,...,n-1,j=2,3,..,n且i<j。x

因为智能体之间的相对距离和拉普拉斯矩阵的非线性相关性,以上问题是一个非线性的优化问题,为了方便分析,利用以下两个引理将问题进行转换。

引理3:考虑由向量p

引理4:对于拉普拉斯矩阵Δ,其第二小特征值λ

①p

由以上两个定理可知,x

为了实现迭代,迭代的每一步都使得第二小特征值最大化,我们将约束离散化。

令d

化简上式,有

d

d

同理,定义d

d

所以将前面最优化问题的非凸约束转化为:

本发明的有益效果是:

本发明在考虑信道环境的情况下,探究了AGV在物料运输中保持系统稳定的条件,以及可以使得系统性能提高的拓扑优化方法,最后的优化使得系统的性能得到了提高。

本发明考虑信道环境、时延、障碍物,解决了在实际场景中多智能体系统稳定性不理想的问题。此外,在保证系统稳定的前提下,本发明采用提高拉普拉斯第二小特征值的方法使得系统具有更好的稳定性。

附图说明

图1是本发明提供的场景整体结构图。

图2是本发明提供的多AGV协同系统控制过程结构图。

图3是本发明提供的簇头所受的势场示意图。

图4是本发明提供的考虑多个簇信息交互的各个阶段仿真图。

具体实施方式

以下将以图式揭露本发明的实施方式,为明确说明起见,许多实务上的细节将在以下叙述中一并说明。然而,应了解到,这些实务上的细节不应用以限制本发明。也就是说,在本发明的部分实施方式中,这些实务上的细节是非必要的。

本发明以图1为研究场景,即稳定性分析模型,是多智能体协同运送任务的场景,该场景由设备层、边缘层和云端层组成,研究系统的稳定性,并着重对设备层与边缘层的拓扑结构进行分析和优化。

具体的,设备层将数个所述AGV分成若干簇协同完成物料运送任务,每个簇的AGV都有一个簇头,由簇头进行两个簇的信息交互,协同完成实时路径规划的计算任务卸载,簇内的AGV与AGV之间进行位置信息的交互,形成编队,由目标点牵引簇头运动,簇头进一步牵引其他AGV进行运动;边缘层由数个边缘节点组成,每个边缘节点中包括5G基站、MEC,每一个边缘节点管理一块区域,边缘节点只负责管理当前区域内的障碍信息、小车实时路径规划,使得小车进行实时避障;云端层负责为操作人员提供操作界面,将任务以及指令下发给边缘节点,再为所有AGV簇头分配任务,根据云服务层给出的任务,AGV进行自动识别转运,通过设置目标点对簇头进行牵引,在到达目标点后,操作人员完成物料登记后并提取物料,AGV再根据云服务层的指令,选择继续进行配送还是在指定区域进行等待。

本发明假设簇内的AGVs之间采用ZigBee或Wi-Fi mesh自组织网络通信。簇头之间通过5G接入边缘层中的服务器。本文假设综合通信计算能力和电池容量等选取能力最好的AGV作为簇头,簇头启用自身的摄像头来确定周围环境的障碍物位置。AGVs选择与通信范围内所有AGV中通信质量较好(即通信信噪比大于某一阈值)的AGVs建立连接。在执行任务过程中一直进行上述判断,如果在运动过程中由于各种原因导致两个AGVs间的信噪比过低,则断开连接;若原本两个没有通信的AGVs信噪比在行驶过程中大于某个值的概率高于了一定阈值,则两AGVs之间建立连接。这种通信方式相较于集中式通信架构,减少了对簇头通信能力的过高要求,也使得通信拓扑的结构不是固定的,是可调节的。

基于图1所示场景,本发明提出了一种多智能体系统的网络拓扑优化方法,包括以下步骤:

步骤S1、结合信道衰落、天线增益等信道环境设定AGV间以及簇头与基站间建立连接的条件,来判断不同信道环境下AGV之间、簇头与基站的拓扑连接情况。

所述步骤S1中,簇内AGV之间的通信质量矩阵元素定义为:

其中,d

而对于簇头与基站的连接,采用香农公式来计算第i个簇的簇头和第k个基站的信道容量:

步骤S2、考虑各簇的AGV将信息通过簇头传输给MEC进行并在MEC中排队的时延、MEC将计算的数据通过5G传输到簇头控制器的时延以及簇头控制器将控制信息传输到各个AGV执行器的时延。

所述步骤S2中,每个智能体都通过通信网络进行远程操作,每一个小车i的信息由车内的采样器以h为周期进行采样,采样数据可以Zigbee或Wi-Fi发送给其他的小车,以及通过簇头用5G发送给MEC,然后经过MEC计算后,再将信息发送给簇头的控制器,最后由簇头控制器将控制信息发送给小车i内的执行器。第k个采样时刻记为t

①当前小车通过车内采样器发送数据包到邻居节点,也会通过簇头发送给MEC,邻居节点接收到数据包后也通过自己的采样器将自己的数据通过簇头传输到MEC进行计算,因此需要经过MEC中队列排队,再经过计算之后再发送给簇头控制器。此过程中存在在MEC中排队的时延。

②MEC将计算的数据通过5G网络传输到簇头控制器过程中存在的时延

③簇头控制器将控制信息传输到小车内执行器之间也需要整合信息,这个过程也包含时延

所以总时延就是

步骤S3、通过设置每个簇内AGV与簇头的理想距离和人工势场函数来实现分离和聚合原则,在保证系统的稳定性的前提下完成运输任务。

所述步骤S3中,设置了人工势场函数。考虑一组由N个小车组成的多智能体系统,其中每个小车的动力学方程如下:

其中,x

通过设置与簇头的理想距离进行编队控制,并利用人工势场函数进行避障控制,得到的AGV状态方程如下:

其中,t

对上式求负梯度,得

其中,μ

AGV间簇内避障函数如下:

其中,μ

内部避障控制输入定义为:

其中,||x

进行外部避障时,即小车和障碍物之间的避障控制。为了方便计算,设置所有障碍物为质点,ob={o

其中,μ

其中,N

步骤S4、利用Lyapunov稳定性定理分析上述系统达到稳定性的条件,使用LMI计算符合条件的参数。

步骤S4中,令

Δ=De-A

D=col{0,0,...,0,1}

/>

其中De为节点度矩阵,A为节点通信质量矩阵,Δ为拉普拉斯矩阵,x(t)表示各个智能体在t时刻的位置信息矩阵,r表示各个智能体与簇头的相对距离矩阵,u

Δ

V(t)=V

其中,

V

其中,P>0,Q

经证明,得到稳定性条件如下:

设d

其中,

证明:

对于t∈[t

其中,

定义

ψ(t)=[x

引理1:如果存在常数矩阵R>0且R∈R

引理2:对于给定的正整数n,m,区间(0,1)中的标量η,以及给定矩阵R>0,两个矩阵W

如果存在一个矩阵S∈R

由引理1和引理2,可以得到:

所以

步骤S5、通过最大化拉普拉斯矩阵第二小特征值来优化系统性能,为了防止智能体在最大化目标中任意互相接近而发生碰撞,以及考虑到现实生活中外部避障功能的需要,所以将拓扑优化问题施加一些约束。

步骤S5中,考虑编队拓扑邻接矩阵拉普拉斯矩阵Δ的第二小特征值是一个影响系统控制稳定性的重要指标。Δ=De-A。为了防止智能体在最大化目标中任意互相接近而发生碰撞,以及考虑到现实生活中外部避障功能的需要,所以将拓扑优化问题转化为如下问题:

其中,i=1,2,...,n-1,j=2,3,..,n且i<j。x

因为智能体之间的相对距离和拉普拉斯矩阵的非线性相关性,以上问题是一个非线性的优化问题,为了方便分析,利用以下两个引理将问题进行转换。

引理3:考虑由向量p

引理4:对于拉普拉斯矩阵Δ,其第二小特征值λ

①p

由以上两个定理可知,x

为了实现迭代,迭代的每一步都使得第二小特征值最大化,我们将约束离散化。

令d

令x(t

化简上式,有

d

d

同理,定义d

d

所以将前面的最优化问题的非凸约束转化为:

步骤S6、通过仿真从单个簇内和考虑两个簇信息交互两种情况下分析步骤S1-S3建立模型的可行性,以及不同信道环境下对系统拓扑和性能的影响。最后使用步骤S4的算法得出优化后的拓扑与之前拓扑的性能进行对比,验证优化算法的可行性。

为了说明本发明所提方法的有效性,下面给出一个实例。通过仿真来评估所提出的算法的性能。考虑一个200m×200m的工业园区,其中有若干簇的小车,每个簇有自己的运输任务,簇内小车使用Zigbee或Wi-Fi进行信息交互。有的簇间存在信息交互来协同完成实时路径规划等计算任务卸载,簇间通过5G接入边缘层服务器进行连接。在仿真中,障碍物被抽象为一个质点,随机分布在工业园区内。通过对每个簇设置目标点,目标点对簇头小车施加引力,簇头再牵动整组小车向目标点移动,途中若遇到障碍物,障碍物和小车之间就会施加斥力来避免碰撞,在这一过程中有可能改变簇的拓扑连接情况。工业园区内考虑多个簇信息交互时的车间工作过程,为了方便实验,我们仅选取两个簇的情况,具体参数如表1所示,为了仿真图的清晰,在生成仿真图时将这两个基站分别放在[5,25]和[25,25]处,在仿真代码中仍然设置在[-85,100]和[105,100]的位置。我们选取工业园区中的一个簇,仿真环境为30m×40m的二维空间,验证六辆AGV小车组成的编队系统的稳定性以及根据信道环境进行队形变换的可行性。如图4所示,表示考虑多个簇间信息交互的拓扑结构图,图中的(I)、(II)、(III)、(IV)分别表示簇处于初始状态、簇内小车完成避免簇内碰撞的控制、外部避障以及最终到达目的地的状态。

表1仿真参数

/>

以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

相关技术
  • 一种基于多智能体强化学习的无线网络拓扑优化控制方法
  • 基于智能演化和稳定性评估的能源系统网络拓扑生成方法
技术分类

06120115924510