一种应用于群体智能系统的最优编队控制方法

文献发布时间：2023-06-19 19:30:30

技术领域

本发明涉及群体智能系统技术领域，具体涉及一种应用于群体智能系统的最优编队控制方法。

背景技术

近年来，基于群体智能系统的编队控制在无人车(UGV)、无人机(UAV)、卫星编队等领域得到了人们的广泛关注，拥有广泛的应用前景。编队控制大致可分为无领航者群体编队控制和领航者-追随者群体跟踪控制两类。有领航者的情况下可以更好的控制整个编队任务的宏观结构，跟随者仅需根据控制律实时更新自身位置信息，并跟随领航者轨迹保持队形。在实际应用中外部环境与任务目标大多是动态的，因此考虑动态的群体智能系统更具有实际价值，可以更好的适应实际任务需求，如：协同探测、环境感知等。

在实际应用中，群体智能系统中常常会有一些性能约束，比如达成预期编队构型的速度最快、完成任务时损耗最少、实际控制量大小等等。最优编队问题就是在实现的编队任务目标的同时，还需要优化群体智能系统的团队性能指标。因此，设计一种既能完成预期编队任务，又能优化全局目标函数的分布式控制律具有十分重要的实际意义。

发明内容

针对现有技术中的上述不足，本发明提供了一种应用于群体智能系统的最优编队控制方法。

为了达到上述发明目的，本发明采用的技术方案为：

一种应用于群体智能系统的最优编队控制方法，包括以下步骤：

S1、获取所有智能体的初始状态信息；

S2、根据群体智能系统中领航者数量和跟随者数量，确定预期目标编队构型；

S3、根据智能体的初始状态信息和预期目标编队构型，确定群体智能系统的拉普拉斯矩阵；

S4、根据智能体的初始位置信息确定领航者的运动轨迹，并更新领航者的实时位置信息；

S5、根据所有智能体的初始状态信息、群体智能系统的拉普拉斯矩阵以及领航者的实时位置信息，确定最优编队分布式控制律；

S6、根据最优编队控制律更新所有跟随者的实时位置信息，完成预期编队任务目标。

可选地，步骤S1中智能体的初始状态信息具体包括：

智能体的初始位置信息和初始运行时间，以及智能体网络通讯拓扑结构。

可选地，步骤S2中确定的预期目标编队构型具体为：

其中，

可选地，步骤S3中确定的群体智能系统的拉普拉斯矩阵具体为：

其中，

可选地，步骤S5具体包括以下分步骤：

S51、根据每一个智能体的局部代价函数约束构建全局代价函数；

S52、采用惩罚函数法对构建的全局代价函数进行处理，得到处理后的全局代价函数；

S53、根据所有智能体的初始状态信息、群体智能系统中跟随者的拉普拉斯矩阵、领航者的实时位置信息以及处理后的全局代价函数，确定最优编队分布式控制律。

可选地，所述全局代价函数具体为：

其中，

可选地，所述处理后的全局代价函数具体为：

其中，

可选地，所述最优编队分布式控制律具体为：

其中，

本发明具有以下有益效果：

本发明实现了群体智能系统进行编队的同时最小化全局代价函数，完成任务的同时可以达到预先设定的系统性能指标的最优。由于本发明中基于误差符号积分鲁棒控制来设计分布式的控制方法，在减少控制输入的抖振的同时降低了通讯要求，增加了系统的鲁棒性以及可拓展性，更适用大型智能系统的控制。

附图说明

图1为本发明实施例中一种应用于群体智能系统的最优编队控制方法的流程示意图；

图2所示为本发明实施例中4辆无人机的通信拓扑结构示意图；

图3所示为本发明实施例中最优编队的运动轨迹示意图；

图4所示为本发明实施例中跟随者的X方向最优编队误差示意图；

图5所示为本发明实施例中跟随者的Y方向最优编队误差示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，本发明实施例提供了一种应用于群体智能系统的最优编队控制方法，包括以下步骤S1至S6：

S1、获取所有智能体的初始状态信息；

在本发明的一个可选实施例中，本实施例建立的群体智能系统包括至少一个领航者和任意数量的跟随者，获取群体智能系统中获取所有智能体的初始位置信息和初始状态信息，其中智能体的初始状态信息具体包括智能体的初始位置信息和初始运行时间，以及智能体网络通讯拓扑结构。智能体的通讯拓扑结构确保智能体相互之间线性独立，且具有一定通讯能力，并保证目标编队构型中所有智能体均同一个平面上。

S2、根据群体智能系统中领航者数量和跟随者数量，确定预期目标编队构型；

在本发明的一个可选实施例中，本实施例根据群体智能系统中领航者数量

其中，

S3、根据智能体的初始状态信息和预期目标编队构型，确定群体智能系统的拉普拉斯矩阵；

在本发明的一个可选实施例中，本实施例定义通讯拓扑G中链路的权重为

本实施例中通讯拓扑G为无向连通图，因此有

S4、根据智能体的位置信息确定领航者的运动轨迹，并更新领航者的实时位置信息；

在本发明的一个可选实施例中，本实施例建立群体智能系统中领航者的运动轨迹为：

其中，

群体智能系统中跟随者的动力学方程为：

其中，

通过引入局部变量作为智能体的参考信号，得到跟随者的轨迹参考信号为：

其中，

S5、根据所有智能体的初始状态信息、群体智能系统的拉普拉斯矩阵以及领航者的实时位置信息，确定最优编队分布式控制律；

在本发明的一个可选实施例中，步骤S5具体包括以下分步骤：

S51、根据每一个智能体的局部代价函数约束构建全局代价函数；

S52、采用惩罚函数法对构建的全局代价函数进行处理，得到处理后的全局代价函数；

S53、根据所有智能体的初始状态信息、群体智能系统的拉普拉斯矩阵、领航者的实时位置信息以及处理后的全局代价函数，确定最优编队分布式控制律。

具体而言，本实施例基于跟随者实时位置与领航者实时位置之间距离的二次型作为整个无人机系统的性能指标，表示为：

其中，

每个跟随者带有局部不等式约束，表示为：

其中，

将每个跟随者的局部不等式约束的和组成全局代价函数，将其转换为与参考信号有关的形式：

其中，

本实施例针对约束优化问题，采用惩罚函数法将一个约束优化问题近似为无约束优化问题进行求解，经过处理后形成的惩罚函数为：

其中，

本实施例对于给定领航者运动轨迹，跟随者编队任务中心跟踪领导者动态轨迹，基于误差符号积分鲁棒控制、梯度下降法、惩罚函数法设计分布式控制律，得到含不等式约束条件下分布式智能系统最优编队控制律为：

其中，

S6、根据最优编队控制律更新所有跟随者的实时位置信息，完成预期编队任务目标。

在本发明的一个可选实施例中，跟随者根据所述编队控制律更新所有其实时位置信息，并按照领航者的实际运动轨迹计算出最优轨迹，跟随者对最优轨迹进行跟踪且将领航者合围在编队中心。

下面针对具体实例对本实施例提供的一种应用于群体智能系统的最优编队控制方法进行具体分析说明。

设定有4架无人机分布在平面的不同位置，其中领航者数量为1架，跟随者数量为3架，需要完成编队任务如下：领航者拥有自己的动力学模型，根据给定轨迹进行飞行任务；跟随者从任意初始位置开始进行合围并形成三角形编队，编队中心即为领航者实时位置。在此过程中，为保证跟随者能够尽快跟踪领航者位置，以跟随者实时位置与领航者实时位置距离的二次型作为整个无人机系统的性能指标。本实施例的目标为完成三角形编队的同时保持三角形编队并将领航者围在编队中心，并且在完成编队任务的基础上使得无人机系统的性能指标达到最优。类似的，我们也可以选取跟随者实时位置与跟随者初始位置距离的二次型作为整个无人机系统的性能指标。也就是在完成编队任务的同时需要满足跟随者移动距离最小、燃料消耗最少，同样具有较高的实际应用价值。

在二维平面中，给定领航者

动态领航者智能体运动轨迹为：

跟随者智能体的动力学方程为：

局部编队参考信号为：

预期编队构型为：

初始化无人机仿真运行时间

在预设的4架无人机中，选取一架无人机作为领航者，记为0号。剩余3架无人机作为无人机智能系统最优编队中的跟随者，记为1号、2号和3号。根据图2所示4架无人机的无向通信拓扑图G，根据无人机智能系统最优编队的任务要求，从而确定无人机集群系统编队

根据所设计的通信拓扑G，整理得本实施例的拉普拉斯矩阵L和跟随者拉普拉斯矩阵

无人机智能系统最优编队的领航者运动轨迹规划可提前进行规划。本实施例中，领航者期望轨迹为圆形轨迹，通过分别给定初始时刻

基于跟随者实时位置与领航者实时位置之间距离的二次型作为整个无人机系统的性能指标：

每个跟随者带有局部不等式约束：

基于误差符号积分鲁棒控制方法和惩罚函数方法，得到分布式无人机智能系统最优编队控制律为：

根据已知的拉普拉斯矩阵，结合最优编队控制律和跟随者智能体的动力学方程可以实时更新无人机智能系统中跟随者的位置信息。

本实施例对无人机智能系统在最优编队控制律作用下进行仿真，如图3至图5所示。图中，

图3展示了二维平面空间上无人机智能系统最优编队的实时运动轨迹图，领航者预先设定绕坐标系原点做圆周运动。初始时刻

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：赵宇;张钰泉;刘永芳;
专利申请人：西北工业大学深圳研究院;西北工业大学;

上一篇：一种短期电力负荷预测方法及系统
下一篇：一种基于特征聚类的铁路轨道不平顺潜在病害辨识方法