掌桥专利:专业的专利平台
掌桥专利
首页

一种基于带有移动基站的分布式粒子群优化算法

文献发布时间:2023-06-19 19:28:50


一种基于带有移动基站的分布式粒子群优化算法

技术领域

本发明涉及优化算法技术领域,尤其涉及一种基于带有移动基站的分布式粒子群优化算法。

背景技术

在实际的生活中,有时候会存在多个目标,并且必须对这多个目标同时开始进行搜索。这时候,传统的目标搜索方法将不再适用,因为大多数的传统的目标搜索方法都难以通过一次算法运行同时对多个目标展开搜索。传统的算法在处理多个目标的搜索任务时,通常是采用顺序的方法来逐个地对多个目标展开搜索。一些文献中的研究已经讨论了对多个目标搜索的问题。但大多数文献都忽略了机器人系统的有限通信能力和通讯行为造成的能耗问题。Zheng虽然考虑到了机器人系统的通信限制问题,但是Zheng提出的算法与PSO算法相比较,机器人个体的状态更新方法并不十分有效。

在2009年,Derr将DPSO算法用于控制群机器人系统去执行单个目标和多个目标的同时搜索任务。在对多个目标的同时搜索过程中,每个机器人都是在部署之前就经过了编程而被分成不同的子群来寻找特定的目标。机器人是根据从每个目标处接收到的信号的强度(Received Signal Strength,RSS)来跟踪这些目标的。这个搜索方法的缺点是:子群中的每个机器人只能将所属子群中的最佳适应值发送给同一子群中的其它机器人,不同的子群之间不存在任何合作。另外,机器人系统的通信限制问题并没有被考虑。Zhang在2014年利用多机器人系统同时并行地搜索多个目标

Tang在2018年提出了一种控制群机器人系统同时地搜索多个目标的方法,该方法是基于一种改进的PSO算法和一种改进的分组策略(Improved Group Strategy,IGS)的。在该方法的第一阶段,机器人随机地分布在整个搜索区域中。在该方法的第二阶段,群机器人系统被分组,每个机器人组都只是专注于搜索一个特定的目标,每个分组中的机器人都是根据一种基于收缩因子的粒子群优化(Constriction Factor-based Particle SwarmOptimization,CFPSO)算法进行移动的。机器人分组的结构是通过若干个搜索辅助点来确定的,这些搜索辅助点都是从信号强度取值大于阈值的各个历史的最佳位置中选择的。选择搜索辅助点时,将对信号强度取值不小于阈值的单个历史的最佳位置进行排序。搜索辅助点的选择完成以后,相对接近同一个搜索辅助点的机器人便组成了一个小组。但是,该方法没有考虑机器人系统的通信限制问题。因此,该方法的顺利实现需要具有一个拥有强大的通信能力的中央单元来完成单个历史的最佳位置的排序和机器人个体之间距离的计算。另外,该方法不能保证对搜索资源的平衡利用。可能出现有太多的机器人靠近同一搜索辅助点并且搜索同一个目标,而其它的目标却只有很少的机器人参与搜索的现象。此外,该方法也没有考虑每个小群体中的机器人个体的多样性,这会导致子群容易出现陷入局部极优的情况。

在2014年,Zheng提出了一种改进的群体爆炸策略(Improved Group ExplosionStrategy,IGES)来执行多目标的搜索任务,该策略的灵感来自于自然界中的爆炸现象。在IGES中,机器人群被自适应地分为若干个小团体,这些小团体将独立地寻找不同的目标,第i个机器人的速度以及位置的更新方程表示如下:

其中,V

发明内容

本发明的目的是为了解决现有技术中存在在机器人系统的更新过程中,仅考虑了最近的十个历史状态,这可能会导致一些以前出现的良好的历史解被直接丢弃。而且,机器人小组的中心以及最好的适应位置的中心间的相对位置作为每个机器人的速度更新的主要指导因素,并不能有效地利用不同的目标的个体最优适应位置,导致算法的搜索效率降低的缺点,而提出的一种基于带有移动基站的分布式粒子群优化算法。

为了实现上述目的,本发明采用了如下技术方案:

一种基于带有移动基站的分布式粒子群优化算法,包括以下步骤:

S1、群机器人系统的动态分组:群机器人系统中所有的机器人个体被动态的分成一些小子群为之后的目标搜索做准备,一旦这些小子群分组完成,不同的子群将独立地对不同的目标进行搜索;

S2、机器人代表的选择:从整个机器人群体中动态地选择出若干机器人代表;

S3、基站的定位:基站的定位可以被分为:基站的初始部署和基站的重新定位两个部分;

S4、数据的传输:在数据的传输阶段,选定的机器人代表们将自己所了解到的最优数据信息传输给基站,基站执行汇总与分析,然后在必要的时候,将在它的通信范围内向所有的机器人广播新发现的最佳解,与单目标搜索情况不同的是基站的广播对象发生了改变,基站的广播对象不再是它通信范围内的所有机器人。

优选的,所述S3中,其中,在第一次迭代中,需要决定引入合适数量的基站并且将这些基站进行初始地部署,在第二次迭代及以后的所有迭代中,基站会进行重新进行定位,这个重新定位的行为是在考虑了机器人系统的通信限制问题和机器人的通讯能量消耗的前提下进行位置更新的,为了以后的数据交流及传输做准备工作,与单目标搜索情况不同的是基站进行重新定位时的依据因素不只限于对一个目标的考量。

优选的,所述S1中,为了在搜索过程中同时且有效地处理多个目标,将机器人群动态地分为若干个小的机器人子群,一旦机器人分组完成,每个机器人子群将会独立地搜索特定的目标,每一次迭代开始时都会进行一次分组,这样能够克服在分组完成后各个子群独立地进行目标搜索过程中互相没有合作的缺陷,机器人R

其中,I(T

其中,

优选的,所述S2中,为了从群机器人系统中选择合适数量的机器人代表来代替所有的机器人,将自己发现的最优信息数据传输给基站,提出RRS-MT算法。

优选的,所述RRS-MT算法是在RRS算法的基础上提出的,在RRS-MT算法中,在选择机器人代表的时候仍然是考虑了机器人所处的位置对应的目标函数取值和机器人的能量水平,最好的当然是选择处在更优的位置和具有更高的剩余能量的机器人作为机器人代表,另外,机器人代表所具有的邻居机器人数目越多,该机器人代表也就越具有代表性,和RRS算法不同的是,在RRS-MT算法中机器人代表的选择过程是在每个子群中独立地展开和进行的,在不同的子群中,采用的目标函数是不同的,因为不同子群中的机器人所搜索的目标对象是不同的,作为目标函数的搜索误差的计算公式也是不同的,

为了保持足够数量的机器人代表以有效地代表所有的机器人,将H

其中,

优选的,所述S3中,基站的重新定位具体如下:为了减短数据信息的传输距离并提高算法搜索的精度,基站也需要在每一次迭代中进行重新定位,对于每一个基站,选择这个基站通信范围内最有价值的机器人代表,并利用这个选定的机器人代表指导基站重新进行定位,所谓最有价值指的是具有最优的目标函数取值和足够高的剩余能量,机器人代表与基站之间的距离应该尽可能的短,目的是减小机器人在通讯过程所需要消耗的能量,考虑到在同时搜索多个目标时,一个基站的通信范围内可能存在着多个最有价值的机器人代表(针对不同的目标而言),此时,基站的更新需要照顾到不同的目标,基站BS

Nr

其中,c

优选的,公式(18)中之所以考虑最有价值的机器人代表的平均值是因为基站的移动需要照顾到对所有目标的搜索,这种方式可以尽可能地缩短搜索每一个目标的最有价值的机器人代表和基站之间的数据传输距离,最终达到节省机器人在搜寻目标过程中的通讯能量消耗,从公式(18)中可以看到有三个因素影响着基站速度的更新,其中,第一个因素是基站本身的惯性速度,第二个因素是基于该基站的可通讯范围内的所有最有价值的机器人代表的平均位置信息的,通过这种方式,基站可以朝它的通信范围内的所有最有价值的机器人代表的平均位置移动,这样做的目的是尽可能地缩短基站和各个最有价值的机器人代表之间数据传输的距离,从而降低机器人在通讯过程所需要耗费的能量,第三个因素是基于对该基站的可通讯范围内的所有最有价值的机器人代表的平均位置下一时刻状态的预测估计的,所有的机器人代表在下一次迭代中的位置都可以通过公式(7)和公式(8)进行预测和估计,唯一的区别就是公式(7)中的kbest

从实质上来看,基站重新定位的目的就是减短数据的传输距离,数据的传输距离是指基站与它的通讯范围内所有最有价值的机器人代表之间的欧式距离,为了保证该提出的基站重新定位方法在实时的任务中是可行的,在初始化时,将基站的速度取值设置为比机器人的初始速度大得多的值,这样,基站就能够非常快地到达它的目标更新位置,另外在RRS-MT算法的后续迭代中,对于每一个子群,都是优先从先前的迭代中已经选择成为机器人代表的机器人中选择产生新的机器人代表,在上一次的迭代中被选择作为机器人代表的机器人有很大的可能性会被选择作为下一次迭代中新的机器人代表,考虑到在基站的重新定位方法中,把处于基站通讯范围内的所有最有价值的机器人代表的当前所处位置的平均值以及在下一次迭代即将处的位置的平均值用于指导基站的重新定位,能够动态地保持一种高质量的机器人代表与基站之间的良好连接关系;

在基站的重新定位过程中,并非是要求所有的机器人都将数据信息发送到基站,而是只要求一部分最有价值的机器人代表必须将数据信息发送到基站,这样一来,机器人和基站之间数据传输的距离之和能够大大地减少,最终达到减少机器人在通讯过程中能量消耗的目的。

优选的,所述S4中,首先,基站从选择的最优机器人代表处接收数据信息;然后,基站汇总并分析这些数据信息以确定已知的最佳位置是否有所更新;之后,如果已知的最佳位置有更新,则基站向基站通信范围内部的所有机器人广播新的已知最佳位置信息,反之,则基站不发生任何广播行为,值得注意的是,在每一次迭代中,一旦机器人群的群划分完成,每一个机器人子群将独立地搜索不同的目标,在数据的传输阶段,每个基站仅向位于自己通讯范围内的搜索T

本发明中,所述一种基于带有移动基站的分布式粒子群优化算法的有益效果:

本发明利用提出的动态分组方法对群机器人系统进行分组,目的是在每一次迭代时都能使最合适的机器人子群去搜索不同的目标,帮助群机器人系统在搜索的过程中能够有效地同时处理多个目标,动态地从机器人群中选择适量的机器人代表,目的是代表所有的机器人将最优的数据信息传输到基站,引入了适当数量的可移动基站以减轻机器人系统的通信限制问题,此外,还提出了基站的初始部署和重新定位方法,目的是缩短数据信息的传输距离,从而降低机器人系统在通讯过程中的能量耗费,还提出了处理具有不同重要性等级目标同时搜索的方法,实验的结果表明,在考虑存在机器人系统通信限制和通讯能量消耗问题的前提下,在控制群机器人系统同时搜索多个目标任务中展现出了优于其它算法的性能;

本发明在每一次迭代时都能使最合适的机器人子群去搜索不同的目标,帮助群机器人系统在搜索的过程中能够有效地同时处理多个目标,代表所有的机器人将最优的数据信息传输到基站,引入了适当数量的可移动基站以减轻机器人系统的通信限制问题,缩短数据信息的传输距离,从而降低机器人系统在通讯过程中的能量耗费。

附图说明

图1为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的机器人对目标的感知情况图;

图2为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的数据的传输过程图;

图3为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的群机器人系统目标搜索控制算法流程图;

图4为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例1的测试环境图;

图5为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例2的测试环境图;

图6为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例3和4的测试环境图;

图7为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例1中利用MBDPSO-MT算法对三个目标同时搜索的搜索误差变化图;

图8为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例2中利用MBDPSO-MT算法对五个目标同时搜索的搜索误差变化图;

图9为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例3中利用MBDPSO-MT算法对十个目标同时搜索的搜索误差变化图;

图10为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的实验案例4中利用MBDPSO-MT算法对十个目标同时搜索的搜索误差变化图;

图11为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的利用MBDPSO-MT算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在初始时刻的位置图;

图12为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的利用MBDPSO-MT算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=20时的位置图;

图13为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的利用MBDPSO-MT算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=100时的位置图;

图14为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的利用MBDPSO-MT算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=200时的位置图;

图15为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的使用PDPSO算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=100时的位置图;

图16为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的使用IGES算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=100时的位置图;

图17为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的使用IGS算法控制群机器人系统执行多个目标同时搜索任务时所有的机器人和目标在t=100时的位置图;

图18为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的测试MBDPSO-MT算法的鲁棒性实验中所有的机器人和目标在初始时刻的位置图;

图19为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的测试MBDPSO-MT算法的鲁棒性实验中所有的机器人和目标在t=10时的位置图;

图20为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的测试MBDPSO-MT算法的鲁棒性实验中所有的机器人和目标在t=20时的位置图;

图21为本发明提出的一种基于带有移动基站的分布式粒子群优化算法的测试MBDPSO-MT算法的鲁棒性实验中所有的机器人和目标在t=200时的位置图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。

参照图1-21,一种基于带有移动基站的分布式粒子群优化算法,包括以下步骤:

S1、群机器人系统的动态分组:群机器人系统中所有的机器人个体被动态的分成一些小子群为之后的目标搜索做准备,一旦这些小子群分组完成,不同的子群将独立地对不同的目标进行搜索;

S2、机器人代表的选择:从整个机器人群体中动态地选择出若干机器人代表;

S3、基站的定位:基站的定位可以被分为:基站的初始部署和基站的重新定位两个部分;

S4、数据的传输:在数据的传输阶段,选定的机器人代表们将自己所了解到的最优数据信息传输给基站,基站执行汇总与分析,然后在必要的时候,将在它的通信范围内向所有的机器人广播新发现的最佳解,与单目标搜索情况不同的是基站的广播对象发生了改变,基站的广播对象不再是它通信范围内的所有机器人。

基于带有移动基站的分布式粒子群优化算法的群机器人多目标搜索即MBDPSO-MT。

在PSO算法中,每个粒子在自我历史经验和整个种群的社会经验的指导下,经过多次的位置更新,最终找到目标函数的最优解。在群机器人系统中,每个机器人个体在控制算法的控制和引导作用下,也都会遵守一定的行为准则,通过学习和信息交互对目标进行搜索。它们二者的差异在于搜索空间是真实的还是虚拟的。此外就是搜索主体的差异。在PSO算法中,任务的主体是粒子。然而群机器人系统中,任务的主体却是机器人。PSO算法中的粒子一一对应于群机器人系统里的个体机器人。在PSO算法中的粒子被看作质点,而在机器人系统中的机器人是拥有一定的质量与尺寸的。在PSO算法中粒子的速度取值可以是任何数值,但是,考虑到安全及成本的因素,在群机器人系统中机器人的速度应该受到速度的上限和下限的限制且符合动力学特征的约束(例如机器人不可能飞快的穿越或者遍历庞大的搜索区域)。在PSO算法中的粒子都是采用绝对定位的机制的,然而在群机器人系统中的机器人的定位方式既可以是绝对定位,也可以是相对定位。在PSO算法中的粒子之间的通讯任何时候都认为是成功的,粒子能够在任意时刻与种群中的任何其它的粒子个体交换信息。然而,在群机器人系统里机器人间的通讯并不一定能保证成功地建立。因为存在着通讯限制的问题,机器人只能依靠简单的局部通信来完成信息的交互。在PSO算法中的粒子被认为是拥有无限的能量的,但是机器人拥有的能量却是有限的。PSO算法中的粒子位置的维度可以是任意维的,但是群机器人系统位置的维度是二维或三维的。

1、群机器人系统网络模型

本文考虑了一个由N个机器人和N

假设1:每一个机器人的初始能量都是相同的,并且群机器人网络中所有的机器人都是同质的。所有机器人个体间的通信链接都是对称的。在整个过程中,所有的通信都可以通过直接或者多跳的方式实现,并且优先地选择最节能的方式进行通信。机器人之间的信息交流可能以自组织的方式传递,机器人及服务器的直接连接不是必需的。机器人自身和该机器人的相邻机器人可以通过通信来检测在机器人的感测范围内的目标。例如:如图1所示,目标T

假设2:每个机器人都能够精确地知道自己在物理空间中所处的位置,并且都具有一条能够处理所有的数据流量的数据链接。

假设3:每个目标都能够连续地辐射出特定的信号,并且每个机器人都配备有特定的传感器,这些传感器可以检测在其感应范围内目标发出的信号。对于机器人R

其中,P表示来自目标T

假设4:除目标数目之外,没有提供任何有关该目标的先验信息。

假设5:机器人和基站都是可移动的。

假设6:假设无线通信由电池供电,而移动由燃料供电。

假设7:机器人充电非常不方便,但是所有的基站都可以由外部设备供电。

2、群机器人系统通讯能耗模型

在本文,将群机器人网络看作WSN。在WSN中当数据传递的距离增加时,用于传输数据的能量消耗将会急剧地增加。WSN的能量耗散模型可以被描述如下

其中,E

3、MBDPSO-MT算法

在MBDPSO-MT算法中,第i个机器人(R

/>

其中,ω(t)是惯性权重。

其中,ω

在MBDPSO-MT算法中,为了减轻群机器人系统中机器人的通信限制对搜索过程的负面影响,引入了适当数量的可移动基站来增强系统中机器人个体之间的通信能力。为了降低机器人通信能量的消耗,提出一种策略来动态地选择一些机器人代表以代表所有的机器人将它们发现的最优数据信息传递给基站。MBDPSO-MT算法总共有四个重要组成部分:

(1)群机器人系统的动态分组。群机器人系统中所有的机器人个体被动态的分成一些小子群为之后的目标搜索做准备。一旦这些小子群分组完成,不同的子群将独立地对不同的目标进行搜索。

(2)机器人代表的选择。从整个机器人群体中动态地选择出若干机器人代表。与单目标搜索中机器人代表选择方法不同的是,MBDPSO-MT算法中机器人代表的选择是基于对不同的目标函数都进行计算和评估来完成的。

(3)基站的定位。基站的定位可以被分为:基站的初始部署和基站的重新定位两个部分。其中,在MBDPSO-MT算法的第一次迭代中,需要决定引入合适数量的基站并且将这些基站进行初始地部署。在MBDPSO-MT算法的第二次迭代及以后的所有迭代中,基站会进行重新进行定位,这个重新定位的行为是在考虑了机器人系统的通信限制问题和机器人的通讯能量消耗的前提下进行位置更新的,为了以后的数据交流及传输做准备工作。与单目标搜索情况不同的是基站进行重新定位时的依据因素不只限于对一个目标的考量。

(4)数据的传输。在数据的传输阶段,选定的机器人代表们将自己所了解到的最优数据信息传输给基站。基站执行汇总与分析,然后在必要的时候,将在它的通信范围内向所有的机器人广播新发现的最佳解。与单目标搜索情况不同的是基站的广播对象发生了改变,基站的广播对象不再是它通信范围内的所有机器人。

3.1群机器人系统的动态分组法

为了在搜索过程中同时且有效地处理多个目标,本文提出一种群机器人系统的动态分组算法(Dynamic Swarm Division,DSD),将机器人群动态地分为若干个小的机器人子群。一旦机器人分组完成,每个机器人子群将会独立地搜索特定的目标。在MBDPSO-MT算法的每一次迭代开始时都会进行一次分组,这样能够克服在分组完成后各个子群独立地进行目标搜索过程中互相没有合作的缺陷。机器人R

其中,I(T

考虑到上面所描述的问题,本文提出了一种平衡用于搜索不同目标的机器人数量的方案。在该方案中,首先是根据响应阈值p

其中,

表1DSD算法伪代码

/>

在表1中:

f

在算法后期的迭代中,必须将ω

3.2机器人代表的选择算法

在MBDPSO-MT算法中,为了从群机器人系统中选择合适数量的机器人代表来代替所有的机器人,将自己发现的最优信息数据传输给基站,提出了一种机器人代表的选择算法来动态地选择和更新合理的机器人代表集合R(t)。为了和第四章提出的RRS算法区别开,称本文的机器人代表选择算法为RRS-MT算法。

RRS-MT算法是在RRS算法的基础上提出的,在RRS-MT算法中,在选择机器人代表的时候仍然是考虑了机器人所处的位置对应的目标函数取值和机器人的能量水平。最好的当然是选择处在更优的位置(较小目标函数取值)和具有更高的剩余能量的机器人作为机器人代表。另外,机器人代表所具有的邻居机器人数目越多(通讯邻域越大),该机器人代表也就越具有代表性。和RRS算法不同的是,在RRS-MT算法中机器人代表的选择过程是在每个子群中独立地展开和进行的。在不同的子群中,采用的目标函数是不同的。因为不同子群中的机器人所搜索的目标对象是不同的,作为目标函数的搜索误差的计算公式也是不同的。表2中描述了RRS-MT算法中所使用的所有符号的含义。

为了保持足够数量的机器人代表以有效地代表所有的机器人,将H

其中,

表2RRS-MT算法中符号的含义

3.3基站的初始部署方法

在MBDPSO-MT算法中,基站的初始部署会极大地影响机器人系统在通讯过程中的能量消耗,因为它决定了机器人代表与基站之间的数据传输所经过的距离。另外,鉴于与低成本的机器人相比基站的通信范围很大,引入基站的数量越多,数据能够被传递的范围就越广,这样一来可以减轻机器人系统通信限制对搜索效果的不良影响。然而,如果引入过多的基站将对减轻机器人系统通信限制没有什么明显的改善作用,反而导致基站成本的增加。在MBDPSO-MT算法中,基站的初始部署是根据本文在第四章中提出的基站的初始部署方法进行部署的。

3.4基站的重新定位策略

为了减短数据信息的传输距离并提高算法搜索的精度,在MBDPSO-MT算法中,基站也需要在每一次迭代中进行重新定位。对于每一个基站,选择这个基站通信范围内最有价值的机器人代表,并利用这个选定的机器人代表指导基站重新进行定位。所谓最有价值指的是具有最优的目标函数取值和足够高的剩余能量。机器人代表与基站之间的距离应该尽可能的短,目的是减小机器人在通讯过程所需要消耗的能量。考虑到在同时搜索多个目标时,一个基站的通信范围内可能存在着多个最有价值的机器人代表(针对不同的目标而言)。此时,基站的更新需要照顾到不同的目标,基站BS

Nr

其中,c

公式(18)中之所以考虑最有价值的机器人代表的平均值是因为基站的移动需要照顾到对所有目标的搜索,这种方式可以尽可能地缩短搜索每一个目标的最有价值的机器人代表和基站之间的数据传输距离,最终达到节省机器人在搜寻目标过程中的通讯能量消耗。从公式(18)中可以看到有三个因素影响着基站速度的更新。其中,第一个因素是基站本身的惯性速度。第二个因素是基于该基站的可通讯范围内的所有最有价值的机器人代表的平均位置信息的。通过这种方式,基站可以朝它的通信范围内的所有最有价值的机器人代表的平均位置移动,这样做的目的是尽可能地缩短基站和各个最有价值的机器人代表之间数据传输的距离,从而降低机器人在通讯过程所需要耗费的能量。第三个因素是基于对该基站的可通讯范围内的所有最有价值的机器人代表的平均位置下一时刻状态的预测估计的。所有的机器人代表在下一次迭代中的位置都可以通过公式(7)和公式(8)进行预测和估计,唯一的区别就是公式(7)中的kbest

从实质上来看,基站重新定位的目的就是减短数据的传输距离。具体的,数据的传输距离是指基站与它的通讯范围内所有最有价值的机器人代表之间的欧式距离。为了保证该提出的基站重新定位方法在实时的任务中是可行的,在初始化时,将基站的速度取值设置为比机器人的初始速度大得多的值,这样,基站就能够非常快地到达它的目标更新位置。另外在RRS-MT算法的后续迭代中,对于每一个子群,都是优先从先前的迭代中已经选择成为机器人代表的机器人中选择产生新的机器人代表。在上一次的迭代中被选择作为机器人代表的机器人有很大的可能性会被选择作为下一次迭代中新的机器人代表。考虑到在本文提出的基站的重新定位方法中,把处于基站通讯范围内的所有最有价值的机器人代表的当前所处位置的平均值以及在下一次迭代即将处的位置的平均值用于指导基站的重新定位,能够动态地保持一种高质量的机器人代表与基站之间的良好连接关系。

在基站的重新定位过程中,并非是要求所有的机器人都将数据信息发送到基站,而是只要求一部分最有价值的机器人代表必须将数据信息发送到基站。这样一来,机器人和基站之间数据传输的距离之和能够大大地减少,最终达到减少机器人在通讯过程中能量消耗的目的。

3.5数据传输方式

在MBDPSO-MT算法的数据传输阶段:首先,基站从选择的最优机器人代表处接收数据信息;然后,基站汇总并分析这些数据信息以确定已知的最佳位置是否有所更新;之后,如果已知的最佳位置有更新,则基站向基站通信范围内部的所有机器人广播新的已知最佳位置信息。反之,则基站不发生任何广播行为。值得注意的是,在MBDPSO-MT算法的每一次迭代中,一旦机器人群的群划分完成,每一个机器人子群将独立地搜索不同的目标。在数据的传输阶段,每个基站仅向位于自己通讯范围内的搜索T

3.6具有不同重要性等级目标的处理方法

在实际的多个目标搜索任务中,虽然需要同时对多个目标展开搜索,有时却会更加迫切的寻找到其中的某一部分目标(例如:具有更强毒性的毒源或者敌机的主机等)。此时,在利用MBDPSO-MT算法控制群机器人系统执行这类多个目标同时搜索任务的过程中,需要首先对要搜索的所有目标对象进行基于重要性等级(Important Level,IL)的排列。IL一般是先验信息,本文记第i个目标T

其中,

3.7子群内部行为和MBDPSO-MT算法伪代码

子群内部行为伪代码如表3和表4所示。

表3子群内部行为算法伪代码(t=0)

表3描述了当t=0时,子群内部行为算法伪代码。其中,N

表4子群内部行为算法伪代码(t>0)

/>

表4描述了当t>0时,子群内部行为算法伪代码。

表5MBDPSO-MT算法伪代码

/>

MBDPSO-MT算法伪代码如表5所示。在表5中,第1-9行是初始化。第10-28行是机器人群进行速度及位置的迭代更新。第11行是利用DSD算法对群机器人系统进行分组,动态划分策略可以使得最合适的机器人去搜索各个目标,从而提高群机器人系统的搜索效率。第14-17行指基站的初始部署和重新定位,第15行基站的初始部署是基于提出的ICH-HS算法的。第16行是基站根据公式(18)和(19)进行重新定位。第18-27行是数据的传输过程,针对不同目标的最具有价值的机器人代表将自己所获知的最优信息发送给基站,基站经过综合分析得出结论数据,依据是否有更新决定是否有必要发送这个信息给所有在其通讯范围内的搜索特定目标的普通机器人,这种做法可以在保证对各个目标搜索效果的基础上,尽可能地减少系统的通讯能耗和计算负担。

为了方便理解,图3展示了本文提出的控制群机器人系统执行各类目标搜索过程的流程图,其中包含了对单目标的搜索和对多个目标同时搜索的方法;

4.本发明创造的优点:

本文在考虑存在机器人系统通信限制和通讯能量消耗问题的前提下,提出MBDPSO-MT算法并利用它控制群机器人系统执行多个目标的同时搜索任务。在MBDPSO-MT算法中,利用提出的动态分组方法对群机器人系统进行分组,目的是在每一次迭代时都能使最合适的机器人子群去搜索不同的目标,帮助群机器人系统在搜索的过程中能够有效地同时处理多个目标。根据提出的RRS-MT算法动态地从机器人群中选择适量的机器人代表,目的是代表所有的机器人将最优的数据信息传输到基站。MBDPSO-MT算法引入了适当数量的可移动基站以减轻机器人系统的通信限制问题。此外,本文还提出了基站的初始部署和重新定位方法,目的是缩短数据信息的传输距离,从而降低机器人系统在通讯过程中的能量耗费。此外本文还提出了处理具有不同重要性等级目标同时搜索的方法。实验的结果表明,在考虑存在机器人系统通信限制和通讯能量消耗问题的前提下,MBDPSO-MT算法在控制群机器人系统同时搜索多个目标任务中展现出了优于其它算法的性能。

5.1实验设计

为了验证MBDPSO-MT算法的有效性,本文将MBDPSO-MT算法与PSO(OPSO)算法,DPSO算法,CDPSO算法,Derr提出的算法(PDPSO算法)[9],IGES算法和IGS算法进行了比较。为了方便比较,假设搜索区域中是不存在障碍物的。为了保证实验比较的准确性,将所有的实验独立重复做30次并取平均值作为实验结果。本文利用不同的实验案例来验证MBDPSO-MT算法的有效性和鲁棒性,表7描述了这些实验案例的特点。实验案例1-4设计的目的是测试在控制群机器人系统进行多个目标同时搜索的任务中MBDPSO-MT算法的性能。在实验案例1中,搜索区域的大小为300m*300m,机器人的数量为50,最大的迭代次数为200,待搜索目标的数量为3。在实验案例2中,搜索区域的大小为300m*300m,机器人的数量为60,最大的迭代次数为100,待搜索目标的数量为5。在实验案例3和实验案例4中,搜索区域的大小为300m*300m,机器人的数量为60,待搜索目标的数量为10,实验案例3和4之间唯一的区别在于最大的迭代次数不同。

表7实验案例

可以看出,这些实验案例分别在搜索区域的大小、机器人个体的数量、最大的迭代次数方面有所不同。因此,它们相对全面地反映了群机器人系统对多目标的搜寻场景。实验中所有机器人和目标的位置都是随机初始化的。设计的测试环境如图4到图6所示。其中,绿色的小圆圈代表机器人,这些小圆圈的中心代表机器人的位置。红色的星号代表待搜索的目标。

5.5.2实验结果与分析

图7到图10分别描述了在实验案例1-4中利用MBDPSO-MT算法控制群机器人系统搜索多个目标时每个目标搜索误差的变化情况,具有不同形状和颜色的线条表示不同目标的搜索误差的变化。可以看出,所有目标的搜索误差都能够随着迭代次数的增大而减少,这意味着提出的MBDPSO-MT算法能够成功地控制和引导群机器人系统同时地搜索所有的目标。另外,如果迭代的次数足够大,群机器人系统能够有效地找到所有目标。如图9和图10所示,当最大的迭代次数为40时,有一些目标的搜索误差还不等于零。但是,当最大的迭代次数为200时,所有目标的搜索误差都能够收敛为零,即机器人能够成功地找到所有的目标。

表8列出了利用PSO算法,DPSO算法,CDPSO算法,PDPSO算法,IGES算法,IGS算法和MBDPSO-MT算法控制群机器人系统找到所有的目标所需要花费时间的比较。表5.8中所有关于时间数据的单位均为秒。显然,与其它三种算法比较,利用PDPSO算法,IGS算法,IGES算法和MBDPSO-MT算法控制群机器人系统搜索到所有目标所需要花费的时间更少些。这是因为PDPSO算法,IGS算法,IGES算法和MBDPSO-MT算法能够同时并行地搜索多个目标。但是,当使用PSO算法,DPSO算法和CDPSO算法搜索多个目标时必须采用顺序的方法,找到所有的目标需要花费更多的搜索时间。从表5.8可以看出,当待搜索目标的数量较少时,利用IGS算法控制群机器人系统搜索到所有目标所费的时间比利用PDPSO算法花费的时间短。这是因为在IGS算法中,引入了对群机器人系统的分组策略,该策略的原理是根据机器人的适应性取值来分配机器人去搜索不同的目标。但是,在PDPSO算法中,每个机器人在部署之前都已经经过编程确定好了所要寻找的目标对象。搜索每个目标的机器人都是固定的,并且各个机器人子群之间没有任何互相合作。当目标的数量很大时,利用IGS算法控制群机器人系统搜索到所有目标所花费的时间比利用PDPSO算法花费的时间长。原因是在IGS算法中,并没考虑搜索资源的平衡问题。搜索资源的不平衡意味着用于搜索同一个目标的机器人数量过多,而用于搜索其它目标的机器人数量却很少。当目标的数量很大时,搜索资源的不平衡现象可能变得更加严重,这导致找到所有目标的搜索时间增加。

表8各算法在多目标搜索中的性能比较

与利用PDPSO算法和IGS算法相比,利用IGES算法控制群机器人系统搜索到所有目标所花费的时间更短,主要原因是IGES算法考虑到了群机器人系统的通信限制的问题,IGES算法主要利用机器人的本地信息来指导机器人状态的更新。但是,在PDPSO算法中,由于存在机器人的通信限制问题,不是所有的机器人都能够随时且有效地了解全局的最佳信息。因此,大大降低了PDPSO算法的搜索效率。在IGS算法中,对机器人群体进行分组是根据机器人的适应度取值的,这个分组使得最合适的机器人去搜索不同的目标。但是当存在机器人的通信限制问题时,对最佳位置的排序以及距离的计算无法有效地完成,这对机器人群体的分组结果和IGS算法的性能产生了不利的影响。利用MBDPSO-MT算法控制群机器人系统搜索到所有目标所花费的时间显然是最短的,在MBDPSO-MT算法中,对于每一个机器人来讲,本地信息和全局信息均用于指导机器人状态的更新。但是,IGES算法仅仅使用了本地信息来指导机器人的更新,其效率不如MBDPSO-MT算法中机器人的更新方式的效率高。此外,在IGES算法中,机器人进行速度更新的过程仅仅考虑了最近的十个历史状态,这可能会导致一些早已经出现的良好的历史解信息被无端丢失。但是,MBDPSO-MT算法却是能够充分地利用所有的历史最佳位置来指导机器人的状态更新。另外,MBDPSO-MT算法还引入了适当数量的移动基站,其目的是减轻机器人系统的通信限制对搜索过程的不良影响。在群机器人系统的动态划分过程中,机器人对各个目标的响应概率被用作主要的划分标准之一,整个机器人群体被分为多个子群以独立地搜索不同的目标。随着机器人位置的变化,机器人对各个目标的响应概率也随之发生变化。在每次迭代的开始时执行的动态机器人群体划分使得最合适的机器人子群对特定的目标进行搜索,最终能够提高对所有目标的搜索效率。

图11到图14显示了利用MBDPSO-MT算法控制群机器人系统执行多个目标同时搜索的任务时,机器人群体的位置进化过程的一部分。搜索区域的大小为300m*300m,待搜索目标的数量为10,机器人个体的数量为60。在图11到图14中,机器人群体会按照MBDPSO-MT算法的控制引导而移动,随着迭代次数增大,群机器人系统最终能够成功地找到所有的目标。

在测试环境不发生任何变化的情况下,图15到图17分别显示了利用PDPSO算法,IGES算法和IGS算法控制群机器人系统执行多个目标同时搜索的任务时,所有的机器人和目标在t=100时的位置。从图13和图15看出,当迭代次数相同时,利用PDPSO算法控制群机器人系统所能成功搜索到目标的数量小于利用MBDPSO-MT算法所能成功搜索到目标的数量。这是因为在MBDPSO-MT算法中,在每次迭代开始时执行的动态机器人群划分操作会选择最合适的机器人来搜索各个目标,从而提高了对所有目标的搜索效率。但是,在PDPSO算法中,搜索每个目标的机器人都是之前就编程好的,是固定不变的。此外,PDPSO算法并没考虑机器人系统的通信限制问题。但是,MBDPSO-MT算法考虑到了机器人系统的通信限制问题并引用了适当数量的可移动基站来增强系统中机器人个体之间的通信。

从图13和图16可以看出,当迭代次数相同时,利用IGES算法所能成功搜索到目标的数量要少于利用MBDPSO-MT算法所能成功搜索到目标的数量。原因是在IGES算法中,虽然考虑了机器人系统的通信限制问题,然而机器人的速度更新方式不如MBDPSO-MT算法中机器人速度的更新方式有效,这就降低了目标搜索的效率。

从图13和图17中可以看出,当迭代次数相同时,利用IGS算法控制群机器人系统所能够成功搜索到目标的数量小于利用MBDPSO-MT算法所能成功搜索到目标的数量。在图17中存在更多的远离任何目标位置的机器人。出现这个现象的原因在于:IGS算法没考虑到机器人系统的通信限制问题,不能保证同一分组中所有的机器人都能够及时地知道全局的最佳位置。因此,机器人位置的更新受到了严重的不良影响。另外,在机器人的分组过程中,由于在通讯范围以外的某一些机器人的位置不能被其它机器人知道,因此不能成功地实施最佳位置的排序分类和距离的计算。此外,IGS算法没有考虑到搜索资源的平衡性,这会导致不好的机器人分组结果以及搜索某些目标时的搜索效率十分低下。

最后,本文做实验测试了MBDPSO-MT算法的鲁棒性。将搜索区域的大小设置为300m*300m,待搜索目标的数量为10,群机器人系统中机器人个体的初始数量为60。实验的主要思想是:假设某些机器人上配备的传感器突然失效或者死亡,群机器人系统是否还能够有效地搜索所有的目标。本实验中,假设在第十五次迭代时有五分之一的传感器突然失效或者死亡。实验结果如图18到21所示,尽管能够正常运行的传感器数量突然减少,但最终群机器人系统还是能够成功地找到所有的目标,其原因是通过对群机器人系统进行动态地群组划分,使得最合适的机器人子群被用来搜索各个目标,当能够正常运行的传感器数量突然减少时,尽管在一个机器人子群中配备了能够正常工作的传感器的机器人数量并不多,但是高质量的搜索种群却有助于最终找到最佳的目标位置。在此,高质量指机器人的位置是相对靠近这个机器人所要搜索的目标位置的。另外,在MBDPSO-MT算法中对机器人的动态群组划分过程中,通过考虑机器人的质量相似度保证了整个机器人子群中机器人的多样性,这能够有效地避免各个子群陷入局部的极优状态。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

技术分类

06120115920821