掌桥专利:专业的专利平台
掌桥专利
首页

一种通信受限状况下多无人机协同对地搜索在线规划方法

文献发布时间:2023-06-19 19:30:30


一种通信受限状况下多无人机协同对地搜索在线规划方法

技术领域

本发明属于无人机技术领域,具体涉及一种通信受限状况下多无人机协同对地搜索在线规划方法。

背景技术

无人机具有机体结构简单、成本相对较低、滞空时间长等特性,并且凭借这些优点,无人机在森林防火、灾区监控、无人区搜救、野生动物监测等领域逐渐发挥巨大作用,拥有广阔的应用前景。针对大面积探测时单机探测范围有限的问题,采用多架无人机通过通信网络组网构成搜索编队的方式,可以突破单机的性能限制,有效扩大搜索范围与持续时间。但是由于如山区搜救、森林防火等应用场景中,任务执行区域人迹罕至、蜂窝数据基站缺失、容易出现树木山体遮挡等因素,进而导致无人机编队的通信时常受限,无法有效及时的协调编队内各无人机的搜索范围,造成搜索区域重叠、无人机单元碰撞损耗等问题。如何有效规划无人机编队的搜索区域,根据局部地形、障碍、威胁等信息以及任务要求进行动态调整,同时自动引导编队内各无人机单元针对规划区域进行有效、持续的搜索,对于提升监测搜索效能具有重大意义。

现有的无人机协同搜索方法主要可以分为两类:离线方法与在线方法。离线方法通过任务前人工/自动规划搜索区域与航迹并发送给执行任务的无人机单元,无人机单元按照固定区域/路线执行搜索监视任务,不适用于复杂多变的任务场景,无法根据突发事件动态灵活调整。在线方法通过协同的各无人机单元在任务执行时在线实时规划任务区域与搜索路径,可根据任务的需要灵活改变搜索策略,按照协同的架构可分为集中式方法与分布式方法。集中式方法包含一个或多个决策单元,决策单元在获取到协同的全部无人机的状态信息后计算规划方案并实时指引无人机飞行,当决策单元失效或无人机由于干扰无法获取决策单元的控制规划指令时,集群内的各无人机单元将失去指引与控制,进而丧失任务执行能力,同时由于需要畜栏里全部无人机的任务规划数据,导致决策单元的计算量大,对数据链的带宽与实时性也有很高的要求。分布式架构中无人机之间通过数据链交互相邻或全部协作无人机单元的实时信息,自行规划搜索方案。分布式方法相较于集中式方法鲁棒性更好,但是现有的分布式搜索技术方法仍高度依赖机间通信数据链支撑,当通信失效时由于无法获得它机信息导致一系列问题。即使有的方法考虑到通信干扰问题,但是多是通过对数据进行补偿的方式完成规划,并未考虑通讯长时间中断或部分无人机通讯中断的通讯受限情况下多无人机协同对地搜索规划问题,导致无法满足对山区等通信可靠性差的复杂区域内多无人机协同搜索要求。

发明内容

为了解决现有技术中存在的上述问题,本发明提供了一种通信受限状况下多无人机协同对地搜索在线规划方法。本发明要解决的技术问题通过以下技术方案实现:

本发明提供了一种信受限状况下多无人机协同对地搜索在线规划方法,包括:

步骤1:建立任务区域的搜索图与初始不确定信息图,构建无人机的运动模型与机载传感器模型;

步骤2:判断当前

当通信可用时,获取当前可通信的全部无人机的位置信息,根据全部无人机的位置信息利用Voronoi图划分方法进行区域划分并更新区域划分结果,根据更新的区域划分结果,每个无人机执行基于注意力机制的蚁群算法,获得对应的第一控制决策序列;

当通信不可用时,根据前一时刻的区域划分结果,每个无人机执行基于注意力机制的蚁群算法,获得对应的第二控制决策序列;

步骤3:当通信不可用时,控制无人机执行对应的第二控制决策序列,执行后更新目标存在概率地图和不确定信息图,判断更新后的不确定信息图是否满足预设的不确定度要求,若满足则结束搜索任务,若不满足则返回步骤2进行下一轮的搜索规划,直至搜索任务结束;

当通信可用时,每个无人机获取其它无人机对应的第一控制决策序列实现信息共享,信息共享后更新任务区域的目标存在概率地图和不确定信息图,判断更新后的不确定信息图是否满足预设的不确定度要求,若满足则结束搜索任务,若不满足则继续步骤4;

步骤4:根据无人机对应的第一控制决策序列以及无人机的当前状态,计算得到每个无人机对应的收益值,并将其加入收益值集合中;

步骤5:根据预设的预测步长T

预测控制决策生成操作包括:在0≤t<T

步骤6:根据无人机对应的预测控制决策序列以及无人机的当前状态,计算得到每个无人机对应的新的收益值,对每个无人机将其新的收益值与收益值集合中的收益值进行比较,根据比较结果更新所述收益值集合,重复步骤5-步骤6直至达到预设的收益值集合更新截至条件,得到最终的收益值集合;

步骤7:将最终的收益值集合中的收益值对应的决策序列作为对应无人机的控制决策序列,控制无人机执行该控制决策序列,执行后返回步骤2,进行下一轮的搜索规划,直至搜索任务结束。

与现有技术相比,本发明的有益效果在于:

本发明提供了一种通信受限状况下多无人机协同对地搜索在线规划方法,解决了在复杂环境下无人机集群内仅在有限时间窗口下进行数据交互的通信受限情况下无人机编队执行搜索任务的问题。充分考虑了通讯不畅的问题,在有限时间窗口下进行基于Voronoi图的搜索区域划分,有效解决了集群内各单元无法实时数据交互而导致的搜索区域重合与无人机碰撞的问题。本发明所提出的AACO算法针对任务的常规指令信息、先验信息和突发信息,通过引入自注意力机制自适应更新搜索策略,以最大程度满足不同搜索期望。构建的基于Voronoi图划分方法与AACO算法的DMPC框架可以有效解决无人机编队在通信受限情况下的对地搜索问题。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

附图说明

图1是本发明实施例提供的一种基于Voronoi图划分方法的划分过程示意图;

图2是本发明实施例提供的一种DMPC-AACO控制框架图;

图3是本发明实施例提供的一种基于AACO的无人机对地搜索路径示意图;

图4是本发明实施例提供的一种搜索后环境不确定信息图;

图5是本发明实施例提供的AACO方法与常见方法的效果对比图;

图6是本发明实施例提供的基于DMPC-AACO方法的搜索轨迹是示意图;

图7是本发明实施例提供的基于DMPC-AACO方法搜索后的任务区域环境不确定度地图。

具体实施方式

为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的一种通信受限状况下多无人机协同对地搜索在线规划方法进行详细说明。

有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。

实施例一

本实施例提供的一种通信受限状况下多无人机协同对地搜索在线规划方法,针对复杂情况下的无人机协同对地搜索场景,场景包含突发事件侦测、重点区域监测、覆盖搜索、通讯间断性可用等因素,利用基于分布式模型预测控制与注意力机制的蚁群算法解决多约束条件下的无人机协同在线对地搜索规划控制问题。

本实施例的方法主要包括以下三个部分:(1)针对间断通讯的限制,采用Voronoi图划分方法用以解决在复杂场景下搜索过程中无人机保持在一个区域内的问题,在通信可用时,无人机集群内部进行数据交换,并根据当前态势信息实时重规划各自的搜索区域,防止无人机集群在独自搜索阶段重复搜索其它单元已搜索区域,与此同时,解决无人机集群由于无法实时交互各自位置而导致的碰撞损耗问题;(2)提出一种基于Voronoi图的分布式模型预测控制(Distributed Model Predictive Control,DMPC)框架,解决无人机在通信间断可用时的数据交互与控制优化问题;(3)针对无人机搜索控制规划问题,由于通信限制没有实时的全局信息可以用来优化任务分配问题的解决方案,因此有很大的概率无法获得最佳全局解决方案。考虑到无人机有限的搜索范围和实时处理的要求,提出了一种基于注意力机制的蚁群(Attention Mechanism Ant Colony Optimization,AACO)算法,针对无人机搜索任务特点,采用注意力机制对蚁群算法进行改进,提升蚁群算法在搜索时的搜索效率,同时增加搜索因子,加强无人机对未搜索区域的搜索效能,加速算法收敛。

首先对本实施了提供的Voronoi图划分方法和基于注意力机制的蚁群算法进行说明。

请参见图1所示的本发明实施例提供的一种基于Voronoi图划分方法的划分过程示意图,基于Voronoi图划分方法,具体包括以下步骤:

(1)基于全部无人机单元划分时刻的位置信息

(2)将每一个散点P

(3)将点集中的散点依次插入,遍历三角链表,寻找出其外接圆O

(4)删除影响三角形的公共边,将插入点与影响三角形的全部顶点连接起来,记录在Voronoi边的列表当中,其结果如图1中的(c)图所示;

(5)根据在Voronoi边的列表生成每一个无人机i对应的划分区域V(p

由于在协同搜索任务中,任务区域常存在一个或多个有通过先期其它侦查手段得到目标存在概率的区域需要优先搜索,当遇到突发事件时需要对突发事件地点进行搜索侦查,针对此类问题,本实施例提出一种注意力机制,通过注意力机制对信息素矩阵进行处理,注意力机制中的关注点分为三个类型分别针对三种情形,包括:重点关注点、突发关注点和普通关注点,通过这三类关注点对搜索进行引导,提高搜索效率。

本实施例的基于注意力机制的蚁群(Attention Mechanism Ant ColonyOptimization,AACO)算法,具体包括以下步骤:

步骤a:对于每一个无人机,根据不同的关注点,(即,重点关注点、突发关注点和普通关注点),利用注意力机制对目标存在概率地图和不确定信息图进行更新;

其中,若无人机的搜索区域中存在重点关注点,则对重点关注点的周围栅格(x,y)的不确定信息图按照以下方式更新:

式中,(x

若无人机的搜索区域中存在突发关注点,则对突发关注点的周围栅格(x,y)的不确定信息图按照以下方式更新:

/>

式中,(x

若无人机的搜索区域内不存在重点关注点和突发关注点,则采用不确定度质心作为普通关注点,不确定度质心的计算方式如下:

步骤b:基于关注点生成期望搜索区域,期望搜索区域的计算公式如下:

式中,(x

步骤c:在期望搜索区域内执行蚁群算法,初始化蚁群算法的参数,参数包括蚂蚁个数M,迭代次数n,信息素启发因子α、期望启发因子β和搜索因子detect

步骤d:对于蚂蚁k,根据无人机的运动模型,限制选择下一时刻的可选路径点,从当前t时刻无人机所在路径点m选择下一时刻的路径点n的概率P

式中,τ

步骤e:根据机载传感器模型以及选择的下一时刻的路径点,更新不确定信息图,无人机路径周围距离为r的栅格不确定度变化由下式更新:

χ(x,y,t+1)=(1-f(r))χ(x,y,t) (7);

步骤f:重复步骤d-步骤e,直至蚂蚁运动步数满足预设的蚂蚁步数阈值,得到该蚂蚁k的路径轨迹;

步骤g:重复步骤d-步骤f,直至得到全部蚂蚁的路径轨迹;

步骤h:根据每只蚂蚁的路径轨迹计算得到对应的优势值J

式中,ω

步骤i:选取最大优势值对应的蚂蚁的路径轨迹,根据该蚂蚁的路径轨迹,更新信息素矩阵,重复步骤d-步骤h,直至完成n次迭代,将全部迭代中优势值最大对应的路径轨迹作为控制决策序列输出。

本实施例的AACO算法针对任务的常规指令信息、先验信息和突发信息,通过引入自注意力机制自适应更新搜索策略,以最大程度满足不同搜索期望。

进一步地,对本实施例的通信受限状况下多无人机协同对地搜索在线规划方法的具体流程进行说明。在本实施例中,基于分布式模型预测控制思想,将全任务周期的搜索任务规划问题转换为短时间域内的规划问题,同时在通讯可用阶段可实时调整规划策略,建立了基于Voronoi图划分的分布式模型预测控制框架,如图2所示,可以将执行任务的全部无人机作为一个大系统,则该系统的无人机状态为X(t)={X

其中,f为无人机系统的状态转移函数,记第i架无人机的状态State

/>

在该框架下,本实施例的通信受限状况下多无人机协同对地搜索在线规划方法包括:

步骤1:建立任务区域的搜索图与初始不确定信息图,构建无人机的运动模型与机载传感器模型;

在本实施例中,步骤1包括:

步骤1.1:对任务区域进行格栅化处理,建立任务区域的搜索图;

假设任务区域是一个长宽分别为L

步骤1.2:根据搜索目标的先验存在概率P

在真实搜索任务当中,常在特定区域存在搜索目标的先验存在概率P

步骤1.3:根据初始目标存在概率地图生成初始不确定信息图,每个栅格的不确定度的计算公式如下:

式中,χ(x,y,t)表示在t时刻栅格(x,y)的不确定度,(x,y)表示栅格的坐标,P(x,y,t)表示在t时刻栅格(x,y)的目标存在概率;

步骤1.4:设置无人机i在t时刻的状态表示为:

其中,无人机i当前的位置信息

式中,

无人机i当前的航向信息

式中,H表示航向,h表示在栅格中无人机下一时刻可前往区域的航向角,其中,1表示正前方、2表示右前方45°、3表示正右方、4表示右后方135°、5表示左后方135°、6表示正左方、7表示左前方45°。

步骤1.5:在栅格化环境下,机载传感器的探测效率为

步骤2:判断当前

其中,当通信可用时,获取当前可通信的全部无人机的位置信息,根据全部无人机的位置信息利用Voronoi图划分方法进行区域划分并更新区域划分结果,根据更新的区域划分结果,每个无人机执行基于注意力机制的蚁群算法,获得对应的第一控制决策序列;

当通信不可用时,根据前一时刻的区域划分结果,每个无人机执行基于注意力机制的蚁群算法,获得对应的第二控制决策序列;

步骤3:当通信不可用时,控制无人机执行对应的第二控制决策序列,执行后更新目标存在概率地图和不确定信息图,判断更新后的不确定信息图是否满足预设的不确定度要求,若满足则结束搜索任务,若不满足则返回步骤2进行下一轮的搜索规划,直至搜索任务结束;

当通信可用时,每个无人机获取其它无人机对应的第一控制决策序列实现信息共享,信息共享后更新任务区域的目标存在概率地图和不确定信息图,判断更新后的不确定信息图是否满足预设的不确定度要求,若满足则结束搜索任务,若不满足则继续步骤4;

在本实施例中,预设的不确定度要求为任务区域的平均不确定度小于0.1。

步骤4:根据无人机对应的第一控制决策序列以及无人机的当前状态,计算得到每个无人机对应的收益值,并将其加入收益值集合中;

其中,收益值Profit的计算方式如下:

s.t.

式中,

步骤5:根据预设的预测步长T

预测控制决策生成操作包括:在0≤t<T

步骤6:根据无人机对应的预测控制决策序列以及无人机的当前状态,计算得到每个无人机对应的新的收益值,对每个无人机将其新的收益值与收益值集合中的收益值进行比较,根据比较结果更新收益值集合,重复步骤5-步骤6直至达到预设的收益值集合更新截至条件,得到最终的收益值集合;

在本实施例中,对每个无人机将其新的收益值与收益值集合中的收益值进行比较,根据比较结果更新所述收益值集合,包括:

求解无人机的新的收益值与收益值集合中收益值的差值的绝对值,若该差值绝对值大于预设的差值阈值,则在收益值集合中保留较大的收益值。

其中,预设的收益值集合更新截至条件为:

上述差值绝对值小于或等于预设的差值阈值,或者收益值集合更新次数达到预设次数。

步骤7:将最终的收益值集合中的收益值对应的决策序列作为对应无人机的控制决策序列,控制无人机执行该控制决策序列,执行后返回步骤2,进行下一轮的搜索规划,直至搜索任务结束。

本发明实施例的通信受限状况下多无人机协同对地搜索在线规划方法,解决了在复杂环境下无人机集群内仅在有限时间窗口下进行数据交互的通信受限情况下无人机编队执行搜索任务的问题。充分考虑了通讯不畅的问题,在有限时间窗口下进行基于Voronoi图的搜索区域划分,有效解决了集群内各单元无法实时数据交互而导致的搜索区域重合与无人机碰撞的问题。

实施例二

本实施例通过仿真实验对实施例一所提出的方法的效果进行验证说明。

仿真一:AACO方法仿真分析:

假设仿真初始时刻一架无人机对一个30km×30km的区域进行搜索,场景内存在两个重点关注目标,其目标参数设置如f表1所示。

表1目标参数设置

蚁群算法的初始化参数如表2所示。

表2AACO方法参数设置

首先对场景进行初始化,确定搜索前的概率图与环境不确定图。随着无人机对区域的不断搜索,区域的环境不确定将逐渐降低。无人机在第38步时使

仿真二:基于Voronoi图划分方法的DMPC-AACO仿真分析:

针对大规模场景建立分布式无人机集群搜索任务规划平台,设置场景为:

(1)集群中包含4架处于不同位置的无人机;

(2)任务区域大小为$500km imes 500km$;

(3)存在10个任务区域,目标位置数据、存在目标的先验概率信息与区域性质如表3所示;

(4)在此算例中增加了禁飞区的限定,禁飞区位置如表3所示;

(5)静默通信要求无人机每80个决策步长可进行一次通信;960steps时的通信窗口之后出现电磁干扰,数据链失效,电磁干扰持续到1440步。

表3环境参数设置

DMPC-AACO方法参数初始化如表4所示,模型预测控制的预测步长为15,执行步长为10,最终任务的终止条件为整个任务区域的环境不确定度小于0.1。

表4DMPC-AACO方法参数设置

结果如图6和图7所示,图6中圆形区域为关注点区域扩散结果,矩形区域为禁飞区,图7中矩形柱为禁飞区,如结果图所示,四架无人机协同使环境不确定下降到指定阈值,最终任务区域的平均环境不确定度<0.05,且无人机完成了对重点关注点与紧急任务点的搜索。

应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

相关技术
  • 一种通信链路受限下的多无人机自主协同搜索方法
  • 一种通信链路受限下的多无人机自主协同搜索方法
技术分类

06120115936500