掌桥专利:专业的专利平台
掌桥专利
首页

一种用于无人集群的智能行为管控方法及装置

文献发布时间:2024-04-18 19:58:30


一种用于无人集群的智能行为管控方法及装置

技术领域

本发明属于无人集群智能控制技术领域,具体为一种用于无人集群的智能行为管控方法及装置。

背景技术

以智能机器人和无人机为代表的智能无人集群系统正成为科技发展主流方向和战略性新兴产业。同时智能无人集群系统也呈现出规模化、网络化、集群化的发展趋势。智能无人集群系统的发展面临诸多制约,例如软硬件体系结构异构多样性与群体互操作性的矛盾,节点个体自主性与群体行为协同性的矛盾,节点能力受限性与集群应用复杂性的矛盾等。因此,提升无人集群系统智能化、自主化和协同化水平亟待解决两个关键科学问题:一是智能无人集群系统的非确定行为的可控性,二是大规模自主群体的智能协同性。

工作环境、任务以及交互的复杂性使得智能无人集群系统中个体之间难以协同,进而难以采取有效的协同行动。为此,研究智能行为管控的抽象和一般化建模方法,实现个体自主行为到群体协同行为的关联和管控机理,是解决管控系统的构造以及智能行为管控问题的重要途径。

发明内容

本发明所要解决的技术问题在于,提供一种用于无人集群的智能行为管控方法及装置,能够将计算压力从资源受限的物理个体,转移至资源丰富的后端虚拟环境,并增强物理个体间的协作,提升目标任务的执行效率。

为了解决上述技术问题,本发明实施例第一方面公开了一种用于无人集群的智能行为方法,所述方法包括:

S1,预设目标任务、物理集群和虚拟环境;所述虚拟环境,包括三维虚拟场景和虚拟集群,分别用于模拟物理环境和物理集群;

所述物理集群和虚拟集群,分别包括P个物理个体和P个虚拟个体;所述P大于1;

S2,利用物理集群,在所述物理环境中执行所述目标任务;

S3,利用所述物理集群实时获取全局物理环境信息;

S4,利用所述虚拟环境进行推演,并控制所述物理集群。

作为一种可选的实施方式,本发明实施例第一方面中,所述利用物理集群,在所述物理环境中执行所述目标任务,包括:

S21,预设物理个体控制模型;

S22,将所述目标任务分解为P个个体任务;

S23,将所述物理个体控制模型,分别部署于P个所述物理个体;

S24,将P个个体任务分别发送至对应的所述物理个体;

S25,将P个所述个体控制模型的模型任务目标,分别设置为对应的所述个体任务;

S26,所述P个物理个体在所述个体控制模型的控制下,在所述物理环境中分别执行对应的所述个体任务,实现以协同方式执行目标任务。

作为一种可选的实施方式,本发明实施例第一方面中,所述利用所述物理集群实时获取全局物理环境信息,包括:

S31,分别利用P个所述物理个体,实时采集对应的个体物理环境信息,并发送至所述虚拟环境;

S32,利用所述虚拟环境对P个所述个体物理环境信息进行融合,得到所述全局物理环境信息。

作为一种可选的实施方式,本发明实施例第一方面中,所述分别利用P个所述物理个体,实时采集对应的个体物理环境信息,并发送至所述虚拟环境,包括:

S311,P个所述物理个体分别利用第一话题转换模块,对对应的所述个体物理环境信息进行转换,得到P个第一个体场景话题;

S312,P个所述物理个体分别利用第二话题转换模块,对对应的所述第一个体场景话题进行转换,得到P个第二个体场景话题并发布;

S313,所述虚拟环境订阅并获取P个所述物理个体的所述第二个体场景话题;

S314,所述虚拟环境利用所述第二话题转换模块,分别对P个所述第二个体场景话题进行转换,得到P个所述第一个体场景话题;

S315,所述虚拟环境利用所述第一话题转换模块,分别对P个所述第一个体场景话题进行转换,得到P个所述个体物理环境信息。

作为一种可选的实施方式,本发明实施例第一方面中,所述利用所述虚拟环境进行推演,并控制所述物理集群,包括:

S41,利用所述虚拟环境进行模拟推演,获取N个虚拟推演环境;所述N大于1;

S42,分别对N个所述虚拟推演环境进行评估,得到N个评估值;

S43,选择所述评估值最高的任一所述虚拟推演环境,作为最优推演环境;

S44,利用所述最优虚拟推演环境,控制所述物理集群。

作为一种可选的实施方式,本发明实施例第一方面中,所述利用所述虚拟环境进行模拟推演,获取N个虚拟推演环境,包括:

S411,预设N个虚拟群体决策模型;

S412,创建N个与所述虚拟环境完全相同的虚拟推演环境;

S413,分别利用N个所述虚拟群体决策模型,控制对应的所述虚拟推演环境中的所述虚拟集群执行所述目标任务,直到运行时间达到推演时间阈值,得到N个虚拟推演环境。

作为一种可选的实施方式,本发明实施例第一方面中,所述利用所述最优虚拟推演环境,控制所述物理集群,包括:

S441,计算每个所述虚拟个体,在所述最优虚拟推演环境和所述虚拟环境中的M

S442,删除每个所述虚拟个体的所述第一状态差异值集合中,小于对应的状态差异阈值的状态差异值,得到每个所述虚拟个体的第二状态差异值集合;所述第二状态差异值集合包括M

S443,分别利用每个所述虚拟个体的所述第二状态差异值集合中的M

S444,分别将每个所述虚拟个体的M

作为一种可选的实施方式,本发明实施例第一方面中,所述分别将每个所述虚拟个体的M

S4441,将P个所述虚拟个体的M

S4442,所述虚拟环境利用所述第一话题转换模块,分别对P个所述外部控制指令组进行转换,得到P个所述虚拟个体的第一指令话题;

S4443,所述虚拟环境利用所述第二话题转换模块,分别对P个所述第一指令话题进行转换,得到P个所述虚拟个体的第二指令话题并发布;

S4444,P个所述物理个体订阅并获取与自身编号对应的所述第二指令话题;

S4445,P个所述物理个体分别利用所述第二话题转换模块,对获取的所述第二指令话题进行转换,得到P个第一指令话题;

S4446,P个物理个体利用所述第一话题转换模块,分别对对应的所述第一指令话题进行转换,得到对应的所述外部控制指令组;

S4447,P个所述物理个体,分别执行对应的所述外部控制指令组中的M

本发明实施例第二方面公开了一种用于无人集群的智能行为管控装置,所述装置包括:

存储有可执行程序代码的存储器;

与所述存储器耦合的处理器;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的用于无人集群的智能行为管控方法中的部分或全部步骤。

本发明实施例第三方面公开了一种计算机可存储介质,所述装置包括:

存储有可执行程序代码的存储器;

与所述存储器耦合的处理器;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面公开的用于无人集群的智能行为管控方法中的部分或全部步骤。

与现有技术相比,本发明实施例具有以下有益效果:

通过在虚拟环境中模拟物理环境和物理集群,并利用最优虚拟推演环境控制物理集群,可以降低前端物理个体的计算压力,并充分利用后端丰富的计算资源,避免因物理个体计算性能不足降低目标任务的执行效果;利用虚拟环境产生的外部控制指令,和个体控制模型产生的内部控制指令,共同控制物理个体完成目标任务,可以增强物理个体间的协作,提升目标任务的执行效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种用于无人集群的智能行为管控方法的流程示意图;

图2是本发明实施例公开的一种用于无人集群的智能行为管控装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例一

请参阅图1,图1是本发明实施例公开的一种用于无人集群的智能行为管控方法的流程示意图。其中,图1所描述的用于无人集群的智能行为管控方法应用于无人集群智能行为管控领域,如无人机集群火情监测,本发明实施例不做限定。如图1所示,该无人集群的智能行为管控方法包括:

S1,预设目标任务、物理集群和虚拟环境;上述虚拟环境,包括三维虚拟场景和虚拟集群,分别用于模拟物理环境和物理集群;上述物理集群和虚拟集群,分别包括P个物理个体和P个虚拟个体,且P大于1;

需要说明的是,物理集群中的物理个体,与虚拟集群中的虚拟个体一一对应;虚拟个体是对应的物理个体的虚拟模型,用于在虚拟环境中模拟对应的物理个体;三维虚拟场景可真实模拟物理场景中的地形、环境物体和目标物体;

可选的,虚拟环境部署于后台服务器上,可以充分利用后台丰富的计算资源;

可选的,上述物理个体为无人机或无人车;

S2,利用物理集群,在物理环境中执行目标任务;

S3,利用物理集群实时获取全局物理环境信息;

S4,利用虚拟环境进行推演,并控制物理集群。

在一个可选的实施例中,上述利用物理集群,在物理环境中执行目标任务,包括:

S21,预设物理个体控制模型;

S22,将目标任务分解为P个个体任务;

以目标任务为获取指定目标物体周围环境温度为例,将目标四周360°的区域划分为P个子区域,则P个个体任务分别为获取对应子区域内目标物体周围环境温度;

S23,将物理个体控制模型,分别部署于P个物理个体;

可选的,物理个体的控制器上运行Linux操作系统,个体控制模型经编译后写入物理个体的控制器,作为Linux操作系统的进程运行;

S24,将P个个体任务分别发送至对应的物理个体;

S25,将P个个体控制模型的模型任务目标,分别设置为对应的个体任务;

S26,P个物理个体在个体控制模型的控制下,在物理环境中分别执行对应的个体任务,实现以协同方式执行目标任务。

需要说明的是,物理个体在外部控制指令和内部控制指令的共同控制下运行;当物理个体接收到虚拟环境发送的外部控制指令时,在外部控制指令的控制下运行;当物理个体没有接收到虚拟环境发送的外部控制指令时,在内部控制指令的控制下运行,且由于内部控制指令是由部署在物理个体上的个体控制模型,通过强化学习算法对个体物理环境信息进行处理产生的,因此物理个体可以自主运行,完成个体控制模型的模型任务目标;上述个体控制模型利用预先获取的物理环境信息库进行训练。

上述内部控制指令用于改变物理个体的个体状态及控制物理个体上的传感器完成数据采集;上述外部控制指令仅用于改变物理个体的个体状态;

可选的,上述个体状态包括个体位置和个体姿态;

可选的,上述传感器为IMU、温度计、里程计或摄像机;

在另一个可选的实施例中,上述利用物理集群实时获取全局物理环境信息,包括:

S31,分别利用P个物理个体,实时采集对应的个体物理环境信息,并发送至虚拟环境;

S32,利用虚拟环境对P个个体物理环境信息进行融合,得到全局物理环境信息。

需要说明的是,由于不同物理个体距离指定目标物体的距离和角度不同,对应的个体物理环境信息只能反映指定目标物体的部分特征,因此将个体物理环境信息进行融合,得到全局物理环境信息,可以全方位反映指定目标物体的特征。例如采集的个体物理环境信息为个体图像信息时,全局物理环境信息为所有个体图像信息进行拼接得到的全局图像信息。

在又一个可选的实施例中,上述分别利用P个物理个体,实时采集对应的个体物理环境信息,并发送至虚拟环境,包括:

S311,P个物理个体分别利用第一话题转换模块,对对应的个体物理环境信息进行转换,得到P个第一个体场景话题;

S312,P个物理个体分别利用第二话题转换模块,对对应的第一个体场景话题进行转换,得到P个第二个体场景话题并发布;

S313,虚拟环境订阅并获取P个物理个体的第二个体场景话题;

S314,虚拟环境利用第二话题转换模块,分别对P个第二个体场景话题进行转换,得到P个第一个体场景话题;

S315,虚拟环境利用第一话题转换模块,分别对P个第一个体场景话题进行转换,得到P个个体物理环境信息。

可选的,上述逻辑话题生成模块为ROS(机器人操作系统),上述话题转换模块为DDS-ROSBridge;上述第一个体场景话题和第二个体场景话题,分别为ROS话题和FastRTPS话题;

需要说明的是,ROS通过发布/订阅机制实现消息的收发;发送方将要发送的消息转换为ROS话题并发布,订阅该ROS话题的接受方收到该ROS话题后,将该ROS话题转换为要接收的消息;由于ROS的发布/订阅机制受限于本地的多个进程,需要使用DDS-ROSBridge对其进行分布式扩展,实现不同物理对象的消息收发;发送方产生ROS话题后,进一步转换为FastRTPS话题并发布,而订阅该FastRTPS话题的接收方在收到该FastRTPS话题后,将该FastRTPS话题转换为ROS话题,再进一步转换为要接收的消息。

另外需要说明的是,虚拟环境和每个物理个体,均部署有逻辑话题生成模块和物理话题生成模块;逻辑话题生成模块和物理话题生成模块经编译后,均作为操作系统的进程,在物理个体上的控制器,或虚拟环境的后台服务器上运行。

在又一个可选的实施例中,上述利用虚拟环境进行推演,并控制物理集群,包括:

S41,利用虚拟环境进行模拟推演,获取N个虚拟推演环境;上述N大于1;

S42,分别对N个虚拟推演环境进行评估,得到N个评估值;

S43,选择评估值最高的任一虚拟推演环境,作为最优推演环境;

S44,利用最优虚拟推演环境,控制物理集群。

可选的,上述分别对N个虚拟推演环境进行评估,得到N个评估值,包括:

S421,获取每个虚拟推演环境中所有虚拟个体的个体任务完成率;上述个体任务完成率为虚拟个体当前已完成的任务占对应的个体任务的百分比;

S422,分别计算每个虚拟推演环境中所有虚拟个体的任务完成率的均值,得到N个评估值。

在又一个可选的实施例中,上述利用虚拟环境进行模拟推演,获取N个虚拟推演环境,包括:

S411,预设N个虚拟群体决策模型;

S412,创建N个与所述虚拟环境完全相同的虚拟推演环境;

S413,分别利用N个所述虚拟群体决策模型,控制对应的所述虚拟推演环境中的所述虚拟集群执行所述目标任务,直到运行时间达到推演时间阈值,得到N个虚拟推演环境。

需要说明的是,上述虚拟群体决策模型,采用机器学习算法产生虚拟控制指令,控制虚拟个体的运行;上述机器学习算法为蚁群算法、粒子群算法、模拟退火算法或群体学习算法。

在又一个可选的实施例中,上述利用利用最优虚拟推演环境,控制物理集群,包括:

S441,计算每个虚拟个体,在最优虚拟推演环境和虚拟环境中的M

S442,删除每个虚拟个体的第一状态差异值集合中,小于对应的状态差异阈值的状态差异值,得到每个虚拟个体的第二状态差异值集合;上述第二状态差异值集合包括M

S443,分别利用每个虚拟个体的第二状态差异值集合中的M

S444,分别将每个虚拟个体的M

以上述个体状态包括个体位置和个体姿态为例,上述状态差异值集合包括个体位置差异值和个体姿态差异值,且M

当某个虚拟个体对应的M

在又一个可选的实施例中,上述分别将每个所述虚拟个体的M

S4441,将P个虚拟个体的M

S4442,虚拟环境利用第一话题转换模块,分别对P个外部控制指令组进行转换,得到P个虚拟个体的第一指令话题;

S4443,虚拟环境利用第二话题转换模块,分别对P个第一指令话题进行转换,得到P个虚拟个体的第二指令话题并发布;

S4444,P个物理个体订阅并获取与自身编号对应的第二指令话题;

S4445,P个物理个体分别利用第二话题转换模块,对获取的第二指令话题进行转换,得到P个第一指令话题;

S4446,P个物理个体分别利用第一话题转换模块,对对应的第一指令话题进行转换,得到对应的外部控制指令组;

S4447,P个物理个体,分别执行对应的外部控制指令组中的M

可见,实施本发明实施例所描述的用于无人集群的智能行为管控方法,能够将计算压力从资源受限的物理个体,转移至资源丰富的后端虚拟环境,并增强物理个体间的协作,提升目标任务的执行效率

实施例二

请参阅图2,图2是本发明实施例公开的一种用于无人集群的智能行为管控装置的结构示意图。其中,图2所描述的用于无人集群的智能行为管控装置能够应用于无人集群智能行为管控领域,如无人机集群火情监测计算,本发明实施例不做限定。如图2所示,该用于无人集群的智能行为管控装置可以包括以下部分:

存储有可执行程序代码的存储器201;

与存储器201耦合的处理器202;

处理器202调用存储器201中存储的可执行程序代码,用于执行实施例一所描述的一种用于无人集群的智能行为管控方法中的步骤。

实施例三

本发明实施例公开了一种计算机读存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一所描述的用于无人集群的智能行为管控方法中的步骤。

以上所描述的装置实施例仅是示意性的,其中作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-OnlyMemory,ROM)、随机存储器(RandomAccessMemory,RAM)、可编程只读存储器(ProgrammableRead-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammableReadOnly Memory,EPROM)、一次可编程只读存储器(One-timeProgrammableRead-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable ProgrammableRead-OnlyMemory,EEPROM)、只读光盘(CompactDisc Read-OnlyMemory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是:本发明实施例公开的一种多模型协同处理方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

相关技术
  • 一种用于无人设备集群控制的多体队形重构方法
  • 一种无人节点的集群组织方法及装置
  • 用于空调的智能控温装置方法及装置、空调、存储介质
  • 一种仿哈里斯鹰狩猎智能行为的无人作战飞机集群攻击方法
  • 一种仿原鸽个体属性智能行为的无人机集群协同控制方法
技术分类

06120116498649