掌桥专利:专业的专利平台
掌桥专利
首页

多机器人实时资源分配的决策方法

文献发布时间:2023-06-19 11:29:13


多机器人实时资源分配的决策方法

技术领域

本申请涉及人工智能技术领域,尤其涉及多机器人实时资源分配的决策方法、电子设备及存储介质。

背景技术

多机器人具备单个机器人无可比拟的优势,如并行性、柔性等优越性能,作为具有社会价值的产物,在实际应用中,单体机器人难以在有效时间内完成,需要多机器人协作的事情(如:合作送外卖,合作巡查楼宇等)。

具备自主移动能力的机器人,在楼层与中任意穿行时,需要通过闸机、自动门、电梯等各种设备资源;随着机器人的数量逐渐增多,但是各种设备资源的数量有限,因此,需要对多个机器人进行合理高效的调度,以达到最大化的利用资源,避免资源浪费。

因此,期望提供多机器人实时资源分配的决策方法,实现多个机器人能在同一楼宇中任意穿行,使得各种设备资源的利用最大化。

发明内容

为克服相关技术中存在的问题,本申请提供一种多机器人实时资源分配的决策方法、电子设备及存储介质,旨在解决如何对多个机器人进行合理高效的调度,以达到最大化的利用资源,避免资源浪费的问题。

本申请解决上述技术问题的技术方案如下:一种多机器人实时资源分配的决策方法,包括以下步骤:步骤1,根据分配到的资源,通过第一算法选择出当前最优的资源,得到确定的资源;步骤2,估算所述确定的资源到目的地的第一时间,估算机器人到底目的地的第二时间;步骤3,当所述第二时间与所述第一时间的时间差等于预设值,请求获取所述确定的资源;步骤4,通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序;步骤5,确定所述排队顺序排在首位的一个机器人使用所述确定的资源。

优选的,通过一中央服务器将资源分配给所述机器人。

优选的,通过所述机器人的服务器实时获取资源。

优选的,在通过第一算法选择出当前最优的资源,得到确定的资源之前,所述第一算法通过一固定时序持续对资源进行选择。

优选的,当所述第一算法通过一固定时序持续对资源进行选择时,判断第一次选择的资源与第二次选择的资源是否相同。

优选的,当第一次选择的资源与第二次选择的资源不相同时,通过一滤波算法对第二次选择的资源进行滤波,得到确定的资源。

优选的,在请求获取所述确定的资源时,每一个机器人通过2.4g与4g互补的方式与其它机器人相互通信。

优选的,通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序时还包括以下步骤:获取所述机器人的自身信息,得到第一输入数据;收集其它获取到所述确定的资源的机器人的信息,得到第二输入数据;将所述第一输入数据以及所述第二输入数据输入所述第二算法中,使得每一个所述机器人得到相同的排队顺序。

本申请实施例的第二方面提供了一种电子设备,包括:

处理器;以及一个或多个处理器;一个或多个程序,其中所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行如上所述的方法的指令。

本申请第三方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的方法。

本申请提供一种多机器人实时资源分配的决策方法、电子设备及存储介质,通过分配到的资源,通过第一算法选择出当前最优的资源,得到确定的资源;估算所述确定的资源到目的地的第一时间,估算机器人到底目的地的第二时间;当所述第二时间与所述第一时间的时间差等于预设值,请求获取所述确定的资源;通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序;确定所述排队顺序排在首位的一个机器人使用所述确定的资源,以此使得多个机器人能在同一楼宇中任意穿行,达到多机器人同时过闸机/自动门/电梯等设备资源,此方法具有易于实现,人类易于理解,与人类行为相似,易于扩展,可简易的使用在多对多的资源分配场景中,达到资源占用,独占,排队等效果。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。

图1是本申请实施例示出的多机器人实时资源分配的决策方法的流程示意图;

图2是本申请实施例示出的多机器人实时资源分配的决策方法的另一流程示意图;

图3是本申请实施例示出的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的优选实施方式。虽然附图中显示了本申请的优选实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

以下结合附图详细描述本申请实施例的技术方案。

请参阅图1,图1为本申请第一实施例示出的多机器人实时资源分配的决策方法的流程示意图,如图1所示,方法包括以下步骤:

步骤S1,根据分配到的资源,通过第一算法选择出当前最优的资源,得到确定的资源。

具体的,分配资源时,通过一中央服务器将资源分配给所述机器人,其中分别给到所有机器人一组可用的资源,资源比如:过闸机、自动门、电梯,所述中央服务器分配给到每个机器人的资源可相同也可以不同。多个机器人会各自在可用资源池中进行选择。通常情况下,一组可用资源即为一组具有相同能力的资源,比如:在同一电梯厅,且可到达相同目标楼层的所有电梯为一组可用资源。

在其中一个实施例中,通过所述机器人的服务器实时获取资源。在其他实施例中,资源可以由外部输入给机器人,资源也可以通过写死在机器人的程序中;或者在机器人的程序启动时确定资源。

在其中一个实施例中,在通过第一算法选择出当前最优的资源,得到确定的资源之前,所述第一算法通过一固定时序持续对资源进行选择,当所述第一算法通过一固定时序持续对资源进行选择时,判断第一次选择的资源与第二次选择的资源是否相同,当第一次选择的资源与第二次选择的资源不相同时,通过一滤波算法对第二次选择的资源进行滤波,得到确定的资源。

所有机器人都使用一组相同选择算法,即所有的机器人都采用所述第一算法选择出当前最优的资源。所述机器人在选择在确定能使用资源前需持续进行,以一个较短的固定时序进行选择,即是在通过第一算法选择出当前最优的资源,得到确定的资源之前,所述第一算法通过一固定时序持续对资源进行选择。每次所述第一算法都给出一个最优的解,即是输出一个最优资源,如果输出的结果与上次不相同,则需要将输出的结果经过所述滤波算法,如果输出的结果成功通过滤波,则确定机器人选择该资源,即得到确定的资源。其中滤波算法是为了防止结果抖动,避免机器人选择的结果一直在变化。滤波算法主要用于减少机器人以及现实世界的传感器获取到的各项数据抖动造成的最优资源的抖动。滤波算法也会用于当多个机器人同时选择到同一资源时,根据各个机器人的滤波算法的差异,做排他,使得更适合该资源的机器人优先保持选择资源。

步骤S2,估算所述确定的资源到目的地的第一时间,估算机器人到底目的地的第二时间。

步骤S3,当所述第二时间与所述第一时间的时间差等于预设值,请求获取所述确定的资源。

在其中一个实施例中,开始请求的时机可以动态确定,当所述确定的资源为电梯资源时,估算电梯到达目的地的时间,以及估算所述机器人移动到电梯门口的时间,如果预估的电梯到达时间大于预估的机器人靠近电梯门口时间,机器人即可开始请求获取该电梯资源,以此用当机器人到达电梯门口时,电梯正好也到达的效果,实现了提前呼梯,但不会过早呼梯的效果。

其中在资源分配与资源被选择的流程中的所述确定的资源,不会被其他机器人或资源自身知晓,仅仅存在与机器人自身思考中。

在请求获取资源的流程中,机器人会把自己在分配选择流程中的所述确定的资源,通过机器人之间的互相通信向其它机器人传递。在其中一个是实例中,在请求获取所述确定的资源时,每一个机器人通过2.4g与4g互补的方式与其它机器人相互通信。即机器人与机器人之间通过2.4g与4g互补的方式,发送多机协议中的约定字段使得多个机器人之间可以相互通信。

请求获取资源的流程中,请求命令只需要在所述确定的资源每次变更时,请求命令更新,请求命令并持续以预设的时序向其它机器人发送。

步骤S4,通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序。

步骤S5,确定所述排队顺序排在首位的一个机器人使用所述确定的资源。

具体的,所述第二算法为排队算法,所有机器人会使用一套相同的排队算法,即获取到所述确定的资源的多个机器人都采用相同的排队算法,当多个机器人选择并请求到同一资源时,所述第二算法要确保多个机器人的先后使用关系。即通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序。排队顺序的计算比如根据机器人自身定位,计算与目标资源之间的距离与角度,判断哪个机器人能更快过,所述第二算法就该机器人排在优先的位置。其中,所述第二算法应保证,当前最适合使用该资源的机器人,计算排队结果时排在排队顺序的首位。排队顺序无需在通信中传递,机器人之间只共享自身位置,代价分数等信息。

机器人使用所述确定的资源时,如果确定当前机器人可以使用某一分配的已申请资源时,则无需继续排队等待的流程,其中可使用的条件至少应包含:

1.该机器人已请求且正在请求该资源;

2.该机器人在排队顺序中排在首位;

3.物理环境中达到可立刻使用该资源的状况(如:机器人已在电梯口等待进入)

4.所请求资源已处于可用状态(如:电梯已到达当前楼层,并开门停稳)。

在本实施例中,通过第一算法选择出当前最优的资源,得到确定的资源,在请求获取所述确定的资源时,每一个机器人通过2.4g与4g互补的方式与其它机器人相互通信,使得多个机器人之间可多对多互相实时通信,以此使机器人自身以一定共识去使用资源,实现多个机器人实时资源分配的决策;通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序,排队顺序无需在通信中传递,机器人之间只共享自身位置,代价分数等信息,以此使得机器人可以根据现场环境变换持续变换最适合当下的资源分配结果,从而达到多个机器人排队使用资源的效果。

请参阅图2,图2为本申请第二实施例示出的多机器人实时资源分配的决策方法的另一流程示意图。第二实施例为在上述实施例的基础上增加以下步骤,具体如下:

通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序时还包括以下步骤:

步骤S101,获取所述机器人的自身信息,得到第一输入数据;

步骤S102,收集其它获取到所述确定的资源的机器人的信息,得到第二输入数据;

步骤S103,将所述第一输入数据以及所述第二输入数据输入所述第二算法中,使得每一个所述机器人得到相同的排队顺序。

具体的,每个机器人都会使用自身信息,与收到的其他使用同一资源的机器人的信息,输入同一排队算法,使得每个机器人得出相同优先级结论,以此使得排队顺序无需在多个机器人的通信中传递,以此实现快速相应资源分配。

在本实施例中,通过第一算法选择出当前最优的资源,得到确定的资源,在请求获取所述确定的资源时,每一个机器人通过2.4g与4g互补的方式与其它机器人相互通信,使得多个机器人之间可多对多互相实时通信,以此使机器人自身以一定共识去使用资源,实现多个机器人实时资源分配的决策;通过第二算法对获取到所述确定的资源的多个机器人进行排队,得到多个机器人的排队顺序,排队顺序无需在通信中传递,机器人之间只共享自身位置,代价分数等信息,以此使得机器人可以根据现场环境变换持续变换最适合当下的资源分配结果,从而达到多个机器人排队使用资源的效果。

图3是本申请实施例示出的电子设备的结构示意图。

参见图3,电子设备400包括存储器410和处理器420。

处理器420可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器410可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器1020或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器410可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器410可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器410上存储有可执行代码,当可执行代码被处理器420处理时,可以使处理器420执行上文述及的方法中的部分或全部。

上文中已经参考附图详细描述了本申请的方案。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述的部分,可以参见其他实施例的相关描述。本领域技术人员也应该知悉,说明书中所涉及的动作和模块并不一定是本申请所必须的。另外,可以理解,本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。

此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。

或者,本申请还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或电子设备、服务器等)的处理器执行时,使所述处理器执行根据本申请的上述方法的各个步骤的部分或全部。

本领域技术人员还将明白的是,结合这里的申请所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本申请的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

相关技术
  • 多机器人实时资源分配的决策方法
  • 一种基于云超实时仿真平台与硬件在环的实时决策方法
技术分类

06120112939882