掌桥专利:专业的专利平台
掌桥专利
首页

基于算力服务网关的算力编排调度方法、算力网络及装置

文献发布时间:2024-01-17 01:28:27


基于算力服务网关的算力编排调度方法、算力网络及装置

技术领域

本申请涉及算力服务技术领域,具体而言,涉及一种基于算力服务网关的算力编排调度方法、算力网络及装置。

背景技术

随着社会数智化转型不断深入,算力规模出现爆发式的增长、算力供给方式向集群生态转变。为促进算力和网络的深度融合发展,业内提出算力网络一体化信息基础设施和信息服务体系。

算力网络中的算力网关业务节点,将算力业务以网络服务形式开放的一个边界门户,屏蔽算力接入和承载网的接入差异,对所有算力资源的信息状态进行通告和调度,并基于算力资源标签进行算网路由转发。为了实现对算力网络中算力资源的汇总和调度,通常针对不同的算力资源的属性采用不同的协议编程的方式将数据转发给算网大脑进行分析。但是,由于协议编程不可无限扩展且需要占用较多的字节,容易导致算力数据传输稳定性较差且无法实现实时感知。

因此,如何提供一种高效的基于算力服务网关的算力网络中算力编排调度方法的技术方案成为亟需解决的技术问题。

发明内容

本申请的一些实施例的目的在于提供一种基于算力服务网关的算力编排调度方法、算力网络及装置,通过本申请的实施例的技术方案可以基于算力服务网关实现算力网络中的算力编排调度,实现算力网络中算力资源的高效感知,提升算力服务的效率和性能。

第一方面,本申请的一些实施例提供了一种基于算力服务网关的算力网络中算力编排调度方法,应用于算力网络,所述算力网络包括:算网运营平台、算网大脑和多个算力服务网关;其中,所述算网运营平台接收用户的算力服务订单,并向算网大脑发送与所述算力服务订单对应的算力服务请求;所述算网大脑基于所述算力服务请求,生成一级编排调度包,其中,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略;所述目标算力服务网关接收所述算网大脑发送的所述一级编排调度包和算法策略,并利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包。

本申请的一些实施例通过由算网运营平台、算网大脑和多个算力服务网关构成的算力网络可以对用户的算力服务请求进行处理和编排调度。其中,算网大脑可以基于算力服务请求从多个算力服务网关管控的算力资源中选择出最优的目标算力服务节点,以及确定算力服务路径,生成一级编排调度包。之后目标算力服务网关对一级编排调度包处理得到二级编排调度包,以使得目标算力服务节点基于二级编排调度包配置成为可以服务算力服务请求的节点。本申请的一些实施例通过设置多个算力服务网关可以为算网大脑分担对目标算力服务节点确定多种配置信息的计算压力,降低了算网大脑的计算量。而且,通过算网大脑选择的最优的目标算力服务节点,可以降低对算力服务请求的响应时间,同时基于算力服务路径可以使得算力服务请求可以快速到达目标算力服务节点,也可以一定程度上降低了算力服务请求的响应时间,提升了算力服务的效率和性能。

在一些实施例,所述算力网络是基于云原生分布式容器集群和微服务技术架构技术底座搭建的;所述算网运营平台、所述算网大脑和所述多个算力服务网关之间通过全光网络底座进行网络互联和通信。

本申请的一些实施例通过上述组网方式,可以实现安全可靠确定性的网络互联,为实现算力的高效感知提供服务基础架构。

在一些实施例,所述多个算力服务网关中各个算力服务网关管控多个算力节点,所述各个算力服务网关属于各个算力可用区,所述各个算力可用区是基于算力网络中算力资源的属性划分的,其中,所述属性包括:地域属性、算力资源负荷属性、算力响应时间属性和算力资源利用率属性中的至少一种。

本申请的一些实施例通过将算力资源按照属性划分为不同的可用区,每个可用区通过算力服务网关管理,可以实现算力节点的分区管理,提升算力感知效率和算力服务质量。

在一些实施例,所述算网大脑基于所述算力服务请求,生成一级编排调度包,包括:所述算网大脑选取与所述算力服务策略对应的所述目标算力服务节点,并基于网络带宽占用状态进行路径规划,得到所述算力服务路径;所述方法还包括:所述算网大脑生成携带有所述一级编排调度包和所述算法策略发送至所述目标算力服务网关。

本申请的一些实施例的算网大脑可以基于算力服务请求生成一级编排调度包并提供算法策略一并给目标算力服务网关,可以实现对一级编排调度包的有效优化。

在一些实施例,所述利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包,包括:所述目标算力服务网关利用所述算法策略对所述目标算力服务节点进行算网资源编排调度,得到与所述算力服务策略相匹配的所述二级编排调度包中的多种配置信息,其中,所述多种配置信息包括:算力参量、核数、内存参量、数据库信息、算法信息和中间件信息。

本申请的一些实施例通过算法策略可以有效优化一级编排调度包得到二级编排调度包,进而管控得到符合算力服务策略的目标算力服务节点,可以实现算力服务请求的有效处理,提升算力服务质量。

在一些实施例,在所述生成二级编排调度包之后,所述方法还包括:所述目标算力服务网关向所述目标算力服务节点发送所述二级编排调度包;所述目标算力服务网关获取所述目标算力服务节点完成所述算力服务请求的算力服务结果;所述目标算力服务网关向所述算网运营平台发送所述算力服务结果。

本申请的一些实施例通过获取目标算力服务节点执行算力服务请求的算力服务结果并反馈至算网运营平台,实现算力服务的有效监管。

第二方面,本申请的一些实施例提供了一种算力网络,所述算力网络用于执行如第一方面中任一实施例所述的方法,所述算力网络包括:基于算力资源的属性对算力网络资源划分得到的多个算力可用区,其中,所述多个算力可用区中各个算力可用区包括:算力服务网关和由所述算力服务网关管控的区域算力节点;其中,所述算力服务网关用于接收注册算力节点的注册请求,并将所述注册算力节点添加到所述算力服务网关管控的资源中;所述算力服务网关用于向算网大脑发送所述注册算力节点的相关信息,以便于所述算网大脑存储所述相关信息,其中,所述相关信息包括:所述注册算力节点的编号、算力服务类型、算力参数和资源利用信息。

本申请的一些实施例通过将算力网络中的算力资源划分为多个算力可用区,对不同的算力服务请求可以选择最优的算力可用区中的区域服务节点进行服务,以此提升算力的高效感知和请求处理效率。算力服务网关通过接收新的算力节点的注册请求并同步给算网大脑,可以为后续算力服务请求提供有效的业务服务。

在一些实施例,所述各个算力可用区与所述算网大脑连接,所述算网大脑与算力运营平台连接,其中,所述算网运营平台和所述算网大脑通过统一调用接口调用所述算力服务网关;所述算力服务网关用于获取所述区域算力节点的算力服务情况,或者,所述算力服务网关用于通过云管平台获取所述区域算力节点的算力服务情况。

本申请的一些实施例通过统一调用接口实现标准能力的开放和统一管理;通过算力服务网关可以实现对区域算力节点的有效管理,或者,通过云管平台可以实现对不同算力资源的统一管理,提供了统一的异构算力度量与标准体系,为上层应用匹配更合适高效的算力类型提供更多的算力资源作为业务的候选。

第三方面,本申请的一些实施例提供了一种基于算力服务网关的算力网络中算力编排调度方法,包括:应用于目标算力服务网关,所述目标算力服务网关为多个算力服务网关中的一个,所述多个算力服务网关均与算力网络中的算网大脑连接,所述方法包括:接收所述算网大脑发送的与用户的算力服务请求相关的一级编排调度包和算法策略,其中,所述一级编排调度包是由所述算网大脑基于所述算力服务请求生成的,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略;利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包。

第四方面,本申请的一些实施例提供了一种基于算力服务网关的算力网络中算力编排调度装置,应用于目标算力服务网关,所述目标算力服务网关为多个算力服务网关中的一个,所述多个算力服务网关均与算网大脑连接,包括:获取模块,用于接收所述算网大脑发送的与用户的算力服务请求相关的一级编排调度包和算法策略,其中,所述一级编排调度包是由所述算网大脑基于所述算力服务请求生成的,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略;生成模块,用于利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包,其中,所述二级编排调度包用于配置所述目标算力服务节点,所述二级编排调度包包括:多种配置信息。

第五方面,本申请的一些实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如第一方面或第二方面任一实施例所述的方法。

第六方面,本申请的一些实施例提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述程序时可实现如第一方面或第三方面任一实施例所述的方法。

第七方面,本申请的一些实施例提供一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如第一方面或第三方面任一实施例所述的方法。

附图说明

为了更清楚地说明本申请的一些实施例的技术方案,下面将对本申请的一些实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请的一些实施例提供的算力网络系统图;

图2为本申请的一些实施例提供的基于算力服务网关的算力网络中算力编排调度的方法流程图之一;

图3为本申请的一些实施例提供的基于算力服务网关的算力网络中算力编排调度的方法流程图之二;

图4为本申请的一些实施例提供的基于算力服务网关的算力网络中算力编排调度的装置组成框图;

图5为本申请的一些实施例提供的一种电子设备示意图。

具体实施方式

下面将结合本申请的一些实施例中的附图,对本申请的一些实施例中的技术方案进行描述。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

相关技术中,算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)等深度融合,提供一体化服务的新型信息基础设施。算力网络的目标是实现“算力泛在、算网共生、智能编排、一体服务”,逐步推动算力成为与水电一样,可“一点接入、即取即用”的社会级服务,达成“网络无所不达、算力无所不在、智能无所不及”的愿景。当前整个算力网络中的算力可以由不同的硬件架构组织。总得来说包括 CPU(CentralProcessing Unit,中央处理器)、GPU(graphics processing unit,图像处理器)、FPGA(Field Programmable Gate Array,可编程阵列逻辑)和AISC(Application SpecificIntegrated Circuit)芯片等四类。CPU主要包括X86和ARM,虽然ARM设计之初作为面向低功耗等场景推出的定制化的ASIC芯片,但是随着ARM在服务器和嵌入式终端的广泛应用,目前也是作为通用芯片来应用和部署。GPU主要是矢量的图形化数据能够实现快速处理的专有架构;FPGA作为可编程逻辑门电路在硬件加速等方面具有优势。而面向特定场景的处理需求需要定制专用芯片来进行处理,比如当前针对深度学习设计的各种TPU、NPU应该属于领域的定制的ASIC。

算网大脑作为算力网络的编排管理核心,通过人工智能技术实现算网智能感知、智能编排调度和算网自智,促进算网一体和算网共生发展。算网的智能感知需要对各种异构算力进行统一标识和算力度量建模。并且需要对各种异构算力进行实时高效的信息数据采集和算力状态感知。

传统的对算力状态感知的方法中,算力网关提供了将算力信息转换为网络服务向外开放的手段。而对于算力使用方而言,算力网关提供了将网络中的算力进行汇总并进行动态调度的可能。算力网关间的通道以overlay的形式架设在底层承载网络上,允许通过SRv6-bsid(Segment Routing IPv6,路由转发)等服务化网络能力对算力和网络同时进行保障。但是,由于算力网络中的算力复杂度较高,SRv6 SID可编程空间不可无限扩展,自定义算力度量机制不能无限由此传播,因此无法实现所有的算力数据的有效转发。而且IP路由可在边界进行汇聚,根据地址前缀长度进行路由通告,然而多维算力路由无法应用此机制。算力资源是有状态的,如果使用算力路由通告资源,则路由会随使用状态不断变化,影响网络稳定性。

在另一种现有技术的方案中算力服务网关和算力管控平台的各种算力状态信息数据都需要通过网络向算力网络大脑(简称为:算网大脑)汇聚传输,算网大脑需要承受巨大的网络带宽消耗。由单一的算网大脑节点处理所有算力节点的状态通告信息,其需要承担巨大的计算和处理能力消耗。

由上述相关技术可知,现有技术中算网大脑计算量较大,影响算力感知的效率。

鉴于此,本申请的一些实施例提供了一种基于算力服务网关的算力网络中算力编排调度方法,该方法应用于管控有多个算力节点的目标算力服务网关,目标算力服务网关为多个算力服务网关中的一个,多个算力服务网关均与算网大脑连接,该方法通过算网大脑对算力服务请求进行初步计算,得到一级编排调度包。然后将一级编排调度包和预先设置的算法策略下发至目标算力服务网关。目标算力服务网关接收到一级编排调度包和算法策略后,可以基于此生成二级编排调度包,通过二级编排调度包中的信息可以对目标算力服务节点进行配置,使得目标算力服务节点满足对算力服务请求服务的条件。本申请的一些实施例通过算力服务网关管理算力节点,实现了算力网络中的算力资源的编排调度,目标算力服务网关可以分担算网大脑对目标算力服务节点处理的压力,提升了算力感知的效率和算力服务质量。

下面结合附图1示例性阐述本申请的一些实施例提供的算力网络的整体组成结构。

在本申请的一些实施例中,算力网络包括基于算力资源的属性对算力网络资源划分得到的多个算力可用区,其中,所述多个算力可用区中各个算力可用区包括:算力服务网关和由所述算力服务网关管控的区域算力节点。

如图1所示,本申请的一些实施例提供了一种算力网络,该算力网络包括:算网运营平台100、算网大脑110、第一可用区AZ1、第二可用区AZ2、第三可用区AZ3和第四可用区AZ4。AZ1包括:第一算力服务网关111、第一云管平台、资源池c1和c2。AZ2包括:第二算力服务网关112、第二云管平台、资源池c3和c4。AZ3包括:第三算力服务网关113、第三云管平台、资源池c5和c6。AZ4包括:第四算力服务网关114、第四云管平台、资源池c7和c8。

在本申请的一些实施例中,图1中的算力服务网关通过全光网络底座联通算力运营平台100和算网大脑110。资源池中设置有不同类型的算力节点,以满足算力用户的各种服务需求。

在本申请的一些实施例中,所述多个算力服务网关中各个算力服务网关管控多个算力节点,所述各个算力服务网关属于各个算力可用区,所述各个算力可用区是基于算力网络中算力资源的属性划分的,其中,所述属性包括:地域属性、算力资源负荷属性、算力响应时间属性和算力资源利用率属性中的至少一种。

例如,在本申请的一些实施例中,按算力资源和网络资源的空间和时间综合关联度(作为属性的一个具体示例),将算力网络划分为若干个AZ,即可用区,如图1中的AZ1、AZ2、AZ3、AZ4等。例如,空间指的是可以为按算力所属的地域属性进行划分,如华北区、华东区和华南区等。时间指的是算力服务的网络时延时间大小、算力节点响应时间等。算力资源负荷属性具体指的是算力资源科承受的算力服务的负荷量。算力资源利用率属性指的是算力资源的实际能够提供服务的能力。具体的,可以根据实际情况选择划分方式对算力网络进行可用区的划分,本申请实施例在此不作具体限定。

在本申请的一些实施例中,所述各个算力可用区与所述算网大脑连接,所述算网大脑与算力运营平台连接,其中,所述算网运营平台和所述算网大脑通过统一调用接口调用所述算力服务网关;所述算力服务网关用于获取所述区域算力节点的算力服务情况,或者,所述算力服务网关用于通过云管平台获取所述区域算力节点的算力服务情况。

具体的,每个可用区区域内的各种异构算力资源统一向本区域(也就是所属的可用区)的算力服务网关注册并接受本区域算力服务网关的纳管、算力编排和调度,此时可以不设置云管平台。在本申请的另一些实施例中,本区域算力服务网关也可用通过本区域内的云管平台对区域内的算力资源进行纳管、感知、编排和调度,也就是图1中所示的每个可用区均设置有云管平台与算力服务网关通信。

在本申请的一些实施例中,算力用户可以通过算网运营平台100订购(各种类型的)算力服务,并提出相关算网业务质量和性能要求。算网运营平台100基于算力用户订购的算力服务订单向算网大脑110发送算力服务请求。例如,算力用户可以指定其需要的算力业务类型是什么、算力规模需要多大、需要多久完成算力服务请求等。

在本申请的一些实施例中,算网大脑110用于选取与算力服务策略对应的目标算力服务节点,并基于网络带宽占用状态进行路径规划,得到算力服务路径;算网大脑110用于将携带有所述一级编排调度包的算力服务调度请求和所述算法策略发送至目标算力服务网关。

例如,在本申请的一些实施例中,算网大脑110可以基于算力服务请求的时间、地点以及用户制定的算力服务策略,为用户选择距离近且符合条件的最优算力服务节点(也就是目标算力服务节点)。例如,用户属于华东区,此时可以从华东区的可用区中的算力资源中选择最优算力服务节点,并获取管理华东区的目标算力服务网关。然后基于用户到最优算力服务节点之间的网络路径,分析当前网络带宽占用状态,选择一条不拥堵、带宽较宽以及经过路由器的数量较少的网络路径作为最优网络路径(作为算力服务路径的一个具体示例)。通过该最优网络路径将算力服务请求分配至最优算力服务节点,可以提升对算力服务请求的响应效率,进而提升对业务的处理效率。

在本申请的一些实施例中,算网大脑110用于根据算力服务请求的内容为算力用户进行选择为其服务的目标算力服务网关,生成一级编排调度包,并将一级编排调度包和相关的算法策略下发给目标算力服务网关。其中,目标算力服务网关为图1中4个算力服务网关中的任一个。

在本申请的一些实施例中,目标算力服务网关可以基于一级编排调度包和相关的算法策略为算力用户选择出合适的目标算力服务节点,以完成算力服务请求。最后目标算力服务网关可以将算力服务结果反馈给算网运营平台100。其中,目标算力服务节点可以表征的是算力服务节点唯一标识、算力服务节点ID或者是指向具体的某一算力服务节点。

应理解,算力服务网关的数量是基于算力网络含有的算力节点的数量和情况进行设定的,图1只是针对本申请的一些实施例进行的简要示例。在实际应用中,可用区的数量可以不止上述四个,算力服务网关的数量也可以不止上述四个。本申请实施例在此不作具体限定。

在本申请的一些实施例中,图1中的算力网络可以执行基于算力服务网关的算力网络中算力编排调度方法,该方法包括:所述算网运营平台接收用户的算力服务订单,并向算网大脑发送与所述算力服务订单对应的算力服务请求;所述算网大脑基于所述算力服务请求,生成一级编排调度包,其中,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略;所述目标算力服务网关接收所述算网大脑发送的所述一级编排调度包和算法策略,并利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包。其中,二级编排调度包用于配置所述目标算力服务节点,所述二级编排调度包包括:多种配置信息。

下面结合附图2示例性阐述本申请的一些实施例提供的由目标算力服务网关执行的基于算力服务网关的算力网络中算力编排调度的实现过程。

需要说明的是,目标算力服务网关是由算力大脑110基于算力用户的算力服务请求,结合各可用区的算力资源的算力类型、算力响应时间、传输带宽、网络传输时延和算力资源利用情况选择出目标算力服务节点后确定的。

请参见附图2,图2为本申请的一些实施例提供的一种基于算力服务网关的算力网络中算力编排调度的方法流程图,该基于算力服务网关的算力网络中算力编排调度的方法包括:

S210,接收所述算网大脑发送的与用户的算力服务请求相关的一级编排调度包和算法策略,其中,所述一级编排调度包是由所述算网大脑基于所述算力服务请求生成的,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略。

例如,在本申请的一些实施例中,算力服务策略可以是由用户制定的算力服务请求相关的用户要求(例如,在对算力服务请求服务的过程中以性能优先、以服务质量优先或以服务时间优先等要求)。算网大脑110根据算力服务请求的地点、时间和算力服务策略可以选择最优目标算力服务节点、确定最优目标算力服务节点所述的目标算力服务网关、制定最优网络路径(作为算力服务路径的一个具体示例),并且进行算力服务编排(包括算网资源编排和算网业务编排),生成一级编排调度包。也就是说,算网大脑110根据算力服务请求在算力网络全域(即在所有可用区的算力资源中)分配最优算力资源节点(也就是最优目标算力服务节点)。且将该算力服务请求给到最优算力资源节点时制定最优网络路径,以使得请求可以快速到达节点,降低响应时间。并且,算力大脑110中还预先设定有针对不同的算力服务类型,制定的算法策略。如,针对不同的算力业务,采用什么样的算力环境、算力规模、算力流量大小等。例如,算网大脑通过云原生基础设施(如分布式内存数据库)向目标算力服务网关提供与算法策略相关的算法模型、策略模型、流程模型、编排模型,以及各种模型相关参数集,或下发编排调度指令,连同一级编排调度包下发至含有目标算力服务节点的目标算力服务网关。具体的,算法模型可以确认对当前算力服务请求提供的具体的算法类型。策略模型可以确认对当前算力服务请求实行什么样的算法策略可以满足用户的性能或时间要求,以为用户提供优质的算力服务。流程模型可以确认对当前算力服务请求服务的具体过程。编排模型可以确认对当前算力服务请求提供的算法、策略和流程之间是如何进行组合配置的,以完成该算力请求服务的。各种模型相关参数集可以为最优算力资源节点提供一些配置参数,如,数据库参数、中间件参数等。具体的,可以根据实际情况利用上述全部或部分模型对最优算力资源节点进行服务,以保质保量的完成用户的算力服务请求。

在本申请的一些实施例中,所述算力服务策略包括:所述算力服务请求对应的算力业务类型,算力业务模型、算力服务规模、算力服务质量等级要求、算力相关参数。

例如,在本申请的一些实施例中,一级编排调度包中的算力服务策略可以具体包括:算力用户的算力服务请求相关的算力需求。如,算力服务请求为训练模型,此时算力业务模型可以为训练模型业务,算力业务模型为涉及到的与训练相关的模型,算力服务规模可以为需要多大规模的数据量进行训练,进而决定算力服务规模,算力服务质量可以为在训练的过程中与训练效率相关的参量(例如,在设定时间内完成对模型的多少次迭代)。算力相关参数可以指训练模型过程中的功耗参数、频率参数等。

S220,利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包。

例如,在本申请的一些实施例中,目标算力服务网关可以根据算法策略对一级编排调度包进行优化得到可以落地实施的含有与目标算力服务节点相关配置的二级编排调度包,以使得目标算力服务节点可以针对性的对算力服务请求进行服务。基于此,目标算力服务网关可以利用算法策略针对性的对目标算力服务节点的算网资源进行配置、优化以及进行业务编排调度生成二级编排调度包,并将算力服务请求下发至目标算力服务节点以完成配置,进而可以实现对算力服务请求的有效服务。其中,二级编排调度包用于配置目标算力服务节点,二级编排调度包包括:多种配置信息。

在本申请的一些实施例中,S220可以包括:所述目标算力服务网关利用所述算法策略对所述目标算力服务节点进行算网资源编排调度,得到与所述算力服务策略相匹配的所述二级编排调度包中的多种配置信息,其中,所述多种配置信息包括:算力参量、核数、内存参量、数据库信息、算法信息和中间件信息。

例如,在本申请的一些实施例中,目标算力服务网关可以通过算法策略对一级编排调度包进行优化,编排调度,得到二级编排调度包,以使得目标算力服务节点可以满足为算力服务请求提供服务的环境条件。如,为算力请求服务提供服务环境、CPU核数(作为核数的一个具体示例)、需要调用的数据库信息(如数据库名称、数据库大小等)、中间件信息(如中间件类型、中间件数量等)、算力值(作为算力参量的一个具体示例),算力服务计费数据接口等。在本申请的另一些实施例中,目标算力服务网关还可以通过云管平台或者目标算力服务网关本身配置或读取其管控下的算力节点的基本信息(如,算力值、内存、核数等),以便于目标算力服务网关进行编排调度。

在本申请的一些实施例中,所述二级编排调度包还可以包括:算力业务ID集、算力业务模型集、算力服务质量等级编码、算力服务运行镜像、算力服务环境参数,以及所述目标算力服务节点的算力值、内存值、存储量、网络性能参数、算力业务服务流程、算力服务结果返回接口和算力服务计费数据返回接口。

具体的,二级编排调度包的内容可以基于实际情况进行更新,本申请实施例并不局限于此。

在本申请的一些实施例中,在执行S220之后,基于算力服务网关的算力网络中算力编排调度的方法还包括:获取所述目标算力服务节点完成所述算力服务请求的算力服务结果;向算网运营平台发送所述算力服务结果。

例如,在本申请的一些实施例中,目标算力服务网关可以管控目标算力服务节点完成算力服务请求对应的算力服务,并获取算力服务结果。算力服务结果中还可以包括算力计费情况,如算力资源使用量、使用时间。通过向算网运营平台100发送算力服务结果,可以便于算力用户查看和了解算力服务状态、进度和结果情况。

在本申请的一些实施例中,基于算力服务网关的算力网络中算力编排调度的方法还包括:接收注册算力节点的注册请求,并将所述注册算力节点添加到所述目标算力服务网关管控的算力资源中;向所述算网大脑发送所述注册算力节点的相关信息,其中,所述相关信息包括:所述注册算力节点的编号、算力服务类型、算力参数和资源利用信息。

例如,在本申请的一些实施例中,目标算力服务网关可以接收新的算力节点(作为注册算力节点的一个具体示例)的注册请求。目标算力服务网关接收新的算力节点的注册请求后,可以为新的算力节点分配唯一的算力标识(作为编号的一个具体示例)并添加到资源池中。同时,目标算力服务网关还可以向算网大脑110同步新的算力节点,以使得在后续分配算力服务请求时纳入编排调度范围内。另外,目标算力服务网关还可以对其管控的资源池中的算力节点的算力情况进行更新。同时,通过基于云原生分布式内存共享机制(如云原生分布式内存数据库)进行算力网络全域的算力统一标识数据库的同步更新,以实现算力节点的资源情况的同步通告,提升算力服务质量。

具体的,资源节点侧的异构算力统一标识数据库集群节点可以进行算力节点时变算力度量信息更新。时变算力度量信息包括:算力节点的故障、告警、失效等时变信息。通过对算力资源节点的全栈数据的实时监测和分析,实时更新算力资源节点的时变属性数据。时变数据更新触发门限用于对算力节点的算力状态进行监测,例如,当算力节点故障时,可以在时变算力度量信息中将算力节点的时变属性数据由“正常”修改为“故障”。

在目标算力服务网关侧的异构算力统一标识数据库集群节点可以进行算力节点一级汇聚算力度量信息更新。一级汇聚算力度量信息包括包含算力节点对应的算力资源标识的一级汇聚属性数据。一级汇聚属性数据可以包括:算力节点的资源可用状态、资源利用率等中间汇聚属性数据信息。其中,资源可用状态和资源利用率是基于资源变化率的情况进行更新的。例如,当资源占用变化率在本次预设时间周期采集的资源可用状态的属性值与上一个预设时间周期记录的资源可用状态的属性值的变化量超过5%(可以是±5%)时,可以更新资源可用状态和资源利用率对应的属性值。

在算网大脑侧的异构算力统一标识数据库集群节点可以进行算力节点二级汇聚算力度量信息更新。二级汇聚算力度量信息可以包括算力节点的资源空闲情况和资源利用率。例如,当算力节点的占用率在两个时间节点超过预设阈值时,可以更新二级汇聚算力度量信息中的算力节点的资源空闲情况和资源利用率。

由于算力服务网关针对不同算力资源的管理系统所提供的API(ApplicationProgramming Interface,应用程序编程接口)能力接口差异性较大,因此可以对不同云管平台进行逐一适配与接入。其次,多样化的异构算力具有不同的技术指标与适用场景而目前缺乏统一的异构算力度量与标示体系,通过提取标准能力、建立标准数据模型(也就是算法策略)有助于为上层应用匹配更合适高效的算力类型并提供更多的算力资源作为业务的候选。最后,算力服务网关可以向算网大脑和运营层应用提供统一的调用接口,实现标准能力的开放和统一管理。

下面结合附图3示例性阐述本申请的一些实施例提供的基于算力服务网关的算力网络中算力编排调度的具体过程。

请参见附图3,图3为本申请的一些实施例提供的一种基于算力服务网关的算力网络中算力编排调度的方法流程图。

下面示例性阐述上述实现过程。

S310,算网运营平台100获取算力用户的算力服务,生成算力服务请求发送至算网大脑110。

S320,算网大脑110基于算力服务请求,对算力资源进行计算、编排调度生成一级编排调度包,并与算法策略一并发送至目标算力服务网关。

S330,目标算力服务网关管控目标算力服务节点,进行针对目标算力服务节点的算网资源和业务编排调度生成二级编排调度包。

S340,目标算力服务网关将二级编排调度包发送至目标算力服务节点。

S350,目标算力服务节点完成算力服务请求对应的算力服务后,目标算力服务网关将算力服务结果反馈给算网运营平台100。

需要说明的是,S310~S350的具体实现细节可以参照上文提供的方法实施例,为避免重复,此处适当省略详细描述。

请参考图4,图4示出了本申请的一些实施例提供的基于算力服务网关的算力网络中算力编排调度的装置的组成框图。应理解,该基于算力服务网关的算力网络中算力编排调度的装置与上述方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该基于算力服务网关的算力网络中算力编排调度的装置的具体功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。

图4的基于算力服务网关的算力网络中算力编排调度的装置包括至少一个能以软件或固件的形式存储于存储器中或固化在基于算力服务网关的算力网络中算力编排调度的装置中的软件功能模块,该基于算力服务网关的算力网络中算力编排调度的装置包括:获取模块410,用于接收算网大脑发送的与用户的算力服务请求相关的一级编排调度包和算法策略,其中,所述一级编排调度包是由所述算网大脑基于所述算力服务请求生成的,所述一级编排调度包包括:根据所述算力服务请求确定的目标算力服务节点、所述目标算力服务节点所属的目标算力服务网关、算力服务路径和算力服务策略;生成模块420,用于利用所述算法策略对所述一级编排调度包进行处理,生成二级编排调度包。

在本申请的一些实施例中,所述算力服务策略包括:所述算力服务请求对应的算力业务类型,算力业务模型、算力服务规模、算力服务质量等级要求、算力相关参数。

在本申请的一些实施例中,生成模块420,用于基于所述算法策略从所述目标算力服务网关中的算力节点中选择符合所述算力服务策略的所述目标算力服务节点;对所述目标算力服务节点进行业务编排调度,生成所述二级编排调度包。

在本申请的一些实施例中,所述二级编排调度包包括:算力业务ID集、算力业务模型集、算力服务质量等级编码、算力服务运行镜像、算力服务环境参数,以及所述目标算力服务节点的算力值、内存值、存储量、网络性能参数、算力业务服务流程、算力服务结果返回接口和算力服务计费数据返回接口。

在本申请的一些实施例中,在生成模块420之后,基于算力服务网关的算力网络中算力编排调度的装置还包括:反馈模块(图中未示出)用于获取所述目标算力服务节点完成所述算力服务请求的算力服务结果;向算网运营平台发送所述算力服务结果。

在本申请的一些实施例中,基于算力服务网关的算力网络中算力编排调度的装置还包括:注册模块(图中未示出)用于:接收注册算力节点的注册请求,并将所述注册算力节点添加到所述目标算力服务网关管控的算力资源中;向所述算网大脑发送所述注册算力节点的相关信息,其中,所述相关信息包括:所述注册算力节点的编号、算力服务类型、算力参数和资源利用信息。

在本申请的一些实施例中,所述多个算力服务网关中各个算力服务网关管控多个算力节点,所述各个算力服务网关属于各个算力可用区,所述各个算力可用区是基于算力网络中算力资源的属性划分的,其中,所述属性包括:地域属性、算力资源负荷属性、算力响应时间属性和算力资源利用率属性中的至少一种。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法中的对应过程,在此不再过多赘述。

本申请的一些实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。

本申请的一些实施例还提供了一种计算机程序产品,所述的计算机程序产品包括计算机程序,其中,所述的计算机程序被处理器执行时可实现如上述实施例提供的上述方法中的任意实施例所对应方法的操作。

如图5所示,本申请的一些实施例提供一种电子设备500,该电子设备500包括:存储器510、处理器520以及存储在存储器510上并可在处理器520上运行的计算机程序,其中,处理器520通过总线530从存储器510读取程序并执行所述程序时可实现如上述任意实施例的方法。

处理器520可以处理数字信号,可以包括各种计算结构。例如复杂指令集计算机结构、结构精简指令集计算机结构或者一种实行多种指令集组合的结构。在一些示例中,处理器520可以是微处理器。

存储器510可以用于存储由处理器520执行的指令或指令执行过程中相关的数据。这些指令和/或数据可以包括代码,用于实现本申请实施例描述的一个或多个模块的一些功能或者全部功能。本公开实施例的处理器520可以用于执行存储器510中的指令以实现上述所示的方法。存储器510包括动态随机存取存储器、静态随机存取存储器、闪存、光存储器或其它本领域技术人员所熟知的存储器。

以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

相关技术
  • 一种基于信息中心网络的算力网络任务调度方法及装置
  • 基于软件定义算力网络的调度方法、装置、设备及介质
技术分类

06120116231103