掌桥专利:专业的专利平台
掌桥专利
首页

一种分布式算力资源调配方法、设备及介质

文献发布时间:2023-06-19 19:04:00


一种分布式算力资源调配方法、设备及介质

技术领域

本申请涉及算力资源管理技术领域,尤其涉及一种分布式算力资源调配方法、设备及介质。

背景技术

随着数字化时代的发展,企业客户的数字化转型将逐渐推进,算力的提升势在必行。如何能够承载计算压力,并有效地利用算力资源已经成为数字化转型行业的刚需。

传统的算力运用,通常通过两种方式进行。一是自建本地工作站或者大数据节点,但这种方式容易导致计算效率低以及算力资源闲置浪费等问题。二是通过单一的架构配置算力管理方式,订购单一架构的算力服务。面对算力需求不同的服务等级协议要求时,如果已订购的服务等级协议等级较低,算力资源将不能使用或者是降低计算效率。所以,面对多样化的算力服务需求时,通常订购算力服务等级较高的算力资源,从而导致采购成本的增加以及算力资源的浪费。

发明内容

本申请实施例提供了一种一种分布式算力资源调配方法、设备及介质,用于解决如下技术问题:面对多样化的算力服务需求时,通常订购算力服务等级较高的算力资源,从而导致采购成本的增加以及算力资源的浪费。

本申请实施例采用下述技术方案:

本申请实施例提供一种分布式算力资源调配方法。包括,获取多个分布式算力节点分别上传的算力基础信息,基于算力基础信息对多个分布式算力进行分类处理,以得到多个算力集合;基于算力集合的类型,选择相应的预置测试任务清单,通过预置测试任务清单对算力集合进行循环算力测试,以得到算力集合对应的多个参考算力值;对多个参考算力值进行取中值处理,以确定出算力集合对应的算力认证信息;其中,算力认证信息包括算力集合对应的总算力值,以及算力集合中多个分布式算力节点分别对应的独立算力值;获取用户需求信息,并基于预置任务级别表将用户需求信息转换为算力资源需求;根据算力认证信息与算力资源需求,确定出算力资源需求对应的服务费用,以基于服务费用对多个分布式算力节点进行调配,以完成用户需求。

本申请实施例通过对分布式算力节点进行分类,以及对每个集合中的分布式算力节点进行循环算力测试,能够确定出每个类型的算力集合分别对应的算力值,从而能够根据用户的所需算力进行算力分配。充分利用闲置算力资源,实现算力供需双方的资源共享,算力提供方不再是专有的某个数据中心或集群。其次,本申请实施例通过确定出算力资源需求所对应的服务费用,能够基于最低费用对算力节点进行调配,降低了传统的自建超算及购买单一的商业算力的投入成本。

在本申请的一种实现方式中,通过预置测试任务清单对算力集合进行循环算力测试,以得到算力集合对应的多个参考算力值,具体包括:通过预置测试任务清单中的第一测试任务,依次对当前算力集合中的多个分布式算力节点进行算力测试,得到每个分布式算力节点分别对应的第一参考独立算力值;将多个第一参考算力值进行求和计算,得到算力集合对应的第一总参考算力值;以及通过预置测试任务清单中的第二测试任务,依次对当前算力集合中的多个分布式算力节点进行算力测试,得到每个分布式算力节点分别对应的第二参考独立算力值;将多个第二参考算力值进行求和计算,得到算力集合对应的第二总参考算力值;重复上述测试过程,直到进行算力测试的次数达到预设次数阈值,以得到每个分布式节点分别对应的多个参考独立算力值,以及得到算力集合对应的多个总参考算力值。

在本申请的一种实现方式中,对多个参考算力值进行取中值处理,以确定出算力集合对应的算力认证信息,具体包括:将每个分布式节点分别对应的多个参考独立值进行两两取中值处理,以得到每个分布式节点分别对应的独立算力值;以及将算力集合对应的多个总参考算力值进行两两取中值处理,以得到算力集合对应的总算力值;基于独立算力值与总算力值,确定出算力集合对应的算力认证信息。

在本申请的一种实现方式中,确定出算力集合对应的算力认证信息之后,方法还包括:确定出当前算力集合中的多个分布式算力节点,分别对应的参考算力值反馈时长信息;以及确定出当前算力集合对应的可用资源信息;基于参考算力值反馈时长与反馈结果,确定出当前算力集合中的多个分布式算力节点分别对应的算力资源属性;将算力认证信息、算力资源属性以及可用资源信息进行发布,以通过发布的信息对用户需求进行算力匹配。

在本申请的一种实现方式中,基于算力认证信息与算力资源需求,确定出算力资源需求对应的服务费用,以基于服务费用对多个分布式算力节点进行调配,以完成用户需求,具体包括:基于算力资源需求,确定出所需算力类型,以根据所需算力类型确定出所需算力集合;将所需算力集合中的多个分布式算力节点进行组合,得到多个算力组合;其中,多个算力组合分别对应的算力值均处于预设算力值区间,且预设算力值区间与算力资源需求相关;基于多个算力组合分别对应的算力资源属性,确定出多个算力组合分别对应的服务费用,并将最低服务费用对应的算力组合进行调配以完成用户需求。

在本申请的一种实现方式中,基于多个算力组合分别对应的算力资源属性,确定出多个算力组合分别对应的服务费用,具体包括:基于算力资源属性,获取每个算力组合中的多个分布式算力节点分别对应的影响SLA级别的第一资源,以及获取每个算力组合中的多个算力节点分别对应的影响SLA级别的第二资源;基于用户需求信息所对应的SLA服务等级,确定出第一资源对应的第一服务等级系数,以及确定出第二资源对应的第二服务等级系数;基于第一服务等级系数、预置第一资源单价系数、第二等级系数以及预置第二资源单价系数,确定出多个算力组合分别对应的服务费用。

在本申请的一种实现方式中,基于第一服务等级系数、预置第一资源单价系数、第二等级系数以及预置第二资源单价系数,确定出多个算力组合分别对应的服务费用,具体包括:基于函数

P

F

确定出多个算力组合分别对应的服务费用;其中,D为算力组合对应的服务费用;P为预置第一资源单价系数;A为预置第一资源单价;i为当前第一资源的序号;n为算力组合中第一资源的总数量;F为预置其他它资源单价系数;B为预置第二资源单价;w为当前第二资源的序号;k为算力组合中第二资源的总数量;T

在本申请的一种实现方式中,获取用户需求信息,并基于预置任务级别表将用户需求信息转换为算力资源需求,具体包括:获取用户需求信息;其中,用户需求信息至少包括任务类型、任务时长、任务内容以及任务优先级中的一项;基于任务类型确定出相应的算力集合;将任务内容与预置任务级别表进行比对,确定出单位时长内任务内容对应的所需算力;基于单位时长内任务内容对应的所需算力以及任务时长,确定出用户需求对应的算力资源需求,以根据算力资源需求与任务优先级进行资源调度。

本申请实施例提供一种分布式算力资源调配设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:获取多个分布式算力节点分别上传的算力基础信息,基于算力基础信息对多个分布式算力进行分类处理,以得到多个算力集合;基于算力集合的类型,选择相应的预置测试任务清单,通过预置测试任务清单对算力集合进行循环算力测试,以得到算力集合对应的多个参考算力值;对多个参考算力值进行取中值处理,以确定出算力集合对应的算力认证信息;其中,算力认证信息包括算力集合对应的总算力值,以及算力集合中多个分布式算力节点分别对应的独立算力值;获取用户需求信息,并基于预置任务级别表将用户需求信息转换为算力资源需求;根据算力认证信息与算力资源需求,确定出算力资源需求对应的服务费用,以基于服务费用对多个分布式算力节点进行调配,以完成用户需求。

本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:获取多个分布式算力节点分别上传的算力基础信息,基于算力基础信息对多个分布式算力进行分类处理,以得到多个算力集合;基于算力集合的类型,选择相应的预置测试任务清单,通过预置测试任务清单对算力集合进行循环算力测试,以得到算力集合对应的多个参考算力值;对多个参考算力值进行取中值处理,以确定出算力集合对应的算力认证信息;其中,算力认证信息包括算力集合对应的总算力值,以及算力集合中多个分布式算力节点分别对应的独立算力值;获取用户需求信息,并基于预置任务级别表将用户需求信息转换为算力资源需求;根据算力认证信息与算力资源需求,确定出算力资源需求对应的服务费用,以基于服务费用对多个分布式算力节点进行调配,以完成用户需求。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本申请实施例通过对分布式算力节点进行分类,以及对每个集合中的分布式算力节点进行循环算力测试,能够确定出每个类型的算力集合分别对应的算力值,从而能够根据用户的所需算力进行算力分配。充分利用闲置算力资源,实现算力供需双方的资源共享,算力提供方不再是专有的某个数据中心或集群。其次,本申请实施例通过确定出算力资源需求所对应的服务费用,能够基于最低费用对算力节点进行调配,降低了传统的自建超算及购买单一的商业算力的投入成本。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本申请实施例提供的一种分布式算力资源调配方法流程图;

图2为本申请实施例提供的一种分布式算力资源管理方法示意图;

图3为本申请实施例提供的一种分布式算力资源调配实现流程示意图;

图4为本申请实施例提供的一种分布式算力资源调配设备的结构示意图。

具体实施方式

本申请实施例提供一种分布式算力资源调配方法、设备及介质。

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

随着数字化时代的发展,企业客户的数字化转型将逐渐推进,算力的提升势在必行。如何能够承载计算压力,并有效地利用算力资源已经成为数字化转型行业的刚需。

传统的算力运用,通常通过两种方式进行。一是自建本地工作站或者大数据节点,但这种方式容易导致计算效率低以及算力资源闲置浪费等问题。二是通过单一的架构配置算力管理方式,订购单一架构的算力服务。面对算力需求不同的服务等级协议要求时,如果已订购的服务等级协议等级较低,算力资源将不能使用或者是降低计算效率。所以,面对多样化的算力服务需求时,通常订购算力服务等级较高的算力资源,从而导致采购成本的增加以及算力资源的浪费。

为了解决上述问题,本申请实施例提供一种分布式算力资源调配方法、设备及介质。通过对分布式算力节点进行分类,以及对每个集合中的分布式算力节点进行循环算力测试,能够确定出每个类型的算力集合分别对应的算力值,从而能够根据用户的所需算力进行算力分配。充分利用闲置算力资源,实现算力供需双方的资源共享,算力提供方不再是专有的某个数据中心或集群。其次,本申请实施例通过确定出算力资源需求所对应的服务费用,能够基于最低费用对算力节点进行调配,降低了传统的自建超算及购买单一的商业算力的投入成本。

下面通过附图对本申请实施例提出的技术方案进行详细的说明。

图1为本申请实施例提供的一种分布式算力资源调配方法流程图。如图1所示,分布式算力资源调配方法包括如下步骤:

S101、分布式算力管理系统获取多个分布式算力节点分别上传的算力基础信息,基于算力基础信息对多个分布式算力节点进行分类处理,以得到多个算力集合。

在本申请的一个实施例中,各分布式的算力节点将算力资源的基础信息通过对应的北向接口统一发布,分布式算力管理系统通过对各分布式算力节点北向接口上报的算力基础信息进行汇聚,形成全局统一的算力资源可用分布视图。

需要说明的是,北向接口是通过部署算网适配器来适配第三方算力资源,屏蔽底层不同算力资源平台的异构性,完成对分布式算力资源的接入和纳管。

进一步地,通过算网纳管一体机实现对分布式异构算力接入和纳管,通过北向文件的采集与解析,主动识别异构算力类型,比如超算、智算、通用算力等,实现对不同算力类型的分类管理。

S102、基于算力集合的类型,选择相应的预置测试任务清单,通过预置测试任务清单对算力集合进行循环算力测试,以得到算力集合对应的多个参考算力值。

在本申请的一个实施例中,通过预置测试任务清单中的第一测试任务,依次对当前算力集合中的多个分布式算力节点进行算力测试,得到每个分布式算力节点分别对应的第一参考独立算力值。将多个第一参考算力值进行求和计算,得到算力集合对应的第一总参考算力值,以及通过预置测试任务清单中的第二测试任务,依次对当前算力集合中的多个分布式算力节点进行算力测试,得到每个分布式算力节点分别对应的第二参考独立算力值。将多个第二参考算力值进行求和计算,得到算力集合对应的第二总参考算力值。重复上述测试过程,直到进行算力测试的次数达到预设次数阈值,以得到每个分布式节点分别对应的多个参考独立算力值,以及得到算力集合对应的多个总参考算力值。

具体地,三方算力类型识别后,会对每个算力集合的算力进行测试,以确定出每个算力集合分别对应的算力。本申请实施例预设有不同的预置测试任务清单,不同的算力集合对应有不同的预置测试任务清单,且每个预置测试任务清单中包含有多个不同的测试任务。

进一步地,在对当前算力集合进行测试时,通过当前算力集合的类型,确定出相应的预置测试任务清单。通过该预置测试任务清单中的第一测试任务,循环对该算力集合中的每个分布式算力节点进行测试,从而可以得到每个分布式算力节点分别对应的第一参考独立算力值。其次,在通过该预置测试任务清单中的第二测试任务,循环对该算力集合中的所有分布式算力节点进行测试,得到每个分布式节点分别对应的第二参考独立算力值。不断重复上述测试过程,通过预置测试任务清单中的测试任务循环对当前算力集合中的每个分布式算力节点进行测试。直到达到预设测试次数,即停止测试任务。

进一步地,在通过第一测试任务对当前算力集合进行测试时,将该当前算力集合中每个分布式算力节点分别对应的第一参考独立算力值进行相加计算,可以得到该当前算力集合对应的第一总参考算力值。以及在通过第二测试任务对当前算力集合进行测试时,将该当前算力集合中每个分布式算力节点分别对应的第二参考独立算力值进行相加计算,可以得到该当前算力集合对应的第二总参考算力值。重复该过程,可以得到当前算力集合在进行每个测试任务时,分别对应的总参考算力值。

S103、对多个参考算力值进行取中值处理,以确定出算力集合对应的算力认证信息。其中,算力认证信息包括算力集合对应的总算力值,以及算力集合中多个分布式算力节点分别对应的独立算力值。

在本申请的一个实施例中,将每个分布式节点分别对应的多个参考独立值进行两两取中值处理,以得到每个分布式节点分别对应的独立算力值。以及将算力集合对应的多个总参考算力值进行两两取中值处理,以得到算力集合对应的总算力值。基于独立算力值与总算力值,确定出算力集合对应的算力认证信息。

具体地,得到每个分布式节点分别对应的多个参考独立值之后,对多个参考独立值进行取中值处理。例如,假设得到的四个参考独立值,两两取中值后,得到两个取中值后的数值,将该两个取中值后的数值再次进行取中值处理,即可得到当前分布式算力节点对应的独立算力值。同理,将当前算力集合对应的多个总参考算力值进行两两取中值处理,即可得到该算力集合对应的总算力值。将该算力集合对应的总算力值,以及该算力集合中每个分布式算力节点分别对应的独立算力值,作为该算力集合的算力认证信息。

在本申请的一个实施例中,确定出当前算力集合中的多个分布式算力节点,分别对应的参考算力值反馈时长信息,以及确定出当前算力集合对应的可用资源信息。基于参考算力值反馈时长与反馈结果,确定出当前算力集合中的多个分布式算力节点分别对应的算力资源属性。将算力认证信息、算力资源属性以及可用资源信息进行发布,以通过发布的信息对用户需求进行算力匹配。

具体地,基于测试任务的反馈时间、反馈结果,确定该三方算力资源的标签属性。三方算力资源接入并通过能力认证后,在分布式算力管理平台进行发布,发布内容包含:算力认证信息、算力资源属性以及可用资源等。

S104、获取用户需求信息,并基于预置任务级别表将用户需求信息转换为算力资源需求。

在本申请的一个实施例中,获取用户需求信息,其中,用户需求信息至少包括任务所属行业、任务时长、任务内容以及任务优先级中的一项。基于任务所属行业确定出相应的算力集合。其中,任务所属行业至少包括科学计算、工程计算、智能计算中的一项。将任务内容与预置任务级别表进行比对,确定出单位时长内任务内容对应的所需算力。基于单位时长内任务内容对应的所需算力以及任务时长,确定出用户需求对应的算力资源需求,以根据算力资源需求与任务优先级进行资源调度。

具体地,获取用户需求信息,在接到用户针对不同行业(例如:科学计算、工程计算、智能计算等)的算力需求时,按照计算需求转换为不同的SLA:Service-LevelAgreement服务等级(例如:算力性能、算力效率、数据量大小等),系统根据SLA服务等级进行算力资源的分配。将该用户需求信息中的任务内容与预置任务级别表进行比对,以确定出该任务内容对应的单位时长内对应的所需算力。在基于用户需要信息中的任务时长,得到该用户需求信息对应的算力资源需求。即,可以通过用户需求信息,确定出所需算力,根据所需算力以及所需要的算力效率等可以确定出相应的SLA服务等级。

S105、基于算力认证信息与算力资源需求,确定出算力资源需求对应的服务费用,以基于服务费用对多个分布式算力节点进行调配,以完成用户需求。

在本申请的一个实施例中,基于算力资源需求,确定出所需算力类型,以根据所需算力类型确定出所需算力集合。将所需算力集合中的多个分布式算力节点进行组合,得到多个算力组合;其中,多个算力组合分别对应的算力值均处于预设算力值区间,且预设算力值区间与算力资源需求相关。基于多个算力组合分别对应的算力资源属性,确定出多个算力组合分别对应的服务费用,并将最低服务费用对应的算力组合进行调配以完成用户需求。

具体地,根据用户的算力资源需求,确定出相应的算力类型,从而根据算力类型确定出相应的算力集合,以在该确定出的算力集合中确定出需要调配的分布式算力节点。进一步地,基于用户算力需求得到算力资源需求后,确定出的算力集合中存在多个分布式算力节点,每个分布式算力节点对应有不同的算力,将该算力集合中的一个或多个分布式算力节点进行组合,使其组合后得到算力值大于该算力资源需求,且不大于预设算力值。该预设算力值与该算力资源需求相关,例如,可以是该算力资源需求的110%。

进一步地,基于预设算力值区间,可以得到当前算力集合所对应的多个算力组合。对该多个算力组合进行费用计算,基于计算出的最低费用得到需要调配的分布式算力节点,以通过调配的分布式算力节点完成当前用户需求。

在本申请的一个实施例中,基于算力资源属性,获取每个算力组合中的多个分布式算力节点分别对应的影响SLA级别的第一资源,以及获取每个算力组合中的多个算力节点分别对应的影响SLA级别的第二资源。其中,第一资源为影响SLA级别的关键资源,第二资源为影响SLA级别的其它资源。基于用户需求信息所对应的SLA服务等级,确定出第一资源对应的第一服务等级系数,以及确定出第二资源对应的第二服务等级系数。基于第一服务等级系数、预置第一资源单价系数、第二等级系数以及预置第二资源单价系数,确定出多个算力组合分别对应的服务费用。

进一步地,在得到当前算力集合所对应的多个算力组合后,确定出每个算力组合中的多个分布式算力节点分别对应的影响SLA级别的第一资源,以及获取每个算力组合中的多个算力节点分别对应的影响SLA级别的第二资源。其中,影响SLA级别的第一资源可以为CPU资源,影响SLA级别的第二资源可以为内存、网络等资源。

进一步地,根据用户需求资源对应的SLA服务等级,确定当前算力组合所对应的SLA服务等级是否符合。在符合用户需求对应的SLA服务等级的情况下,基于预设服务等级系数表确定出当前算力组合中的第一资源所对应的第一服务等级系数,以及确定出当前算力组合中的第二资源所对应的第二服务等级系数。其中,该预设服务等级系数表中包括多个第一资源与多个第二资源,以及还包括该多个第一资源分别对应的第一服务等级系数,以及还包括该多个第二资源分别对应的第二服务等级系数。例如,当SLA服务等级为一级时,对应的服务等级系数为0,当SLA服务等级为二级时,对应的服务等级系数为0.2。本申请实施例可以针对不同的服务等级预设有不同的服务等级系数。从而通过该服务等级系数以及不同资源的单价系数,得到不同算力组合分别对应的服务费用。

具体地,基于函数

P

F

确定出多个算力组合分别对应的服务费用。其中,D为算力组合对应的服务费用;P为预置第一资源单价系数;A为预置第一资源单价;i为当前第一资源的序号;n为算力组合中第一资源的总数量;F为预置其他它资源单价系数;B为预置第二资源单价;w为当前第二资源的序号;k为算力组合中第二资源的总数量;T

在本申请的一个实施例中,将算力资源的相关调度信息提交到算力接入的南向接口,通过南向接口下发调用指令。在客户的计算任务完成之后,算力调度及时释放相关的三方算力资源,用于匹配其他客户的需求。

在本申请的一个实施例中,在对用户进行算力匹配调度的过程中,还包括对算力的周期性监控及实时监控。周期性监控,是指算力资源认证发布后,分布式算力管理系统通过算力接入的南向接口,选择测试文件,确定测试周期、北向文件存放路径等下发周期性的测试任务。通过北向接口采集验证三方算力资源的认证信息,当相关验证结果有所变更时,对算力资源对应的发布信息进行相应的刷新并重新发布。所述的实时监控,是指对参与算力调度的已占用算力资源,通过对应的算力接入的南向接口,根据所需监控的内容选择对应的测试文件,下发立即测试任务,通过北向接口采集监控算力占用资源的处理器占用率、内存占用率等运行数据。

进一步地,根据某大型工程机械公司装载机全工况仿真需求,需要通过模拟仿真、人工智能等创新应用技术手段对装备进行实验和测试,属于比较典型的任务式算力需求场景。企业自身仅有传统低计算性能的本地工作站仅能实现6核心单仿真作业,并且计算效率较低,如何能够承载计算压力并有效的利用算力资源已经成为该企业数字化转型的刚需。

根据本申请实施例中的方案,按照算力应用模式进行场景分类,分别在计算性能、计算效率以及投入成本方面验证对比如下:

运用本申请实施例中的内容,打通了商业算力与闲散算力节点,实现了128核单仿真作业的高性能,仿真效率比较本地工作站能力提升超15倍,使用闲散算力年投入成本仅为9.6万/年,相比自建超算成本降低超87%。

图2为本申请实施例提供的一种分布式算力资源管理方法示意图。如图2所示,三方算力资源包括超算、智算、闲散算力以及其它算力等。通过分布式算力管理系统将用户发布的需求,与三方算力资源进行匹配。从而充分利用闲置算力资源,实现算力供需双方的资源共享,算力提供方不再是专有的某个数据中心或集群。算力需求用户可以使用高性能算力资源,同时降低了传统的自建超算及购买单一的商业算力的投入成本。

图3为本申请实施例提供的一种分布式算力资源调配实现流程示意图。如图3所示,包括算力接入、算力认证与发布、算力SLA转化、算力调度、算力监测以及需求发布。其中算力接入包括各分布式的算力中心(节点)将算力资源的基础信息通过对应的北向接口统一发布,分布式算力管理系统通过对各分布式算力中心(节点)北向接口上报的算力基础信息进行汇聚,形成全局统一的算力资源可用分布视图。

算力类型识别,通过上述算网纳管一体机实现对分布式异构算力接入和纳管,通过北向文件的采集与解析,主动识别异构算力类型,比如超算、智算、通用算力等,实现对不同算力类型的分类管理。

计算能力认证,是三方算力类型识别后,基于确定的算力类型选择对应的测试任务清单;然后以取中间值的方法,通过层层的取中值最后将范围缩小逐渐确定该三方算力类型的整体能力标签;然后基于测试任务的反馈时间、反馈结果,确定该三方算力资源的标签属性。

算力资源的发布,是指三方算力资源接入并通过能力认证后,在分布式算力管理平台进行发布,发布内容包含:算力能力标签、算力资源属性、可用资源等。

SLA转化是指用户需求转换以及算力资源的映射。

所述算力资源的映射,是指将用户需求对应的算力服务SLA等级,映射为对算力资源的需求。

算力调度是指基于SLA转化的结果,找到满足客户计算需求的算力资源,并把算力资源的相关调度信息提交到算力接入的南向接口,通过南向接口下发调用指令。在客户的计算任务完成之后,算力调度及时释放相关的三方算力资源,用于匹配其他客户的需求。

算力监测包括周期性监控及实时监控。

所述的周期性监控,是指算力资源认证发布后,分布式算力管理系统通过算力接入的南向接口,选择测试文件,确定测试周期、北向文件存放路径等下发周期性的测试任务。通过北向接口采集验证三方算力资源的认证信息,当相关验证结果有所变更时,对算力资源对应的发布信息进行相应的刷新并重新发布。

所述的实时监控,是指对参与算力调度的已占用算力资源,通过对应的算力接入的南向接口,根据所需监控的内容选择对应的测试文件,下发立即测试任务,通过北向接口采集监控算力占用资源的处理器占用率、内存占用率等运行数据。

需求发布是指客户根据自身需求,提出算力服务需求,用户无需关注算力资源的位置与形态。

图4为本申请实施例提供的一种分布式算力资源调配设备的结构示意图。如图4所示,分布式算力资源调配设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

获取多个分布式算力节点分别上传的算力基础信息,基于所述算力基础信息对所述多个分布式算力进行分类处理,以得到多个算力集合;

基于算力集合的类型,选择相应的预置测试任务清单,通过所述预置测试任务清单对所述算力集合进行循环算力测试,以得到所述算力集合对应的多个参考算力值;

对所述多个参考算力值进行取中值处理,以确定出所述算力集合对应的算力认证信息;其中,所述算力认证信息包括所述算力集合对应的总算力值,以及所述算力集合中多个分布式算力节点分别对应的独立算力值;

获取用户需求信息,并基于预置任务级别表将所述用户需求信息转换为算力资源需求;

根据所述算力认证信息与所述算力资源需求,确定出所述算力资源需求对应的服务费用,以基于所述服务费用对所述多个分布式算力节点进行调配,以完成用户需求。

本申请实施例还提供一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:

获取多个分布式算力节点分别上传的算力基础信息,基于所述算力基础信息对所述多个分布式算力进行分类处理,以得到多个算力集合;

基于算力集合的类型,选择相应的预置测试任务清单,通过所述预置测试任务清单对所述算力集合进行循环算力测试,以得到所述算力集合对应的多个参考算力值;

对所述多个参考算力值进行取中值处理,以确定出所述算力集合对应的算力认证信息;其中,所述算力认证信息包括所述算力集合对应的总算力值,以及所述算力集合中多个分布式算力节点分别对应的独立算力值;

获取用户需求信息,并基于预置任务级别表将所述用户需求信息转换为算力资源需求;

根据所述算力认证信息与所述算力资源需求,确定出所述算力资源需求对应的服务费用,以基于所述服务费用对所述多个分布式算力节点进行调配,以完成用户需求。

本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请的实施例可以有各种更改和变化。凡在本申请实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

相关技术
  • 一种分布式系统部署方法、系统、电子设备及存储介质
  • 一种分布式数据连接处理方法、装置、设备及存储介质
  • 一种文件分布式部署方法、装置、电子设备及存储介质
  • 一种分布式显示方法、系统、设备及计算机可读存储介质
  • 分布式算力资源的编排方法、装置、设备及存储介质
  • 分布式算力资源的编排方法、装置、设备及存储介质
技术分类

06120115783940