掌桥专利:专业的专利平台
掌桥专利
首页

服务器算力的管理方法及相关设备

文献发布时间:2024-04-18 19:58:26


服务器算力的管理方法及相关设备

技术领域

本公开涉及计算机技术领域,尤其涉及一种服务器算力的管理方法、装置、计算机设备、可读存储介质及产品。

背景技术

目前,随着AI大模型的飞速发展,对网络提出了零丢包、低时延、高性能、大带宽的需求,无损以太网成为发展趋势。现有算力网络针对服务器算力如何发现,算力如何感知的问题没有形成统一的标准,算力服务器如何将算力资源上报给叶子节点的问题尚未解决。现有业界部分方案采用IP层进行算力上报,此种实现方式要求服务器必须支持IP协议,进行IP封装后才能进行算力上报,此种方式首先增加了报文的长度,浪费传输带宽,其次不能完全适用于无损以太网中,因此目前实现方式无法满足新业务的发展需求。

发明内容

本公开实施例提供了一种服务器算力的管理方法、装置、计算机设备、可读存储介质及产品,涉及计算机技术领域,管理方法可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

本公开实施例提供了一种服务器算力的管理方法,包括:通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报。

在一个实施例中,通过链路层接收第一服务器发送的第一算力数据帧包括:基于融合以太网的远端内存直接访问技术RDMA通过链路层接收第一服务器发送的第一算力数据帧。

在一个实施例中,所述第一算力数据帧还包括第一报文数据,所述第一报文数据包括所述第一服务器的算力属性;其中,所述算力属性包括算力描述、算力形式、算力种类、算力单位、算力大小和采集时间中的一种或多种。

在一个实施例中,方法还包括:向所述第一服务器发送第二算力数据帧;其中,所述第二算力数据帧的包括第二报文头,所述第二报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第二算力发现协议;其中,所述第二算力发现协议包括算力确认。

在一个实施例中,方法还包括:向所述第一服务器周期性地发送第三算力数据帧;其中,所述第三算力数据帧的包括第三报文头,所述第三报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第三算力发现协议;其中,所述第三算力发现协议包括算力查询。

在一个实施例中,方法还包括:接收所述第一服务器发送的第四算力数据帧;其中,所述第四算力数据帧的包括第四报文头,所述第四报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第四算力发现协议;其中,所述第四算力发现协议包括算力撤销。

本公开实施例提供了一种服务器算力的管理装置,包括:接收单元,用于通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报。

本公开实施例提供了计算机设备,包括处理器、存储器、输入输出接口;所述处理器分别与所述存储器和所述输入输出接口相连,其中,所述输入输出接口用于接收数据及输出数据,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行如上实施例中任一项所述的方法。

本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行如上实施例中任一项所述的方法。

本公开实施例提供了计算机产品,包括计算机程序,该计算机程序被处理器执行时实现如上实施例中任一项所述的方法。

本申请的服务器算力的管理方法通过通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报,从而可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了可以应用本公开实施方式的服务器算力的管理方法的示例性系统架构的示意图;

图2是本公开实施例提供的一种服务器算力的管理方法的流程图;

图3是本公开实施例提供的一种第一算力数据帧的结构数据图;

图4是本公开实施例提供的一种服务器算力的管理方法的流程图;

图5是本公开实施例提供的一种第二算力数据帧的结构数据图;

图6是本公开实施例提供的一种服务器算力的管理方法的流程图;

图7是本公开实施例提供的一种第三算力数据帧的结构数据图;

图8是本公开实施例提供的一种服务器算力的管理方法的流程图;

图9是本公开实施例提供的一种第四算力数据帧的结构数据图;

图10是本公开实施例提供的一种服务器算力的管理装置的结构数据图;

图11是本公开实施例提供的一种计算机设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

在本公开实施例中,可以基于以太网协议技术,通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报,从而可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

下面首先对本公开的一些术语进行说明:

RoCE,全称RDMA over Converged Ethernet,从字面来看,就是基于融合以太网的RDMA,所以在了解RoCE之前还得先认识下RDMA这项技术。RDMA(Remote Direct MemoryAccess),全称远端内存直接访问技术,可以在极少占用CPU的情况下,把数据从一台服务器传输到另一台服务器,或存储到服务器。

以太网,是一种计算机局域网技术。它规定了包括物理层的连线、电子信号和介质访问层协议的内容。以太网是应用最普遍的局域网技术。无损以太网(Lossless Ethernet)是一种专门用于数据中心网络的网络技术,旨在提供低延迟、高吞吐量和可靠性的传输服务。

MAC地址(Media Access Control Address),直译为媒体存取控制位址,也称为局域网地址(LAN Address),MAC位址,以太网地址(Ethernet Address)或物理地址(PhysicalAddress),它是一个用来确认网络设备位置的位址。在OSI模型中,第三层网络层负责IP地址,第二层数据链路层则负责MAC位址。MAC地址用于在网络中唯一标示一个网卡,一台设备若有一或多个网卡,则每个网卡都需要并会有一个唯一的MAC地址。MAC_DA是源媒体存取控制位址,MAC_SA是目的媒体存取控制位址。

本公开实施例提供的方案涉及RoCE、以太网和MAC地址等技术。

图1示出了可以应用本公开实施方式的服务器算力的管理方法的示例性系统架构100的示意图。

如图1所示,系统架构100可以包括算力网关101和服务器集群102。

应该理解,图1中的算力网关101和服务器集群102的数目仅仅是示意性的。根据实现需要,可以具有任意数目的算力网关和服务器集群。比如服务器集群102中的服务器数量可以是大于等于1的多个。其中,算力网关可以通过路由器或者交换机与其他算力网关或设备连接,进行数据的传递和交换等。

服务器集群102中的服务器可以是提供各种服务的服务器。例如,算力网关通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报,从而可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

其中,以上所提及的服务器可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、车路协同、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,还可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。

可选的,本公开实施例中所涉及的数据可以存储在云平台中,或者可以基于云存储技术、区块链技术对该数据进行存储,在此不做限制。

目前,RoCE有2个版本,版本1是纯以太的,纯二层协议,不支持网络层IP(InternetProtocol),版本2是可以支持三层IP协议。

图2是本公开实施例提供的一种服务器算力的管理方法的流程图。本公开实施例提供的方法可以应用在图1实施例中的算力网关中。

如图2所示,本公开实施例提供的方法可以包括如下步骤。

在步骤S210中,通过链路层接收第一服务器发送的第一算力数据帧;

其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;

其中,所述第一算力发现协议包括算力上报。

在该步骤中,算力网关通过链路层接收第一服务器发送的第一算力数据帧;

其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报。

其中,第一服务器可以是服务器集群中的任一个服务器。

图2的方法中,算力网关通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报,从而可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

在一个实施例中,通过链路层接收第一服务器发送的第一算力数据帧包括:基于融合以太网的远端内存直接访问技术RDMA通过链路层接收第一服务器发送的第一算力数据帧。

图3是本公开实施例提供的一种第一算力数据帧300的结构数据图。

参考图3,第一算力数据帧300包括第一报文头301和第一报文数据302。

所述第一报文头301包括源媒体存取控制位址(MAC_DA)、目的媒体存取控制位址(MAC_SA)、链路层类型(Type:0x0707)和第一算力发现协议(Opcode:0X01);其中,所述第一算力发现协议包括算力上报。所述第一报文数据302包括所述第一服务器的算力属性;其中,所述算力属性包括算力描述、算力形式、算力种类、算力单位、算力大小和采集时间中的一种或多种。

图4是本公开实施例提供的一种服务器算力的管理方法的流程图。本公开实施例提供的方法可以应用在图1实施例中的算力网关。

如图4所示,本公开实施例提供的方法可以包括如下步骤。

在步骤S410中,向所述第一服务器发送第二算力数据帧;

其中,所述第二算力数据帧的包括第二报文头,所述第二报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第二算力发现协议;其中,所述第二算力发现协议包括算力确认。

在该步骤中,算力网关向所述第一服务器发送第二算力数据帧;

其中,所述第二算力数据帧的包括第二报文头,所述第二报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第二算力发现协议;其中,所述第二算力发现协议包括算力确认。

图5是本公开实施例提供的一种第二算力数据帧500的结构数据图。

参考图5,第二算力数据帧500包括第二报文头501。

所述第二报文头501包括源媒体存取控制位址(MAC_DA)、目的媒体存取控制位址(MAC_SA)、链路层类型(Type:0x0707)和第二算力发现协议(Opcode:0X02);其中,所述第二算力发现协议包括算力确认。

图6是本公开实施例提供的一种服务器算力的管理方法的流程图。本公开实施例提供的方法可以应用在图1实施例中的算力网关。

如图6所示,本公开实施例提供的方法可以包括如下步骤。

在步骤S610中,向所述第一服务器周期性地发送第三算力数据帧;

其中,所述第三算力数据帧的包括第三报文头,所述第三报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第三算力发现协议;

其中,所述第三算力发现协议包括算力查询。

在该步骤中,算力网关向所述第一服务器周期性地发送第三算力数据帧;

其中,所述第三算力数据帧的包括第三报文头,所述第三报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第三算力发现协议;

其中,所述第三算力发现协议包括算力查询。

图7是本公开实施例提供的一种第三算力数据帧700的结构数据图。

参考图7,第三算力数据帧700包括第三报文头701。

所述第三报文头501包括源媒体存取控制位址(MAC_DA)、目的媒体存取控制位址(MAC_SA)、链路层类型(Type:0x0707)和第三算力发现协议(Opcode:0X04);其中,所述第三算力发现协议包括算力查询。

图8是本公开实施例提供的一种服务器算力的管理方法的流程图。本公开实施例提供的方法可以应用在图1实施例中的算力网关。

如图8所示,本公开实施例提供的方法可以包括如下步骤。

在步骤S810中,接收所述第一服务器发送的第四算力数据帧;

其中,所述第四算力数据帧的包括第四报文头,所述第四报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第四算力发现协议;

其中,所述第四算力发现协议包括算力撤销。

在该步骤中,算力网关接收所述第一服务器发送的第四算力数据帧;

其中,所述第四算力数据帧的包括第四报文头,所述第四报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第四算力发现协议;

其中,所述第四算力发现协议包括算力撤销。

图9是本公开实施例提供的一种第四算力数据帧900的结构数据图。

参考图9,第四算力数据帧900包括第四报文头901。

所述第四报文头901包括源媒体存取控制位址(MAC_DA)、目的媒体存取控制位址(MAC_SA)、链路层类型(Type:0x0707)和第四算力发现协议(Opcode:0X03);其中,所述第四算力发现协议包括算力撤销。

图10是本公开实施例提供的一种服务器算力的管理装置1000的结构数据图。

参考图10,本申请的服务器算力的管理装置包括:

接收单元1010,用于通过链路层接收第一服务器发送的第一算力数据帧;

其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报。

本申请图10的服务器算力的管理装置,通过链路层接收第一服务器发送的第一算力数据帧;其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报,从而可以实现服务器算力不依赖于网络协议,上报方式简单直接高效。

在一个实施例中,接收单元1010,还用于基于融合以太网的远端内存直接访问技术RDMA通过链路层接收第一服务器发送的第一算力数据帧。

在一个实施例中,所述第一算力数据帧还包括第一报文数据,所述第一报文数据包括所述第一服务器的算力属性;其中,所述算力属性包括算力描述、算力形式、算力种类、算力单位、算力大小和采集时间中的一种或多种。

在一个实施例中,本申请的服务器算力的管理装置还包括:

发送模块,用于向所述第一服务器发送第二算力数据帧;

其中,所述第二算力数据帧的包括第二报文头,所述第二报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第二算力发现协议;其中,所述第二算力发现协议包括算力确认。

在一个实施例中,发送模块,还用于向所述第一服务器周期性地发送第三算力数据帧;

其中,所述第三算力数据帧的包括第三报文头,所述第三报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第三算力发现协议;其中,所述第三算力发现协议包括算力查询。

在一个实施例中,接收单元1010,还用于接收所述第一服务器发送的第四算力数据帧;

其中,所述第四算力数据帧的包括第四报文头,所述第四报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第四算力发现协议;其中,所述第四算力发现协议包括算力撤销。

参见图11,图11是本公开实施例提供的一种计算机设备1100的结构示意图。如图11所示,本公开实施例中的计算机设备可以包括:一个或多个处理器1101、存储器1102和输入输出接口1103。该处理器1101、存储器1102和输入输出接口1103通过总线1104连接。存储器1102用于存储计算机程序,该计算机程序包括程序指令,输入输出接口1103用于接收数据及输出数据,如用于宿主机与计算机设备之间进行数据交互,或者用于在宿主机中的各个虚拟机之间进行数据交互;处理器1101用于执行存储器1102存储的程序指令。

其中,该处理器1101可以执行如下操作:

通过链路层接收第一服务器发送的第一算力数据帧;

其中,所述第一算力数据帧包括第一报文头,所述第一报文头包括源媒体存取控制位址、目的媒体存取控制位址、链路层类型和第一算力发现协议;其中,所述第一算力发现协议包括算力上报。

在一些可行的实施方式中,该处理器1101可以是中央处理单元(centralprocessing unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignal processor,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器1102可以包括只读存储器和随机存取存储器,并向处理器1101和输入输出接口1103提供指令和数据。存储器1102的一部分还可以包括非易失性随机存取存储器。例如,存储器1102还可以存储设备类型的信息。

具体实现中,该计算机设备可通过其内置的各个功能模块执行如上述实施例中各个步骤所提供的实现方式,具体可参见上述实施例中各个步骤所提供的实现方式,在此不再赘述。

本公开实施例通过提供一种计算机设备,包括:处理器、输入输出接口、存储器,通过处理器获取存储器中的计算机程序,执行上述实施例中所示方法的各个步骤,进行传输操作。

本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序适于由该处理器加载并执行上述实施例中各个步骤所提供的方法,具体可参见上述实施例中各个步骤所提供的实现方式,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本公开所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本公开方法实施例的描述。作为示例,计算机程序可被部署为在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行。

该计算机可读存储介质可以是前述任一实施例提供的装置或者该计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smart mediacard,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本公开实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中的各种可选方式中所提供的方法。

本公开实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在该说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。

本公开实施例提供的方法及相关装置是参照本公开实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程传输设备的处理器以产生一个机器,使得通过计算机或其他可编程传输设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程传输设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程传输设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。

以上所揭露的仅为本公开较佳实施例而已,当然不能以此来限定本公开之权利范围,因此依本公开权利要求所作的等同变化,仍属本公开所涵盖的范围。

相关技术
  • 一种在单个边缘计算服务器场景下基于线性搜索的移动区块链优化算力分配方法
  • 一种在多个边缘计算服务器场景下基于模拟退火的移动区块链优化算力分配方法
  • 一种车辆检测数据管理方法、分析方法、设备及服务器
  • 算力管理方法、算力管理装置、视频管理设备及存储介质
  • 一种边缘计算设备算力的编排方法及其相关设备
技术分类

06120116491557