掌桥专利:专业的专利平台
掌桥专利
首页

一种功率管理方法以及装置

文献发布时间:2023-06-19 18:37:28


一种功率管理方法以及装置

技术领域

本说明书涉及通信技术领域,尤其涉及一种功率管理方法以及装置。

背景技术

随着网络技术的发展,承载数据和应用的服务器的需求也逐渐增加,对于服务器的管理和维护的要求也越来越高。

在刀箱服务器中,通过OM(管理板,Onboard Management)可以实现对于服务器中其他组件(包括网板、风扇、显示器、各节点和电源等)的功率管理。在进行组件的热插拔时,OM会根据刀箱服务器当前的剩余功率与插入组件的需求功率进行判断,若插入组件的需求功率大于当前的剩余功率,OM将会拒绝插入组件上电,或强制插入组件下电,使急需上电的插入组件无法快速上电启动,造成服务器的功能无法实现乃至引起服务器故障,降低了服务器的可靠性。

发明内容

为克服相关技术中存在的问题,本说明书提供了一种功率管理方法以及装置。

结合本说明书实施方式的第一方面,本申请提供了一种功率管理方法,包括:

根据服务器中供电电源所提供的电源总功率以及当前组件的占用功率,确定服务器的剩余功率,其中,当前剩余功率为电源总功率和占用功率的差值;

若检测到功能节点插入到服务器中,则获取功能节点的需求功率;

若确定需求功率不小于剩余功率,则根据预设供电策略,将服务器中的至少部分备用电源切换为供电电源,并重新计算剩余功率直至剩余功率大于需求功率;

启动插入到服务器的功能节点。

可选的,供电策略,至少包括N+N、N+1和无冗余。

可选的,在将服务器中的至少部分备用电源切换为供电电源之后,还包括:

若供电策略被置于无冗余且需求功率大于剩余功率,则根据组件优先级从低到高,依次回收服务器中已经上电的功能节点的已分配功率,并重新计算剩余功率直至剩余功率大于需求功率。

可选的,在确定需求功率不小于剩余功率之后,还包括:

上报告警信息,并记录异常日志。

结合本说明书实施方式的第二方面,本申请提供了一种功率管理装置,包括:

运算单元,用于根据服务器中供电电源所提供的电源总功率以及当前组件的占用功率,确定服务器的剩余功率,其中,当前剩余功率为电源总功率和占用功率的差值;

获取单元,用于若检测到功能节点插入到服务器中,则获取功能节点的需求功率;

切换单元,用于若确定需求功率不小于剩余功率,则根据预设供电策略,将服务器中的至少部分备用电源切换为供电电源,并重新计算剩余功率直至剩余功率大于需求功率;

启动单元,用于启动插入到服务器的功能节点。

可选的,供电策略,至少包括N+N、N+1和无冗余。

可选的,该装置,还包括:

回收单元,用于若供电策略被置于无冗余且需求功率大于剩余功率,则根据组件优先级从低到高,依次回收服务器中已经上电的功能节点的已分配功率,并重新计算剩余功率直至剩余功率大于需求功率。

可选的,该装置,还包括:

告警单元,用于上报告警信息,并记录异常日志。

结合本说明书实施方式的第三方面,本申请提供了一种管理设备,包括收发器、处理器和机器可读存储介质,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器被机器可执行指令促使:实现上述任一项的方法步骤。

结合本说明书实施方式的第四方面,本申请提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,机器可执行指令促使处理器:实现上述任一项的方法步骤。

本说明书的实施方式提供的技术方案可以包括以下有益效果:

本说明书实施方式中,通过在服务器的管理设备中预设供电策略,在新插入的功能节点的需求功率大于服务器的剩余功率时,通过切换服务器的供电策略,使备用电源切换为供电电源以提供更大的剩余功率,满足新插入的功能节点的上电需求,从而减少了新功能节点的上电时间,提升了服务器的可靠性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本说明书的实施方式,并与说明书一起用于解释本说明书的原理。

图1是本申请所涉及的一种功率管理方法的流程图;

图2是本申请实施方式所涉及的一种服务器的结构示意图;

图3是本申请所涉及的一种功率管理装置的结构示意图;

图4是本申请所涉及的一种管理设备的结构示意图。

具体实施方式

这里将详细地对示例性实施方式进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施方式中所描述的实施方式并不代表与本说明书相一致的所有实施方式。

本申请提供了一种功率管理方法,如图1所示,包括:

S100、根据服务器中供电电源所提供的电源总功率以及当前组件的占用功率,确定服务器的剩余功率。

如图2所示的服务器,可以包含有OM、若干功能节点、电源以及风扇等组件,在功能节点上部署有BMC(基板管理控制器,Baseboard Management Controller)和BIOS(基础输入输出系统,Basic Input Output System)芯片等管理器件,BMC用于对功能节点上的器件状态进行检测,并控制功能节点的上电、下电等操作,BIOS芯片用于实现功能节点的自检和启动过程等。该功能节点可以是插接到服务器中的计算节点、存储节点和互联节点等。互联节点,该互联节点用于实现服务器中存储节点和计算节点之间的数据交互以及计算节点与外部设备(如交换机、其他服务器等)之间的交互。

在一台服务器中,总功率=供电电源个数×单个供电电源功率×X%,其中,X表示冗余系数,设置范围为0-100之间,可以根据实际的需求进行设置,比如可以设置为90%,也就是预留10%的功率。

当前组件的占用功率=固定功率+上电功率;

其中,固定功率=OM最大功率+风扇最大功率+功能节点BMC功率+基础IO功率;

上电功率=处理器+显卡+内存+单板基础功率。

基于上述公式,上述的OM、功能节点、风扇和电源的个数不唯一,根据实际部署进行计算即可。

由于服务器中存在供电策略,根据供电策略,部分电源会处于供电状态,部分电源会处于备份状态。比如,供电策略,至少包括N+N、N+1和无冗余。根据实际需要也可以设置为N+2、N+3…N+(N-1)等形式,对此不做限制。

OM可以通过采集电源的信息,确定出当前处于供电状态的电源的数量以及所能提供的功率,从而确定出供电电源的总功率。

在服务器处于工作状态时,OM会与服务器中的功能节点进行心跳报文的交互。通过交互心跳报文,一方面可以确定功能节点是否出现故障,另一方面在心跳报文中可以携带有功能节点当前的功率,OM通过接收心跳报文可以从载荷中解析出一台功能节点的上电功率。之后,通过固定功率和多台功能节点的上电功率,便可以加算出当前组件的占用功率。继而,OM可以确定出服务器的剩余功率,当前剩余功率为电源总功率和占用功率的差值。

S101、若检测到功能节点插入到服务器中,则获取功能节点的需求功率。

在服务器中,如图2所示,可以包含有未插入功能节点的槽位。为了能够提升服务器的工作效率,可以将一个新的功能节点插入到该槽位。

在功能节点插入到槽位后,功能节点的BMC被上电,以对功能节点的上电过程进行管理。之后,通过BMC激活BIOS芯片进行自检,收集功能节点各个组件的功率,并汇总形成功能节点的需求功率。

在OM确定出功能节点的需求功率以及服务器的剩余功率后,根据二者的大小关系,确定后续的执行。若需求功率小于剩余功率,则OM可以直接向BMC下发上电指令,以使的BMC控制功能节点上电。若需求功率不小于剩余功率,则说明新插入的功能节点可能无法正常上电,执行步骤S102。

S102、若确定需求功率不小于剩余功率,则根据预设供电策略,将服务器中的至少部分备用电源切换为供电电源,并重新计算剩余功率直至剩余功率大于需求功率。

由于在服务器可以配置有多种供电策略,并且,这些供电策略可以被划分出一定的级别,即根据所采用的备用电源的数量,从多至少依次降序排列,比如,在供电策略包含N+N、N+1和无冗余,则可以N+N所采用的备用电源数量为N,级别最高,N+1次之,无冗余的级别最低。在服务器工作时,按照级别从高到低选用供电策略,也就是说,优先设置为N+N的供电策略。

在确定需求功率不小于剩余功率时,OM可以确定服务器无法上电新插入的功能节点。此时,由于服务器中仍存在备用电源,因此,OM可以更改服务器当前选用的供电策略,选择第一级优先级的N+1供电策略,即将更多的备用电源切换为供电电源,以提供更多的功率。

在OM进行备用电源至供电电源的切换后,OM检测到供电电源的增加,重新计算剩余功率。

此时,若OM确定出剩余功率大于需求功率,则可以跳转到步骤S103,启动功能节点,完成上电过程。若OM确定剩余功率仍不大于需求功率,则在服务器仍存在备用电源的情况下,继续调整供电策略,将更多的备用电源切换为供电电源,以增加剩余功率的额度来满足新插入的功能节点的需求。

S103、启动插入到服务器的功能节点。

通过调整供电策略,将备用电源切换为供电电源,以增加服务器的剩余功率,可以避免在功能节点插入服务器的时间点上,剩余功率无法满足需求功率的情况下,直接拒绝新插入的功能节点的上电,使服务器的功率控制更加灵活,提升服务器的可靠性。

可选的,在步骤S102、将服务器中的至少部分备用电源切换为供电电源之后,还包括:

S104、若供电策略被置于无冗余且需求功率大于剩余功率,则根据组件优先级从低到高,依次回收服务器中已经上电的功能节点的已分配功率,并重新计算剩余功率直至剩余功率大于需求功率。

若服务器的供电策略已经被调整到最低级别(即无冗余),说明在服务器中已经没有可以切换为供电电源的备用电源,无法继续提升服务器中的剩余功率。如果服务器的剩余功率仍无法满足功能节点的需求功率,则只能终止功能节点的上电过程,等待工作人员进行操作。

由于新插入的功能节点需要完成上电过程,在供电电源和备用电源都无法满足时,OM可以从当前运行的组件上回收部分功率来满足新插入的功能节点的需求功率。

组件的优先级可以预先配置于OM中,也可以在服务器工作后,由系统引导工作人员进行配置。

比如,下面以服务器中所包含的互联节点为例,OM中可以配置按照互联节点的序号配置优先级顺序,以6个互联节点为例,配置槽位号1-3为高优先级,槽位号4-6为低优先级,这样设置的原因在于互联节点为主备设置,即1-3为主,4-6为备,因此,OM可以回收部分备互联节点的功率。

另一种方式,以计算节点和存储节点为例,也可以进行优先级顺序的设置,以16个节点为例,槽位号1-8可以设置为高优先级,槽位号9-16可以设置为低优先级。

当然,关于组件优先级的设置,不限于此,还可以设置其他组件进行功率回收。

可选的,在步骤S102、确定需求功率不小于剩余功率之后,还包括:

S105、上报告警信息,并记录异常日志。

由于通过将备用电源切换为供电电源,实际上仍是有一定异常,因此,OM仍应该上报告警信息,通知工作人员进行修复。

并且,通过记录异常日志的方式,使工作人员能够查询异常发现的时间和原因。

相对应的,本申请提供了一种功率管理装置,如图3所示,包括:

运算单元,用于根据服务器中供电电源所提供的电源总功率以及当前组件的占用功率,确定服务器的剩余功率,其中,当前剩余功率为电源总功率和占用功率的差值;

获取单元,用于若检测到功能节点插入到服务器中,则获取功能节点的需求功率;

切换单元,用于若确定需求功率不小于剩余功率,则根据预设供电策略,将服务器中的至少部分备用电源切换为供电电源,并重新计算剩余功率直至剩余功率大于需求功率;

启动单元,用于启动插入到服务器的功能节点。

可选的,供电策略,至少包括N+N、N+1和无冗余。

可选的,该装置,还包括:

回收单元,用于若供电策略被置于无冗余且需求功率大于剩余功率,则根据组件优先级从低到高,依次回收服务器中已经上电的功能节点的已分配功率,并重新计算剩余功率直至剩余功率大于需求功率。

可选的,该装置,还包括:

告警单元,用于上报告警信息,并记录异常日志。

相对应的,本申请提供了一种管理设备,如图4所示,包括收发器、处理器和机器可读存储介质,机器可读存储介质存储有能够被处理器执行的机器可执行指令,处理器被机器可执行指令促使:实现上述任一项的方法步骤。

相对应的,本申请提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,机器可执行指令促使处理器:实现上述任一项的方法步骤。

本说明书的实施方式提供的技术方案可以包括以下有益效果:

本说明书实施方式中,通过在服务器的管理设备中预设供电策略,在新插入的功能节点的需求功率大于服务器的剩余功率时,通过切换服务器的供电策略,使备用电源切换为供电电源以提供更大的剩余功率,满足新插入的功能节点的上电需求,从而减少了新功能节点的上电时间,提升了服务器的可靠性。

应当理解的是,本说明书并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。

以上所述仅为本说明书的较佳实施方式而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

技术分类

06120115632052