掌桥专利:专业的专利平台
掌桥专利
首页

基于傅里叶增强混合分解的服务器能耗预测系统及方法

文献发布时间:2024-05-31 01:29:11


基于傅里叶增强混合分解的服务器能耗预测系统及方法

技术领域

本发明属于数据中心能耗预测技术领域。

背景技术

随着科技的快速发展,数据中心已经成为支持现代信息社会不可或缺的角色。如在云计算,大数据分析,人工智能等领域,为人们提供了必不可少的云存储、计算能力以及网络服务等,都极大地依赖于卓越和稳定的数据中心基础设施。然而,数据中心的运营代价也相当巨大,尤其是能耗所占的比例。据估算,全球数据中心能源消耗占全球电力总消耗的2%左右,并且这个比例在持续增长。因此,对数据中心的能耗进行有效预测已经成为一个迫切需要解决的问题。数据中心能耗预测方法是找出数据中心能耗趋势,为规划和优化数据中心的能源使用提供依据。通过准确预测能耗趋势,可以提高数据中心运行的效率,降低维护成本,也对环境节能和可持续发展做出贡献。

时间序列预测近年来受到广泛关注,与语言、视频等其他类型的序列数据不同,时间序列是连续记录的,每个时间点都需要保存一组数据信息,由于单个时间点通常无法提供足够的语义信息进行分析,因此许多研究都将重点放在时间变化上,时间变化信息量更大,更能反映时间序列的连续性、周期性、趋势性等固有属性。

数据中心能耗预测实际是一种长期时间序列预测。长期时间序列预测是时间序列预测的一个重要子领域,它关注的是如何准确预测未来较长时间段内的时间序列数据,这需要模型能够捕捉到时间序列数据中的复杂模式,如周期性、趋势性以及各种未知的、难以预测的季节性变化。当处理具有周期性的时间序列时,存在多种方法和工具可以帮助模型捕获其周期性。傅里叶变换是一种强大的工具,它能将时间序列数据转换到频域,使其能明确看到数据中的周期性成分。这在处理周期性明显且固定的时间序列时尤为有效。周期性调整是处理明显周期性影响的时间序列的一种跨学科方法,通过周期性调整,可以转化原始数据,去除周期性影响。自回归移动平均模型(Auto Regressive Integrated MovingAverage,ARIMA)及其变体,是统计学中常用的一种时间序列预测模型。它能处理数据的趋势、周期性以及其他一些可预测的模式。时间序列分解是将时间序列数据分解为趋势、周期性和随机波动三个部分的强大方法。循环神经网络(Recurrent Neural Network,RNN)及其变种,如长短期记忆网络(Long Short Term Memory,LSTM)和门控循环神经网络(GatedRecurrent Unit,GRU),已被证明可以有效模拟和预测周期性时间序列。还有一种常见的方法是使用滑动窗口法,通过创建一个包含过去n个周期数据的滑动窗口作为输入,预测下一个周期的数据,从而捕获周期性。这些模型的优势在于它们能够自动地从时间序列数据中学习并理解深层的、复杂的模式,与此同时,这些模型也各有其特点和局限性,如RNN可能会遇到长期依赖问题,而卷积神经网络(Convolutional Neural Network,CNN)和Transformer则更注重局部或全局的模式识别。

针对具有周期性和趋势性的时间序列,可以设计一个或多个新的变量来表示这些特性,比如季度、月份、周数等。目前学者倾向于将具有周期性和趋势性的时间序列先进行分解,将其分解成周期性和趋势性两部分进行处理。然而,目前的时间序列分解方法侧重于发现数据中的长期趋势和重复模式,可能无法适应突然的、非周期性的变化,而数据中心服务器能耗取决于用户使用操作,具有突然性,目前的时序分解模块还存在着依赖历史的问题,这就会导致模型无法准确的推测未来的变化。

近期提出的线性方法在时序预测上具有较高准确率,并且速度较快,但是并不能捕捉到复杂的时序数据关系,对于非线性的周期性及趋势性容易被忽略,长期时间序列预测并不只是模型设计的问题。模型的性能往往也会受到数据质量、数据缺失和预处理等因素的影响。

发明内容

本发明是为了解决现有服务器能耗预测方法存在对于复杂的时序数据无法准确捕捉,预测数据的准确性差的问题,提出了一种基于傅里叶增强混合分解的服务器能耗预测系统及方法。

本发明所述的基于傅里叶增强混合分解的服务器能耗预测系统,包括:混合分解模块、两个傅里叶频域增强模块、两个维度变换模块、三重线性连接模块和加法器;

所述混合分解模块用于对待预测的服务器历史能耗数据进行分解,获取周期性能耗数据和趋势性能耗数据;

两个傅里叶频域增强模块分别对所述周期性能耗数据和趋势性能耗数据进行特征增强,获取特征增强后的周期性能耗数据和趋势性能耗数据;

两个维度变换模块分别对特征增强后的周期性能耗数据和趋势性能耗数据分别依次进行升维、特征提取和降维,获得一维能耗数据的周期性能耗特征和趋势性能耗特征;

三重线性连接模块用于对所述周期性能耗特征和趋势性能耗特征进行三重线性变换,对周期性能耗特征和趋势性能耗特征进一步特征提取;

加法器对三重线性连接模块提取的周期性能耗特征和趋势性能耗特征相加,获得服务器能耗预测数据。

进一步地,本发明中,混合分解模块获取周期性能耗数据和趋势性能耗数据采用公式:

χ

χ

实现,其中

进一步地,本发明中,两个傅里叶频域增强模块对所述周期性能耗数据和趋势性能耗数据进行特征增强的方法相同,具体为:

步骤A1、对输入数据进行离散傅里叶变换,获得到频域中的复数序列χ

步骤A2、对所述复数序列χ

步骤A3、将频域增强序列进行逆离散傅里叶变换,将频域增强序列转换为时序数据,完成特征增强。

进一步地,本发明中,步骤A1中,对输入数据进行离散傅里叶变换,获得到频域中的复数序列χ

其中,χ

进一步地,本发明中,步骤A2中,对所述复数序列χ

采用:

对复数序列χ

再进行傅里叶变换的频率增强:

其中,

进一步地,本发明中,步骤A3中,将频域增强序列进行逆离散傅里叶变换,将频域增强序列转换为时序数据的公式为:

进一步地,本发明中,两个维度变换模块对特征增强后的周期性能耗数据和趋势性能耗数据依次进行升维、特征提取和降维的过程相同;

设定周期性能耗数据或趋势性能耗数据为长度为T,变量为C的时间序列

步骤B1、计算FTB(X

步骤B2、根据所述FTB(X

步骤B3、将得到的二维张量输入到Inception块中,提取周期性能耗特征和趋势性能耗特征将所述周期性能耗特征和趋势性能耗特征降为一维特征数据;获取一维的周期性能耗特征和趋势性能耗特征。

进一步地,本发明中,步骤B1中,获取FTB(X

通过公式:

A=Avg(Amp(FTB(X

计算FTB(X

根据频率找到对应周期{p

A,{f

period(X

进一步地,本发明中,步骤B2中,将时间序列X

利用公式:

实现,其中Padding(·)是将时间序列沿着时间维度进行零扩展,使其与

进一步地,本发明中,步骤B4中,获取一维的周期性能耗特征和趋势性能耗特征的过程为:

将二维张量输入到Inception块中提取周期性能耗特征和趋势性能耗特征

其中,

获得一维的周期性能耗特征和趋势性能耗特征,其中,

基于傅里叶增强混合分解的服务器能耗预测方法,包括:

步骤一、连续采集数据中心服务器多个历史时刻数据;

所述历史数据包括:单台服务器实时总功耗、GPU实时功耗、GPU实时占用率、CPU实时功耗、CPU实时占用率以及内存占用率;

步骤二、采用混合分解模块对所述多个历史时刻数据进行分解,获取周期性能耗数据和趋势性能耗数据;

步骤三、分别对所述周期性能耗数据和趋势性能耗数据进行傅里叶频域增强,利用频域增强后的周期性能耗数据和趋势性能耗数据对多个历史时刻数据进行周期性能耗特征和趋势性能耗特征提取;

步骤四、采用三重线性变换的方法对所述周期性能耗特征和趋势性能耗特征进行再次特征提取,将再次提取的特征相加,获取服务器能耗预测数据。

本发明所述系统及方法采用混合分解模块对输入数据进行周期性和趋势性分解,达到对数据的内在规律进行更深层次挖掘的目的。接下来,分解后的数据输入傅立叶频域增强模块中,有效地隔离并分解数据中的周期性模式,进一步提升了模型对周期性信息的捕捉和理解能力。将处理后的数据输入到维度变换模块,得到周期间和周期内的规律,为预测提供了更多规律性信息。最后,经过三重线性连接块并求和,得到预测结果。这种方法有效地将周期性分解、维度变换和线性求和等技术相结合,为长期时序预测提供了一种有效的方法。对比实验表明,本发明所述方法具有良好的预测准确性和稳定性,有助于实现数据中心的能源有效管理。

附图说明

图1是本发明所述系统原理图;

图2是傅里叶频域增强模块数据处理过程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其它实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

具体实施方式一:参照图1具体说明本实施方式,本实施方式所述的基于傅里叶增强混合分解的服务器能耗预测系统,包括:混合分解模块1、两个傅里叶频域增强模块2、两个维度变换模块3、三重线性连接模块4和加法器5;

所述混合分解模块1用于对待预测的服务器历史能耗数据进行分解,获取周期性能耗数据和趋势性能耗数据;

两个傅里叶频域增强模块2分别对所述周期性能耗数据和趋势性能耗数据进行特征增强,获取特征增强后的周期性能耗数据和趋势性能耗数据;

两个维度变换模块3分别对特征增强后的周期性能耗数据和趋势性能耗数据分别依次进行升维、特征提取和降维,获得一维能耗数据的周期性能耗特征和趋势性能耗特征;

三重线性连接模块4用于对所述周期性能耗特征和趋势性能耗特征进行三重线性变换,对周期性能耗特征和趋势性能耗特征进一步特征提取;

加法器对三重线性连接模块4提取的周期性能耗特征和趋势性能耗特征相加,获得服务器能耗预测数据。

本发明首先将长期序列数据输入到混合分解模块进行分解,不仅能得到数据的周期性和趋势性,还能有效地应对数据的突变性,然后将其分别输入到傅里叶频域增强模块中,有效地隔离并分解数据中的周期性模式,并使得数据中潜在的周期性、振动频率以及数据波动的速率等特征更加明显。接下来,将其输入到维度变换模块中,得到周期间及趋势性能耗,最终输入到三重线性连接块并相加得到能耗预测结果,如图1所示。

具体实施过程中,为了学习长期预测背景下的复杂时间模式,本发明采用分解的思想,将时序数据分为趋势循环部分和周期性部分。首先进行数据清洗,包括过滤法和平均法,识别并处理异常值和噪声,确保数据质量的统一和稳定。对于遗漏或丢失的数据,本发明采用插值和回归方法进行填充,使数据更为完整,然后对于数据进行归一化处理,使所有数据位于同一量级。最后,确定对预测结果影响最大的特征并对其进行编码。

在编码阶段对于非数值类型的特征,采用独立编码方式进行编码,然后进行深度分析,挖掘出其内在的趋势性和周期性规律,使原本复杂的时序模式变得更为简单,也提供了更好的解读性。这两部分分别反映了该序列的长期进展性和周期性。然而,对于未来的序列来说,直接分解是无法实现的,因为未来是未知的。为了解决这个困境,本发明对于长度为L的输入序列

进一步地,本发明中,混合分解模块1获取周期性能耗数据和趋势性能耗数据采用公式:

χ

χ

实现,其中

进一步地,本发明中,两个傅里叶频域增强模块2对分别所述周期性能耗数据和趋势性能耗数据进行特征增强的方法相同,具体为:

步骤A1、对输入数据进行离散傅里叶变换,获得到频域中的复数序列χ

步骤A2、对所述复数序列χ

步骤A3、将频域增强序列进行逆离散傅里叶变换,将频域增强序列转换为时序数据,完成特征增强。

本实施方式中,离散傅里叶变换包含傅里叶变换(表示为F)和傅里叶逆变换(表示为F

对于傅里叶频率增强模块的输入,首先将其表示为

其中,

其中

其中,d

进一步地,本发明中,步骤A1中,对输入数据进行离散傅里叶变换,获得到频域中的复数序列χ

其中,χ

进一步地,本发明中,步骤A2中,对所述复数序列χ

采用:

对复数序列χ

再进行傅里叶变换的频率增强:

其中,

其中,d

进一步地,本发明中,步骤A3中,将频域增强序列进行逆离散傅里叶变换,将频域增强序列转换为时序数据的公式为:

进一步地,本发明中,两个维度变换模块3分别对特征增强后的周期性能耗数据和趋势性能耗数据依次进行升维、特征提取和降维的过程相同;

设定周期性能耗数据或趋势性能耗数据为长度为T,变量为C的时间序列

步骤B1、计算FTB(X

步骤B2、根据所述FTB(X

步骤B3、将得到的二维张量输入到Inception块中,提取周期性能耗特征和趋势性能耗特征;将所述周期性能耗特征和趋势性能耗特征为一维特征数据;获取一维的周期性能耗特征和趋势性能耗特征。

进一步地,本发明中,步骤B1中,获取FTB(X

通过公式:

A=Avg(Amp(FTB(X

计算FTB(X

根据频率找到对应周期{p

A,{f

period(X

进一步地,本发明中,步骤B2中,将时间序列X

利用公式:

实现,其中Padding(·)是将时间序列沿着时间维度进行零扩展,使其与

进一步地,本发明中,步骤B4中,获取一维的周期性能耗特征和趋势性能耗特征的过程为:

将二维张量输入到Inception块中提取周期性能耗特征和趋势性能耗特征;

其中,

获得一维的周期性能耗特征和趋势性能耗特征,其中,

为了突破只能反映相邻时间点之间变化的一维时间序列分析中的限制,本发明利用傅里叶变换寻找序列的周期内变化和周期间变化的二维时间序列结构。以一个长度为T,记录变量为C的时间序列为例,传统的一维时间序列可以被标示为

再将维度变换块的输出输入到三重线性连接块中,线性块是由三个线性层组成的,并将它们的结果相加以获得最终预测。由于各个线性模型可能捕获数据的不同特征,显著增强了模型的表达能力,这种方法提高了模型面对噪声的稳健性,特别是在对真实世界的含噪声数据进行预测,这种设计使得模型具备更强的应对能力,有较强的鲁棒性。通过将三个模型的预测结果相加,实质上是平滑了多个模型的输出,这有利于降低模型的方差,进一步降低模型过拟合的风险,这种设计有效地提升了模型的性能,提高了其稳定性,并提供了更准确的预测结果。

本发明所述混合分解模块有针对性地处理噪声,并能有效地应对数据突变,同时能通过将不同的时间尺度(如周期性、趋势性)分解出来,从而有效地处理依赖于历史的时序数据。基于傅里叶变换的频域增强块能够将时域数据转换到频域,从而使数据中潜在的周期性、振动频率以及数据波动的速率等特征更加明显。在时序预测中能有效捕捉和分解周期性模式,提升预测模型的准确性。

具体实施方式二:本实施方式所述基于傅里叶增强混合分解的服务器能耗预测方法,包括:

步骤一、连续采集数据中心服务器多个历史时刻数据;

所述历史数据包括:单台服务器实时总功耗、GPU实时功耗、GPU实时占用率、CPU实时功耗、CPU实时占用率以及内存占用率;

步骤二、采用混合分解模块对所述多个历史时刻数据进行分解,获取周期性能耗数据和趋势性能耗数据;

步骤三、分别对所述周期性能耗数据和趋势性能耗数据进行傅里叶频域增强,利用频域增强后的周期性能耗数据和趋势性能耗数据对多个历史时刻数据进行周期性能耗特征和趋势性能耗特征提取;

步骤四、采用三重线性变换的方法对所述周期性能耗特征和趋势性能耗特征进行再次特征提取,将再次提取的特征相加,获取服务器能耗预测数据。

在数据中心能耗数据中,由于用户使用的不确定性,会出现噪声数据,DFT可以对噪音数据进行处理,在将时域信息转换为频域后,可以看到在某些频率上信号的强度是否显著超过随机噪音的强度,通过选择阈值,并将那些强度低于阈值的频率分量消除,将噪音从原始信号中过滤掉,之后再用逆DFT,就能获得一个干净的时域信号。与小波变换、快速傅里叶变换(Fast Fourier Transform,FFT)等相比具有明显的优势。本发明采用的服务器是4块Nvidia 2080Ti显卡,2块CPU。采用ADAM优化器进行L2损失训练,初始学习率为10-4,批量大小设置为32,训练过程在10个回合内提前停止,所有实验均重复3次取平均值,预测长度分别为96及192。

本发明使用PyTorch框架,对基于Transformer的模型Informer和Reformer,两个基于RNN的模型LSTNet和LSTM,及基于CNN的TCN模型作为基线进行实验,表2为在不同数据集下的实验结果,在预测长度为96得情况下,与表中其余模型相比在Electricity数据集中MSE平均提升了0.274,MAE平均提升了0.244;在Exchange数据集中MSE平均提升了0.972,MAE平均提升了0.429;在Weather数据集中MSE平均提升了0.242,MAE平均提升了0.293;在Traffic数据集中MSE平均提升了0.433,MAE平均提升了0.220;在ETT数据集中MSE平均提升了1.635,MAE提升了0.767;在服务器能耗数据集(Server Energy Consumption Dataset,SECD)中MSE平均提升了1.279,MAE平均提升了1.284,由上述数据可知,本文提出的方法具有最优性能。

表2模型在现有数据集Electricity、Exchange、Weather、Traffic、ETT和数据中心能耗数据集下的实验结果

本发明利用混合分解模块将时序数据分解为趋势性和周期性两部分,简化复杂的时序模式并提高了解读性,采用傅里叶频域增强模块(FTB),有效的增强了数据的周期性、振动频率和波动等特性,最后采用三重线性连接块,用于处理维度变换块的输出的信息,对输出进过进行再次提取特征,使输出最终的预测结果更加的准确。

虽然在本文中参照了特定的实施方式来描述本发明,但是应该理解的是,这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是,可以对示例性的实施例进行许多修改,并且可以设计出其他的布置,只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是,可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是,结合单独实施例所描述的特征可以使用在其它所述实施例中。

相关技术
  • 基于线性预测的傅里叶光谱分辨率增强算法及系统
  • 一种基于改进经验傅里叶分解的多谐波源识别方法
技术分类

06120116623773