掌桥专利:专业的专利平台
掌桥专利
首页

一种多任务学习的数据中心水冷系统能耗预测方法与装置

文献发布时间:2024-04-18 19:58:30


一种多任务学习的数据中心水冷系统能耗预测方法与装置

技术领域

本发明属于数据中心节能技术领域,涉及深度学习、以及数据中心系统。具体涉及一种多任务学习的数据中心水冷系统能耗预测方法与装置。

背景技术

数据中心作为全天候运行的用于大规模关键任务的计算基础设施,对于推动IT行业的快速增长乃至改变整个社会经济体系起到了重要作用。软硬件快速发展的互联网时代背景下,人们对于不同种类应用程序的需求不断增加,无论是运行几秒钟的应用程序,或是共享硬件平台上长期运行的应用程序,都依赖于数据中心的计算功能,因此各种大型云服务(如谷歌和Facebook)、电信运营商、银行等对数据计算、处理和存储的需求不断增长,这也促进了数据中心这一大规模计算基础设施的建设。

近些年来,数据中心的能量效率是社会各界关注的重点。首先,数据中心的工作会消耗大量的电量。随着大数据和云计算等技术的快速发展,以指数增长形式的数据通信和数据计算导致了数据中心的大量能耗。一个典型的数据中心可能消耗多达25000户家庭的能源。数据中心空间的耗电量可能是标准办公空间的100至200倍。此外,为典型数据中心供电的能源成本每五年翻一番。在全球范围内,数据中心已经成为了世界上能量消耗最多的建筑类型,数据中心的能耗占比将从2017年的3%上升到2025年的4.5%。数据中心巨大的用电量也因此带来巨大的成本,电费已经成为当今数据中心的一大支出,某些情况下,电力成本可能会超过购买硬件的成本。其次,数据中心能源的大量使用会引发一系列环境问题。目前来看,发电现在主要通过燃烧天然气和煤炭等碳密集型化石燃料实现,因此大量的能源消耗会导致巨大的碳排放。据估计,数据中心行业目前贡献了全球0.3%的碳排放,这一增长趋势将在未来十年继续。由于碳排放过量导致的气候变化是人类面临的最严峻的挑战之一,数据中心的碳排放对人类应对气候变化构成了重大威胁。

根据以上可知,对于数据中心能量消耗相关指标进行监测与评估,对数据中心的能耗方案进行建模、优化,从而实现数据中心能源消耗量以及碳排放量的减少,对于各类会使用到数据中心提供服务的企业、对于各个国家节约能源消耗,乃至对于全人类减轻环保压力都具有极为重要的意义。

数据中心的能耗可分解为IT设备系统(包括服务器、存储设备和网络设备)、空调制冷系统(包括风冷系统、送风回风系统)、配电系统、辅助照明系统等部分。因此,针对于不同部分,不同的研究人员从各个角度提出了降低数据中心能耗的设计方案,如优化提高IT设备能量利用效率,设计提高制冷系统工作效率,选择高纬度地区进行数据中心选址等。在数据中心的各部分系统中,能耗占比最大的是制冷设备和IT设备系统,而制冷设备的功耗和运行状况又直接影响了IT设备系统的性能状况,因此,数据中心冷却系统的能耗是数据中心节能的关键

为解决此问题,对于数据中心的能耗进行完整的建模是十分必要的。基于物理模型的控制已经成为数据中心运行优化和节能的一种可实施解决方案,但精度和计算效率始终是困扰着物理模型驱动方法的难题。近些年来,随着人工智能、深度学习等技术的飞速发展,使用机器学习、深度学习等数据驱动的方法解决数据中心能耗优化问题,提高能源利用效率是有关业界发展的主要方向。不幸的是,此类模型通常需要很长的训练期,并且有着相当的局限性。对数据中心能耗进行快速、精准的预测,是有效降低数据中心能耗、建立绿色节能数据中心的极具应用前景和研究价值的解决方案。融合物理模型驱动和数据驱动的优点,考虑数据中心实际的物理场景,同时采用最先进的深度学习技术的数据中心能耗预测模型与方法,是技术的关键。

发明内容

发明目的:本发明目的在于提供一种多任务学习的数据中心水冷系统能耗预测方法与装置,能够在数据中心水冷系统具有物联网传感器系统的情况下,使用一种多任务学习的方法对数据中心冷却系统能耗进行实时、精确的预测建模。

技术方案:为实现上述目的,本发明采用的技术方案为:一种多任务学习的数据中心水冷系统能耗预测方法,包括以下步骤:

获得时序性的来自于物联网传感模块采集的数据中心运行真实工况数据,并将真实工况数据转化为模型可用的数据集;

使用多任务学习的方法,结合数据中心水冷系统的物理模型和用于实时预测时序数据的多任务深度学习网络模型,对水冷数据中心能耗进行时序性精准预测;所述多任务深度学习网络模型将不同的有源制冷设备按照其真实系统的最小单元分为不同网络模块TE-MLP,每个网络模块TE-MLP包括Transformer的编码器和第一全连接层,用于输入对应设备的工况数据,输出设备能耗;每一个网络模块TE-MLP输出分为两个部分向后传递,其中一路输出经过拼接后直接向后传递,用于模型直接学习有源设备模块的能耗,与另一路输出与无源设备参数和/或环境参数一起输入到第二全连接层,用于模型学习整个制冷系统的能耗。

进一步地,所述方法还包括对建立的用于能耗预测的多任务深度学习网络模型进行敏感性及重要性分析,结合物理模型相关场景,为后续调整系统工作参数、调整物联网传感器测点部署位置和数量提供建议。

作为优选,获取真实工况数据后,对数据进行预处理,包括数据清洗、数据集成、数据规约和数据变换;经过数据预处理后的数据为可被时序预测模型接受作为输入的时序数据集。

作为优选,所述多任务深度学习网络模型中的整合网络描述为:

h

h

Y=Concat(h

其中,x

作为优选,所述MLP网络描述为:

f

其中,ReLU为激活函数,BN为批量归一化操作,W代表权重矩阵,b代表偏差,x代表网络输入。

作为优选,所述多任务深度学习网络模型的损失函数为:

其中,L是模型训练时使用的最终损失函数,L

作为优选,对已经建立好的模型进行敏感性和重要性的分析,结合不同特征的物理含义,简化模型,减少模型所需的特征参数;其中模型敏感性分析通过对于每个变量画出特征敏感性分析图,供研究者判断此模型下各个参数的变化对于输出结果的影响,同时供后续进行优化的过程中将参数与输出结果建立一定的直观关系;同时,通过分析不同特征敏感性分析输出结果的方差判断模型对输入特征变化相应变化的程度;重要性分析倾向于分析不同参数中对模型输出变化的影响程度,对于已经建立好的模型,某一特征的输出偏差的绝对值越大,认为这一特征对于输出的影响重要性越大。

所述多任务深度学习网络模型设计不同的网络模块并合并为整体网络,对系统增加边界条件,同时减少模型中不同设备的耦合关系,把握整体运行关系,使得模型的网络结构与功能与物理系统相对应,能够增强网络模型的可解释性与稳定性。

基于相同的发明构思,本发明提供的一种多任务学习的数据中心水冷系统能耗预测装置,包括:数据获取模块,用于获得时序性的来自于物联网传感模块采集的数据中心运行真实工况数据,并将真实工况数据转化为模型可用的数据集;以及系统能耗预测模块,用于使用多任务学习的方法,结合数据中心水冷系统的物理模型和用于实时预测时序数据的多任务深度学习网络模型,对水冷数据中心能耗进行时序性精准预测;所述多任务深度学习网络模型将不同的有源制冷设备按照其真实系统的最小单元分为不同网络模块TE-MLP,每个网络模块TE-MLP包括Transformer的编码器和第一全连接层,用于输入对应设备的工况数据,输出设备能耗;每一个网络模块TE-MLP输出分为两个部分向后传递,其中一路输出经过拼接后直接向后传递,用于模型直接学习有源设备模块的能耗,与另一路输出与无源设备参数和/或环境参数一起输入到第二全连接层,用于模型学习整个制冷系统的能耗。

基于相同的发明构思,本发明提供的一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的多任务学习的数据中心水冷系统能耗预测方法的步骤。

有益效果:与现有技术相比,本发明具有如下优点:本发明结合多任务学习的方法,根据物理模型优化网络结构,使得模型的网络结构与功能与物理系统相对应,拥有同时输出预测各设备能耗和总能耗的能力,增强了数据中心水冷系统能耗预测模型的可解释性与稳定性。根据现实物理模型对模型的输入参数进行了分组,减少了神经网络中不存在现实物理相关意义的参数之间的耦合度,进而减少了模型的不稳定性。实验表明,在数据中心水冷系统能耗预测的准确率方面显著优于已有相关传统预测模型(例如多项式回归、MLP、LSTM等经典模型),且相较于数据驱动的黑盒模型,有着更高的可解释性和稳定性。同时,本发明中所使用到的敏感性和重要性分析方法使得本发明可以有效分析各个输入参数可以使得研究者对数据中心参数变化对输出结果的影响有更直观的理解,同时有助于减少模型输入参数数量,进而有助于减少数据中心水冷系统中设置的物联网传感器数量,节约成本。

附图说明

图1是本发明实施例的能耗预测建模框架图。

图2是本发明实施例适用的数据中心水冷制冷系统示意图。

图3是本发明实施例的所设计的TE-MLP网络结构示意图。

图4是本发明实施例中的所使用的完整水冷数据中心制冷系统预测网络模型示意图。

图5是本发明实施例的预测结果与实际结果时序对比图。

图6是本发明实施例中重要性分析方法简化参数后模型性能对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明的实施例作详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,但本发明的保护范围不限于下述的实施例。

本发明实施例基于通过物联网传感器模块采集的数据中心实时运行数据,公开了一种多任务学习的数据中心能耗预测方法与系统,为基于水冷散热系统的数据中心的冷却系统的能耗建模预测提供了一个准确率高、可泛化性强、可解释性强的解决方案。首先使用数据库读取获得时序性的来自于物联网传感模块采集获取的数据中心运行真实工况数据;接着对数据进行预处理,将真实工况数据转化为模型学习可用的数据集;然后使用创新的多任务学习水冷数据中心能耗预测模型与方法,对水冷数据中心能耗进行时序性精准预测;最后对建立好的模型进行敏感性、重要性分析,结合物理模型相关场景,为后续调整系统工作参数、调整物联网传感器测点部署位置和数量提供建议。

图1显示了基于物联网的数据中心水冷散热系统的能耗预测建模框架。首先,基于物联网技术,其功能在于通过各类物联网模块对各设备工作状态、环境状态等测点进行实时采集,获取系统中的实时数据,向数据库上传实时数据。本发明实施例中根据数据中心的物理模型及专家经验进行初步筛选,按照设备分类确定需要查找的测点名称。然后连接MySQL数据库,根据测点名称获取测点uid等测点设备基础配置信息,最后连接InfluxDB数据库,根据先前查找得的设备uid检索获取此测点的时序监测信息。

数据预处理的主要步骤分为数据清洗、数据集成、数据规约和数据变换。数据清洗主要包含缺失值处理、重复值处理、异常值处理。数据集成首先通过专家经验去除了实质相同但命名属性不同的特征,然后使用相关性检测冗余,对所有变量计算相关系数矩阵,验证了不存在其他冗余的情况。数据规约首先通过专家经验初步确定了一系列变量维度进行保留,删除了物理意义上与预测能耗无关的变量。后又通过敏感性分析与重要性分析,进一步降低了数据的特征维度。数据变换包括对数据进行规范化,离散化,稀疏化处理,使用Z-score标准化的方法。

本发明实施例考虑数据中心整体能耗的物理建模,数据中心整体能耗主要由制冷设备、IT设备、供电电力转换和其他用电部分组成,IT设备为数据中心的主要功能,主要负责数据存储和数据计算,制冷设备采用集中水冷冷冻水型空调的架构,结合增程式水冷,为IT负载提供散热。先考虑用等式的方式表示总发热量和总能耗,可以列出以下两个等式:

Q

p

其中Qsum表示总发热量,p

考虑本发明实施例所适用的数据中心水冷冷却系统示意图如图2所示。IT机房内的末端精密空调负责为IT负载降温,保证IT负载冷通道的温度维持在恒定安全数值。空调内部的低温冷冻水和空调吸入的热空气交换热量,后在空调后端通过冷冻水泵流回冷水机组/板换。冷水机组/板换的作用是交换冷冻水和冷却水的热量,通过冷水机组/板换的热量交换,冷冻水将热量传递给冷却水,降温后的冷冻水重新流回IT机房为空调制冷。在冷水机机组吸收了一定热量的冷却水在冷却水泵的压力下进入冷却塔,在冷却塔中与室外空气交换热量,后重新流回冷水机组/板换,继续下一次与冷冻水泵交换热量。

可以确定冷却系统能耗与各个制冷设备能耗的物理模型关系:

p

其中p

在本发明实施例中,考虑到真实系统中各设备的工作状态和参数的变化过程并非马尔可夫过程,即系统的输出(在本发明中是系统总能耗)并非只与此时可系统状态有关,也与先前系统的状态有一定相关性,因此输入会是此时系统参数数据和前TIME_STEPS个时刻系统参数数据,其中TIME_STEPS是网络及数据的超参数,这里选择设置为8。

本发明实施例中,使用多任务学习的方法对水冷数据中心的能耗进行预测建模。数据驱动部分,首先建立了TE-MLP(Transformer Encoder-Multilayer Perceptron)模型,在这部分中,本发明实施例考虑结合先前其他PUE预测研究中使用过的MLP网络结构与目前深度学习网络中较为广泛使用的Transformer结构。即使用Transformer中Encoder的结构提取参数特征,然后将Transformer的Decoder层更换为类似MLP网络中的全连接层,用于最终的特征提取与结果拟合。Transformer的Encoder包括位置编码和多头注意力机制。可以通过以下两个公式表示位置编码:

其中pos表示输入数据的位置,d

多头注意力机制的公式可以被表示为:

MultiHead(Q,K,V)=Concat(head

其中

而其中

其中矩阵Q,K,V是由该层的输入乘权重矩阵得到的,d

a

其中a

综上,本发明实施例使用的TE-MLP网络结构示意图如图3所示。

本发明实施例中,多任务深度学习网络模型将不同的有源制冷设备按照其真实系统的最小单元分为不同网络模块,其中每一个网络模块沿用TE-MLP网络结构。这其中的每一个网络模块输出分为两个部分向后传递,其中一个输出经过拼接后直接向后传递,这部分用于模型直接学习这些有源设备模块的功耗,与此同时,这些有源设备网络模块的另一个输出还将和无源设备参数、环境参数一起输入到后续的整合网络中,以供模型学习整个制冷系统的能耗。后续的整合网络可以被描述为:

h

h

Y=Concat(h

其中,x

f

其中,使用ReLU作为激活函数,而批量归一化操作BN用于加快训练过程,提高网络性能。W代表权重矩阵,b代表偏差。

综上,本发明实施例使用的完整水冷数据中心制冷系统预测网络模型示意图如图4所示。

本发明实施例使用了多任务学习方法进行模型训练,通过更改损失函数,将损失函数设置为与神经网络预测各个设备能耗和预测整体能耗都相关的函数,使得神经网络拥有了同时输出预测各设备能耗和总能耗的能力。这样的模型训练方法可以使得网络模型更贴近真实系统的中的网络模型。我们将损失函数设置为以下的形式:

其中,L是模型训练时使用的最终损失函数,L

梯度标准化是多任务学习中十分重要的一种方法,该方法希望能解决多任务学习中不同任务收敛速度不一样的问题,因此该方法设置了每次学习后根据各子任务损失函数变化情况,动态调整不同任务学习权重。其实现思路与相关公式展示如下:

其中,

此深度学习网络使用Adam优化器,损失函数选择为常用于回归问题的MSE,学习率选择为3e-4。本发明实施例使用5折交叉验证对数据集进行划分,选择效果最好的模型。经过训练后,将测试集输入数据经过网络的输出(即网络预测结果)与测试集的标签数据进行实时对比,本发明实施例的预测结果与实际结果时序对比图如图5所示。

在本发明实施例中,对建立好的模型进行敏感性、重要性分析,结合物理模型相关场景,为后续调整系统工作参数、调整物联网传感器测点部署位置和数量提供建议。

模型敏感性分析方法与一般深度学习分类问题中的敏感性不同,是描述模型深入变量变化对输出的影响。这也是对模型进行可解释性评估的重要方法。本研究中的敏感性分析方法寻找输入特征或环境变量的变化来确定预测模型输出的PUE受到影响的变化方式。模型敏感性分析通过对于每个变量画出特征敏感性分析图,可供研究者判断此模型下各个参数的变化对于输出结果的影响,同时可供后续进行优化的过程中将参数与输出结果建立一定的直观关系。同时,通过分析不同特征敏感性分析输出结果的方差也可以一定程度上判断模型对输入特征变化相应变化的程度。敏感性分析的过程如下:

1.对输入特征与标签标准化,对每个输入数据特征和标签数据进行标准化,最终得到标准化后的数据集。

2.模型训练。根据训练集得到训练好的模型,设置模型损失函数,采样数量,敏感性循环次数和重复循环次数。

3.从某一个输入特征中随机采样,将此输入特征中全部替换为随机采样的结果,得到新的数据集。用新的数据集使用训练好的模型评估,得到输出结果,并根据此输出结果画出敏感性曲线,并得到输出特征敏感性分析结果的方差均值。

根据模型敏感性分析结果,可以得到不同变量变化对于功耗影响的关系。有一些输入参数在模型的敏感性分析中不存在明显敏感性输出结果。此变量对于系统工作无明显相关性或关联性,或此变量在数据集中变化不明显,导致模型并没有很好的学习到此变量与最终输出结果的关系,因此,在已有既定的可用数据集前提下,需要将这类参数从能耗预测中舍弃。

重要性分析方法指基于随机排序的特征重要性。基于随机排序的特征重要性常用于衡量机器学习、深度学习模型不同参数的重要性。

重要性分析的大致过程如下:

1.对输入特征与标签标准化,对每个输入数据特征和标签数据进行标准化,最终得到标准化后的数据集。

2.模型训练。根据训练集得到训练好的模型,设置模型损失函数,采样数量,重要性循环次数和重复循环次数。

3.将某一输入特征打乱顺序,其他顺序保持原有顺序不变,获得新的数据集。用新的数据集使用训练好的模型评估,计算模型对应新数据集误差与原先正常数据集误差之差,作为评估此特征的重要性参数。

重要性分析更倾向于分析不同参数中对模型输出变化的影响影响程度。对于已经建立好的模型,某一特征的输出偏差的绝对值越大,可以认为此模型下这一特征对于输出的影响重要性越大。重要性较高的参数是对模型影响较大的变量,在后续进行设备参数调节的过程中需要重点关注。在使用重要性分析获取了对模型影响较大的变量后,本发明结合重要性分析与相关专家经验,筛选出了45个输入参数,使用本发明实施例中的多任务学习的建模方法重新对冷却系统的能耗进行了建模预测,并对比了45个输入参数的模型预测结果与筛选参数前使用了190个输入参数的模型预测结果,其误差对比图6所示。

基于相同的发明构思,本发明实施例公开了一种多任务学习的数据中心水冷系统能耗预测装置,包括:数据获取模块,用于获得时序性的来自于物联网传感模块采集的数据中心运行真实工况数据,并将真实工况数据转化为模型可用的数据集;以及系统能耗预测模块,用于使用多任务学习的方法,结合数据中心水冷系统的物理模型和用于实时预测时序数据的多任务深度学习网络模型,对水冷数据中心能耗进行时序性精准预测;所述多任务深度学习网络模型将不同的有源制冷设备按照其真实系统的最小单元分为不同网络模块TE-MLP,每个网络模块TE-MLP包括Transformer的编码器和第一全连接层,用于输入对应设备的工况数据,输出设备能耗;每一个网络模块TE-MLP输出分为两个部分向后传递,其中一路输出经过拼接后直接向后传递,用于模型直接学习有源设备模块的能耗,与另一路输出与无源设备参数和/或环境参数一起输入到第二全连接层,用于模型学习整个制冷系统的能耗。

基于相同的发明构思,本本发明实施例公开了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的多任务学习的数据中心水冷系统能耗预测方法的步骤。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种地铁车站能耗短期预测方法及其预测系统
  • 基于循环神经网络和多任务学习模型的建筑能耗预测方法
  • 基于小样本学习的云数据中心服务器能耗预测方法
技术分类

06120116504497