基于深度学习的数据中心环境热通道预测算法

文献发布时间：2023-06-19 18:37:28

技术领域

本发明涉及服务器环境热通道预测算法技术领域，具体为基于深度学习的数据中心环境热通道预测算法。

背景技术

通过控制服务器的冷热通道，保持适当的温度、湿度和气流，管理员必须监控这些因素以确保服务器效率并以最少的能源保持数据中心运行；

专利号为：202110604574.X的发明专利公开了一种数据中心机房环境监控系统，包括M个服务器机柜、N个空调机柜、移动巡检终端以及布置于n个可移动服务器机柜上的n个边缘计算终端，所述M个服务器机柜中的m个服务器机柜可在预定范围内移动并相对于不可移动的机柜间隔布置；所述移动巡检终端沿预设巡检路线在所述数据中心机房环境内移动，获取所述n个边缘计算终端的处理结果更新所述预设巡检路线，并在经过所述更新的预设巡检路线时，调节所述N个空调机柜中的部分空调机柜的工作状态；所述边缘处理终端基于所述组合传感器获取的温度和湿度数据，控制所述n个服务器机柜的至少一个在预定范围内移动。本发明实现了数据中心机房的全范围动态巡检与状态控制；

上述环境监控系统提取的网络数据特征能力不明显，且网络计算速度慢，不能及时、准确的反应服务器的环境热通道平均温度，导致运维人员无法对服务器的状态进行判断，有鉴于此，有必要提供基于深度学习的数据中心环境热通道预测算法。

发明内容

本发明的目的在于提供基于深度学习的数据中心环境热通道预测算法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：基于深度学习的数据中心环境热通道预测算法，包括以下步骤：

S1：获取数据：从监控系统获取对应服务器的数据；

S2：数据处理：将S1获取的数据处理成平均值，再进行归一化处理；

S3：搭建BiRCNN网络模型；

S4：模型训练：将S2处理后的数据输入BiRCNN网络模型并作为模型输出的目标，按一定比例分为训练集和测试集进行模型训练；

S5：预测数据：保存模型训练参数，将新时刻数据输入BiRCNN网络模型即可对服务器对应的环境热通道平均温度进行预测。

优选的，S1的具体方法为：从监控系统获取对应服务器的环境冷通道温度、环境热通道温度、服务器功率、精密空调风机转速、精密空调风机转速设定、15分钟后的环境热通道温度六种类型数据。

优选的，S2的具体方法为：将获取的所有环境冷通道温度处理成一个环境冷通道平均温度、将获取的所有环境热通道温度处理成一个环境热通道平均温度、将获取的所有15分钟后环境热通道温度处理成一个15分钟后环境热通道平均温度，把处理好的环境冷通道平均温度、环境热通道平均温度、15分钟后环境热通道平均温度和服务器功率、精密空调风机转速、精密空调风机转速进行归一化。

优选的，S3中BiRCNN网络模型包括：输入层、BiGRU层、卷积层、全连接层、输出层。

优选的，所述输入层输入的数据为环境冷通道平均温度、环境热通道平均温度、服务器功率、精密空调风机转速和精密空调风机转速。

优选的，所述卷积层通过卷积核提取时序数据中的关键信息。

优选的，所述全连接层将提取到的特征数据进一步进行计算汇总。

优选的，所述输出层采用sigmoid激活函数，输出15分钟后该服务器对应的环境热通道平均温度。

优选的，S4的具体方法为：将环境冷通道平均温度、环境热通道平均温度、服务器功率、精密空调风机转速和精密空调风机转速作为BiRCNN网络模型的输入，将15分钟后环境热通道平均温度当做模型输出的目标，按一定比例分为训练集和测试集进行模型训练。

优选的，S5的具体方法为：保存模型训练参数，将新时刻的环境冷通道温度、环境热通道温度、服务器功率、精密空调风机转速、精密空调风机转速设定输入模型，即可预测出15分钟后该服务器对应的环境热通道平均温度。

与现有技术相比，本发明的有益效果是：

本发明搭建的BiRCNN网络模型采用双向GRU网络与CNN网络的结合设计，在获取保留双向GRU对于时间序列数据具有较好预测能力的同时，增加了CNN的卷积层，从而更好的提取时间序列数据中的关键特征，有助于针对性对精密空调送风设定温度、回风设定温度、压缩机转速、风机转速等参数进行及时调控，优化数据中心AI群控算法节能效果，减少运维人员压力。

附图说明

图1为本发明方法的系统图；

图2为本发明BiRCNN网络模型流程图；

图3为本发明GRU输入输出结构；

图4为本发明GRU单元基本结构；

图5为本发明BiRNN基本结构图；

图6为本发明训练过程中的性能曲线图；

图7为本发明CNN计算过程示意图；

图8为本发明卷积层计算过程示意图；

图9为本发明最大池化计算过程示意图；

图10为本发明平均池化计算过程示意图；

图11为本发明全局平均池化策略示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1-2，本发明提供基于深度学习的数据中心环境热通道预测算法，包括以下步骤：

S1：获取数据：从监控系统获取对应服务器的数据；

S2：数据处理：将S1获取的数据处理成平均值，再进行归一化处理；

S3：搭建BiRCNN网络模型；

S4：模型训练：将S2处理后的数据输入BiRCNN网络模型并作为模型输出的目标，按一定比例分为训练集和测试集进行模型训练；

S5：预测数据：保存模型训练参数，将新时刻数据输入BiRCNN网络模型即可对服务器对应的环境热通道平均温度进行预测。

本实施例中，S1的具体方法为：从监控系统获取对应服务器的环境冷通道温度、环境热通道温度、服务器功率、精密空调风机转速、精密空调风机转速设定、15分钟后的环境热通道温度六种类型数据。

本实施例中，S2的具体方法为：将获取的所有环境冷通道温度处理成一个环境冷通道平均温度、将获取的所有环境热通道温度处理成一个环境热通道平均温度、将获取的所有15分钟后环境热通道温度处理成一个15分钟后环境热通道平均温度，把处理好的环境冷通道平均温度、环境热通道平均温度、15分钟后环境热通道平均温度和服务器功率、精密空调风机转速、精密空调风机转速进行归一化。

本实施例中，S3中BiRCNN网络模型包括：输入层、BiGRU层、卷积层、全连接层、输出层。

门控循环单元(Gated Recurrent Unit，GRU)是循环神经网络是RNN的一个变种，它与LSTM的最大区别在于它将三个门控控制结构减少为两个，而在训练效率和效果上没有明显的降低，并且因为GRU的参数相对较少，使得有些情况下GRU在训练速度上表现更优异，且降低了过拟合的风险。

传统RNN由于每层之间神经元的连接，在处理较长时序数据时，容易出现梯度爆炸或者梯度消失的问题。GRU算法通过神经元内的门控设计，控制神经元内部对数据记忆的保留或者遗忘，从而在一定程度上解决传统RNN的梯度爆炸或者梯度消失的问题。

GRU的输入与输出结构如下图3所示，与普通的RNN结构相比几乎一致。GRU单元从两个方向接收信息，分别是当前的输入X

GRU单个神经元的示意图如下图4所示，R

在t的时间步下，GRU单元具体的计算步骤如下，首先t时间步GRU单元的输入为当前输入X

处理后的数据R

其中α

处理后的数据Z

GRU与LSTM作用相同，在捕捉长序列语义关联时，能有效抑制梯度消失或梯度爆炸，效果都优于RNN。但是GRU仍然不能完全解决梯度消失问题，同时作为RNN的变体，有着与RNN结构本身一致的不能并行计算的最大弊端。

双向循环神经网络(Bi-directional RNN，Bi-RNN)是由Schuster等提出的基于单向RNN的一种扩展形式。RNN和GRU对于时间序列数据具有较好的分析能力，主要原因在于其神经网络结构中层内之间神经元从前到后的连接设计。但由于单向设计的原因，RNN和GRU都只能利用过去时间的记忆进行分析预测。双向RNN的提出则可以同时利用过去和未来的数据内容进行分析预测。

Bi-RNN的结构如图5所示，其主要原理是通过使用两个RNN网络构造单层，其基本思路是每一个训练序列向前和向后分别是两个循环神经网络，并且这两层网络都连接同一个输出层。一个是沿着数据时间序列方向的网络，另一个是沿着数据时间序列反向的网络，也因此Bi-RNN的参数量是普通RNN的两倍。当前t时刻的数据输入至两个RNN网络中，两个RNN网络并不相互连接，但在输出过程中进行结合形成最终的输出。

在Bi-RNN的隐藏层中，

如图6所示，在给定时间步t的小批量输入

其中权重

连结两个方向的隐藏状态

其中权重

如图7所示，普通的神经网络通过全连接的神经元直接提取数据集中的信息特征，但由于只能提取一维向量的特征容易丢失空间信息；其次参数过多效率低下，模型训练困难；此外，大量参数容易导致网络过拟合，影响模型预测效果。因此对于图片等具有更高维度信息的数据而言，普通神经网络的表现往往较差。卷积神经网络通过引入卷积、池化等计算过程，使得神经网络获得了提取局部空间特征的能力，从而在更高级的数据分析问题中获得较高的准确率。卷积神经网络的计算过程如图所示，图像在直接输入到网络后，将进行几个阶段的卷积和池化。随后，这些操作的结果将提供给一个或多个完全连层，由最后一个完全连接层输出结果。

卷积神经网络主要包括卷积层、池化层、全连接层三个部分。卷积层为构建卷积神经网络的核心层，承担着网络中大部分的计算量。卷积层中的神经元被排列成特征映射。特征图中的每个神经元都有一个接收场，通过一组可训练权值连接到前一层的神经元邻域，也称滤波器组。对输入的图像和与习得的权重进行卷积，以计算新的特征映射，卷积结果通过非线性激活函数发送。一个特征映射中的所有神经元的权重都被限制为相等，然而，由于同一卷积层内的不同特征映射具有不同的权值，因此可以在每个位置提取多个特征值。第k个输出特征图Υ

式中输入图像x表示，与第k个特征映射相关的卷积滤波用Wk表示，此处的乘法符号*为2D卷积算子，它用于计算输入图像每个位置的滤波器模型的内积，f(·)表示非线性激活函数。非线性激活函数允许提取非线性特征。传统上采用的是s型和双曲正切函数。

卷积层通过卷积核对输入的数据进行特征提取，卷积核在输入的数据上进行滑动并与卷积核计算得到输出。计算方法如图8所示，卷积核在输入数据上进行滑动，在输入数据每个与卷积核大小相同的区域与卷积核进行计算，得到输出。

池化层一般位于卷积层的之后，其目的是降低特征映射的空间分辨率，从而实现输入扭曲和平移的空间不变，利用卷积层的运算结果进一步提取数据中的关键信息。池化层通过采用类似与卷积的操作，降低数据的空间大小来实现减少网络计算量的目的，同时也能够降低模型过拟合情况，提升模型泛化能力。常见的池化操作包括最大池化和平均池化两种。

早期的做法是使用平均池化聚合层传播图像所有小邻域中输入值的平均值到下一层。然而在近期的模型中，最大池化聚合层将接收域中的最大值传播到下一层。最大池化选择每个接收域内最大的元素：

其中，与第k个特征映射相关联的池化操作的输出用Υ

最大池化保留区域内数据最大值进行特征提取，平均池化则是通过计算区域内数据平均值进行特征提取，如图9、10所示分别是采用2×2池化核、步长为2的最大池化和平均池化示意图。

为了在网络中移动时提取更抽象的特征表示，通常将几个卷积层和池化层叠加在一起。跟随这些层的全连接层用于解释这些特征表示，并执行高级推理的功能。全连接层通过利用卷积和池化层得到的图像的特征向量，对图像进行分类。

在分类时，最后一层卷积层的特征图被矢量化，并被送入全连接层，s随后进softmax逻辑回归。该结构将卷积结构与传统的神经网络分类器相结合。它将卷积层作为特征提取器，以传统的方式对得到的特征进行分类。但是，全连通层容易发生过拟合，从而影响整个网络的泛化能力；此外，在全连接操作中需要预先设定所需参数量，即最后一层特征映射的尺寸及通道数，以保证训练的参数量不变，这与卷积层权重共享，能够适应不同尺寸的输入的特性产生矛盾。

为避免过拟合问题与消除尺寸限制，全局平均池化策略(GlobalAveragePooling，GAP)被提出并用于替代传统的全连接层。其思想是在一层中为分类任务的每个对应类别生成一个特征映射。如图11所示，通过对每个特征映射的通道求平均值，并将各通道的平均值组成向量，使最终得到的向量长度与最后一层特征映射的通道数一致，解决了全连接层存在的问题。在全连接层上的全局平均池化的一个优点是，通过加强特征映射和类别之间的对应关系，使它更适合卷积结构。因此，特征图可以很容易地解释为类别置信度图。另一个优点是在全局平均池中没有需要优化的参数，从而避免了该层的过拟合。此外，全球平均池化对空间信息进行汇总，因此对输入的空间转换具有更强的鲁棒性。

本实施例中，所述输入层输入的数据为环境冷通道平均温度、环境热通道平均温度、服务器功率、精密空调风机转速和精密空调风机转速。

本实施例中，所述卷积层通过卷积核提取时序数据中的关键信息。

本实施例中，所述全连接层将提取到的特征数据进一步进行计算汇总。

本实施例中，所述输出层采用sigmoid激活函数，输出15分钟后该服务器对应的环境热通道平均温度。

本实施例中，S4的具体方法为：将环境冷通道平均温度、环境热通道平均温度、服务器功率、精密空调风机转速和精密空调风机转速作为BiRCNN网络模型的输入，将15分钟后环境热通道平均温度当做模型输出的目标，按一定比例分为训练集和测试集进行模型训练。

本实施例中，S5的具体方法为：保存模型训练参数，将新时刻的环境冷通道温度、环境热通道温度、服务器功率、精密空调风机转速、精密空调风机转速设定输入模型，即可预测出15分钟后该服务器对应的环境热通道平均温度。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：赵永国;郭俊峰;梅永坚;詹浩钦;李学彦;
专利申请人：南方电网大数据服务有限公司;

上一篇：一种角膜直径生物测量方法及系统
下一篇：耐油胶芯材料、耐油胶芯及其制备方法和应用