一种使用模糊熵分类的能耗预测优化方法

文献发布时间：2023-06-19 19:27:02

技术领域

本发明涉及建筑能耗预测技术领域，尤其涉及一种使用模糊熵分类的能耗预测优化方法。

背景技术

根据2022年全球建筑和施工现状报告，2021年建筑物运营的二氧化碳排放量已达到历史最高水平，比上一年增加了约5％。而随着城市人口的快速增长，能源消耗和二氧化碳排放量还会不断增加，这意味着节能减排、提高建筑能源利用效率措施的实施刻不容缓。准确的建筑能耗预测是制定各种建筑节能策略的基础，建立高效、准确的建筑能耗预测模型具有十分重要的现实意义。

实现建筑能耗预测的常用方法主要包括物理模型、数据驱动方法等。基于物理模型的建筑能耗预测模型通过建筑热物理原理来实现建筑能耗的预测，具有良好的解释性，但在实际应用过程中存在操作复杂、理论知识储备要求高等问题。机器学习方法作为典型的数据驱动方法，仅依赖过往数据结合一些特征工程等处理，即可得到不错的效果，已在领域内有了广泛应用。近年来，神经网络的发展优化了特征工程步骤，使得建模过程更为简洁，预测模型的非线性拟合程度和预测精度进一步得到了提高。但是，能耗数据的预测依然是一个复杂的过程，能耗数据中存在的复杂非线性与不平稳性、神经网络对特征提取能力以及利用率不足等问题，给精准的能源预测造成了困扰，难以实现准确的预测。为了应对这些挑战，需要一个准确有效的能耗预测模型。

针对能耗数据中的不平稳性与非线性问题，有一些研究基于加性分解、季节分解或经验模态分解等，该类方法将原始的能耗序列数据进行分解，但其分解后的预测精度可能未得到有效得提升，一方面，其分解的重构性可能难以得到保证，因而对各个分解分量预测的结果进行集成时，其整体的预测误差可能不稳定；另一方面，现有的方法基于结果倒推过程，即根据预测结果的好坏来选择对各个分解分量的预测模型，这样的方式不利于实际工程实践。因此，本发明提出使用模糊熵方法计算分解分量的模糊熵，根据相邻分量模糊熵变化最大的原则将各个分量划分为高频与低频信号，再分别使用随机森林(RandomForest,RF)和提出的深度学习模型预测，最后叠加重构得到最终的预测值。

目前，现有技术中的一种建筑能耗预测方法包括以具有自适应噪声的完整集成经验模式分解(Complete Ensemble Empirical Mode Decomposition with AdaptiveNoise,CEEMDAN)方法为代表的时序分解方法。在将原始信号经过CEEMDAN分解以后，现有技术往往使用一种粗糙的分解重构预测方法，即根据预测结果的好坏来选择对各个分解分量的预测模型，这样的方式并不适用于实际的工程任务。

上述现有技术中的一种建筑能耗预测方法的缺点包括：该方法为单一的预测模型，需要详细的建筑物理参数和环境参数等详细信息，才能做出有效的预测，而实际应用时很难收集如此丰富的信息。

该方法并未整合从数据中提取的信息，更重要的信息没有得到更大的权重，因此难以保持理想的预测效果。该方法基于时序分解方法对建筑能耗数据分解后，根据预测结果的好坏来倒推各个分解分量的预测模型，不符合实际的工程应用。

发明内容

本发明的实施例提供了一种使用模糊熵分类的能耗预测优化方法，以实现有效地减小建筑能耗预测的误差。

为了实现上述目的，本发明采取了如下技术方案。

一种使用模糊熵分类的能耗预测优化方法，包括：

通过时序分解方法将原始建筑能耗数据分解为一系列分量，根据模糊熵方法计算各个分量的模糊熵的值；

依次计算相邻两个分量的模糊熵差值，基于模糊熵差值变化最大的两个分量将所有分量划分为高频分量和低频分量；

使用随机森林RF方法对所述高频分量进行预测，得到高频分量预测结果，使用基于自注意力机制优化的CNN-GRU模型对所述低频分量进行预测，得到低频分量预测结果；

将所述高频分量预测结果和所述低频分量预测结果进行重构，得到所述原始建筑能耗数据的能耗预测结果。

优选地，所述的通过时序分解方法将原始建筑能耗数据分解为一系列分量，包括：

保留原始公用建筑能耗数据集中时间戳和能耗值的列，取出时间戳列对应的行数据，将处理后的公用建筑能耗数据集为训练数据和测试数据；使用时序分解方法对训练集的公用建筑能耗数据进行分解，分解为一系列分量。

优选地，所述的根据模糊熵方法计算各个分量的模糊熵的值，包括：

按照模糊熵的原理与计算公式计算各个分量序列的模糊熵，模糊熵的定义与计算按照如下规则进行：

第一，定义序列：给定模式维数m，构造一组m维矢量X(i)，其定义如公式(1)：

X(i)＝[x(i)，x(i+1)，...，x(i+m-1)]-x

式中，x

第二，定义序列间的距离：x(i)与x(j)之间的距离

第三，定义序列的相似度：引入一个新的变量n，通过一个模糊函数

模糊函数

第四，对除自身外所有隶属度求平均，如公式(5)：

将维数m加1变为m+1，重复以上步骤，得到

定义时间序列的指标FuzzyEn(m，n，r)作为

以上的公式中，m为模式维数或称嵌入维数；r代表模糊函数边界的宽度；n决定了相似容限边界的梯度，n在模糊熵向量间相似性的计算过程中起着权重的作用。

优选地，所述的依次计算相邻两个分量的模糊熵差值，基于模糊熵差值变化最大的两个分量将所有分量划分为高频分量和低频分量，包括：

对于分量F

式中：

比较各个相邻分量之间的模糊熵差值

将分量F

优选地，所述的使用RF方法对所述高频分量进行预测，得到高频分量预测结果，包括：

对分解得到的所述高频分量中的各个分量数据，采用滑动窗口的方式，每相邻的24条数据为一个窗口，步长为1，依次向下滑动，直至整个训练集滑动完毕，每个窗口的24条数据作为训练集的一个输入样本，每个窗口下一行的能耗值数据作为训练集的标签，对测试集也按照上述训练集的处理过程，划分为输入样本与标签；

将所述训练集的输入样本和标签输入到RF方法模型，对所述RF方法模型进行学习，得到学习好的RF方法模型，将所述测试集的输入样本和标签输入到RF方法模型，得到高频分量预测结果。

优选地，所述的使用基于自注意力机制优化的CNN-GRU模型对所述低频分量进行预测，得到低频分量预测结果，包括：

对分解得到的所述低频分量中的各个分量数据，采用滑动窗口的方式，每相邻的24条数据为一个窗口，步长为1，依次向下滑动，直至整个训练集滑动完毕，每个窗口的24条数据作为训练集的一个输入样本，每个窗口下一行的能耗值数据作为训练集的标签，对测试集也按照上述训练集的处理过程，划分为输入样本与标签；

在GRU层后加一个自注意力层，得到基于自注意力机制优化的CNN-GRU模型，将所述训练集的输入样本和标签输入到所述基于自注意力机制优化的CNN-GRU模型，对所述基于自注意力机制优化的CNN-GRU模型进行学习，得到学习好的基于自注意力机制优化的CNN-GRU模型，将所述测试集的输入样本和标签输入到所述学习好的基于自注意力机制优化的CNN-GRU模型，得到低频分量预测结果。

优选地，所述的将所述高频分量预测结果和所述低频分量预测结果进行重构，得到所述原始建筑能耗数据的能耗预测结果，包括：

利用所采用的时序分解方法的原理，将所述高频分量预测结果和所述低频分量预测结果进行集成重构，得到所述原始建筑能耗数据的能耗预测结果。

由上述本发明的实施例提供的技术方案可以看出，本发明实施例使用组合预测法：RF方法预测高频信号，混合深度学习模型预测低频信号，叠加重构得到最终预测结果，合理发挥各模型的优势，以减小建筑能耗预测的误差。

本发明附加的方面和优点将在下面的描述中部分给出，这些将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种使用模糊熵分类的能耗预测优化方法的处理流程图；

图2为本发明实施例提供的一种RF模型的建模过程示意图；

图3为本发明实施例提供的一种用于预测低频分量的基于自注意力机制优化的CNN-GRU模型的建模过程示意图。

图4为本发明实施例提供的一种在UnivDorm建筑数据集的CEEMDAN分解序列上，采用RF模型和基于自注意力机制优化的CNN-GRU模型对各个分解分量的预测误差示意图。

具体实施方式

下面详细描述本发明的实施方式，所述实施方式的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样定义，不会用理想化或过于正式的含义来解释。

为便于对本发明实施例的理解，下面将结合附图以几个具体实施例为例做进一步的解释说明，且各个实施例并不构成对本发明实施例的限定。

本发明提出的深度学习模型，采用卷积神经网络(Convolutional NeuralNetwork,CNN)与门控循环单元(Gate Recurrent Unit,GRU)提取数据特征，再通过自注意力(self-attention)层进行优化，从而实现精准预测。此方法探索了信息论中的信号处理方法(模糊熵方法)与数据驱动方法(RF、CNN、GRU、self-attention)在能耗预测方面的优势，使得一些理论知识技术与建筑能耗数据方面更好地结合起来，可以有效减少能耗预测的误差，帮助相关人员提高能源利用率，降低碳排放。

本发明实施例建筑能耗数据经时序分解方法分解后，使用模糊熵方法计算各分量的模糊熵，根据相邻分量模糊熵差值最大的原则将各个分量划分为高频与低频信号，因而更加符合实际工程应用。

本发明实施例提出了一种混合深度学习模型，该混合深度学习模型使用CNN层提取建筑能耗数据的时空特征，然后使用GRU层提取时序特征，其结果经过self-attention层优化以合理分配信息权重，从而提升预测精度。

使用组合预测法：RF方法预测高频信号，提出的混合深度学习模型预测低频信号，叠加重构得到最终预测结果，合理发挥各模型的优势，以减小建筑能耗预测的误差。

本发明实施例提供的使用模糊熵分类的能耗预测优化方法的处理流程如图1所示，包含以下处理过程：通过时序分解方法将原始建筑能耗数据分解为一系列分量，根据模糊熵方法计算各个分量的模糊熵的值，计算完毕后，依次计算相邻两个分量的模糊熵差值，找到模糊熵差值变化最大的两个分量，从而将各个分量划分为高频分量和低频分量两个部分。接着，使用更善于处理高频信号的RF方法预测高频分量，使用提出的基于自注意力机制优化的CNN-GRU模型预测低频分量。最后，将高频分量和低频分量的预测值重构后作为最终的预测结果，根据真实的能耗数据对最终的预测结果进行评估。

(1)模糊熵方法和分量划分方法

熵原本是一个热力学概念，是用来描述热力学系统混乱程度的度量。随着信息论的发展，出现了以近似熵为代表的衡量时间序列复杂度的方法。近似熵一种只需要较短数据就能表现信号的动力学参数，样本熵基于近似熵进行改进，不再依赖数据长度且精度更高。而模糊熵引入相似度概念，对样本熵进行改进，在保持精度的同时计算速度更快。本发明采用模糊熵方法计算各分量序列的复杂度，序列的模糊熵值越高，代表其波形越混乱，频率也越高。模糊熵方法的定义过程如下：

首先定义序列：给定模式维数m，构造一组m维矢量X(i)，其定义如公式(1)：

X(i)＝[x(i)，x(i+1)，...，x(i+m-1)]-x

式中，x

其次，定义序列间的距离：x(i)与x(j)之间的距离

然后，定义序列的相似度：引入一个新的变量n，通过一个模糊函数

模糊函数

接着，对除自身外所有隶属度求平均，如公式(5)：

将维数m加1变为m+1，重复以上步骤，得到

经过以上准备后，定义时间序列的指标FuzzyEn(m，n，r)作为

以上的公式中，m为模式维数或称嵌入维数，一般取m＝2；r代表模糊函数边界的宽度，若该值过大则会丢失统计信息，过小则会使统计特性的效果不理想，而且会增加对结果噪声的敏感性，因此一般将r值取在0.1～0.25倍的序列标准差值；n决定了相似容限边界的梯度，n越大则梯度越大，n在模糊熵向量间相似性的计算过程中起着权重的作用，一般取值为2或3等较小的整数值。

各分量的模糊熵计算完毕后，采用如下的分量划分方法将各分量划分为高频分量和低频分量，以便于进一步的预测，充分发挥各模型的优势。

对于分量F

式中：

比较相邻分量的模糊熵差值

将分量F

(2)随机森林方法

本发明实施例使用善于处理高频信号的RF方法预测高频分量。随机森林是一种基于决策树模型的集成方法，它在接受训练集的数据时，会多次地从其输入特征(即历史的能耗数据)中随机地抓取部分特征，采用随机的方式生成一组组树状图的结构，同时自动从训练集的特征和标签中总结出决策规则，这些树状图结构即为决策树，其中每棵决策树模型都互相独立，且生成的过程互不干扰。最后，在最终的能耗预测汇总中，该方法为这些互相独立的决策树模型的预测结果赋予相同的权重，取这些决策树的预测结果的平均值作为最终预测值。简而言之，随机森林方法使用训练集数据随机、多次地构建多棵决策树，对各个决策树模型的建模结果汇总，从而获取比单一的决策树模型更好的预测表现。

图2为本发明实施例提供的一种RF模型的建模过程示意图。作为集成方法的代表，随机森林基于决策树，每次随机抓取部分特征并以随机模式生成决策树，此过程重复多次，生成多颗决策树，最后集成取均值得到最终的预测结果，从而取得比单个模型更好的回归或分类表现。

本发明中选用MSE(Mean Square Error，均方误差)作为衡量随机森林模型的分枝质量的指标，MSE在公式(10)中被定义，建模的目标是求取最小MSE。

式中，y

(3)基于自注意力机制优化的CNN-GRU模型

图3为本发明实施例提供的一种用于预测低频分量的基于自注意力机制优化的CNN-GRU模型的建模过程示意图。本发明提出基于自注意力机制优化的CNN-GRU模型，以对建筑能耗数据的低频分量进行预测。采用一维卷积层提取数据中不同特征值之间的空间联系，进而弥补基于RNN(Recurrent Neural Network，循环神经网络)的模型无法捕获数据时空特征的缺点，同时一维卷积后提取出的特征仍然保留了时序性。接着选用基于RNN的变体——GRU网络来捕捉时间先后顺序关系与长期依赖，GRU优化了原始RNN可能出现的梯度消失问题，也比LSTM的计算参数更少，收敛速度更快，但GRU网络只能对输入生成固定长度的分量，不会对信息的重要程度进行区分。因此，本发明还提出在GRU层后加一个自注意力层，自注意力通过对GRU网络的输出序列进行变换，提高GRU网络中重要时间步的作用，从而进一步降低模型预测误差。

自注意力层的加入保留了GRU编码器对输入序列的中间输出结果，然后训练一个模型来对这些输入进行选择性的学习，并在模型输出时将输出序列与之进行关联，即实现了序列的全依赖，完成了注意力的特征提取，输出为GRU网络输出分量的加权平均和。最后通过简单的全连接层使整个神经网络输出为指定维度。

(4)原始建筑能耗数据的预处理

数据归一化是机器学习应用中最常用的缩放技术，常用的方法有Min-Max归一化和Z-score归一化等。本发明采用Z-score归一化方法对原始建筑能耗数据进行缩放，通过移除均值并缩放到单位方差来标准化特征。它根据训练集中样本数据的均值和标准差对每个特征进行独立的中心化和缩放，然后利用存储的均值和标准差对数据进行后续的进一步变换，Z-score归一化的计算公式如公式(11)所示。

对于序列x

其中，

本发明实施例提供的使用模糊熵分类的能耗预测优化方法的的具体实现过程包括：

第一步：对公用建筑能耗数据集(每小时能耗的导出数据)作初步处理，去掉与本实验无关的列，仅保留时间戳和能耗值的列，取出“时间戳列中属于3、4、5这三个月”的行数据。

第二步：将处理后的数据集另存为csv文件，作为本实验所用数据集。

第三步：在这一阶段，将数据分为训练数据和测试数据，以前80％的数据作为训练集，后20％为测试集。

第四步：实验使用Pycharm工具在Python 3.8环境下进行。使用时序分解方法对训练集的能耗序列数据进行分解，得到一系列分量。

第五步：根据模糊熵方法的原理，计算各个分量的模糊熵及相邻分量的模糊熵差值。

第六步：比较相邻分量的模糊熵差值，选取模糊熵差值最大的两个分量(记为F

第七步：对分解得到的各个分量数据，采用滑动窗口的方式，每相邻的24条数据为一个“窗口”，步长为1，依次向下滑动，直至整个训练集滑动完毕。则每个“窗口”的24条数据作为训练集的一个输入样本，每个窗口下一行的能耗值数据作为训练集的标签。测试集同以上处理，划分为输入样本与标签。

第八步：初始化两个缩放器，分别用于缩放输入样本数据和标签数据。使用训练集数据准备缩放器以后，缩放训练集数据和测试集数据，以防止数据泄露。(数据泄露指预知了测试集信息，从而得到不正确的结论的问题)

第九步：对高频分量，使用RF模型根据其中每个分量的训练集的输入样本和标签进行学习和训练，然后在测试集上进行预测。

第九步：对低频分量，使用本发明提出的自注意力机制优化的CNN-GRU模型学习每个分量的训练集数据的有效信息，并在在测试集上预测。

第十步：将每个分量的预测模型的预测值使用之前用到的缩放器进行反缩放，记录各个反缩放的值作为模型的预测结果。

第十一步：对记录的预测结果进行重构(例如，若使用加法模型分解时序，则将各分量的预测结果求和)，作为最终的预测结果。

第十二步：对比预测结果与测试集的真实标签，评估模型的预测性能，至此所有工作已结束。

为验证本发明的有效性，以下实验以某大学的学生宿舍的能耗数据集——UnivDorm为例，采用CEEMDAN方法作为本实验的时序分解方法，按照本发明的分量划分方法，依次计算相邻分量的差值后，选择其中最大的差值，即

接着，本发明根据过往的研究结论，对高频分量，选取更合适的RF模型来预测；对低频分量，则采用以上叙述的基于自注意力机制优化的CNN-GRU模型来预测。为验证该方法的有效性，使用以上两个模型分别对UnivDorm数据集分解后的各个分量进行预测，其结果如图4所示。

可以看出，RF模型对IMF

表1

进一步的实验在在三个建筑能耗数据集上，对比了所提出的基于自注意力机制优化的CNN-GRU模型与自回归模型(Auto Regressive,AR)、季节性自回归模型(SeasonalAuto Regressive,SAR)、基于CEEMDAN分解的RF模型、基于CEEMDAN分解的GRU模型的预测误差，评估指标为平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Squared Error,RMSE)。实验结果如表1所示。可以看出，本发明提出的模型优于AR与SAR模型，拥有最低的预测误差，说明此模型很好地学习了数据中的信息，有效地提高了建筑能耗预测的精度。

综上所述，本发明实施例方法的有益效果如下：

在三个数据集上的广泛实验证明了本发明能够仅需历史的能耗数据，即可提供出色的泛化能力和预测性能。

在UnivDorm数据集上分别使用RF和基于自注意力机制优化的CNN-GRU模型模型进行的预测实验表明，本发明所提出的组合预测法具有合理性与有效性。

本发明提出的模糊熵方法和根据相邻分量模糊熵变化最大的分量划分原则，便于发挥各预测模型的优势，也更加符合实际的工程应用。

本领域普通技术人员可以理解：附图只是一个实施例的示意图，附图中的模块或流程并不一定是实施本发明所必须的。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置或系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：谭志;焦英浩;王闯胜;李翔宇;
专利申请人：北京建筑大学;北京合众慧能科技股份有限公司;

上一篇：冷原子超高真空混合气体分压力测量装置及方法
下一篇：一种可解释的钻井参数智能优化方法和装置