掌桥专利:专业的专利平台
掌桥专利
首页

基于长短期时间序列网络的换热站超短期热负荷预测方法

文献发布时间:2023-06-19 11:39:06


基于长短期时间序列网络的换热站超短期热负荷预测方法

技术领域

本发明涉及集中供热技术领域,尤其涉及一种换热站超短期热负荷预测的方法。本发明是基于数据驱动的方法在集中供热过程热负荷预测领域的具体应用。

背景技术

随着中国经济社会的不断发展,城镇化水平的不断提升,集中供热在中国北方城市与农村逐渐覆盖。据国家统计局公布,截止2018年,我国城市集中供热面积已达87.80亿平方米,较2017年底,增长5.67%。集中供热消耗的化石燃料会造成严重的环境污染和雾霾,为实现节能环保,避免供热不均,热负荷预测成为重要的研究问题。并且通过调研一家供热公司得知,该供热公司供热面积约350万平方米,如果在供热过程中降低0.5℃,则可以节省近千万元。所以分别从节能环保和经济效益的角度出发,热负荷预测都具有非常重要的现实意义。集中供热系统是一个非线性、大之后系统,其中包含诸多的阀门和泵,很难建立精准的数学模型,因此,基于数据驱动的方法更适用于热负荷预测领域。

本发明主要为换热站超短期热负荷预测任务而设计。换热站直接连接热用户,并对热量进行分配和配送,而且供热公司直接进行调控的也是换热站。在现实生活中,换热站与小区热用户距离较近,其供热的滞后周期接近于1小时。所以,以换热站和超短期分别作为研究的对象和时间维度将具有较好地现实意义。

传统的热负荷预测方法主要有灰色预测、时间序列预测和回归等方法,随着智能算法的不断发展,也有很多机器学习和神经网络的算法应用到该领域来,比如:支持向量回归(Support Vector Regression,SVR)、循环神经网络(Recurrent Neural Network,RNN)、长短期记忆神经网络(Long Short-Term Memory,LSTM)等。但以上方法均是从热负荷的时序特性上出发的,当输入的序列较长时候,由于梯度消失,很容易造成信息的丢失,故而会丢失较长期信息的相关性,预测的精度有待提升。

发明内容

为了解决神经网络在处理长序列信息容易丢失较长期信息的问题,本发明提供一种长短期时间序列网络(Long Short-term Time-series Network,LSTNet)模型,来应对该问题。热负荷是典型的时间序列问题,而且逐时热负荷带有周期性。本发明提供的长短期时间序列网络模型利用这一特性,引入循环跳跃的思想,可以有效解决信息丢失的问题。模型首先利用随机森林(Random Forest,RF)算法对特征进行筛选降维;然后建立基于长短期时间序列网络的热负荷预测模型,通过卷积层和循环层捕捉长短期的特征信息,然后引入循环跳跃层这一概念,捕捉更长期的特征信息,同时利用自回归算法为模型添加线性处理能力,增强了模型的鲁棒性。

本发明采用了如下的技术方案及实现步骤:

S1选取一定时间段的气象数据和供热数据,构建数据集作为输入变量X

S2对数据进行预处理,其中包括对缺失值、离群值的识别与修正,并对数据进行标准化处理;

S3采用RF方法对输入变量进行筛选,对数据集进行降维操作得到X

S4将训练集逐条输入到LSTNet模型中,训练模型的权重和偏置:

S401首先采用卷积层捕捉短期局部的特征信息;

S402接着利用循环层捕捉长期宏观信息,输出为h

用序列的周期特性,捕捉更长期的信息,输出为h

S403然后通过全连接层的方式,连接循环层和循环跳跃层的输出,得到输出为y

S404然后结合AR过程的输出,为预测添加线性成分,同时使模型可以捕捉到输入的尺度变化,增强模型的鲁棒性,得到输出为y

S405输出模块是将神经网络部分的输出和AR模型的输出进行了整合,得到最终的预测模型。

S5将测试集逐条输入到训练好的LSTNet模型中,得到预测值

有益效果

与现有技术相比,本发明充分考虑了超短期热负荷的周期特性,通过引入循环跳跃层的概念,来弥补常规神经网络由于梯度下降造成的信息丢失的问题。不同于传统的神经网络算法,本发明充分考虑了逐时热负荷的周期特性,该特性更具有代表性,可以更好的完成对超短期热负荷的预测任务。

附图说明

图1为本发明模型结构图;

图2为本发明模拟热负荷数据展示图;

图3为本发明LSTNet模型预测结果展示图;

具体实施方式

下面结合本发明的附图和具体实施例对本发明技术方案进行详细的描述,以使发明的技术特征和优点更为明显。

S1选取尽可能多的相关特征变量数据,其中可包括气象数据、运行工况数据和热负荷数据等,以构建热负荷数据集,得到X

S2在构建完数据集后,对数据进行预处理操作:

S201对缺失值,即数据为0或空的值进行补偿,采用下式来计算:

x

式中x

S202针对离群值,即超过规定范围3倍以上的值,将该值作为缺失值处理;

S203对每一维输入变量进行标准化处理,采用的计算公式为:

式中y

S3利用RF算法对特征变量进行筛选降维,利用随机森林进行特征重要性评估的思想比较简单,主要是看每个特征在随机森林中的每棵树上做了多大的贡献,然后取平均值,最后比较不同特征之间的贡献大小。其中某个特征x的重要性表示为IMP,其计算方法如下:

S301对于随机森林中的每一个决策树,使用相应的袋外数据(Out Of Bag,OOB)来计算它的袋外数据误差,记为OOBError1,其计算公式如下所示:

其中O为袋外数据总数,以袋外数据作为输入,带入随机森林分类器,利用分类器给这O条数据进行分类比较,统计分类错误的数目,设为X。

S302随机地对袋外数据所有样本的特征x加入噪声干扰,再次计算它的袋外数据误差,记为OOBError2;

S303假设随机森林中有N棵树,则特征x的重要性IMP如公式1所示:

给某个特征随机加入噪声之后,袋外的准确率大幅度降低,则说明这个特征对于样本的分类结果影响很大,也就是说它的重要程度比较高。

本发明利用随机森林对特征变量的重要性进行降序排序,然后确定删除比例,从当前的特征变量中剔除相应比例不重要的指标,从而得到一个新的特征集,新特征集的特征为X

S4将训练集数据按照时间序列逐条输入到LSTNet模型中,训练模型的权重和偏置,LSTNet模型整体结构如图1所示:

S401网络的第一模块即为卷积层,该层的作用就是提取特征,捕捉局部短期的特征信息。卷积层模块由多个滤波器组成,其中宽度为ω,高度为m,并且m与特征的个数相同。则第i个滤波器的输出为:

h

其中输出的h

S402卷积层模块输出同时输入到第二模块的循环层和循环跳跃层。循环层所采用的是门控循环单元(Gate Recurrent Unit,GRU),其中使用ReLU作为隐式更新的激活函数。则t时刻单元的隐藏状态输出h

其中z

GRU网络可以捕捉到长期的历史信息,但是由于梯度消失,不能保存之前所有信息,故而会丢失较长期信息的相关性。在LSTNet模型中,通过一种跳跃的思想来解决该问题,这种思想基于周期数据,通过周期p这一超参数,获得非常远的时间信息。在预测t时刻时,可以将上一周期、上上一周期以及更早周期的该时刻数据信息拿来预测。由于一个周期的时间较长,这种类型的依赖关系很难被循环单元捕捉到,所以引入一个具有跳跃连接的循环网络结构,可以扩展信息流的时间跨度,以获得更长期的数据信息。其在t时刻的输出h

该层的输入和循环层相同,均是卷积层的输出。其中p为跳过隐藏单元的数量,即为周期。一般周期是很容易确定的,根据工程经验或者数据趋势来判断,如果数据是非周期性或周期性是动态变化的情况,可以引用注意力机制方法来动态更新周期p。

S403为连接上面两层,模型采用全连接层的方式来组合两个层的输出。该层在t时刻的输出为:

其中W

S404在实际的数据集中,输入的尺度在发生着非周期的变化,但是由于神经网络对输入输出的尺度变化不敏感,故而该问题会显著降低神经网络模型的预测精度。所以在模型中,为了及解决这一不足,在模型中添加了线性部分,并采用经典的自回归(Autoregressive model,AR)模型,增强模型的鲁棒性。则AR模型在t时刻的输出y

其中q

S405输出模块是将神经网络部分的输出和AR模型的输出进行了整合,得到了LSTNet模型的最终输出

其中

S406在模型训练过程中,采用均方误差(Mean Square Error,MSE)函数作为损失函数,其公式为:

式中n为有效数据数目,

S5将测试集逐条输入到训练好的LSTNet模型中,得到预测值

为了验证本方法的有效性,我们使用一个供暖季的正常数据进行验证。数据由EnergyPlus软件模拟河南郑州一小区换热站120天供暖过程得出,数据图如图2所示。采用AR、整合移动平均自回归模型(Autoregressive Integrated Moving Average,ARIMA)、MLR、SVR、GRU等方法做对比实验,实验结果如图3所示,各模型评价指标结果如表1所示。

表1热负荷预测各模型评价指标比较

从上面的实验结果可以看出,针对逐时热负荷预测,本文所利用的LSTNet模型预测性能优于其他模型,在R-square指标上比其他模型更接近于1。模型中LSTNet模型相对于GRU模型,RMSE降低了36.7%,MAE降低了28.5%,模型精度显著提高。

相关技术
  • 基于长短期时间序列网络的换热站超短期热负荷预测方法
  • 基于串联长短期记忆循环神经网络的供热负荷预测方法
技术分类

06120113007242