掌桥专利:专业的专利平台
掌桥专利
首页

一种基于图神经网络的园区碳排放预测方法及系统

文献发布时间:2024-04-18 19:58:26


一种基于图神经网络的园区碳排放预测方法及系统

技术领域

本发明涉及产业园区碳排放评价技术领域,尤其是涉及一种基于图神经网络的产业园区碳排放量预测方法及系统。

背景技术

产业园区的基础设施是园区的重要组成部分,园区内的能源与物质的应用、传输绝大部分都是在基础设施上进行,园区的碳排放绝大部分来自基础设施的排放。因此,对园区的碳排放量进行相关精确计算和准确预测,需要对来自基础设施的多种类型的复杂时间序列数据进行精确的统计与运用。

时间序列数据是按照时间排序的一组随机变量,它通常是在相等间隔的时间段内依照给定的采样率对某种潜在过程进行观测的结果数据,本质上反映的是某个或者某些随机变量随时间不断变化的趋势。时间序列预测是指根据过去的数据来预测未来的趋势和变化。

经典的时间序列预测模型,包括移动平均模型(Moving Average,MA)、自回归模块(Auto Regressive,AR)、自回归移动平均模型(Auto Regressive Moving Average,ARMA)等。近几年,基于神经网络的时间序列预测方法也变得越来越流行,这些方法包括循环神经网络(RNN)、长短时记忆网络(LSTM)和卷积神经网络(CNN)等。

通过经典的时间序列模型和基于神经网络的时间序列预测方法预测园区的碳排放量,需要基于园区单独基础设施的历史时间序列碳排放数据进行预测,并由此汇总全部的园区基础设施的碳排放预测数据。这种方法忽略了园区内不同基础设施之间的相互作用和耦合关系,无法准确预测碳排放量的分布和影响范围。因此,这类方法的预测精度和准确性存在一定的局限性。因此,在现有技术中,常用的时间序列预测模型难以考虑园区基础设施的连接和关系,无法准确预测碳排放量的分布和影响范围。

发明内容

本发明的目的是为了解决上述现有技术所存在问题,而提供一种基于图神经网络的园区碳排放预测方法及系统。

本发明的目的可以通过以下技术方案来实现:

作为本发明的第一方面,提供一种基于图神经网络的园区碳排放预测方法,包括以下步骤:

获取园区拓扑数据,构建拓扑数据集;

搭建用于生成园区图结构网络的GraphRNN模型,使用拓扑数据集对GraphRNN模型进行训练,得到用于生成园区图结构网络的图结构生成模型;

获取园区各基础设施的碳排放时间序列数据,构建碳排放数据集;

搭建用于碳排放预测的STGCN模型;基于图结构生成模型生成园区图结构邻接矩阵,并依照园区图结构网络中与基础设施对应的节点将碳排放数据集中时间序列数据组成特征矩阵,对STGCN模型进行训练,得到用于园区碳排放预测的碳排放预测模型;

获取实时的园区基础设施碳排放量,输入碳排放预测模型,得到园区各基础设备碳排放预测量。

进一步的,所述GraphRNN模型结构包括依次设置的输入层、编码器、注意力机制GAT、GraphRNN、损失函数和输出层;所述GraphRNN包括节点生成RNN和边生成RNN;

其中,所述输入层用于输入训练图信息;编码器用于将训练图信息转换成邻接矩阵;注意力机制GAT用于为邻接矩阵中的节点加权;节点生成RNN用于生成训练图的拓扑结构;边生成RNN用于生成图的边及边的信息;损失函数用于衡量预测结果与真实结果之间的图结构相似程度;输出层输出的是由邻接向量组成的邻接矩阵,并由邻接矩阵得到生成的图结构。

进一步的,所述GraphRNN模型所使用的RNN为门控循环单元GRU。

进一步的,所述GraphRNN模型的损失函数使用基于图结构的图结构相似性GSS损失函数。

进一步的,所述GraphRNN模型构建的具体步骤包括:

输入的训练图信息经由编码器编码,将图结构表示为邻接矩阵A和特征矩阵X的组合;其中,邻接矩阵A是一个二元矩阵,表示节点之间是否有边相连,特征矩阵X包含了每个节点的特征向量;

通过注意力机制GAT对邻接矩阵A和特征矩阵X进行编码得到隐藏状态h;通过输出层将隐藏状态h转化为新的邻接矩阵A′和特征矩阵X′,从而生成一个新的图结构;

GraphRNN模型将图表示为G,其概率分布如下:

其中,G=(V,E,X)表示一个图结构,V是节点集合,E是边集合,X是节点的特征矩阵,t是图生成的步数,A

p(A

p(X

进一步的,所述邻接矩阵A′和特征矩阵X′的计算步骤具体包括:

对于节点i,GAT通过一个可以学习的权重向量w计算出其与邻居节点j之间的注意力系数α

GAT将注意力系数α

将每个节点的新特征向量h

将每个节点的注意力系数α

进一步的,所述STGCN的模型结构包括依次设置的输入层、ST-Conv Block层、GCN-Block层和输出层;

其中,所述输入层用于输入邻接矩阵和特征矩阵;ST-Conv Block层用于处理时序数据;GCN-Block层用于处理空间数据;输出层输出的是某时刻的时空预测数据;损失函数使用均方根误差,用于衡量预测结果与真实结果之间的图结构相似程度。

进一步的,所述STGCN模型的使用He初始化方法初始化参数矩阵,采用高斯分布来初始化权重参数,方差为

进一步的,所述ST-Block层由多个一维卷积层和残差块组成,用于处理时序数据;其中,所述一维卷积层用于提取时序数据的特征,残差块用于防止信息的损失;

所述GCN-Block层由多个图卷积层和残差块组成,用于处理空间数据;其中,所述图卷积层用于在图结构上对节点进行卷积操作,从而提取空间特征;而残差块用于防止信息的损失。

作为本发明的第二方面,提供一种基于图神经网络的产业园区碳排放预测系统,所述系统包括:拓扑数据集获取模块,获取园区拓扑数据,构建拓扑数据集;

图结构生成模型构建模块:搭建用于生成园区图结构网络的GraphRNN模型,使用拓扑数据集对GraphRNN模型进行训练,得到用于生成园区图结构网络的图结构生成模型;

碳排放数据集获取模块,获取园区各基础设施的碳排放时间序列数据,构建碳排放数据集;

碳排放预测模型构建模块:搭建用于碳排放预测的STGCN模型;基于图结构生成模型生成园区图结构邻接矩阵,并依照园区图结构网络中与基础设施对应的节点将碳排放数据集中时间序列数据组成特征矩阵,对STGCN模型进行训练,得到用于园区碳排放预测的碳排放预测模型;

碳排放预测模块:获取实时的园区基础设施碳排放量,输入碳排放预测模型,得到园区各基础设备碳排放预测量。

与现有技术相比,本发明具有以下有益效果:

1)本发明将图神经网络应用于园区碳排放量预测中,通过收集园区的拓扑图结构数据和碳排放时间序列数据,基于GraphRNN对园区拓扑图结构数据进行建模,利用STGCN进行数据训练和预测,从而实现对园区碳排放量的准确预测。

2)本发明针对图结构不唯一性表示、高维以及给定图的边之间存在复杂且非局部的依存关系等问题。采用GraphRNN,通过自回归的方式添加新的节点和边,用以捕获图中所有节点和边的复杂联合概率,在维护图的状态的基础上,生成新的节点,并未新生成的节点生成新的边。通过GraphRNN学习园区内目标对象的分布获得的图生成模型,可解决不同的图可表达同一图结构的问题,构建与真实园区保持一致的结构化网络图。

3)本发明采用基于STGCN的碳排放预测模型,以园区图结构网络为基础,可以有效地考虑园区基础设施之间的时空关系,提高了预测精度。

附图说明

图1为本发明一种基于图神经网络的园区碳排放预测方法的流程图;

图2为本发明中所构建用于生成园区图结构网络的GraphRNN模型结构示意图;

图3为本发明中所构建用于碳排放预测的STGCN的模型结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1作为本发明的第一种实施方式,本实施例提供了一种结合GraphRNN和STGCN的园区碳排放预测方法,以解决常用的时间序列预测模型难以考虑园区基础设施的连接和关系,无法准确预测碳排放量的分布和影响范围的问题。本发明方法通过收集产业园区的拓扑数据和碳排放时间序列数据,基于GraphRNN对园区拓扑数据的建模,利用STGCN进行数据训练和预测,从而实现对产业园区碳排放量的准确预测。如图1所示,本发明方法各步骤的具体操作内容如下:

S1.获取园区拓扑数据,并制作为数据集(Graph-structured carbon emissiondata);

记录园区具体基础设施的属性信息,包括基础设施的名称、类型以及位置信息。同时记录园区具体基础设施的输入或输出类型数据,根据数据的因果关系,记录基础设施之间的连接关系,并做好标注,完后数据集的构建。

S2.搭建用于生成园区图结构网络的GraphRNN模型;

本发明中构建的GraphRNN模型结构如图2所示,由输入层、编码器、注意力机制(Graph Attention Network,GAT)、GraphRNN包括节点生成RNN和边生成RNN、损失函数和输出层。其中,输入层用于输入训练图信息;编码器用于将训练图信息转换成邻接矩阵;注意力机制GAT为邻接矩阵中的节点加权,以便更好的获得节点与边的信息;节点生成RNN生成训练图的拓扑结构;边生成RNN生成图的边及边的信息;损失函数使用的是基于图结构的(Graph Structural Similarity,GSS),其可以用于衡量预测结果与真实结果之间的图结构相似程度;输出层输出的是由邻接向量组成的邻接矩阵,可由此得到生成的图结构。本发明中构建的GraphRNN模型所使用的RNN为门控循环单元(Gated Recurrent Unit,GRU),GRU为RNN的变体,可以缓解RNN存在梯度爆炸或消失问题。

搭建GraphRNN模型的具体实现步骤如下:

S2.1.输入的训练图信息x经由编码器编码,将图结构表示为邻接矩阵A和特征矩阵X的组合,其中A是一个二元矩阵,表示节点之间是否有边相连,X包含了每个节点的特征向量。

S2.2.通过注意力机制GAT对邻接矩阵A和特征矩阵X进行编码得到隐藏状态h。通过输出层将隐藏状态h转化为新的邻接矩阵A′和特征矩阵X′,从而生成一个新的图结构。GAT可以增强GraphRNN模型对图结构中重要节点和边的关注度。

对于节点i,GAT通过一个可以学习的权重向量w计算出其与邻居节点j之间的注意力系数α

其中,h

接着,GAT将注意力系数α

其中,σ表示激活函数,w表示可以学习的权重向量,N

接着,将每个节点的新特征向量h

X′=[h

其中,N为节点数。

最后,将每个节点的注意力系数α

A

其中,A′是一个N×N的邻接矩阵。

S2.3.GraphRNN模型将图表示为G,其概率分布如下:

其中,G=(V,E,X)表示一个图结构,V是节点集合,E是边集合,X是节点的特征矩阵,t是图生成的步数,A

p(A

p(X

S3.使用数据集对GraphRNN模型进行训练,得到用于生成园区图结构网络的图结构生成模型。

GraphRNN模型训练的具体步骤如下:

S3.1.确定训练轮次epochs,批量大小batchsize,迭代次数iterations=样本量/batchsize。

S3.2.for epochs=1to epochs do

a.for iteration=1to iterations do

输入训练数据集中一个batchsize的数据,将其送入本发明构建的GraphRNN模型,经过编码器编码,和GraphRNN解码;

使用GSS损失函数计算损失,并通过梯度下降法更新模型参数。

S3.3.训练结束,得到模型参数,包括GAT的参数和GraphRNN的参数

S4.获取园区各基础设施的碳排放时间序列数据,并制作为碳排放数据集;

记录在一段时间内的相等时间间隔的园区具体基础设施的碳排放时间序列数据,包括具体的年月日时分秒数据、基础设施的碳排放量、基础设施的类型。同时,对数据进行空缺值处理等数据预处理操作,完成数据集的构建。

S5.搭建用于碳排放预测的STGCN模型;

本发明中构建的STGCN的模型结果如图3所示,由输入层、ST-Conv Block层、GCN-Block层和输出层组成。其中,输入层输入邻接矩阵和特征矩阵;ST-Conv Block层是由多个一维卷积层和残差块组成的,用于处理时序数据;GCN-Block是由多个图卷积层和残差块组成的,用于处理空间数据;输出层输出的是某时刻的时空预测数据;损失函数使用的是均方根误差(Root Mean Square Error,RMSE)方法,用于衡量预测结果与真实结果之间的图结构相似程度,可以考虑到时间序列特征的相关性,从而提高模型的预测精度。

碳排放预测公式如下:

其中,e

碳排放预测,可以看作是经典的时间序列预测问题,以上式表示,即在给定过去第M个时间脚步上的观测数据的条件下,预测接下来未来第H个时间脚步上最可能的园区碳排放量(单位tCO2e)。

搭建用于碳排放预测的STGCN模型的具体实现步骤如下:

S5.1.输入训练数据,将图结构表示为邻接矩阵A和特征矩阵X的组合,其中A是一个二元矩阵,表示节点之间是否有边相连,X包含了每个节点的特征向量,即各个节点的时间序列数据。

S5.2.STGCN使用适合ReLU函数性质的He初始化方法。He参数初始化方法可以有效地加速模型的收敛和提高模型的准确率。它采用高斯分布来初始化权重参数,方差为

其中,W表示权重参数,n表示权重矩阵的输入维度。

S5.3.构建ST-Block层,ST-Block是由多个一维卷积层和残差块组成的,用于处理时序数据。一维卷积层可以提取时序数据的特征,残差块可以防止信息的损失。其公式如下:

X

其中,X

S5.4.构建GCN-Block层,GCN-Block是由多个图卷积层和残差块组成的,用于处理空间数据。图卷积层可以在图结构上对节点进行卷积操作,从而提取空间特征,而残差块可以防止信息的损失。其公式如下:

其中,X

S5.5.输出层包括一个时域卷积层和一个全连接层。

时域卷积层的卷积核大小为

全连接层为

S5.6.损失函数是RMSE方法,其可以用于衡量预测结果与真实结果之间的差异。该损失函数可以考虑到时间序列特征的相关性,从而提高模型的预测精度。其公式为:

其中,n代表样本数量,Y

S6.使用数据集碳排放,基于园区图结构网络生成园区图结构邻接矩阵,并将碳排放数据集中时间序列数据组成特征矩阵;对STGCN模型进行训练,得到用于园区碳排放预测的碳排放预测模型。

STGCN进行训练的具体步骤如下:

S6.1.从GraphRNN获得园区图结构网络,并生成园区图结构邻接矩阵。

S6.2.收集园区基础设施时间序列数据,依照园区图结构网络中与基础设施对应的节点,将时间序列数据转成特征向量,并组成特征矩阵。

S6.3.使用He参数初始化方法,初始化参数矩阵。

S6.4.确定训练轮次epochs,批量大小batchsize,迭代次数iterations=样本量/batchsize。

S6.5.for epochs=1to epochs do

a.for iteration=1to iterations do

训练数据集中一个batchsize的数据,将其送入本发明构建的STGCN

使用RMSE损失函数计算损失,并通过梯度下降法更新模型参数

S6.6.训练结束,得到模型参数

S7.获取实时的基础设施碳排放量,通过碳排放预测模型,同时得到一定时间间隔后的园区各基础设备碳排放预测量。并将此预测值通过碳排放预测模型,得到下一时间间隔后的园区各基础设施碳排放预测量,至某一时刻前,重复此步骤。

本发明的主要改进点包括:

使用基于GraphRNN的生成模型,可以有效地生成符合园区拓扑结构的园区图结构网络,同时解决图结构的非唯一性问题;

采用基于STGCN的碳排放预测模型,以园区图结构网络为基础,可以有效地考虑园区基础设施之间的时空关系,提高了预测精度。

使用图神经网络应用于产业园区碳排放量预测中,通过收集产业园区的拓扑图结构数据和碳排放时间序列数据,基于GraphRNN对园区拓扑图结构数据进行建模,利用STGCN进行数据训练和预测,从而实现对产业园区碳排放量的准确预测;

本发明的GraphRNN模型所使用的RNN为门控循环单元(Gated Recurrent Unit,GRU),GRU为RNN的变体,可以缓解RNN存在梯度爆炸或消失问题;

本发明的GraphRNN引入注意力机制Graph Attention Network(GAT)模型,使模型能够更好地学习图数据中的关键信息,生成更优质的图网络;

本发明训练GraphRNN时,使用的损失函数使用基于图结构的损失函数图结构相似性(Graph Structural Similarity,GSS),其可以用于衡量预测结果与真实结果之间的图结构相似程度。该损失函数可以考虑到时空图结构的特点,从而提高模型的预测精度;

本发明训练STGCN模型时,使用的损失函数使用均方根误差(Root Mean SquareError,RMSE)方法,其可以用于衡量预测结果与真实结果之间的差异。该损失函数可以考虑到时间序列特征的相关性,从而提高模型的预测精度。

本发明训练STGCN时,不是根据已有经验设置模型参数,而是使用适合ReLU函数性质的He初始化方法。

实施例2

作为本发明的第二种实施方式,本实施例还提供一种结合GraphRNN和STGCN的园区碳排放预测系统,包括:

拓扑数据集获取模块,获取园区拓扑数据,构建拓扑数据集;

图结构生成模型构建模块:搭建用于生成园区图结构网络的GraphRNN模型,使用拓扑数据集对GraphRNN模型进行训练,得到用于生成园区图结构网络的图结构生成模型;

碳排放数据集获取模块,获取园区各基础设施的碳排放时间序列数据,构建碳排放数据集;

碳排放预测模型构建模块:搭建用于碳排放预测的STGCN模型;基于图结构生成模型生成园区图结构邻接矩阵,并依照园区图结构网络中与基础设施对应的节点将碳排放数据集中时间序列数据组成特征矩阵,对STGCN模型进行训练,得到用于园区碳排放预测的碳排放预测模型;

碳排放预测模块:获取实时的园区基础设施碳排放量,输入碳排放预测模型,得到园区各基础设备碳排放预测量。

GraphRNN模型结构包括依次设置的输入层、编码器、注意力机制GAT、GraphRNN、损失函数和输出层;所述GraphRNN包括节点生成RNN和边生成RNN;

其中,所述输入层用于输入训练图信息;编码器用于将训练图信息转换成邻接矩阵;注意力机制GAT用于为邻接矩阵中的节点加权;节点生成RNN用于生成训练图的拓扑结构;边生成RNN用于生成图的边及边的信息;损失函数用于衡量预测结果与真实结果之间的图结构相似程度;输出层输出的是由邻接向量组成的邻接矩阵,并由邻接矩阵得到生成的图结构。

GraphRNN模型所使用的RNN为门控循环单元GRU,GRU为RNN的变体,可以缓解RNN存在梯度爆炸或消失问题;GraphRNN引入注意力机制GAT模型,使模型能够更好地学习图数据中的关键信息,生成更优质的图网络。

STGCN的模型结构包括依次设置的输入层、ST-Conv Block层、GCN-Block层和输出层;

其中,所述输入层用于输入邻接矩阵和特征矩阵;ST-Conv Block层用于处理时序数据;GCN-Block层用于处理空间数据;输出层输出的是某时刻的时空预测数据;损失函数使用均方根误差,用于衡量预测结果与真实结果之间的图结构相似程度。

训练STGCN模型时,使用的损失函数使用均方根误差RMSE方法,其可以用于衡量预测结果与真实结果之间的差异。该损失函数可以考虑到时间序列特征的相关性,从而提高模型的预测精度,并且训练STGCN时,不是根据已有经验设置模型参数,而是使用适合ReLU函数性质的He初始化方法。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。

相关技术
  • 一种基于图神经网络的空域碳排放短期预测方法及系统
  • 一种基于神经网络模型的碳排放预测方法及系统
技术分类

06120116489347