一种基于时间序列的电力消费预测方法及系统
文献发布时间:2023-06-19 13:49:36
技术领域
本申请涉及电力预测技术领域,尤其涉及一种基于时间序列的电力消费预测方法及系统。
背景技术
电力是人们生活的基本保障,电力供应在经济发展中起着至关重要的作用。如果电力供应大于需求,会导致资源浪费,不符合我国建立资源节约、环境友好行社会的政策,如果电力供应小于需求,会影响正常的生产生活,随着经济的快速增长,我国曾几次出现电力供应不足导致的大面积停电现象,如果不能及时采取正确有效的措施,可能会导致经济发展滞缓。
为了保证电力的发展适应社会发展的需求,需要把握电力消费变化的规律,合理地对电力需求进行预测,进而指导电力规划和电力建设,实现资源合理规划与配置,还可以为将来的经济和电力政策提供参考。但是传统的电力需求预测对经济增长与电力消费之间的长期均衡关系及因果关系的分析具有不稳定性,并且通常直接将整体的经济增长与电力消费进行分析,缺乏对不同产业对应的经济增长与电力消费关系的分析,导致预测结果不准确。
发明内容
本申请提供了一种基于时间序列的电力消费预测方法及系统,以解决传统电力消费预测不准确的问题。
一方面,本申请提供一种基于时间序列的电力消费预测方法,包括:
获取目标省份的原始数据,所述原始数据包括电力消费数据和生产总值数据,所述电力消费数据包括电力消费总量数据和产业结构电力消费数据,所述生产总值数据包括地区生产总值数据和产业结构生产总值数据。
其中,所述产业结构电力消费数据包括第一产业电力消费数据、第二产业电力消费数据和第三产业电力消费数据,所述产业结构生产总值数据包括第一产业生产总值数据、第二产业生产总值数据和第三产业生产总值数据。
对所述原始数据做预处理,获取预处理数据。对原始数据做预处理可以提高数据挖掘的准确率。
对所述预处理数据做协整分析,所述协整分析包括平稳性检验、协整检验和格兰杰因果检验。协整理论从分析时间序列的非平稳性入手,研究非平稳变量之间的关系,避免在使用传统计量经济学方法进行回归分析时导致的伪回归问题。
建立线性回归模型,获取电力消费总量预测结果。
在一种实现方式中,对所述原始数据做预处理为对所述原始数据做对数运算。数据的自然对数使趋势线性化而不改变原始的协整关系,减少时间序列中异方差性的影响,提高模型的拟合准确度。
在一种实现方式中,对所述预处理数据做协整分析,包括:对预处理后的所述电力消费总量数据和所述地区生产总值数据做协整分析,对预处理后的所述产业结构电力消费数据和所述产业结构生产总值数据做协整分析。
在一种实现方式中,所述平稳性检验包括:
对所述预处理数据做ADF检验和PP检验,获取所述预处理数据的平稳性。
若所述预处理数据不平稳,对所述预处理数据做差分计算并对差分数据做平稳性检验,直至所述差分数据平稳。
在一种实现方式中,所述协整检验包括:
若预处理后的所述电力消费数据和所述生产总值数据同阶单整,对预处理后的所述电力消费数据和所述生产总值数据做OLS极大似然估计,并计算残差,获取残差序列。
对所述残差序列做单位根检验,获取所述残差序列的平稳性。
若所述残差序列平稳,则所述电力消费数据和所述生产总值数据具有协整关系。
在一种实现方式中,所述格兰杰因果检验包括:
若所述电力消费数据和所述生产总值数据具有协整关系,对所述电力消费数据和所述生产总值数据做格兰杰因果检验,获取所述电力消费数据和所述生产总值数据的因果关系。
对所述电力消费数据和所述生产总值数据建立误差修正模型,获取所述电力消费数据和所述生产总值数据的长期均衡关系。
在一种实现方式中,建立线性回归模型,获取电力消费总量预测结果,包括:
检验预处理后的所述电力消费总量数据和所述产业结构电力消费数据的相关性。
建立所述电力消费总量的线性回归模型。
对所述线性回归模型做F检验和T检验,获取电力消费总量的线性回归方程。
根据所述电力消费数据和所述生产总值数据的长期均衡关系以及所述线性回归方程,获取电力消费总量预测结果。
另一方面,本申请还提供一种基于时间序列的电力消费预测系统,用于实现上述基于时间序列的电力消费预测方法,包括:数据采集模块、预处理模块、协整分析模块和建模预测模块。
所述数据采集模块被配置为,获取目标省份的原始数据,所述原始数据包括电力消费数据和生产总值数据,所述电力消费数据包括电力消费总量数据和产业结构电力消费数据,所述生产总值数据包括地区生产总值数据和产业结构生产总值数据。
所述预处理模块被配置为,对所述原始数据做预处理,获取预处理数据。
所述协整分析模块被配置为,对所述预处理数据做协整分析,所述协整分析包括平稳性检验、协整检验和格兰杰因果检验。
所述建模预测模块被配置为,建立线性回归模型,获取电力消费总量预测结果。
本申请提供的一种基于时间序列的电力消费预测方法及系统,在实际应用中,首先获取目标省份的原始数据,对所述原始数据做对数运算,获取预处理数据。再对预处理后的电力消费总量数据和地区生产总值数据以及产业结构电力消费数据和产业结构生产总值数据做平稳性检验、协整检验和格兰杰因果检验,获取电力消费和生产总值的协整关系和因果关系。最后建立线性回归模型,获取电力消费总量预测结果。本申请通过分析整体的电力消费与生产总值以及不同产业结构下电力消费和生产总值之间的关系,建立线性回归模型,对电力消费总量进行预测,提高预测准确度。
附图说明
为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种基于时间序列的电力消费预测方法流程示意图;
图2为本申请提供的对所述预处理数据做协整分析的流程示意图;
图3为本申请提供的建立线性回归模型获取电力消费总量预测结果的流程示意图。
具体实施方式
下面将详细地对实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下实施例中描述的实施方式并不代表与本申请相一致的所有实施方式。仅是与权利要求书中所详述的、本申请的一些方面相一致的系统和方法的示例。
电力是人们生活的基本保障,是经济发展的基础。为了保证电力的发展适应社会发展的需求,需要把握电力消费的变化的规律,对电力需求进行预测,进而实现指导电力规划的电力建设。此外我国提倡建立资源节约、环境友好型社会,因此合理地预测电力消费需求不仅有利于电力工业自身的健康发展而且有利于能源的优化配置。电力工业在经济社会中起着越来越重要的作用,电力消费与经济发展的关系也越来越密切,基于此,本申请实施例提供一种基于时间序列的电力消费预测方法及系统,通过分析电力消费与经济之间的关系,对电力消费总量进行预测。
为便于本申请的技术方案进行说明,以下首先对本申请所用到的一些概念进行简要说明。
协整关系,协整分析是处理非平稳时间序列之间长期均衡关系和短期波动的有力工具,如果两个或两个以上的时间序列变量是非平稳的,但是它们的某个线性组合是平稳的,则这些变量之间存在长期稳定的均衡关系。
异方差性是相对于同方差而言的,同方差是指,为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项都具有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
伪回归,指一组非平稳时间序列之间不存在协整关系时,这一组变量构成的回归模型中可能出现的一种假回归。残差序列是一个非平稳序列的回归被称为伪回归,这样的一种回归有可能拟合度、显著性水平等指标都很好,但是由于残差序列是非平稳序列,说明这种回归关系不能真实地反映因变量和解释变量之间存在的均衡关系,而仅仅是一种数字上的巧合。
同阶单整,如果一个非平稳时间序列经过n次差分后达到平稳,则称这个非平稳时间序列是n阶单整序列,如果两个序列经过相同次数的差分后达到平稳,则称这两个序列同阶单整。
下面对本实施例提供的一种基于时间序列的电力消费预测方法进行详细说明。
参见图1,为本申请提供的一种基于时间序列的电力消费预测方法流程示意图。由图1可知,本申请提供的一种基于时间序列的电力消费预测方法包括:
S1:获取目标省份的原始数据,所述原始数据包括电力消费数据和生产总值数据,所述电力消费数据包括电力消费总量数据和产业结构电力消费数据,所述生产总值数据包括地区生产总值数据和产业结构生产总值数据。
其中,所述产业结构电力消费数据包括第一产业电力消费数据、第二产业电力消费数据、第三产业电力消费数据;所述产业结构生产总值数据包括第一产业生产总值数据、第二产业生产总值数据和第三产业生产总值数据。在收集、整理所述原始数据后,体用Excel软件建立数据库。所述原始数据为来源于目标省份统计局、国家统计局以及中国电力企业联合会等的历史电力消费数据与生产总值数据。
S2:对所述原始数据做预处理,获取预处理数据。
数据预处理是数据挖掘流程至关重要的一步,对原始数据进行数据预处理,可以提高数据挖掘的准确率。数据的自然对数使趋势线性化而不改变原始的协整关系,可以减少时间序列中异方差性的影响,提高模型的准确度,因此采用对数运算的方法对所述原始数据做预处理。
以目标省份的地区生产总值数据GDP为例,公式为:
LNGDP=ln(GDP); (1)
其中,LNGDP为对所述地区生产总值数据做对数运算后的数据,GDP为所述地区生产总值数据的原始数据。
S3:对所述与处理数据做协整分析,所述协整分析包括平稳性检验、协整检验和格兰杰因果检验。
协整分析是从分析时间序列的非平稳行入手,研究非平稳变量之间的关系,能够避免在使用传统计量方法进行回归分析时导致的伪回归问题。参见图2,本实施例中对所述预处理数据做协整分析的步骤如下:
S31:对所述预处理数据做ADF检验和PP(Phillips-Perron)检验,获取所述预处理数据的平稳性。
只有当两个变量的时间序列是同阶单整序列时,才可能存在协整关系,因此在进行两个变量协整关系检验之前,先对两个时间序列进行平稳性检验。
S32:若所述预处理数据不平稳,对所述与处理数据做差分计算并对差分数据做平稳性检验,直至所述差分数据平稳。
对所述预处理数据做平稳性检验,基于OLS(Ordinary Least Squares,普通最小二乘法)回归式:
其中,T表示线性时间趋势。当序列中存在单位根,则序列不平稳,不存在单位根,则序列平稳。检验序列H
如果不能拒绝进行平稳性检验的每个序列都不平稳的假设,则对所有序列的一阶差分进行平稳性检验,如果差分后的序列不能达到平稳,则进一步差分,直至序列平稳。
S33:若预处理后的所述电力消费数据和所述生产总值数据同阶单整,对预处理后的所述电力消费数据和所述生产总值数据做OLS极大似然估计,并计算残差,获取残差序列。
S34:对所述残差序列做单位根检验,获取所述残差序列的平稳性。
S35:若所述残差序列平稳,则所述电力消费数据和所述生产总值数据具有协整关系。
S36:对所述电力消费数据和所述生产总值数据做格兰杰因果检验,获取所述电力消费数据和所述生产总值数据的因果关系。
格兰杰因果检验是识别一组变量(X,Y)是否存在因果关系的方法,如果X的变化引起Y的变化,就认为X变化是Y变化的原因。具体表现为:对于服从平稳随机过程的两个变量X和Y,如果用X、Y各自的过去值和现在值预测Y,比不用X的现在及过去值预测所得到的预测Y值较为优良,则存在X到Y的因果关系。
S37:对所述电力消费数据和所述生产总值数据建立误差修正模型,获取所述电力消费数据和所述生产总值数据的长期均衡关系。
在本实施例中,依次对预处理后的所述电力消费总量数据和所述地区生产总值数据、所述产业结构电力消费数据和所述产业结构生产总值数据做协整分析。
对预处理后的所述电力消费总量数据,即LNE,和所述地区生产总值数据,即LNGDP,进行ADF检验和PP检验,检验结果参见表1。
表1
从检验结果可以看出,LNGDP和LNE均为二阶单整序列,符合协整检验的条件。
根据E-G两步法检验原理,对LNGDP和LNE进行OLS极大似然估计,计算残差,并检验残差序列的平稳性,检验结果参见表2。
表2
由表2可知,在显著性水平为1%下,残差序列平稳,LNGDP和LNE之间具有协整关系。
对LNGDP和LNE进行格兰杰因果检验,检验结果参见表3。
表3
从表3可知,对于LNE不是LNGDP的格兰杰原因这一原假设,P值为0.0008,即在1%的显著性水平下,拒绝LNE不是LNGDP的格兰杰原因的原假设,表明电力消费总量是地区生产总值的格兰杰原因。而对于LNGDP不是LNE的格兰杰原因的原假设则不拒绝,表明电力消费总量和地区生产总值之间是从电力消费总量到地区生产总值的单向因果关系。
对LNGDP和LNE建立误差修正模型,得到电力消费总量与地区生产总值的长期均衡关系如下:
LNE=0.823×LNGDP; (3)
由式(3)可知,地区生产总值的对数每增加1%,电力消费总量的对数增加0.823%。
下面对预处理后的所述产业结构电力消费数据和所述产业结构生产总值数据做协整分析。
在本实施例中,所述第一产业电力消费数据、所述第二产业电力消费数据和所述第三产业电力消费数据依次设为E1、E2和E3,对应的预处理后的所述第一产业电力消费数据、所述第二产业电力消费数据和所述第三产业电力消费数据依次设为LNE1、LNE2和LNE3。所述第一产业生产总值数据、所述第二产业生产总值数据和所述第三产业生产总值数据依次设为GDP1、GDP2和GDP3,对应的预处理后的所述第一产业生产总值数据、所述第二产业生产总值数据和所述第三产业生产总值数据依次设为LNGDP1、LNGDP2和LNGDP3。
采用ADF检验和PP检验两种方法对LNE1和LNGDP1、LNE2和LNGDP2、LNE3和LNGDP3进行平稳性检验,检验结果参见表4。
表4
从检验结果可以看出,LNE1和LNGDP1、LNE2和LNGDP2、LNE3和LNGDP3的二阶差分均达到平稳,符合协整检验的条件。
采用E-G两步法进行协整检验,对LNE1和LNGDP1、LNE2和LNGDP2、LNE3和LNGDP3三组数据依次做OLS极大似然估计,计算残差,得到对应的残差序列分别为e1、e2和e3,对残差序列进行单位根检验,结果参见表5。
表5
由表5可知,所述第一产业电力消费与所述第一产业生产总值残差不平稳,LNE1和LNGDP1之间不存在协整关系。在给定1%的显著性水平下,所述第二产业电力消费与所述第二产业生产总值的残差平稳,所述第三产业电力消费与所述第三产业生产总值的残差平稳,LNE2和LNGDP2之间、LNE3和LNGDP3均存在协整关系。
对LNE2和LNGDP2、LNE3和LNGDP3做格兰杰因果检验,检验结果参见表6。
表6
由检验结果可知,所述第二产业电力消费与所述第二产业生产总值之间存在从所述第二产业生产总值到所述第二产业电力消费之间的单向格兰杰因果关系,所述第三产业电力消费与所述第三产业生产总值之间存在从所述第三产业电力消费到所述第三产业生产总值之间的单向格兰杰因果关系。
对LNGDP2和LNE2、LNGDP3和LNE3建立误差修正模型,得到第二产业电力消费与第二产业生产总值、第三产业电力消费与第三产业生产总值的长期均衡关系如下:
LNE2=0.152×LNGDP2; (4)
LNE3=1.421×LNGDP3; (5)
从式(4)和式(5)可以看出,若第二产业生产总值的对数值每增加1%,则第二产业电力消费的对数值增加0.152%,若第二产业电力消费的对数值每增加1%,则第二产业生产总值的对数值增加6.57%;若第三产业生产总值的对数每增加1%,则第三产业电力消费的对数值增加1.421%,若第三产业电力消费的对数值每增加1%,则第三产业生产总值对数值增加0.7%。
S4:建立线性回归模型,获取电力消费总量预测结果。
参见图3,建立线性回归模型,对电力消费总量进行预测的步骤如下:
S41:检验预处理后的所述电力消费总量数据和所述产业结构电力消费数据的相关性。
S42:建立所述电力消费总量的线性回归模型。
根据产业结构电力消费数据建立电力消费总量的多元线性回归模型,首先利用计量经济学软件检验LNE、LNE1、LNE2、LNE3之间的相关性,检验结果参见表7。
表7
从结果可以看出,LNE和LNE2、LNE3之间存在很强的相关性,所以取LNE为因变量,LNE2和LNE3为自变量,构造电力消费总量的多元线性回归模型,对多元线性回归模型做F检验,如表8所示。
表8
从表8可以看出,F检验的显著性大于等于0.00小于0.01,说明多元线性回归模型具有极其显著的统计学意义。
S43:对所述线性回归模型做F检验和T检验,获取电力消费总量的线性回归方程。
对多元线性回归模型做T检验,检验结果参见表9,从结果可以看出LNE2对LNE具有负影响,LNE3对LNE具有正影响。
表9
根据表9可以得出线性回归方程为:
LNE=3.678-0.05LNE2+0.759LNE3; (6)
S44:根据所述电力消费数据和所述生产总值数据的长期均衡关系以及所述线性回归方程,获取电力消费总量预测结果。
式(6)为第二产业电力消费、第三产业电力消费和电力消费总量之间的关系,在步骤S3中,得到了第二产业电力消费和第二产业生产总值、第三产业电力消费和第三产业生产总值之间的长期稳定关系,将式(4)、式(5)和式(6)联立,可通过第二产业生产总值和第三产业生产总值得到电力消费总量,线性回归方程为:
LNE=3.678-0.007LNGDP2+1.078LNGDP3; (7)
经对比验证,可得出式(7)的电力消费总量预测结果优于式(6)电力消费总量的预测结果。
本实施例还提供一种基于时间序列的电力消费预测系统,用于实现上述基于时间序列的电力消费预测方法,包括:数据采集模块、预处理模块、协整分析模块和建模预测模块。
所述数据采集模块用于获取目标省份的原始数据,所述原始数据包括电力消费数据和生产总值数据,所述电力消费数据包括电力消费总量数据和产业结构电力消费数据,所述生产总值数据包括地区生产总值数据和产业结构生产总值数据。所述预处理模块用于对所述原始数据做预处理,获取预处理数据。所述协整分析模块用于对所述预处理数据做协整分析,所述协整分析包括平稳性检验、协整检验和格兰杰因果检验。所述建模预测模块用于建立线性回归模型,获取电力消费总量预测结果。
本申请实施例提供了一种基于时间序列的电力消费预测方法及系统,首先获取目标省份的原始数据,对所述原始数据做对数运算,获取预处理数据。再对预处理后的电力消费总量数据和地区生产总值数据以及产业结构电力消费数据和产业结构生产总值数据做平稳性检验、协整检验和格兰杰因果检验,获取电力消费和生产总值的协整关系和因果关系。最后建立线性回归模型,获取电力消费总量预测结果。本申请通过分析整体的电力消费与生产总值以及不同产业结构下电力消费和生产总值之间的关系,建立线性回归模型,对电力消费总量进行预测,提高预测准确度。
本申请提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本申请总的构思下的几个示例,并不构成本申请保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本申请方案所扩展出的任何其他实施方式都属于本申请的保护范围。
- 一种基于时间序列的电力消费预测方法及系统
- 一种基于时间序列预测方法的采煤机故障预测方法