掌桥专利:专业的专利平台
掌桥专利
首页

基于TARCH模型的天然气负荷波动非对称性分析方法及系统

文献发布时间:2023-06-19 15:47:50



技术领域

本发明属于数据分析领域,具体涉及一种基于TARCH模型的天然气负荷波动非对称性分析方法及系统。

背景技术

天然气作为一种清洁、高效能源,而且能够有效弥补风能和太阳能不易存储、供应不稳定的缺陷,天然气替代高碳高污染煤炭的大趋势不可逆转,所以天然气的发展必将带动城市天然气的快速发展。紧随其后就面临着一系列的诸如:城市气源更换、城市燃气管网规划、储气设施的建设等问题。针对这些问题,燃气负荷预测方法的研究工作就显得尤为重要了。

现有天然气用气负荷的预测方法往往缺少对天然气用气负荷特性的分析,导致天然气负荷预测不准确,然而天然气用气负荷具有显著的周期性、不确定性以及波动性等非线性特征,普通的数学模型难以准确把握这些特性,因此需要分析天然气用气负荷的特征和规律,为天然气负荷的预测提供精确的参考数据。

发明内容

针对现有技术中存在的问题,本发明提供一种基于TARCH模型的天然气负荷波动非对称性分析方法及系统,分析天然气负荷序列的波动非对称性特征,对天然气负荷预测提供数据支撑。

本发明是通过以下技术方案来实现:

一种基于TARCH模型的天然气负荷波动非对称性分析方法,包括以下步骤:

步骤1、获取历史时间段的天然气负荷数据集并进行预处理;

步骤2、对步骤1预处理的数据集按照时间段划分为多个天然气数据子集;

步骤3、对各个天然气数据子集的平稳性进行验证,对通过平稳性验证的天然气数据子集采用白噪声检验法进行ARCH效应验证;

步骤4、采用门限自回归条件异方差模型对通过ARCH效应校验的天然气数据子集进行波动非对称性分析,根据分析结果进行天然气用气负荷预测。

优选的,所述预处理为对天然气负荷数据集中的缺失值和异常值进行处理。

优选的,使用K-means算法对天然气负荷数据集中异常值进行检测并剔除,使用均值插补法对天然气负荷数据集中缺失值进行填充。

优选的,使用K-近邻方法对异常值进行检测并剔除的方法如下:

从天然气负荷数据集中随机选取K个样本点作为质心,计算剩余样本与质心的距离来划分样本对簇的归属度,基于聚类结果计算各样本到质心的距离,若距离大于阈值则判定该样本为异常值。

优选的,步骤3中采用ADF单位根检验法检验天然气数据子集的平稳性。

优选的,步骤3中采用白噪声检验法进行ARCH效应验证的方法如下:

设定原假设H0和备择假设H1;

根据原假设H0和备择假设H1构建统计量;

在原假设成立的条件下,统计量Q(m)服从自由度为m的卡方分布,并结合给定显著性水平α,得到拒绝域;

对天然气数据子集进行Lung-Box检验,当检验结果拒绝了原假设,则天然气数据子集具有ARCH效应。

优选的,所述统计量的表达式如下:

其中,T是样本容量,

所述拒绝域为

优选的,所述门限自回归条件异方差模型的非对称性分析方法如下;

所述门限自回归条件异方差模型的表达式如下:

其中,σ

如果γ

一种基于TARCH模型的天然气负荷波动非对称性分析方法的系统,包括,数据集构建模块,用于构建天然气负荷数据集并进行预处理;

分割模块,用于将天然气负荷数据集按照时间段划分为多个天然气数据子集;

验证模块,用于对各个天然气数据子集的平稳性进行验证,对通过平稳性验证的天然气数据子集采用白噪声检验法进行ARCH效应验证;

分析模块,用于采用门限自回归条件异方差模型对通过ARCH效应校验的天然气数据子集进行波动非对称性分析,根据分析结果进行天然气用气负荷预测。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现基于TARCH模型的天然气负荷波动非对称性分析方法的步骤。

与现有技术相比,本发明具有以下有益的技术效果:

本发明设计了一种基于TARCH模型的天然气用气负荷波动非对称性分析方法,对得到的天然气数据集进行预处理,然后将天然气数据集按年份进行划分,以形成时间跨度上的对比分析;使用ADF单位根检验法检验天然气负荷序列是否平稳,以避免在回归过程中出现伪回归现象;在对通过验证的数据集进行ARCH效应校验,判定数据集是否具有ARCH效应,最后对通过ARCH效应判定的数据集进行基于TARCH模型的波动非对称性分析,使用TARCH模型对天然气用气负荷数据集进行波动性非对称性分析,得出最后的分析结果,根据分析结果进行天然气负压预测,能够提高预测准确性。

附图说明

图1为本发明的TARCH模型波动非对称性分析流程图;

图2为本发明的天然气用气负荷序列波动概况图;

图3为本发明的TARCH模型分析结果展示图。

具体实施方式

下面结合附图对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。

参阅图1-3,一种基于TARCH模型的天然气负荷波动非对称性分析方法,包括以下步骤:

步骤1、获取历史时间段的天然气负荷数据集,并对天然气负荷数据集中的缺失值和异常值进行处理,使用K-means算法对异常值进行检测并剔除,使用均值插补法对缺失值进行填充。

具体的,使用均值插补法对缺失值进行填充,其中有些用户的缺失率较高,对于缺失率较高的用户,将其进行简单的删除处理。对于缺失率较低的数据,采用均值插补的方法进行填充。

例如,在数据收集或者传输的过程中,可能会出现缺失的情况。比如天然气表的采集终端出现损坏或者异常,导致部分数据采集失败,或者在传输数据的过程中,数据文件出现丢失或者损坏的情况等等,这些原因都会造成用户用气量数据的缺失。因此,缺失值填充也是十分重要的一个步骤,其中有些用户的缺失率较高,对于缺失率较高的用户,将其进行简单的删除处理。对于缺失率较低的数据,我们采用均值插补的方法进行填充,比如有一些用户缺失2018年12月的天然气用量,我们将取16年和17年12月份天然气用量的平均值作为缺失值的替代值。

使用K-近邻方法对异常值进行检测并剔除:从天然气负荷数据集中随机选取K个样本点作为质心,计算剩余样本与质心的距离来划分样本对簇的归属度,基于聚类结果计算各样本到质心的距离,若距离大于阈值则判定该样本为异常值。在使用模型对天然气负荷数据集进行异常值判定时,需要保证正常数据和异常数据的类尽可能完整,否则会影响聚类效果进行影响异常值的处理。其中距离的计算方法采用欧式距离法,聚类的类别数K可以通过拐点法进行判别,即通过数据的凝聚度(SSE方差)进行判别,当凝聚度的大小随着k值急剧下降,此时即出现拐点,如果继续增加K值会导致天然气负荷数据分类的准确度降低。

步骤2、按照设定的规则将天然气负荷数据集划分为多个天然气数据子集。根据天然气负荷数据集的大小按至少每隔一年的划分方式对数据集分段,以形成时间跨度上的对比分析;

具体的,在本实施例中,将天然气数据集按年份进行划分:可以根据数据集的大小按至少每隔一年的划分方式对数据集分段,以形成时间跨度上的对比分析,如如将全区段2015年1月31日至2020年7月19日划分为三个阶段。第一阶段的时间区段为2015年1月31日至2016年12月31日,第二阶段的时间区段为2017年1月1日至2018年12月31日,第三阶段的时间区段为2019年1月1日至2020年7月19日。

步骤3、对步骤2得到的多个天然气数据子集分别进行天然气负荷序列的平稳性校验;

使用ADF单位根检验法检验天然气负荷序列是否平稳,以避免在回归过程中出现伪回归现象,ADF检验法是通过在回归方程右边加入因变量y

原假设为:原假设最少存在一个单位根,备选假设为序列不存在单位根。具体做法是:在检验前设定一个概率值P(一般设定为1%、5%或10%),如果最终得到的检验值小于这个概率值,则时间序列拒绝原假设的可能性将是1-P。本文将P值设定为1%,也就是说如果天然气用气负荷序列的单位根检验值小于0.01,那么该序列平稳的概率将达到99%,可以认为序列平稳。

步骤4、对步骤3中通过平稳性校验的天然气数据子集进行ARCH效应校验。

ARCH效应校验用来判定数据集是否具有ARCH效应,只有通过了ARCH效应判定才能进行基于TARCH模型的波动非对称性分析。本发明采用Lung-Box白噪声检验法,检验不显著时没有ARCH效应,检验显著时有ARCH效应。首先获得天然气用气序列的残差,然后对残差平方作Lung-Box白噪声检验。

Lung-Box检验的原假设和备择假设分别为:

H0:原本的数据都是独立的,即总体的相关系数为0,能观察到的某些相关仅仅产生于随机抽样的误差。即

H1:原本的数据不是独立的,即至少存在某个

构造的统计量为:

其中T是样本容量,

在原假设成立的条件下,统计量Q(m)服从自由度为m的卡方分布。给定显著性水平α,则拒绝域是

对天然气数据子集进行Lung-Box检验,当检验结果拒绝了原假设,则意味着天然气数据子集具有ARCH效应。

步骤5、采用TARCH模型(门限自回归条件异方差模型)对通过ARCH效应校验的天然气数据子集进行波动非对称性分析。

为了刻画时间序列波动的非对称特性,TARCH模型在GARCH模型的基础上,增加了一项参数用于拟合数据中可能存在的非对称性。其基本方程式描述如下:

式中,σ

使用TARCH模型拟合天然气数据子集,获得u

本发明提供的一种TARCH模型的天然气负荷波动非对称性分析方法,该方法引入了特征工程,在进行TARCH模型的波动非对称性分析之前,先进行数据的预处理,比如对缺失值进行均值填充法填充,对可能存在的异常值用K-近邻的方法进行剔除,以及对数据集进行分段,从而使分析更准确;其次,将波动性建模分析与天然气用气负荷相结合,分析其中存在的波动对称性规律,根据分析结果进行天然气用气负荷预测。

实施例1

一种基于TARCH模型的天然气负荷波动非对称性分析方法,包括以下步骤:

1)使用K-means算法对获取的天然气负荷数据集中异常值进行检测并剔除,使用均值插补法对天然气负荷数据集中的缺失值进行填充。

2)根据天然气负荷数据集的大小按每隔一年的划分方式对数据集分段,得到多个天然气数据子集,以形成时间跨度上的对比分析;

3)使用ADF单位根检验法检验天然气负荷序列是否平稳,以避免在回归过程中出现伪回归现象。

校验结果如表1所示:

表1 ADF单位根校验结果

P值均小于0.01,说明在1%校验水平下拒绝了原假设,因此天然气用气序列通过了平稳性校验。

4)采用Lung-Box白噪声检验法对通过平稳性校验的天然气数据子集进行校验。

校验结果如表2所示:

表2 ARCH效应校验结果

P值均小于0.01,说明在1%校验水平下拒绝了原假设,因此天然气用气序列通过了ARCH效应校验。

5)基于TARCH(1,1)模型的波动非对称性分析:使用TARCH(1,1)模型对天然气用气负荷数据集进行波动非对称性分析。

为了刻画时间序列波动的非对称特性,TARCH模型在GARCH模型的基础上,增加了一项参数用于拟合数据中可能存在的非对称性。其基本方程式描述如下:

分析结果如表3所示:

表3 TARCH(1,1)模型分析结果

注:变量RESID(-1)^2、GARCH(-1)和RESID(-1)^2*(RESID(-1)<0)分别为

由TARCH(1,1)模型的分析结果可以得出结论:(1)天然气用气序列的波动聚集性越强就越容易表现出波动非对称特性;(2)当天然气用气负荷具备波动非对称特性时,表现为负向冲击对波动的影响大于正向冲击对波动的影响。

一种基于TARCH模型的天然气负荷波动非对称性分析方法的系统,包括数据集构建模块,用于构建天然气负荷数据集并进行预处理;

分割模块,用于将天然气负荷数据集按照时间段划分为多个天然气数据子集;

验证模块,用于对各个天然气数据子集的平稳性进行验证,对通过平稳性验证的天然气数据子集采用白噪声检验法进行ARCH效应验证;

分析模块,用于采用门限自回归条件异方差模型对通过ARCH效应校验的天然气数据子集进行波动非对称性分析,根据分析结果进行天然气用气负荷预测。

本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本发明各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于GARCH模型的天然气负荷波动对称性分析方法的操作。

本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于GARCH模型的天然气负荷波动对称性分析方法的相应步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

技术分类

06120114582793