掌桥专利:专业的专利平台
掌桥专利
首页

基于集成模态分解的用气需求预测方法及其系统

文献发布时间:2023-06-19 12:07:15


基于集成模态分解的用气需求预测方法及其系统

技术领域

本发明属于天然气需求预测方法领域,特别涉及一种基于集成模态分解的用气需求预测方法及其系统。

背景技术

2017年初“气荒”事件发生引发社会广泛关注,2020年“新冠”病毒冲击局部地区天然气市场,实现天然气消费量精准预测关乎到国家民生大计。受宏观经济及能源调控影响,天然气市场处于快速变化态势,不均匀性愈加明显,实现天然气需求预测对优化调度、储气调峰具有着重要意义。

天然气需求预测是通过分析某一地区或用户天然气历史日负荷(消费量)的变化规律,建立预测模型来预测未来天然气需求的方法。非供暖季时期无供暖需求,因此天然气日负荷多以时序为主要变量进行需求预测。近年来天然气消费结构快速变化,采用多年的大数据集有欠拟合风险。经实验发现,采用同样为非供暖季时期、与预测时间相近、数据变化规律相近的小数据集作为训练集可提升预测精度。经典的机器学习算法如BP神经网络、RBF神经网络、小波神经网络等存在需要大量数据进行训练的问题。

天然气日负荷受天气、节假日、人口流动等多因素影响随机性明显。传统的时序预测模型算法如自回归移动平均模型(ARMA)等必须以时间序列平稳为前提条件,因此需要对原时间序列进行处理。电力系统负荷预测中有部分模型采用经验模态分解(EMD),基于经验模态分解理论可以将时间序列自适应地分解原始序列生成内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。将该方法应用于天然气负荷预测中发现,天然气日负荷随机性较强,分解过程中可能因不同模态分量频率相差较大致使三次样条插值法无法有效分离得到不同的IMF分量,或由于低频信号的高幅值特征峰缺少足够极值点,产生模态混叠效应,导致预测精度偏低。此外,在使用模态分解与预测算法组合进行预测过程中存在部分IMF高频分量精度较低易导致预测结果失真。本发明公开了一种涉及集成模态分解(EEMD)、粒子群算法(PSO)、支持向量机回归模型(SVR)的综合非供暖季天然气负荷预测方法。

发明内容

针对上述问题,本发明提供了一种基于集成模态分解的用气需求预测方法,所述预测方法包括以下步骤:

将训练集和验证集中的天然气日负荷按时序特征组成原始序列,其中,所述时序特征包括日期、节假日;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;

用所述训练集分量和验证集分量训练若干个支持向量机回归模型SVR,训练后的模型记为{SVR

用所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVR

用所述{SVR

将测试集代入{SVR

进一步地,对所述支持向量机回归模型进行训练前需要对使用的数据进行处理,所述处理包括以下步骤:

收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;

将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;

将所述数据集进行归一化处理。

进一步地,所述处理还包括构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。

进一步地,得到所述预测结果后,对预测结果进行反归一化处理,得到预测值;所述反归一化处理与数据集采用的归一化处理规则一致。

进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。

进一步地,所述原始序列训练支持向量机回归模型时采用所述训练集训练,以时序特征为输入变量,以归一化后的天然气日负荷为输出变量。

进一步地,所述训练集分量和验证集分量训练所述支持向量机回归模型时,以所述训练集分量和验证集分量的时序特征作为输入变量,模态分解后的训练集分量和验证集分量为输出变量。

一种基于集成模态分解的用气需求预测系统,所述预测系统包括以下模块:

分解模块:将训练集和验证集中的天然气日负荷按时序特征组成原始序列;对所述原始序列进行集成模态分解,分解后得到训练集分量和验证集分量;

第一训练模块:用于采用所述训练集分量和验证集分量训练若干个支持向量机回归模型,训练后的模型记为{SVR

第二训练模块:用于将所述原始序列训练所述支持向量机回归模型,训练后的模型记为SVR

第三训练模块:用于将所述{SVR

预测模块:用于将测试集代入{SVR

进一步地,所述预测系统还包括处理模块,所述处理模块包括预处理单元、数据集单元、归一化单元;

预处理单元:用于收集数据并对数据进行预处理,所述预处理包括对数据进行清洗、变换和集成;

数据集单元:用于将预处理后的数据进行天然气负荷变化规律分析,并根据分析结果确定数据集的选择范围,其中,所述数据集包括训练集、验证集和测试集;

归一化单元:用于将所述数据集进行归一化处理。

进一步地,所述处理模块还包括构建单元,用于构建支持向量机回归模型,所述支持向量机回归模型的构建过程中,采用粒子群算法对所述支持向量机回归模型中参数进行寻优。

进一步地,所述训练集分量和验证集分量是由所述原始序列进行集成模态分解得到的内涵模态分量和残差分量按日期重新分组得到的。

一种对所述预测方法和系统进行有效性评价的方法,所述方法包括以下步骤:

将对数据不进行处理,直接采用粒子群优化的支持向量机模型进行预测作为对照组1;将采用集成模态分解后使用滑动平均方法进行预测为对照组2;将采用集成模态分解后利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法作为对照组3;在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测作为对照组4;将所述预测方法作为实验组;

根据对照组1、对照组2、对照组3、对照组4和实验组的模型预测结果,计算每组预测结果的百分比误差和均方根误差,根据所述百分比误差和均方根误差对所述预测结果进行评价。

本发明所公开的基于集成模态分解的用气需求预测方法。选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型),降低时序模型建立条件中对于原始数据序列平稳的要求,使得模型适用面更广。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型的方法(IEEMD-SVR-SVR)提升天然气日负荷预测精度。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书以及附图中所指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本发明实施例的IEEMD-SVR-SVR的基本数据流向图;

图2示出了本发明实施例的EEMD分解流程图;

图3示出了本发明实施例的EMD分解流程图;

图4示出了本发明实施例PSO优化SVR预测模型流程图;

图5示出了传统的基于EEMD分解的预测模型流程图;

图6示出了本发明实施例2015-2017年A市天然气月度消费量不均匀系数图;

图7示出了PSO-SVR模型、EEMD-ARMA模型、EEMD-SVR模型、EEMD-SVR-SVR模型、EEMD-SVR-SVR五种模型对非供暖季时期天然气日负荷的预测误差以及实际值对比结果图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明针对天然气消费结构逐年快速变化、非供暖季时期日负荷变化随机性较强的特征,选取适用小数据集的支持向量机回归模型(SVR)进行预测,超参数选取采用粒子群算法(PSO)进行参数寻优。针对经验模态分解中模态混叠问题采用集成模态分解(EEMD)进行改进(EEMD-SVR模型)。针对高频IMF分量预测精度低导致的预测结果失真问题,采用将原始序列预测结果、IMF分量预测序列结果导入新的SVR模型中训练以建立综合预测模型(IEEMD-SVR-SVR)的方法,提升天然气日负荷预测精度。

该预测方法包括以下步骤:

A、数据收集及数据预处理;采集被预测地区近3年的天然气年度分日消费量与时序特征值(如日期、节假日、相似日等),进行数据清洗、数据变换、数据集成等数据预处理,形成标准化数据集格式。

B、天然气负荷变化规律分析与数据集选择范围;分析天然气日负荷变化规律,厘清天然气日负荷变化阶段性特征,依据测试集选取训练集和验证集数据,验证集用于辅助构建模型。根据天然气年度消费量规模大小、天然气消费结构的相似程度、供暖季起止时间、分日消费量的变化规律按照“就近原则”以测试集起始时间向前选取同一年份、去年同一时期数据作为模型训练集与验证集。

C、数据归一化;将选取的训练集、验证集、测试集组成数据集,按照统一规则进行归一化,统一规则指训练集、验证集、测试集中的数据归一化公式、最大值、最小值选取保持一致。

D、EEMD分解;将归一化后的训练集和验证集中的天然气日负荷按时序组成天然气日负荷序列(即按时间排序的、归一化后的天然气日负荷序列)进行EEMD分解,得到多个不同时间尺度的内涵模态分量IMF(记作IMF

具体地,对EEMD分解进行详细说明,EEMD分解是针对EMD分解出现的模态混叠问题,在信号分解中不断添加频率均匀分布的高斯白噪声以平滑异常信号,通过多次EMD分解得到IMF分量做整体平均以克服模态混叠,使信号在不同尺度上具有连续性。EEMD分解流程如图2所示:

①向原始序列中加入均匀频率但不等幅的高斯白噪声序列:

y

其中,y(t)为原始序列,n

②对y

③重复步骤①②k次,分解得到k组,每组n个IMF分量IMF

a=ek或lne+0.5alnk=0 (1-2)

式中,e为原始序列标准差,表征原始序列和EMD重构结果的差异程度,a为高斯白噪声幅值,k为预设分解次数。即分解次数与高斯白噪声幅值呈负相关,以减少噪声对分解结果的影响。

④对k组IMF分量取算数平均,把n个IMF均值作为EEMD最终分解的结果。

其中,IMF

其中步骤②中EMD分解流程可参照图3,

经验模态分解(EMD)的主要思想为:EMD可将任何信号(序列)中不同时间尺度的波动逐级分解为若干不同内涵模态分量(IMF)和一个代表信号总体趋势的剩余分量之和。其中IMF分量需要满足以下两个假设:

一是在整个波形内,信号波的极值点与过零点次数至多相差1;

二是在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称。

具体分解步骤如图3所示:

1)确定原始序列y(t)的极大值和极小值点,利用三次样条函数拟合上下包络线b

2)计算原始序列y(t)与平均包络线b

3)若序列h

4)计算剩余信号(剩余序列),计算公式如式1-5所示:

r(t)=y(t)-∑IMF

将剩余序列作为新序列,重复1)~3)继续进行分解直至r(t)无法继续分解或满足预设条件,此时得到一系列IMF

此时,原始序列分解成为n个幅值、频率均不同的IMF分量和余项r

E、IMF分量、残差量(Res)训练SVR模型;将训练集分量和验证集分量的时序特征作为输入变量,以模态分解后的训练集分量(IMF

建立SVR模型过程中,核函数直接决定了支持向量与核方法的最终性能,但核函数的选择一直是一个未解决的问题。SVR模型主要采用台湾大学林智仁提供的LibSVM工具箱,其中核函数简化成表1所示的四种形式。

表1常用核函数

本发明通过试算对比的方法选取核函数。此外,超参数选取决定影响SVR拟合效果。超参数C值选取的大小决定模型对落在“间隔带”外点的宽度,超参数是在选择高斯核或拉欧拉斯核函数时高斯带宽参数。参数寻优过程中采用全局搜索方法占用资源率较高,本发明采用粒子群寻优算法(PSO)方法进行全局寻优,PSO一种基于群体智能的全局随机搜索算法,假设在l维搜索空间中,有n个粒子形成群落,其中第i个粒子在第k次迭代的位移参数和速度参数分别为:

第i个粒子迭代至第k次为止搜索到的最优位置为个体极值,记为:

粒子群迄今为止搜索到的最优位置为全局极值,记为:

其中,

迭代过程中,粒子速度和位移的更新公式为:

其中:

采用PSO算法进行SVR参数寻优步骤如附图4所示:

(1)输入SVR训练集数据,设置PSO算法初始值包括c

(2)初始化种群,生成随机粒子及随机解,计算初代粒子适应度,适应度函数选用对训练集进行k折交叉验证的均方误差。

其中,y

(3)计算本次迭代中个体适应度的粒子。将每个粒子的个体极值

(4)根据式1-11,式1-12进行的迭代更新计算。若更新后个体适应度优于

(5)判断是否达到最大迭代次数或是否满足终止条件,若满足,则输出全局最优的C、γ。否则返回步骤(4)继续迭代。

F、原始序列的SVR模型训练。将归一化后的训练集以时序特征输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVR

G、预测结果的嵌套模型训练。将{SVR

H、模型验证。将测试集代入{SVR

示例性地,以以预测Y城市2017年8月20日-8月29日天然气日需求为例对该预测方法进行说明。

数据收集及数据预处理。收集Y城市2015年1月1日-2017年8月19日天然气历史日负荷数据,进行数据清洗、数据变换、数据集成等数据预处理。将数据集转化为格式统一、无异常值、无缺省数据集。

从获取的数据中对天然气日负荷变化规律进行分析和数据集的选择范围,包括训练集、测试集和验证集。以月度为单位分析天然气的月负荷不均匀性,观察天然气日负荷变化规律,不均匀系数的计算公式如公式1-14所示:

其中,η为月不均匀系数,Q

将选取的162组训练集、10组验证集和10组测试集组成数据集,按照统一规则进行归一化,输入端数据集为时序特征变量,包括日期、节假日特征值,输出端为天然气日负荷。

EEMD分解。将归一化后的训练集和验证集中的天然气消费量共172组数据按日期时序组成天然气日负荷序列进行EEMD分解,得到6个不同时间尺度的内涵模态分量IMF(记作IMF

用IMF分量、残差量(Res)训练SVR模型,将时序特征变量作为输入变量,模态分解后的训练集分量(IMF

原始序列的SVR模型训练。将归一化后的训练集以时序特征值为输入变量,以归一化后的天然气日负荷为输出变量训练SVR模型,记为SVR

预测结果的嵌套模型训练。将{SVR

模型预测输出。将选取的测试集代入{SVR

模型效果评价。为评价IEEMD-SVR-SVR模型预测效果,分别将步骤F中训练完成的SVR

PSO-SVR表示不进行数据处理,直接采用粒子群优化的支持向量机模型进行预测;EEMD-ARMA表示在进行集成模态分解后采用滑动平均方法进行预测,EEMD-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值直接加和作为最终预测值的方法;EEMD-SVR-SVR表示在集成模态分解后,利用SVR模型进行预测,将预测值重新建立新的SVR模型进行预测;IEEMD-SVR-SVR表示改进的EEMD-SVR-SVR模型,即本文提出的方法,重新引入了最原始天然气日负荷序列所构建的SVR模型作为最终模型的参考变量之一进行预测(保留原始数据中的部分细节变量)。

表2五种模型预测误差对比表

五种模型的的预测结果如表2所示,IEEMD-SVR-SVR的百分比误差(MAPE)值为2.13%、均方根误差(RSME)值为4.80,相对其余四种模型明显下降,具有较好的预测效果。

尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 基于集成模态分解的用气需求预测方法及其系统
  • 基于一维小波分解重构和神经网络的天然气需求预测方法
技术分类

06120113176521