掌桥专利:专业的专利平台
掌桥专利
首页

用电负荷的预测方法、装置、存储介质及计算机设备

文献发布时间:2024-04-18 19:58:26


用电负荷的预测方法、装置、存储介质及计算机设备

技术领域

本发明涉及电力技术领域,尤其是涉及一种用电负荷的预测方法、装置、存储介质及计算机设备。

背景技术

随着社会的不断发展,各个用电场所的用电需求也随之增加,为了对各个用电场所进行有效供电,避免用电场所因缺电而造成的损失,需要对各个用电场所的用电需求进行预测。

目前,通常对采集后的数据直接进行用电负荷预测。然而,采集的数据中包含较多对预测结果无用的数据,采用无用的数据对用电负荷进行预测,会导致用电负荷的预测精度较低,与此同时,在负荷预测过程中,对无用数据进行分析会浪费较多时间,从而导致用电负荷的预测效率较低。

发明内容

本发明提供了一种用电负荷的预测方法、装置、存储介质及计算机设备,主要在于能够提高用电负荷的预测效率和预测精度。

根据本发明的第一个方面,提供一种用电负荷的预测方法,包括:

获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;

根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;

确定各所述历史气象数据之间的第一相关性系数;

根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;

根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;

将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。

可选地,在所述根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数之前,所述方法还包括:

确定所述历史气象数据中的异常数据,并将所述历史气象数据中的异常数据去除,得到去除异常数据后的历史气象数据。

可选地,所述确定所述历史气象数据中的异常数据,包括:

在各所述历史气象数据中确定目标历史气象数据,并统计所述目标历史气象数据对应的领域内的数据密度;

若所述数据密度大于预设密度阈值,则将所述目标历史气象数据确定为聚类中心;

基于所述聚类中心,对各所述历史气象数据进行聚类,得到聚类结果;

将所述聚类结果中不属于任何聚类簇中的数据确定为异常数据。

可选地,所述确定所述历史气象数据中的异常数据,包括:

确定各所述历史气象数据对应的中位数,并确定各所述历史气象数据中的最小值与所述中位数之间的第一中间值,并将所述第一中间值确定为各所述历史气象数据对应的第一四分位数;

确定各所述历史气象数据中的最大值与所述中位数之间的第二中间值,并将所述第二中间值确定为各所述历史气象数据对应的第三四分位数;

计算所述第一四分位数与所述第三四分位数之间的距离,并将所述距离确定为各所述历史气象数据对应的四分位间距;

根据所述第一四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测下限值;

根据所述第三四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测上限值;

在各所述历史气象数据中,将所述异常检测下限值至异常检测上限值之外的数据确定为异常数据。

可选地,所述确定所述历史气象数据中的异常数据,包括:

利用预设孤立森林检测算法检测所述历史气象数据中的异常数据。

可选地,所述利用预设孤立森林检测算法检测所述历史气象数据中的异常数据,包括:

确定所述历史气象数据中的第一最大数据值和第一最小数据值;

在所述第一最大数据值和所述第一最小数据值之间选择第一数据分割值;

在所述历史气象数据中确定小于或等于第一数据分割值的第一历史气象数据,以及确定大于第一数据分割值的第二历史气象数据;

确定所述第一历史气象数据中的第二最大数据值和第二最小数据值;

在所述第二最大数据值和所述第二最小数据值之间选择第二数据分割值,并根据所述第二数据分割值检测所述第一历史气象数据中的离群值;

确定所述第二历史气象数据中的第三最大数据值和第三最小数据值;

在所述第三最大数据值和所述第三最小数据值之间选择第三数据分割值,并利用所述第三数据分割值检测所述第二历史气象数据中的离群值;

将所述第一历史气象数据中的离群值和所述第二历史气象数据中的离群值确定为所述历史气象数据中的异常数据。

可选地,在所述将所述历史气象数据中的异常数据去除,得到去除异常数据后的历史气象数据之后,所述方法还包括:

确定所述去除异常数据后的历史气象数据中的最大值、最小值和方差;

将所述去除异常数据后的最大值与最小值相减,得到所述历史气象数据对应的交互特征值;

将所述历史气象数据对应的方差和所述交互特征值填充至所述去除异常数据后的历史气象数据中,得到扩充后的历史气象数据。

可选地,所述根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数,包括:

基于各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据对应的第一重要性系数;

将各所述历史气象数据对应的实际历史用电负荷进行置换,得到各所述历史气象数据对应的置换后的历史用电负荷;

基于各所述历史气象数据及其对应的置换后的历史用电负荷,确定各所述历史气象数据对应的第二重要性系数;

基于所述第一重要性系数和所述第二重要性系数,确定各所述历史气象数据对应的重要性系数。

可选地,所述基于各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据对应的第一重要性系数,包括:

将各所述历史气象数据及其对应的实际历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第一重要性系数。

可选地,所述基于各所述历史气象数据及其对应的置换后的历史用电负荷,确定各所述历史气象数据对应的第二重要性系数,包括:

将各所述历史气象数据及其对应的置换后的历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第二重要性系数。

可选地,所述基于所述第一重要性系数和所述第二重要性系数,确定各所述历史气象数据对应的重要性系数,包括:

利用预设分位数比较法计算所述第一重要性系数和所述第二重要性系数之间的比值;

将所述比值取对数,得到各所述历史气象数据对应的重要性系数。

可选地,所述确定各所述历史气象数据之间的第一相关性系数,包括:

确定各所述历史气象数据中任意一历史气象数据对所述其余历史气象数据做回归分析的负相关系数,其中,所述其余历史气象数据为各所述历史气象数据中去除所述任意一历史气象数据后的数据;

将1与所述负相关系数的平方相减,得到所述任意一历史气象数据对所述其余历史气象数据的容忍系数;

确定所述容忍系数的倒数,并将所述容忍系数的倒数确定为所述任意一历史气象数据与其余历史气象数据之间的第一相关性系数。

可选地,所述根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数,包括:

计算各所述历史气象数据对应的期望值和标准差,以及确定各所述实际历史用电负荷对应的期望值和标准差;

将各所述历史气象数据与对应的期望值相减,得到第一差值,以及将各所述实际历史用电负荷与对应的期望值相减,得到第二差值;

将所述第一差值与所述第二差值相乘,得到差值乘积,并根据所述差值乘积确定各所述历史气象数据与各所述实际历史用电负荷之间的协方差;

将各所述历史气象数据对应的标准差与各所述实际历史用电负荷对应的标准差相乘,得到标准差乘积;

将所述协方差与所述标准差乘积相除,得到各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数。

可选地,所述根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据,包括:

根据各所述历史气象数据的重要性系数,对各所述历史气象数据进行筛选,得到第一历史气象数据集;

根据各所述历史气象数据中任意一历史气象数据与其余历史气象数据之间的第一相关性系数,对各所述历史气象数据进行筛选,得到第二历史气象数据集;

根据各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数,对各所述历史气象数据进行筛选,得到第三历史气象数据集;

根据所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集,确定所述筛选后的历史气象数据。

可选地,所述根据各所述历史气象数据的重要性系数,对各所述历史气象数据进行筛选,得到第一历史气象数据集,包括:

在各所述历史气象数据的重要性系数中确定小于第一预设阈值的目标重要性系数;

在各所述历史气象数据中将所述目标重要性系数对应的历史气象数据剔除,得到第一历史气象数据集。

可选地,所述根据各所述历史气象数据中任意一历史气象数据与其余历史气象数据之间的第一相关性系数,对各所述历史气象数据进行筛选,得到第二历史气象数据集,包括:

在所述任意一历史气象数据对应的第一相关性系数中确定大于第二预设阈值的第一目标相关性系数;

在各所述历史气象数据中将第一目标相关性系数对应的历史气象数据剔除,得到第二历史气象数据集。

可选地,所述根据各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数,对各所述历史气象数据进行筛选,得到第三历史气象数据集,包括:

在各所述历史气象数据对应的第二相关性系数中确定小于第三预设阈值的第二目标相关性系数;

在各所述历史气象数据中将所述第二目标相关性系数对应的历史气象数据剔除,得到第三历史气象数据集。

可选地,所述根据所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集,确定所述筛选后的历史气象数据,包括:

确定所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集之间的气象数据交集,并将所述气象数据交集确定为所述筛选后的历史气象数据。

可选地,所述预设用电负荷预测模型为预设梯度提升树模型,所述预设梯度提升树模型包括多个基分类器,所述将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷,包括:

确定所述筛选后的历史气象数据对应的第一特征向量,以及确定所述时间属性数据对应的第二特征向量;

将所述第一特征向量和所述第二特征向量进行横向拼接,得到用电拼接特征向量;

将所述用电拼接特征向量输入至各所述基分类器中进行负荷预测,得到各所述基分类器分别输出的预测用电负荷;

将各所述基分类器分别输出的预测用电负荷进行加权平均值计算,得到所述用电对象在所述预测日的用电负荷。

根据本发明的第二个方面,提供一种用电负荷的预测装置,包括:

获取单元,用于获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;

第一确定单元,用于根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;

第二确定单元,用于确定各所述历史气象数据之间的第一相关性系数;

第三确定单元,用于根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;

筛选单元,用于根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;

预测单元,用于将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。

根据本发明的第三个方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上用电负荷的预测方法。

根据本发明的第四个方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以上用电负荷的预测方法。

根据本发明提供的一种用电负荷的预测方法、装置、存储介质及计算机设备,与目前直接用采集的数据来对用电负荷进行预测的方式相比,本发明通过获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;并根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;与此同时,确定各所述历史气象数据之间的第一相关性系数;之后根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;之后根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;最终将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。由此通过确定各个历史气象数据的重要性系数、各个历史气象数据与其余历史气象数据之间的相关性系数,以及各个历史气象数据与各个历史用电负荷之间的相关性系数,并根据重要性系数和相关性系数,对各个历史气象数据进行筛选,得到筛选后的历史气象数据,最终利用预设用电负荷预测模型对筛选后的历史气象数据的转化价值进行预测,得到用电对象在预测日的用电负荷,从而通过对历史气象数据进行筛选,并利用筛选后的历史气象数据来进行用电负荷预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出了本发明实施例提供的一种用电负荷的预测方法流程图;

图2示出了本发明实施例提供的另一种用电负荷的预测方法流程图;

图3示出了本发明实施例提供的一种用电负荷的预测装置的结构示意图;

图4示出了本发明实施例提供的另一种用电负荷的预测装置的结构示意图;

图5示出了本发明实施例提供的一种计算机设备的实体结构示意图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。

目前,采集后的数据直接用来进行用电负荷预测的方式,由于需要对数据中的无用数据进行分析,会导致用电负荷的预测效率较低和预测精度较低。

为了解决上述问题,本发明实施例提供了一种用电负荷的预测方法,如图1所示,所述方法包括:

101、获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取用电对象在用电负荷预测日的时间属性数据。

其中,历史气象数据包括历史温度、历史湿度、历史降雨量、历史风速等数据,实际历史用电负荷与历史气象数据相对应,如每个历史日期均有其对应的历史气象数据和实际历史用电负荷。时间属性数据是用电负荷预测日的节假日信息和时间信息等,如待预测日是否属于节假日,预测日中的各个时间段是否为休息时间段等。

对于本发明实施例,电力数据库中存储着各个用电对象所处位置的历史日期中的历史气象数据及其对应的实际历史用电负荷,当需要对用电对象在未来某一天(预测日)的用电负荷进行预测时间,首先在电力数据库中获取多个历史日期的历史气象数据及其对应的实际历史用电负荷,与此同时,判断该预测日是否为节假日以及预测日中的各个时间段是否为休息时间段等属性信息,之后根据各个历史日期中的历史气象数据及其对应的实际历史用电负荷,之后对历史气象数据进行筛选,最终根据筛选后的历史气象数据对用电对象在预测日的用电负荷进行预测,由此通过对历史气象数据进行筛选,能够避免无用数据参与用电负荷的预测过程,从而本发明实施例能够提高用电负荷的预测效率和预测精度,与此同时,还能够避免对无用数据进行分析所浪费的计算资源,从而本发明实施例能够节约用电负荷预测过程中的计算资源。

102、根据各个历史气象数据及其对应的实际历史用电负荷,确定各个历史气象数据的重要性系数。

其中,重要性系数是指各个历史气象数据在用电负荷预测过程中的重要程度。

对于本发明实施例,具体可以利用Null Importance(无效重要性选择)方法来计算各个历史气象数据的重要性系数,因此在获取用电对象所处位置的历史气象数据及其对应的实际历史用电负荷后,通过各个历史气象数据及其对应的实际历史用电负荷,确定各个历史气象数据在用电负荷预测过程中的第一重要行系数,以及通过各个历史气象数据及其对应的打乱后的历史用电负荷,确定各个历史气象数据在用电负荷预测过程中的第二重要行系数,最终根据第一重要性系数和第二重要性系数,确定各个历史气象数据在用电负荷预测过程中的重要程度(重要性系数),之后针对各个历史气象数据在用电负荷预测过程中的重要程度,对各个历史气象数据进行筛选,最终根据筛选后的历史气象数据对用电负荷进行预测,由此通过对历史气象数据进行筛选,去除历史气象数据中重要性较低的数据,之后利用重要性较高的历史气象数据来对用电负荷进行预测,由此在用电负荷预测过程中,能够避免对重要性较低的数据进行分析所浪费的时间,从而本发明实施例能够提高用电负荷的预测效率,与此同时,也能够避免过度关注不重要的数据而导致用电负荷预测错误的情况,从而本发明实施例能够提高用电负荷的预测精度。

103、确定各个历史气象数据之间的第一相关性系数。

对于本发明实施例,首先确定任意一历史气象数据与其余历史气象数据之间的多重共线性,之后根据多重共线性,采用方差膨胀因子算法来确定各个历史气象数据中任意一历史气象数据与其余历史气象数据之间的相关性系数,若各个历史气象数据之间存在强相关性,会导致用电负荷预测不准确,为了提高用电负荷的预测精度,需要根据各个历史气象数据与其余历史气象数据之间的相关性系数,对各个历史气象数据进行筛选,筛选掉相关性较强的气象数据,最终利用筛选后的历史气象数据来对用电负荷进行预测,从而能够提高用电负荷的预测精度。

例如,若历史气象数据包括:数据A、数据B、数据C和数据D,首先确定数据A分别与数据B、数据C和数据D之间的相关性系数,并确定数据B分别与数据C和数据D之间的相关性系数,并确定数据C与数据D之间的相关性系数,之后根据各个历史气象数据之间的相关性系数,对历史气象数据进行筛选,例如,若数据A与数据C之间的相关性系数较大,则在历史气象数据中将数据A和数据C中任意一数据删除(若将数据C删除),最终得到筛选后的历史气象数据包括数据A、数据B和数据D,之后根据筛选后的历史气象数据对用电负荷进行预测。

104、根据各个历史气象数据及其对应的实际历史用电负荷,确定各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数。

对于本发明实施例,具体可以利用皮尔逊相关系数(Pearson correlationcoefficient)方法来计算各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数,具体计算方法为,首先计算各个历史气象数据与对应的实际历史用电负荷之间的协方差和标准差,之后将协方差与标准差相除,得到各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数,之后根据各个历史气象数据对应的第二相关性系数,确定与历史用电负荷相关性较低的目标历史气象数据,并在各个历史气象数据中将目标历史气象数据删除,得到筛选后的历史气象数据,最终根据筛选后的历史气象数据对用电负荷进行预测,由此通过对历史气象数据进行筛选,去除历史气象数据中与用电负荷相关性较低的数据,之后利用与用电负荷相关性较高的历史气象数据来对用电负荷进行预测,由此在用电负荷预测过程中,能够避免对与用电负荷相关性较低的数据进行分析所浪费的时间,从而本发明实施例能够提高用电负荷的预测效率,与此同时,也能够避免过度关注相关性较低的数据而导致用电负荷预测错误的情况,从而本发明实施例能够提高用电负荷的预测精度。

105、根据重要性系数,第一相关性系数和第二相关性系数,对历史气象数据进行筛选,得到筛选后的历史气象数据。

对于本发明实施例,本发明实施例可以根据各个历史气象数据对应的重要性系数,对历史气象数据进行初步筛选,得到第一筛选后的历史气象数据,之后根据各个历史气象数据之间的第一相关性系数,对第一筛选后的历史气象数据进行再次筛选,得到第二筛选后的历史气象数据,之后根据各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数,对第二筛选后的历史气象数据进行终极筛选,得到第三筛选后的历史气象数据,并将该第三筛选后的历史气象数据确定为本发明实施例中对预测日进行用电负荷预测的气象数据。

在本发明的又一实施例中,确定各个历史气象数据对应的重要性系数,各个历史气象数据之间的第一相关性系数,以及各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数之后,还可以根据重要性数据、第一相关性数据和第二相关性系数,同一对历史气象数据进行一次筛选,得到筛选后的历史气象数据,最终利用筛选后的历史气象数据对用电对象在预测日的用电负荷进行预测。由此通过对采集的历史气象数据进行筛选,将历史气象数据中对用电负荷预测作用较小的历史气象数据删除,同时将对用电负荷预测精度产生影响的气象数据删除,最终利用筛选后的历史气象数据对用电负荷进行预测,能够提高用电负荷的预测效率和预测精度。

106、将筛选后的历史气象数据和时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到用电对象在预测日的用电负荷。

对于本发明实施例,将历史气象数据中的无用数据进行筛选,得到筛选后的历史气象数据后,将筛选后的历史气象数据和预测日的时间属性数据输入至预设用电负荷预测模型中进行用电负荷预测,最终用电负荷预测模型能够输出用电对象在预测日的用电负荷,从而通过对历史气象数据进行筛选,并利用筛选后的历史气象数据来进行用电负荷预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

根据本发明提供的一种用电负荷的预测方法,与目前直接用采集的数据来对用电负荷进行预测的方式相比,本发明通过获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;并根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;与此同时,确定各所述历史气象数据之间的第一相关性系数;之后根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;之后根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;最终将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。由此通过确定各个历史气象数据的重要性系数、各个历史气象数据与其余历史气象数据之间的相关性系数,以及各个历史气象数据与各个历史用电负荷之间的相关性系数,并根据重要性系数和相关性系数,对各个历史气象数据进行筛选,得到筛选后的历史气象数据,最终利用预设用电负荷预测模型对筛选后的历史气象数据的转化价值进行预测,得到用电对象在预测日的用电负荷,从而通过对历史气象数据进行筛选,并利用筛选后的历史气象数据来进行用电负荷预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

进一步的,为了更好的说明上述对数据进行分类的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种用电负荷的预测方法,如图2所示,所述方法包括:

201、获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取用电对象在用电负荷预测日的时间属性数据。

具体地,可以在电力数据库中获取用电对象所处位置的历史气象数据及其对应的实际历史用电负荷,并通过日历等装置确定预测日是否属于节假日,以及预测日的预测时间是否休息时间等信息。

进一步地,在获取到历史气象数据后,首先需要对历史气象数据进行初步筛选,基于此,所述方法包括:确定所述历史气象数据中的异常数据,并将所述历史气象数据中的异常数据去除,得到去除异常数据后的历史气象数据。其中,确定历史气象数据中的异常数据包括:利用预设孤立森林检测算法检测所述历史气象数据中的异常数据。其中,利用预设孤立森林检测算法检测历史气象数据中的异常数据,包括:确定所述历史气象数据中的第一最大数据值和第一最小数据值;在所述第一最大数据值和所述第一最小数据值之间选择第一数据分割值;在所述历史气象数据中确定小于或等于第一数据分割值的第一历史气象数据,以及确定大于第一数据分割值的第二历史气象数据;确定所述第一历史气象数据中的第二最大数据值和第二最小数据值;在所述第二最大数据值和所述第二最小数据值之间选择第二数据分割值,并根据所述第二数据分割值检测所述第一历史气象数据中的离群值;确定所述第二历史气象数据中的第三最大数据值和第三最小数据值;在所述第三最大数据值和所述第三最小数据值之间选择第三数据分割值,并利用所述第三数据分割值检测所述第二历史气象数据中的离群值;将所述第一历史气象数据中的离群值和所述第二历史气象数据中的离群值确定为所述历史气象数据中的异常数据。

其中,异常数据是指与其他历史气象数据明显不同的气象数据。离群值即为异常气象数据。

具体地,可以利用孤立森林检测算法来检测历史气象数据中的异常数据,具体利用孤立森林进行检测的方式为:在各个历史气象数据中随机选择某一类型历史气象数据,并确定该类型历史气象数据中的最大气象数据值(第一最大数据值)和最小气象数据值(第一最小数据值),之后在最大气象数据值和最小气象数据值之间任意选择一个数据最为气象数据分割值(第一数据分割值),之后根据气象数据分割值将该类型气象数据分成两组,即在该类型气象数据中确定小于或等于气象数据分割值的第一组历史气象数据(第一历史气象数据),并在该类型气象数据中确定大于气象数据分割值的第二组历史气象数据(第二历史气象数据),之后根据上述方式在第一组历史气象数据中确定最大气象数据值(第二最大数据值)和最小气象数据值(第二最小数据值),之后在最大气象数据值和最小气象数据值之间选择第二数据分割值,并利用第二数据分割值对第一组历史气象数据进行分割,同理对第二组历史气象数据进行分割,按照此方式不算对历史气象数据进行分割,直至不能分割位置,之后确定各个历史气象数据的分割次数,并将分割次数小于预设阈值的历史气象数据确定为异常气象数据,之后在历史气象数据中将异常气象数据删除,得到去除异常数据后的历史气象数据,例如,若某一种类型历史气象数据为历史温度数据,包括:2℃,19℃,50℃,25℃,13℃,8℃,20℃,-10℃,上述温度数据中最大温度为50℃,最小温度为-10℃,在最大温度和最小温度中随机确定一个温度分割值为0℃,则以0℃为分界点对上述各个历史温度数据进行分组,小于或等于0℃的第一组温度数据包括:2℃,19℃,50℃,25℃,13℃,8℃,20℃,大于0℃的第二组温度数据包括:-10℃,由此可知,第二组温度数据中仅包含一个温度数据,无法在继续分割,则-10℃对应的分割次数为1次,之后对第一组温度数据进行再次分割,具体分割方法为,首先确定第一组温度数据中的最大数据50℃和最小数据为2℃,在最大数据和最小数据之间随机选择一个温度分割值为27℃,之后以27℃为分界点对第一组温度数据进行分组,小于或等于27℃的第三组温度数据包括:2℃,19℃,25℃,13℃,8℃,20℃,大于27℃的第四组温度数据包括:50℃,由此可知,第四组温度数据中仅包含一个数据,无法在继续分割,则50℃对应的分割次数为2次,由此按照上述方式继续对第三组温度数据进行分割,最终可以得到各个温度数据对应的分割次数,若预设阈值为3,则将分割次数小于3次的温度数据确定为异常数据,上述示例中的50℃和-10℃即为异常数据。由此按照上述方式将确定各种类型历史气象数据中的异常气象数据,并在各个历史气象数据中将各种类型的异常气象数据删除。由此通过将历史气象数据中的异常气象数据删除,能够避免异常数据参与用电负荷预测导致的预测精度较低的问题,从而本发明实施例能够提高用电负荷的预测精度。

在本发明的又一实施例中,还可以利用DBSCAN算法(Density-Based SpatialClustering of Applications with Noise,密度聚类算法)来检测历史气象数据中的异常数据,基于此,所述方法包括:在各所述历史气象数据中确定目标历史气象数据,并统计所述目标历史气象数据对应的领域内的数据密度;若所述数据密度大于预设密度阈值,则将所述目标历史气象数据确定为聚类中心;基于所述聚类中心,对各所述历史气象数据进行聚类,得到聚类结果;将所述聚类结果中不属于任何聚类簇中的数据确定为异常数据。

其中,领域是指以目标历史气象数据为圆心,以r为半径的区域,半径r可以根据实际需求而设定,数据密度是指目标历史气象数据对应的领域内的数据量,预设密度阈值是根据实际需求设定的数值。

具体地,首先确定几个定义:核心点(目标历史气象数据):在半径r内含有超过MinPts数目的历史气象数据;边界点(边界气象数据):在半径r内历史气象数据的数量小于MinPts,但是落在核心历史气象数据的邻域内的点;噪音点(异常数据):既不是核心点也不是边界点的点。具体聚类方法为:对每个历史气象数据计算其邻域内数据的集合,当集合内的数据的数量超过预设密度阈值,则将该历史气象数据确定为核心点(聚类中心),之后查看剩余点是否在核心点的邻域内,将在核心点的邻域内的剩余点确定为边界点,将不在核心点的邻域内的剩余点确定为噪音点,之后将噪音点对应的历史气象数据确定为异常数据,最终在各个历史气象数据中将异常数据剔除。

进一步地,本发明实施例还可以利用箱线图法来检测历史气象数据中的异常数据,具体方法包括:确定各所述历史气象数据对应的中位数,并确定各所述历史气象数据中的最小值与所述中位数之间的第一中间值,并将所述第一中间值确定为各所述历史气象数据对应的第一四分位数;确定各所述历史气象数据中的最大值与所述中位数之间的第二中间值,并将所述第二中间值确定为各所述历史气象数据对应的第三四分位数;计算所述第一四分位数与所述第三四分位数之间的距离,并将所述距离确定为各所述历史气象数据对应的四分位间距;根据所述第一四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测下限值;根据所述第三四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测上限值;在各所述历史气象数据中,将所述异常检测下限值至异常检测上限值之外的数据确定为异常数据。

具体地,首先确定历史气象数据集中的中位数Q2,即数据集中的中间值;并根据中位数,确定历史气象数据集对应的第一四分位数Q1,即数据集最小值和中位数之间的中间数;之后根据中位数,确定历史气象数据集对应的第三四分位数Q3,即数据集的中位数和最大值之间的中间数;并确定历史气象数据集对应的四分位间距IQR,即第一四分位数至第三四分位数之间的距离;之后计算历史气象数据集对应的上限值upper=Q3+1.5*IQR,以及下限值lower=Q1 -1.5*IQR,最终在各个历史气象数据中确定lower-upper之外的数据,并将lower-upper之外的数据确定为异常数据。

进一步地,在将历史气象数据中的异常数据去除后,为了让模型学习到更多的信息,从而提高用电负荷的预测精度,还可以扩充预测数据集,基于此,所述方法还包括:确定所述去除异常数据后的历史气象数据中的最大值、最小值和方差;将所述去除异常数据后的最大值与最小值相减,得到所述历史气象数据对应的交互特征值;将所述方差和所述交互特征值填充至所述去除异常数据后的历史气象数据中,得到扩充后的历史气象数据。

具体地,例如,若历史气象数据为历史温度,若对温度数据集进行扩充,首先需要确定各个历史温度对应的最大历史温度和最小历史温度,之后将最大历史温度与最小历史温度相减,得到历史温度对应的交互特征值,与此同时,计算各个历史温度对应的方差,最终将交互特征值和方差填充至历史气象数据中,得到扩充后的历史气象数据。

202、基于各个历史气象数据及其对应的实际历史用电负荷,确定各个历史气象数据对应的第一重要性系数。

203、将各个历史气象数据对应的实际历史用电负荷进行置换,得到各个历史气象数据对应的置换后的历史用电负荷。

204、基于各个历史气象数据及其对应的置换后的历史用电负荷,确定各个历史气象数据对应的第二重要性系数。

205、基于第一重要性系数和第二重要性系数,确定各个历史气象数据对应的重要性系数。

对于本发明实施例,为了对历史气象数据进行筛选,首先需要确定各个历史气象数据对应的第一重要性系数,基于此,步骤202具体包括:将各所述历史气象数据及其对应的实际历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第一重要性系数。之后确定确定各历史气象数据对应的第二重要性系数,基于此,步骤204具体包括:将各所述历史气象数据及其对应的置换后的历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第二重要性系数。最终需要根据第一重要性系数和第二重要性系数来确定各个历史气象数据对应的重要性系数,基于此,步骤205具体包括:利用预设分位数比较法计算所述第一重要性系数和所述第二重要性系数之间的比值;将所述比值取对数,得到各所述历史气象数据对应的重要性系数。

其中,重要性系数的大小反应历史气象数据对用电负荷预测过程的重要程度。具体地,例如,若历史温度A℃对应的实际历史用电负荷为ekw,历史温度B℃对应的实际历史用电负荷为fkw,历史温度D℃对应的实际历史用电负荷为gkw,将上述历史温度及其对应的真实历史用电负荷输入至预设树模型中,通过预设树模型可以输出上述各个历史温度对应的第一重要性系数,之后将上述各个历史温度对应的真实历史用电负荷打乱,例如,打乱后的对应关系为:历史温度A℃对应的实际历史用电负荷为gkw,历史温度B℃对应的实际历史用电负荷为ekw,历史温度D℃对应的实际历史用电负荷为fkw,将历史温度及其对应的打乱后的历史用电负荷输入至预设树模型中,通过预设树模型输出打乱用电负荷后的各个历史温度对应的第二重要性系数,由此按照上述方式能够计算出各个历史气象数据对应的第一重要性系数和第二重要性系数,之后根据第一重要性系数和第二重要性系数,按照如下公式计算各个历史气象数据对应的重要性系数:

其中,y表示各个历史气象数据对应的重要性系数,x

206、确定各个历史气象数据之间的第一相关性系数。

对于本发明实施例,若各个历史气象数据之间存在强相关性,会导致模型预测不稳定,因此,为了提高模型的预测精度,即提高用电负荷的预测精度,还需要确定各个历史气象数据之间的第一相关性系数,基于此,步骤206具体包括:确定各所述历史气象数据中任意一历史气象数据对所述其余历史气象数据做回归分析的负相关系数,其中,所述其余历史气象数据为各所述历史气象数据中去除所述任意一历史气象数据后的数据;将1与所述负相关系数的平方相减,得到所述任意一历史气象数据对所述其余历史气象数据的容忍系数;确定所述容忍系数的倒数,并将所述容忍系数的倒数确定为所述任意一历史气象数据与其余历史气象数据之间的第一相关性系数。

具体地,首先在历史气象数据中选择任意一个历史气象数据,并对该任意一个历史气象数据与其余历史气象数据之间做回归分析,以此来确定该任意一历史气象数据与其余历史气象数据之间的负相关系数,之后按照如下公式计算该任意一历史气象数据与其余历史气象数据之间的第一相关性系数:

其中,R

207、根据各个历史气象数据及其对应的实际历史用电负荷,确定各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数。

对应本发明实施例,历史气象数据与历史用电负荷之间无相关性或相关性较弱,则历史气象数据对用电负荷预测过程将不会产生影响,为了需要将对用电负荷预测过程不产生影响的历史气象数据筛选掉,首先需要计算各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数,基于此,步骤207具体包括:计算各所述历史气象数据对应的期望值和标准差,以及确定各所述实际历史用电负荷对应的期望值和标准差;将各所述历史气象数据与对应的期望值相减,得到第一差值,以及将各所述实际历史用电负荷与对应的期望值相减,得到第二差值;将所述第一差值与所述第二差值相乘,得到差值乘积,并根据所述差值乘积确定各所述历史气象数据与各所述实际历史用电负荷之间的协方差;将各所述历史气象数据对应的标准差与各所述实际历史用电负荷对应的标准差相乘,得到标准差乘积;将所述协方差与所述标准差乘积相除,得到各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数。

具体地,可以按照如下公式计算各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数:

其中,β

208、根据重要性系数,第一相关性系数和第二相关性系数,对历史气象数据进行筛选,得到筛选后的历史气象数据。

对于本发明实施例,在确定各个历史气象数据对应的总要性系数,各个历史气象数据之间的第一相关性系数,以及各个历史气象数据与实际历史用电负荷之间的第二相关性系数后,需要根据重要性系数、第一相关性系数和第二相关性系数对历史气象数据进行筛选,基于此,步骤208具体包括:根据各所述历史气象数据的重要性系数,对各所述历史气象数据进行筛选,得到第一历史气象数据集;根据各所述历史气象数据中任意一历史气象数据与其余历史气象数据之间的第一相关性系数,对各所述历史气象数据进行筛选,得到第二历史气象数据集;根据各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数,对各所述历史气象数据进行筛选,得到第三历史气象数据集;根据所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集,确定所述筛选后的历史气象数据。

具体地,首先根据各个历史气象数据对应的重要性系数,对历史气象数据进行筛选,具体筛选方法包括:在各所述历史气象数据的重要性系数中确定小于第一预设阈值的目标重要性系数;在各所述历史气象数据中将所述目标重要性系数对应的历史气象数据剔除,得到第一历史气象数据集。

其中,第一预设阈值是根据实际需求设定的数值。具体地,根据各个历史气象数据对应的重要性系数,确定重要性系数小于第一预设阈值的目标重要性系数,则该目标重要性系数对应的历史气象数据即为对用电负荷预测过程不产生影响的数据,因此需要将历史气象数据中的该目标重要性系数对应的历史气象数据删除,得到第一历史气象数据集。

进一步地,还需要根据各个历史气象数据之间的第一相关性系数,对各个历史气象数据进行筛选,基于此,具体筛选方法包括:在所述任意一历史气象数据对应的第一相关性系数中确定大于第二预设阈值的第一目标相关性系数;在各所述历史气象数据中将第一目标相关性系数对应的历史气象数据剔除,得到第二历史气象数据集。

其中,第二预设阈值是根据实际情况设定的数据。具体地,若第二预设阈值为2,历史气象数据中包括:历史气象数据A,历史气象数据B和历史气象数据C,历史气象数据A与历史气象数据B之间的第一相关性系数为2.5,历史气象数据B与历史气象数据C之间的第一相关性系数为1.5,历史气象数据A与历史气象数据C之间的第一相关性系数为1,则在数据A与数据B中任选一数据删除,若删除数据A,则第二历史气象数据集中的数据为:历史气象数据B和历史气象数据C。

进一步地,还需要根据历史气象数据与实际历史用电负荷之间的第二相关性系数,对各个历史气象数据进行筛选,基于此,具体筛选方法包括:在各所述历史气象数据对应的第二相关性系数中确定小于第三预设阈值的第二目标相关性系数;在各所述历史气象数据中将所述第二目标相关性系数对应的历史气象数据剔除,得到第三历史气象数据集。

其中,第三预设阈值是根据实际需求设定的数值。具体地,若第三预设阈值为1,各个历史气象数据包括:历史气象数据A、历史气象数据B、历史气象数据C,历史气象数据A与实际历史用电负荷之间的相关性系数为1.5,历史气象数据B与实际历史用电负荷之间的相关性系数为0.5,历史气象数据C与实际历史用电负荷之间的相关性系数为2,则确定历史气象数据B与实际历史用电负荷之间的相关性系数小于第三预设阈值,则在历史气象数据中将数据B删除,得到第三历史气象数据集为:历史气象数据A和历史气象数据C。

进一步地,在根据各个历史气象数据对应的重要性系数,对历史气象数据进行筛选,得到第一历史气象数据集,以及根据各个历史气象数据之间的第一相关性系数,对历史气象数据进行筛选,得到第二历史气象数据集,以及根据各个历史气象数据与实际历史用电负荷之间第二相关性系数,对历史气象数据进行筛选,得到第三历史气象数据集后,计算第一历史气象数据集、第二历史气象数据集与第三历史气象数据集之间的气象数据交集,将三者之间的气象数据交集确定为筛选后的历史气象数据,最终气象数据交集中的历史气象数据对用电负荷进行预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

209、将筛选后的历史气象数据和时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到用电对象在预测日的用电负荷。

其中,预设用电负荷预测模型为预设梯度提升树模型(xgboost模型),预设梯度提升树模型包括多个基分类器。

对于本发明实施例,为了提高预设用电负荷预测模型的预测精度,在利用预设用电负荷预测模型进行用电负荷预测之前,首先需要训练并构建该预设用电负荷预测模型,基于此,具体构建方法包括:获取样本气象数据和样本预测日对应的样本时间属性数据,以及获取所述样本预测日对应的实际用电负荷;对所述样本气象数据进行筛选,得到筛选后的样本气象数据;将所述筛选后的样本气象数据和样本时间属性数据输入至预设初始用电负荷预测模型中进行用电负荷预测,得到所述样本预测日对应的预测用电负荷;基于所述样本预测日对应的实际用电负荷和预测用电负荷,构建所述预设初始用电负荷预测模型对应的损失函数;基于所述损失函数,构建所述预设用电负荷预测模型。即首先构建预设初始用电负荷预测模型,并构建预设初始用电负荷预测模型对应的损失函数,基于该损失函数,不断对预设初始用电负荷预测模型中的模型参数进行调优,最终得到参数最优、损失最小的预设初始用电负荷预测模型,便将该损失最小参数最优的预设初始用电负荷预测模型确定为预设用电负荷预测模型,之后利用该构建好的预设用电负荷预测模型来对待预测日的用电负荷进行预测,从而能够提高用电负荷的预测精度。

对于本发明实施例,在构建完预设用电负荷预测模型后,需要根据筛选后的历史气象数据对用电负荷进行预测,基于此,步骤209具体包括:确定所述筛选后的历史气象数据对应的第一特征向量,以及确定所述时间属性数据对应的第二特征向量;将所述第一特征向量和所述第二特征向量进行横向拼接,得到用电拼接特征向量;将所述用电拼接特征向量输入至各所述基分类器中进行负荷预测,得到各所述基分类器分别输出的预测用电负荷;将各所述基分类器分别输出的预测用电负荷进行加权平均值计算,得到所述用电对象在所述预测日的用电负荷。

具体地,为了帮助模型获取到更加详尽和全面的特征信息,提高模型预测性能,需要对帅选后的历史气象数据的时间属性数据进行拼接处理,基于此,首先可以利用预设词嵌入方法确定筛选后的历史气象数据对应的第一特征向量,以及时间属性数据对应的第二特征向量,之后对第一特征向量、第二特征向量进行横向拼接,用电拼接特征向量,例如,若第一特征向量为[1,2,3],第二特征向量为[4,5,6],将它们横向拼接,得到的拼接特征向量为[1,2,3,4,5,6],之后将用电拼接特征向量输入至各个基分类器中进行用电负荷预测,各个基分类器会分别输出其对应的预测用电负荷,最终计算各个基分类器分别输出的预测用电负荷的加权平均值,得到用电对象在待预测日对应的用电负荷,由此通过对历史气象数据和时间属性数据进行拼接处理,能够获取到更加全面的特征信息,从而能够提高用电负荷的预测精度。

根据本发明提供的另一种用电负荷的预测方法,与目前直接用采集的数据来对用电负荷进行预测的方式相比,本发明通过获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;并根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;与此同时,确定各所述历史气象数据之间的第一相关性系数;之后根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;之后根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;最终将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。由此通过确定各个历史气象数据的重要性系数、各个历史气象数据与其余历史气象数据之间的相关性系数,以及各个历史气象数据与各个历史用电负荷之间的相关性系数,并根据重要性系数和相关性系数,对各个历史气象数据进行筛选,得到筛选后的历史气象数据,最终利用预设用电负荷预测模型对筛选后的历史气象数据的转化价值进行预测,得到用电对象在预测日的用电负荷,从而通过对历史气象数据进行筛选,并利用筛选后的历史气象数据来进行用电负荷预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

进一步地,作为图1的具体实现,本发明实施例提供了一种用电负荷的预测装置,如图3所示,所述装置包括:获取单元31、第一确定单元32、第二确定单元33、第三确定单元34、筛选单元35和预测单元36。

所述获取单元31,可以用于获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据。

所述第一确定单元32,可以用于根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数。

所述第二确定单元33,可以用于确定各所述历史气象数据之间的第一相关性系数。

所述第三确定单元34,可以用于根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数。

所述筛选单元35,可以用于根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据。

所述预测单元36,可以用于将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。

在具体应用场景中,为了剔除历史气象数据中的异常数据,如图4所示,所述装置还包括:剔除单元37。

所述剔除单元37,可以用于确定所述历史气象数据中的异常数据,并将所述历史气象数据中的异常数据去除,得到去除异常数据后的历史气象数据。

在具体应用场景中,为了确定历史气象数据中的异常数据,所述剔除单元37,具体可以用于在各所述历史气象数据中确定目标历史气象数据,并统计所述目标历史气象数据对应的领域内的数据密度;若所述数据密度大于预设密度阈值,则将所述目标历史气象数据确定为聚类中心;基于所述聚类中心,对各所述历史气象数据进行聚类,得到聚类结果;将所述聚类结果中不属于任何聚类簇中的数据确定为异常数据。

在具体应用场景中,为了确定历史气象数据中的异常数据,所述剔除单元37,具体还可以用于确定各所述历史气象数据对应的中位数,并确定各所述历史气象数据中的最小值与所述中位数之间的第一中间值,并将所述第一中间值确定为各所述历史气象数据对应的第一四分位数;确定各所述历史气象数据中的最大值与所述中位数之间的第二中间值,并将所述第二中间值确定为各所述历史气象数据对应的第三四分位数;计算所述第一四分位数与所述第三四分位数之间的距离,并将所述距离确定为各所述历史气象数据对应的四分位间距;根据所述第一四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测下限值;根据所述第三四分位数和所述四分位间距,计算各所述历史气象数据对应的异常检测上限值;在各所述历史气象数据中,将所述异常检测下限值至异常检测上限值之外的数据确定为异常数据。

在具体应用场景中,为了确定历史气象数据中的异常数据,所述剔除单元37,具体可以用于利用预设孤立森林检测算法检测所述历史气象数据中的异常数据。

在具体应用场景中,为了确定历史气象数据中的异常数据,所述剔除单元37,包括第一确定模块371和选择模块372。

所述第一确定模块371,可以用于确定所述历史气象数据中的第一最大数据值和第一最小数据值。

所述选择模块372,可以用于在所述第一最大数据值和所述第一最小数据值之间选择第一数据分割值。

所述第一确定模块371,具体可以用于在所述历史气象数据中确定小于或等于第一数据分割值的第一历史气象数据,以及确定大于第一数据分割值的第二历史气象数据。

所述第一确定模块371,具体可以用于确定所述第一历史气象数据中的第二最大数据值和第二最小数据值。

所述选择模块372,具体可以用于在所述第二最大数据值和所述第二最小数据值之间选择第二数据分割值,并根据所述第二数据分割值检测所述第一历史气象数据中的离群值。

所述第一确定模块371,具体可以用于确定所述第二历史气象数据中的第三最大数据值和第三最小数据值。

所述选择模块372,具体可以用于在所述第三最大数据值和所述第三最小数据值之间选择第三数据分割值,并利用所述第三数据分割值检测所述第二历史气象数据中的离群值。

所述第一确定模块371,具体可以用于将所述第一历史气象数据中的离群值和所述第二历史气象数据中的离群值确定为所述历史气象数据中的异常数据。

在具体应用场景中,为了对历史气象数据进行扩充,所述装置还包括:扩充单元38。

所述扩充单元38,可以用于确定所述去除异常数据后的历史气象数据中的最大值、最小值和方差;将所述去除异常数据后的最大值与最小值相减,得到所述各种类型气象数据对应的交互特征值;将所述方差和所述交互特征值填充至所述去除异常数据后的历史气象数据中,得到扩充后的历史气象数据。

在具体应用场景中,为了确定各个历史气象数据的重要性系数,所述第一确定单元32,包括第二确定模块321和置换模块322。

所述第二确定模块321,可以用于基于各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据对应的第一重要性系数。

所述置换模块322,可以用于将各所述历史气象数据对应的实际历史用电负荷进行置换,得到各所述历史气象数据对应的置换后的历史用电负荷。

所述第二确定模块321,具体可以用于基于各所述历史气象数据及其对应的置换后的历史用电负荷,确定各所述历史气象数据对应的第二重要性系数。

所述第二确定模块321,具体可以用于基于所述第一重要性系数和所述第二重要性系数,确定各所述历史气象数据对应的重要性系数。

在具体应用场景中,为了确定各个历史气象数据对应的第一重要性系数,所述第二确定模块321,具体可以用于将各所述历史气象数据及其对应的实际历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第一重要性系数。

在具体应用场景中,为了确定各个历史气象数据对应的第二重要性系数,所述第二确定模块321,具体可以用于将各所述历史气象数据及其对应的置换后的历史用电负荷输入至预设树模型中进行重要性预测,得到各所述历史气象数据对应的第二重要性系数。

在具体应用场景中,为了确定各个历史气象数据对应的重要性系数,所述第二确定模块321,包括相除子模块和确定子模块。

所述相除子模块,可以用于利用预设分位数比较法计算所述第一重要性系数和所述第二重要性系数之间的比值。

所述确定子模块,可以用于将所述比值取对数,得到各所述历史气象数据对应的重要性系数。

在具体应用场景中,为了确定任意一历史气象数据与其余历史气象数据之间的第一相关性系数,所述第二确定单元33,包括第三确定模块331、第一相减模块332。

所述第三确定模块331,可以用于确定各所述历史气象数据中任意一历史气象数据对所述其余历史气象数据做回归分析的负相关系数,其中,所述其余历史气象数据为各所述历史气象数据中去除所述任意一历史气象数据后的数据。

所述第一相减模块332,可以用于将1与所述负相关系数的平方相减,得到所述任意一历史气象数据对所述其余历史气象数据的容忍系数。

所述第三确定模块331,可以用于确定所述容忍系数的倒数,并将所述容忍系数的倒数确定为所述任意一历史气象数据与其余历史气象数据之间的第一相关性系数。

在具体应用场景中,为了确定各个历史气象数据与各个实际历史用电负荷之间的第二相关性系数,所述第三确定单元34,包括计算模块341、第二相减模块342、相乘模块343和相除模块344。

所述计算模块341,可以用于计算各所述历史气象数据对应的期望值和标准差,以及确定各所述实际历史用电负荷对应的期望值和标准差。

所述第二相减模块342,可以用于将各所述历史气象数据与对应的期望值相减,得到第一差值,以及将各所述实际历史用电负荷与对应的期望值相减,得到第二差值。

所述相乘模块343,可以用于将所述第一差值与所述第二差值相乘,得到差值乘积,并根据所述差值乘积确定各所述历史气象数据与各所述实际历史用电负荷之间的协方差。

所述相乘模块343,还可以用于将各所述历史气象数据对应的标准差与各所述实际历史用电负荷对应的标准差相乘,得到标准差乘积。

所述相除模块344,可以用于将所述协方差与所述标准差乘积相除,得到各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数。

在具体应用场景中,为了对历史气象数据进行筛选,所述筛选单元35,包括筛选模块351和第四确定模块352。

所述筛选模块351,可以用于根据各所述历史气象数据的重要性系数,对各所述历史气象数据进行筛选,得到第一历史气象数据集。

所述筛选模块351,还可以用于根据各所述历史气象数据中任意一历史气象数据与其余历史气象数据之间的第一相关性系数,对各所述历史气象数据进行筛选,得到第二历史气象数据集。

所述筛选模块351,还可以用于根据各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数,对各所述历史气象数据进行筛选,得到第三历史气象数据集。

第四确定模块352,可以用于根据所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集,确定所述筛选后的历史气象数据。

在具体应用场景中,为了确定第一历史气象数据集,所述筛选模块351,具体可以用于在各所述历史气象数据的重要性系数中确定小于第一预设阈值的目标重要性系数;在各所述历史气象数据中将所述目标重要性系数对应的历史气象数据剔除,得到第一历史气象数据集。

在具体应用场景中,为了确定第二历史气象数据集,所述筛选模块351,具体可以用于在所述任意一历史气象数据对应的第一相关性系数中确定大于第二预设阈值的第一目标相关性系数;在各所述历史气象数据中将第一目标相关性系数对应的历史气象数据剔除,得到第二历史气象数据集。

在具体应用场景中,为了确定第三历史气象数据集,所述筛选模块351,具体可以用于在各所述历史气象数据对应的第二相关性系数中确定小于第三预设阈值的第二目标相关性系数;在各所述历史气象数据中将所述第二目标相关性系数对应的历史气象数据剔除,得到第三历史气象数据集。

在具体应用场景中,为了确定筛选后的历史气象数据,所述第四确定模块352,具体可以用于确定所述第一历史气象数据集、所述第二历史气象数据集和所述第三历史气象数据集之间的气象数据交集,并将所述气象数据交集确定为所述筛选后的历史气象数据。

在具体应用场景中,为了对待预测日的用电负荷进行预测,所述预测单元36,包括第五确定模块361、拼接模块362、预测模块363和均值计算模块364。

所述第五确定模块361,可以用于确定所述筛选后的历史气象数据对应的第一特征向量,以及确定所述时间属性数据对应的第二特征向量。

所述拼接模块362,可以用于将所述第一特征向量和所述第二特征向量进行横向拼接,得到用电拼接特征向量。

所述预测模块363,可以用于将所述用电拼接特征向量输入至各所述基分类器中进行负荷预测,得到各所述基分类器分别输出的预测用电负荷。

所述均值计算模块364,可以用于将各所述基分类器分别输出的预测用电负荷进行加权平均值计算,得到所述用电对象在所述预测日的用电负荷。

需要说明的是,本发明实施例提供的一种用电负荷的预测装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。

基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;确定各所述历史气象数据之间的第一相关性系数;根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。

基于上述如图1所示方法和如图3所示装置的实施例,本发明实施例还提供了一种计算机设备的实体结构图,如图5所示,该计算机设备包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;确定各所述历史气象数据之间的第一相关性系数;根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。

通过本发明的技术方案,本发明通过获取用电对象所处位置的历史气象数据和实际历史用电负荷,以及获取所述用电对象在用电负荷预测日的时间属性数据;并根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据的重要性系数;与此同时,确定各所述历史气象数据之间的第一相关性系数;之后根据各所述历史气象数据及其对应的实际历史用电负荷,确定各所述历史气象数据与各所述实际历史用电负荷之间的第二相关性系数;之后根据所述重要性系数,所述第一相关性系数和所述第二相关性系数,对所述历史气象数据进行筛选,得到筛选后的历史气象数据;最终将所述筛选后的历史气象数据和所述时间属性数据输入至预设用电负荷预测模型中进行负荷预测,得到所述用电对象在所述预测日的用电负荷。由此通过确定各个历史气象数据的重要性系数、各个历史气象数据与其余历史气象数据之间的相关性系数,以及各个历史气象数据与各个历史用电负荷之间的相关性系数,并根据重要性系数和相关性系数,对各个历史气象数据进行筛选,得到筛选后的历史气象数据,最终利用预设用电负荷预测模型对筛选后的历史气象数据的转化价值进行预测,得到用电对象在预测日的用电负荷,从而通过对历史气象数据进行筛选,并利用筛选后的历史气象数据来进行用电负荷预测,能够避免无用数据对预测结果的干扰,从而能够提高用电负荷的预测精度,与此同时,通过对历史气象数据进行精简,能够避免在用电负荷预测过程中对无用数据进行分析所浪费的时间,从而本发明能够提高用电负荷的预测效率,同时也能够节约模型对无用数据进行分析的计算资源。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

相关技术
  • 电子装置、基于决策树模型的建筑物用电负荷预测方法及存储介质
  • 用电设备的控制方法、装置、计算机设备和存储介质
  • 一种居民用电电量预测方法、装置、设备及存储介质
  • 用电管理方法、装置、计算机设备和存储介质
  • 客户稳定性的预测方法、装置、计算机设备和存储介质
  • 用电负荷预测方法、装置、计算机设备和存储介质
  • 用电负荷预测方法、装置、电子设备和存储介质
技术分类

06120116489262