掌桥专利:专业的专利平台
掌桥专利
首页

基于电力大数据居家概率预测方法及其设备

文献发布时间:2023-06-19 10:24:22


基于电力大数据居家概率预测方法及其设备

技术领域

本说明书一个或多个实施例涉及居家概率技术领域,尤其涉及基于电力大数据居家概率预测方法及其设备。

背景技术

第七次全国人口普查工作于今年初全面启动,由于人口普查工作要求全覆盖,所以普查最大的痛点就是入户难,找不到人,从而影响普查效率以及普查质量。主要表现在多次入户找不到人,同时由于普查员责任心不强,导致普查数据偏差较大。而根据住户过去的居家数据,预测住户未来居家概率是解决上述问题的一个重要因素。

目前对住户居家概率的预测主要依赖统计的人均用电量,预测住户未来的用电量,同时结合机器学习的方法对住户未来居家概率进行预测,没有通过数据分析的方法对住户的居家概率进行预测,同时,当区域内住户的用电数据不具备训练要求时,则会无法准确对住户未来居家概率进行预测。

发明内容

有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于电力大数据居家概率预测方法及其设备,以解决现有技术中预测住户居家概率不准确或者无法预测的问题。

基于上述目的,本说明书一个或多个实施例提供了基于电力大数据居家概率预测方法,包括:

获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ;

根据获取日用电量数据判断住户是否为空置住户;

基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量;

将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

可选的,所述根据获取日用电量数据判断住户是否为空置住户,包括:

获取住户日用电量数据,若满足如下条件中的任一个条件:

(1)连续两周用电数据为零;

(2)一个月用电数据为零;

(3)半年用电数据为零;

则判断为空置住户,其居家概率为零。

可选的,所述建时间序列模型为采用用于处理非平稳序列的时间序列模型。

可选的,所述将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率,包括:

分别将住户预测日用电量与住户平均用电量μ进行比较;

若住户预测日用电量高于住户平均用电量μ,则住户未来一段时间在家的概率≥50%;

若住户预测日用电量低于住户平均用电量μ,则住户未来一段时间在家的概率<50%。

可选的,所述分别将住户预测日用电量与住户平均用电量μ进行比较,包括:

基于住户平均用电量μ,计算出住户用电标准差σ;

基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间;

将住户预测日用电量分别和分割区间进行比较。

可选的,所述日用电量数据与居家概率密度服从正态分布。

可选的,所述基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间,包括:

根据日用电量数据与居家概率密度的正态分布,确定分割区间的范围;

基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间。

可选的,所述分割区间的端点值从小到大分别为:μ-3σ、μ-2σ、μ-σ、μ、μ+σ、μ+2σ、μ+3σ。

可选的,所述居家概率的判断标椎如下:

若住户预测日用电量≥μ+2σ,则居家概率为≥95%;

若住户预测日用电量∈[μ+σ,μ+2σ),则居家概率为[85%~95%);

若住户预测日用电量∈[μ,μ+σ),则居家概率为[50%~85%);

若住户预测日用电量∈[μ-σ,μ),则居家概率为[25%~50%);

若住户预测日用电量∈[μ-2σ,μ-σ),则居家概率为[5%~25%);

若住户预测日用电量<μ-2σ,则居家概率为<5%。

一种装置,用于执行所述基于电力大数据居家概率预测方法,包括:

数据获取模块,用于获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ;

数据判断模块,用于根据获取日用电量数据判断住户是否为空置住户;

模型处理模块,用于基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量;

概率预测模块,用于将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

从上面所述可以看出,本说明书一个或多个实施例提供的一种基于电力大数据居家概率预测方法及其设备,通过获取住户历史用电数据,建立住户用电量预测的时间序列模型,预测住户未来的用电数据,基于对住户未来用电数据的预测,和对住户历史用电数据的对比分析,通过基于数理统计的方法预测住户居家概率,一方面有利于避免机器学习方法对训练数据要求的弊端,另一方面也为人口普查员明确住户是否在家,引导普查员选择合适的时间入户调查提供了准确的依据。

附图说明

为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本说明书一个或多个实施例基于电力大数据居家概率预测方法的流程图图;

图2为本说明书一个或多个实施例住户居家概率预测模型流程图;

图3为本说明书一个或多个实施例日用电量数据与居家概率密度关系分布图;

图4为本说明书一个或多个实施例执行基于电力大数据居家概率预测方法设备的内部模块框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本公开进一步详细说明。

目前对住户居家概率的预测主要依赖统计的人均用电量,预测住户未来的用电量,同时结合机器学习的方法对住户未来居家概率进行预测,没有通过数据分析的方法对住户的居家概率进行预测,同时,当区域内住户的用电数据不具备训练要求时,则会无法准确对住户未来居家概率进行预测。

为了解决上述问题,本说明书一个或多个实施例提供了基于电力大数据居家概率预测方法,包括:

获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ;

根据获取日用电量数据判断住户是否为空置住户;

基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量;

将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

本说明书一个或多个实施例还提供的一种装置,用于执行基于电力大数据居家概率预测方法,包括:

数据获取模块,用于获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ;

数据判断模块,用于根据获取日用电量数据判断住户是否为空置住户;

模型处理模块,用于基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量;

概率预测模块,用于将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

通过获取住户历史用电数据,建立住户用电量预测的时间序列模型,预测住户未来的用电数据,基于对住户未来用电数据的预测,和对住户历史用电数据的对比分析,通过基于数理统计的方法预测住户居家概率,一方面有利于避免机器学习方法对训练数据要求的弊端,另一方面也为人口普查员明确住户是否在家,引导普查员选择合适的时间入户调查提供了准确的依据。

具体的,本说明书一个或多个实施例提供了基于电力大数据居家概率预测方法,流程图如图1~2所示,包括:

步骤101,获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ。

举例来说,获取住户最近一个月时间范围内的日用电量数据作为历史用电数据,计算出住户平均用电量μ。

步骤102,根据获取日用电量数据判断住户是否为空置住户。

获取住户日用电量数据,若满足如下条件中的任一个条件:

(1)连续两周用电数据为零;

(2)一个月用电数据为零;

(3)半年用电数据为零;

则判断为空置住户,其居家概率为零。

举例来说,根据获取日用电量数,若住户连续两周用电数据为零,则该住户为近两周空置住户,其居家概率为0;住户一个月用电数据为零,近一个月空置住户,其居家概率为0;住户半年用电数据为零,近半年空置住户,其居家概率为0。

步骤103,基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量。

举例来说,基于获取的日用电量数据构建时间序列模型,本次居民用电量数据量大,数据形态各异,很难判定所有的数据都是平稳数据,所以统一采用适合用于处理非平稳序列的时间序列模型,预测未来7天每日的用电量。

时间序列模型采用ARIMA模型适用于非平稳时间序列数据,其中的I表示差分的次数,适当的差分可使原序列成为平稳序列后,再进行ARIMA模型的建模。

ARIMA模型建立步骤包括:

平稳:通过差分的手段,对非平稳时间序列数据进行平稳操作。

定阶:确定ARIMA模型的阶数p,q。

估计:估计未知参数。

检验:检验残差是否是白噪声过程。对于白噪声序列,虽然其是稳定的,但白噪声代表其变化无规律,无法从中学习到趋势,在进行时间序列分析时,进行白噪声检验。在白噪声检验的方法中,采用Ljung-Box test(LBQ)。

预测:利用模型预测住户未来七天日用电量。

步骤104,将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

举例来说,分别将住户预测日用电量与住户平均用电量μ进行比较;包括,基于住户平均用电量μ,计算出住户用电标准差σ;

基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间;

将住户预测日用电量分别和分割区间进行比较。

若住户预测日用电量高于住户平均用电量μ,则住户未来一段时间在家的概率≥50%;

若住户预测日用电量低于住户平均用电量μ,则住户未来一段时间在家的概率<50%。

即分别用预测的住户七天的用电量,跟住户历史获得月平均电量相比较。比月平均用电量值高的。起码有一半的概率是在家的,而低于月平均用电量平均值的,自然其在家概率也低。

单个住户的日用电分布居家概率密度,在排除其他因素的影响下,近似服从正态分布,如图3所示。据此,可以根据短期用电量的预测值,与月平均用电量统计数据做对比,对住户居家概率进行预测。

根据日用电量数据与居家概率密度的正态分布,确定分割区间的范围;

基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间。即日用电量数据被分成的区间的端点值从小到大分别为:μ-3σ、μ-2σ、μ-σ、μ、μ+σ、μ+2σ、μ+3σ。

根据日用电量数据与居家概率密度的正态分布,进行住户未来居家概率的预测,若住户预测日用电量≥μ+2σ,则居家概率为≥95%;

若住户预测日用电量∈[μ+σ,μ+2σ),则居家概率为[85%~95%);

若住户预测日用电量∈[μ,μ+σ),则居家概率为[50%~85%);

若住户预测日用电量∈[μ-σ,μ),则居家概率为[25%~50%);

若住户预测日用电量∈[μ-2σ,μ-σ),则居家概率为[5%~25%);

若住户预测日用电量<μ-2σ,则居家概率为<5%。

为了执行上述方法,本说明书一个或多个实施例还提供的一种装置,模块的内部连接如图4所示,包括:数据获取模块401,数据判断模块402,模型处理模块403,概率预测模块404。

具体的,数据获取模块401,用于获取住户一段时间内的日用电量数据,并计算出住户平均用电量μ。

举例来说,获取获取住户最近一个月时间范围内的日用电量数据作为历史用电数据,计算出住户平均用电量μ。

数据判断模块402,用于根据获取日用电量数据判断住户是否为空置住户。

举例来说,根据获取日用电量数,若住户连续两周用电数据为零,则该住户为近两周空置住户,其居家概率为0;住户一个月用电数据为零,近一个月空置住户,其居家概率为0;住户半年用电数据为零,近半年空置住户,其居家概率为0。

模型处理模块403,用于基于获取的日用电量数据构建时间序列模型,并采用所述的时间序列模型预测住户未来一段时间的日用电量,得住户预测日用电量。

举例来说,基于获取的日用电量数据构建时间序列模型,本次居民用电量数据量大,数据形态各异,很难判定所有的数据都是平稳数据,所以统一采用适合用于处理非平稳序列的时间序列模型,预测未来7天每日的用电量。

概率预测模块404,用于将住户预测日用电量与住户平均用电量μ进行比较,预测住户未来一段时间的居家概率。

举例来说,分别将住户预测日用电量与住户平均用电量μ进行比较;包括,基于住户平均用电量μ,计算出住户用电标准差σ;

基于住户平均用电量μ和住户用电标准差σ,将用户日用电量数据分割成数个区间,得分割区间;

将住户预测日用电量分别和分割区间进行比较。

若住户预测日用电量高于住户平均用电量μ,则住户未来一段时间在家的概率≥50%;

若住户预测日用电量低于住户平均用电量μ,则住户未来一段时间在家的概率<50%。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本公开的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本说明书一个或多个实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。

本说明书一个或多个实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本公开的保护范围之内。

相关技术
  • 基于电力大数据居家概率预测方法及其设备
  • 一种基于产业园电力大数据的用电峰值预测方法及设备
技术分类

06120112531623