掌桥专利:专业的专利平台
掌桥专利
首页

一种混合农排用户灌溉电量确定方法及装置

文献发布时间:2024-04-18 20:00:25


一种混合农排用户灌溉电量确定方法及装置

技术领域

本发明涉及计算机技术领域,尤其涉及一种混合农排用户灌溉电量确定方法及装置。

背景技术

目前,农田灌溉主要依靠地下水开采,而一些地区由于地下水超采严重,且降水量少,导致地表水短缺,这可能会引发一系列生态环境问题,并威胁国家农产品安全和当地经济发展。

进行地下水超采综合治理的关键在于如何准确的统计地下水用量,而精准统计地下水用量在具体实现上比较困难,可能需要投入很大成本,故一些地区开始采用“以电折水”方案,该方案通过计算农排用户用电量的方式来折合计算出地下水用量,例如公开号为CN112945329A的中国专利文献公开的确定农业机井灌溉水量方案,通过农排用户机井设备的一些设备参数确定出灌溉机井的“以电折水”系数,将农排用户的实际用电量乘以“以电折水”系数从而得出该农排用户的地下水用量。

然而,由于农业灌溉机井档案中一些农排用户的实际用电量并非是纯灌溉用电,而是包括了生活用电,我们把这类用户称为混合农排用户,由于混合农排用的实际用电量中包含了非灌溉用电,这就导致以混合农排用户的实际用电量乘以“以电折水”系数最终得到的灌溉水量的计算结果是不准确的,如果要精准统计混合农排用户的灌溉电量,可能需要为混合农排用户的单独附加智能电表进行计量,但从全国范围来看,混合农排用户数量较大,这显然会提高成本,或者增加用户负担。

发明内容

本发明提供了一种混合农排用户灌溉电量确定方法及装置,无需混合农排用户额外附加电力计量设备,就能够较为准确的确定出混合农排用户的灌溉电量,从而基于确定的灌溉电量来折合水量,实施“以电折水”方案,最终可以较为准确的得出混合农排用户的实际灌溉水量。

第一方面,本发明提供了一种混合农排用户灌溉电量确定方法,包括:

基于纯农排用户的用电数据生成第一数据集,基于非农排用户的用电数据生成第二数据集,基于混合农排用户的用电数据生成第三数据集;

基于第一数据集和第二数据集分别训练预先构建的回归模型,得到用于预测纯农排用户用电量的第一模型和用于预测非农排用户用电量的第二模型;

以第一模型和第二模型为基学习器,以两个基学习器的输出作为元学习器的输入,利用第三数据集进行训练,得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系;

以混合农排用户的待预测用电数据为输入,利用第一模型进行预测,并基于预测结果和所述线性关系得到混合农排用户灌溉电量。

第二方面,本发明提供了一种混合农排用户灌溉电量确定装置,包括:

数据集生成模块,用于基于纯农排用户的用电数据生成第一数据集,基于非农排用户的用电数据生成第二数据集,基于混合农排用户的用电数据生成第三数据集;

第一模型训练模块,用于基于第一数据集和第二数据集分别训练预先构建的回归模型,得到用于预测纯农排用户用电量的第一模型和用于预测非农排用户用电量的第二模型;

第二模型训练模块,用于以第一模型和第二模型为基学习器,以两个基学习器的输出作为元学习器的输入,利用第三数据集进行训练,得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系;

灌溉电量计算模块,用于以混合农排用户的待预测用电数据为输入,利用第一模型进行预测,并基于预测结果和所述线性关系得到混合农排用户灌溉电量。

综上,本发明提供一种混合农排用户灌溉电量确定方法及装置,通过分析历史用电数据,利用纯农排用户和非农排用户两个类型的历史用电数据分别形成数据集训练得到两个基学习器,以两个基学习器和一个元学习器组成分层模型,通过混合农排用户的历史用电数据训练分层模型,最终得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,在实际应用时,以混合农排用户的待预测用电数据为输入,利用预测纯农排用户用电量的第一模型进行预测,根据预测结果和上述得到的混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,最终确定混合农排用户灌溉电量。从而可以较为准确的对混合农排用户的非农业灌溉用电进行识别,准确确定其灌溉用电量,进而能够提高“以电折水”的测算准确率,为相关部门提供数据支撑,辅助政策精准实施,且本发明无需混合农排用户额外附加电力计量设备,节省了设备成本,不增加混合农排用户负担。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的混合农排用户灌溉电量确定方法的实现流程图;

图2是本发明实施例提供的混合农排用户灌溉电量确定方法的模型架构图;

图3是本发明实施例提供的混合农排用户灌溉电量确定装置的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图通过具体实施例来进行说明。

图1为本发明实施例提供的混合农排用户灌溉电量确定方法的实现流程图,图2为本发明实施例提供的混合农排用户灌溉电量确定方法的模型架构图。

如图1所示,该方法可以包括:

步骤101、基于纯农排用户的用电数据生成第一数据集,基于非农排用户的用电数据生成第二数据集,基于混合农排用户的用电数据生成第三数据集;

在本发明实施例中,用电数据通常可以包括客户编号、日期、用电量、降雨量和用户类型,其中,用户类型包括三类,分别是纯农排用户、非农排用户和混合农排用户;纯农排用户是指其用电量均为灌溉用电产生的用户,非农排用户是指其用电量均不为灌溉用电产生的用户,也即其用电量均为生活用电,混合农排用户是指其用电量既包括灌溉电量,又包括生活用电电量的用户。本发明的目的就是分析出混合农排用户的灌溉电量。

本发明所应用采集的用电数据为包含上述三种用户类型的用电数据,本发明采用分层模型的思想分析不同用户类型的用电数据特征,进而来确定混合农排用户中灌溉电量和生活电量的比例关系。故需要将用电数据根据不同的用户类型进行划分,以各类型用户的用电数据分别进行模型训练,故,在步骤101之前,本发明所示的方法还可以包括:基于所述用户类型将所述用电数据划分为纯农排用户的用电数据、非农排用户的用电数据和混合农排用户的用电数据。

由于上述得到的初始用电数据的数据特征不够明显,本发明还对初始用电数据进行了特征衍生,从中整理和提取直接影响本发明分析结果的数据特征,以提高后续模型训练的速度和准确性。

本发明基于三类用户的用电数据分别生成对应的数据集,基于用电数据生成数据集的步骤包括:对所述用电数据进行通用特征衍生,获得用电数据通用特征,所述通用特征包括:月度降水天数、月降雨量、月度单日最大降雨量、月度用电天数、月度降雨天数、月度单日最大用电量;对所述用电数据进行特有特征衍生,获得用电数据特有特征,所述特有特征包括:是否灌溉期月份;所述灌溉期月份为每年的3月至6月以及每年的10月至11月;基于所述通用特征和所述特有特征生成初始数据集,并对所述初始数据集进行缺失值填补与归一化处理,得到训练用的数据集。

在本实施例中,首先根据实际用电数据衍生出月度的通用特征,在通用特征的基础上再添加特有特征,如本方案应用于灌溉电量的确定,而灌溉期月份对这一结果影响较大,但原有用电数据中并未体现这一特征,为了提高训练速度和预测结果的准确性,将“是否灌溉期月份”这一适应本方案应用目的的特有特征加入到数据集中,且,根据实际情况将每年的3月至6月以及每年的10月至11月定义为灌溉期月份,当然,在不同的地区灌溉期月份可是根据不同情况进行适应性调整,本方案中的灌溉期月份用于华北地区。

如图2所示,所收集的包括三类用户的用电数据可以作为训练集,基于用户类型进行用户分群后可以得到纯农排用户数据集(第一数据集)、非农排用户数据集(第二数据集)和混合农排用户数据集(第三数据集)。

步骤102、基于第一数据集和第二数据集分别训练预先构建的回归模型,得到用于预测纯农排用户用电量的第一模型和用于预测非农排用户用电量的第二模型。

所述第一模型为四个回归模型中预测纯农排用户用电量的预测结果最优的回归模型,所述纯农排用户用电量表示灌溉电量;

所述第二模型为四个回归模型中预测非农排用户用电量的预测结果最优的回归模型,所述非农排用户用电量表示非灌溉电量。

在本发明实施例中,预先构建的回归模型可以为多个,可以包括随机森林回归模型、岭回归模型、LightGBM回归模型和asso回归模型;不同的回归模型算法不同,各有优劣势。在本发明方案中,4个回归模型均被采用,并根据训练和测试的结果可以选定预测结果最优的一个。

利用第一数据集,即纯农排用户的用电数据,划分为训练集和测试集,分别训练和测试上述4个回归模型,直至每个回归模型的输出结果最优,再比较上述4个回归模型的输出结果,选定最优的一个作为纯农排用户用电量的预测模型,也即第一模型。

利用第二数据集,即非农排用户的用电数据,划分为训练集和测试集,分别训练和测试上述4个回归模型,直至每个回归模型的输出结果最优,再比较上述4个回归模型的输出结果,选定最优的一个作为非农排用户用电量的预测模型,也即第二模型。

上述训练和测试的过程可参考现有技术,在此不再赘述,在训练过程中,第一模型的输入为纯农排用户的月度用电数据对应的数据特征,第一模型的预测结果为纯农排用户的月度用电量;第二模型的输入为非农排用户的月度用电数据对应的数据特征,第二模型的预测结果为所述非农排用户的月度用电量。

如图2所示,模型1、模型2、模型3、模型4可以分别为随机森林回归模型、岭回归模型、LightGBM回归模型和asso回归模型。可以从训练好后的模型中选择一个预测结果最优的模型。第一模型为基学习器中的纯农排用户用电量预测模型,第二模型为基学习器中的非农排用户用电量预测而模型。

步骤103、以第一模型和第二模型为基学习器,以两个基学习器的输出作为元学习器的输入,利用第三数据集进行训练,得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系。

在本发明实施例中,采用的是两个基学习器和一个元学习器组成的分层预测模型,也称为Stacking架构。上述第一模型和第二模型对应该架构下的两个基学习器。另外元学习器可采用线性回归算法或岭回归算法构建,再利用混合农排用户对应的第三数据集进行训练和测试,测试过程中,以第一模型预测纯农排用户在混合农排用户数据特征下的灌溉电量,以第二模型预测非农排用户在混合农排用户数据特征下的生活用电量;再将两个模型的预测结果作为元学习器的输入,通过训练和测试使其输出混合农排用户的总用电量,直至元学习器能够输出最优结果,得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系。

由于混合农排用户的用电量主要来源于两方面,即灌溉电量及生活电量,在此基础上二者存在一定的线性关系,本发明方案通过定义混合农排用户的月用电量作为研究目标,通过对灌溉电量以及生活电量进行加权求和可预测混合用户的月用电量,上述线性关系表示为:

y=ω

其中,y表示混合农排用户的月度用电量,ω

本发明实施例中,在元学习器训练好之后,线性关系确定,上述参数ω

如图2所示,以混合农排用户数据集形成混合用户训练集,预测混合用户特征下的纯农排用户月灌溉用电量,以及预测混合用户特征下的非农排用户月生活用电量,将两个预测结果作为元学习器的输入,将混合农排用户月总用电量作为元学习器的输出,对元学习器进行训练和测试,直至其输出结果最优。

步骤104、以混合农排用户的待预测用电数据为输入,利用第一模型进行预测,并基于预测结果和上述线性关系得到混合农排用户灌溉电量。

在一种实现方式中,以混合农排用户的当月待预测用电数据为输入,利用第一模型进行预测,得到当月的灌溉电量初始值;基于线性关系获得第一权重系数;将灌溉电量初始值与第一权重系数相乘,从而得到混合农排用户的当月灌溉电量。

在本发明实施例中,在确定线性关系之后,当需要确定混合农排用户某月的灌溉电量时,便可将混合农排用户当月的用电数据输入到第一模型,再将第一模型的输出结果乘以上述线性关系中的参数ω

在另一种实现方式中,还可以混合农排用户的当月待预测用电数据为输入,利用第二模型进行预测,得到当月的非灌溉电量初始值;再基于线性关系获得第二权重系数;将非灌溉电量初始值与第二权重系数相乘,从而得到混合农排用户的当月非灌溉电量,最后将混合农排用户的当月用电量减去当月非灌溉电量,便可得到混合农排用户的当月灌溉电量。

在本发明实施例中,当训练数据尚不够完善,数据量也不够大时,预测结果可能存在异常,故还可以利用异常检测模块对确定的混合农排用户的当月灌溉电量进行异常判断,若存在异常,可进行修正,以修正后的数值作为最终的当月灌溉电量;若不存在异常,则直接确定为最终的当月灌溉电量。

具体的,在上述步骤基于预测结果和所述线性关系得到混合农排用户灌溉电量之后还包括:

若混合农排用户灌溉电量存在异常,则采用相似度算法基于历史用电数据对混合农排用户灌溉电量进行修正,获得混合农排用户灌溉电量正常值;

相应的,上述基于预测结果和所述线性关系得到混合农排用户灌溉电量包括:基于混合农排用户灌溉电量正常值和线性关系得到混合农排用户灌溉电量。

相应的,上述步骤中,若所述混合农排用户灌溉电量存在异常,则采用相似度算法基于历史用电数据对所述混合农排用户灌溉电量进行修正,获得混合农排用户灌溉电量正常值可以包括:

若混合农排用户灌溉电量大于混合农排用户月度总用电量,则确定混合农排用户灌溉电量存在异常;

将所述混合农排用户的当月待预测用电数据与历史用电数据中的各月度数据进行比较,根据欧式距离选择与所述当月待预测用电数据最近的预设数量的月度数据,分别作为当月待预测用电数据确定近似灌溉电量;

计算确定的预设数量的近似灌溉电量的均值作为所述混合农排用户灌溉电量正常值。

在本发明实施例中,可以通过比较混合农排用户灌溉电量和总用电量的大小来确定其是否异常,当灌溉电量不大于总用电量时,认为混合农排用户灌溉电量正常,将其直接作为最终确定的灌溉电量。

当灌溉电量大于总用电量时,认为混合农排用户灌溉电量存在异常,则可以将混合农排用户的当月待预测用电数据与历史用电数据中的各月度数据进行相似度比较,比如利用数据向量的欧式距离找出与当月待预测用电数据最相似的若干个历史月度数据,再利用该若干个历史月度数据分别作为当月待预测用电数据通过模型来计算若干个近似灌溉电量,最终将计算的若干个近似灌溉电量取平均值作为最终确定的混合农排用户灌溉电量。当然,所选取的最相似的若干个历史月度数据经模型预测和第一权重参数计算后需要为正常值,也即小于总用电量,大于总用电量的异常值需要剔除。从而进一步提高最终确定的灌溉电量的准确性。

如图2所示,可以通过异常结果校准模型执行本发明上述异常结果判定和校准的步骤。

在本发明实施例中,将本发明最终确定的混合农排用户的灌溉电量乘以对应的“以电折水”系数,便可得到该混合农排用户的当月用水量。

由上可知,本发明提供一种混合农排用户灌溉电量确定方法,通过分析历史用电数据,利用纯农排用户和非农排用户两个类型的历史用电数据分别形成数据集训练得到两个基学习器,以两个基学习器和一个元学习器组成分层模型,通过混合农排用户的历史用电数据训练分层模型,最终得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,在实际应用时,以混合农排用户的待预测用电数据为输入,利用预测纯农排用户用电量的第一模型进行预测,根据预测结果和上述得到的混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,最终确定混合农排用户灌溉电量。从而可以较为准确的对混合农排用户的非农业灌溉用电进行识别,准确确定其灌溉用电量,进而能够提高“以电折水”的测算准确率,为相关部门提供数据支撑,辅助政策精准实施,且本发明无需混合农排用户额外附加电力计量设备,节省了设备成本,不增加混合农排用户负担。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。

图3示出了本发明实施例提供的混合农排用户灌溉电量确定装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:

如图3所示,混合农排用户灌溉电量确定装置3包括:数据集生成模块31、第一模型训练模块32、第二模型训练模块33和灌溉电量计算模块34。

数据集生成模块31,用于基于纯农排用户的用电数据生成第一数据集,基于非农排用户的用电数据生成第二数据集,基于混合农排用户的用电数据生成第三数据集;

第一模型训练模块32,用于基于第一数据集和第二数据集分别训练预先构建的回归模型,得到用于预测纯农排用户用电量的第一模型和用于预测非农排用户用电量的第二模型;

第二模型训练模块33,用于以第一模型和第二模型为基学习器,以两个基学习器的输出作为元学习器的输入,利用第三数据集进行训练,得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系;

灌溉电量计算模块34,用于以混合农排用户的待预测用电数据为输入,利用第一模型进行预测,并基于预测结果和所述线性关系得到混合农排用户灌溉电量。

在一个实现方式中,上述用电数据可以包括客户编号、日期、用电量、降雨量和用户类型,用户类型包括纯农排用户、非农排用户和混合农排用户。

相应的,混合农排用户灌溉电量确定装置3还可以包括:数据划分模块,用于在数据集生成模块31基于纯农排用户的用电数据生成第一数据集,基于非农排用户的用电数据生成第二数据集,基于混合农排用户的用电数据生成第三数据集之前,基于用户类型将用电数据划分为纯农排用户的用电数据、非农排用户的用电数据和混合农排用户的用电数据。

在一个实现方式中,混合农排用户灌溉电量确定装置3还可以包括:还可以包括特征衍生模块和数据处理模块。

特征衍生模块用于对用电数据进行通用特征衍生,获得用电数据通用特征,通用特征包括:月度降水天数、月降雨量、月度单日最大降雨量、月度用电天数、月度降雨天数、月度单日最大用电量;以及,对用电数据进行特有特征衍生,获得用电数据特有特征,特有特征包括:是否灌溉期月份;灌溉期月份为每年的3月至6月以及每年的10月至11月。

数据处理模块用于基于所述通用特征和所述特有特征生成初始数据集,并对所述初始数据集进行缺失值填补与归一化处理,得到训练用的数据集。

在一个实现方式中,上述回归模型包括随机森林回归模型、岭回归模型、LightGBM回归模型和asso回归模型;第一模型为四个回归模型中预测纯农排用户用电量的预测结果最优的回归模型,所述纯农排用户用电量表示灌溉电量;第二模型为四个回归模型中预测非农排用户用电量的预测结果最优的回归模型,所述非农排用户用电量表示非灌溉电量,上述元学习器采用线性回归算法或岭回归算法。

在一个实现方式中,上述第一模型的输入为纯农排用户的月度用电数据对应的数据特征,第一模型的预测结果为所述纯农排用户的月度用电量;述第二模型的输入为非农排用户的月度用电数据对应的数据特征,第二模型的预测结果为所述非农排用户的月度用电量。

在一个实现方式中,上述线性关系表示为:

y=ω

其中,y表示混合农排用户的月度用电量,ω

在一个实现方式中,灌溉电量计算模块34具体用于,以混合农排用户的当月待预测用电数据为输入,利用第一模型进行预测,得到当月的灌溉电量初始值;基于所述线性关系获得第一权重系数;将所述灌溉电量初始值与所述第一权重系数相乘,得到混合农排用户的当月灌溉电量。

在一个实现方式中,混合农排用户灌溉电量确定装置3还包括:异常处理模块,用于在灌溉电量计算模块34基于预测结果和所述线性关系得到混合农排用户灌溉电量之后,若所述混合农排用户灌溉电量存在异常,则采用相似度算法基于历史用电数据对所述混合农排用户灌溉电量进行修正,获得混合农排用户灌溉电量正常值;

相应的,混合农排用户灌溉电量确定装置3基于混合农排用户灌溉电量正常值和所述线性关系得到混合农排用户灌溉电量。

异常处理模块具体用于,若混合农排用户灌溉电量大于混合农排用户月度总用电量,则确定所述混合农排用户灌溉电量存在异常;将混合农排用户的当月待预测用电数据与历史用电数据中的各月度数据进行比较,根据欧式距离选择与当月待预测用电数据最近的预设数量的月度数据,分别作为当月待预测用电数据确定近似灌溉电量;计算确定的预设数量的近似灌溉电量的均值作为混合农排用户灌溉电量正常值。

由上可知,本发明提供一种混合农排用户灌溉电量确定装置,通过分析历史用电数据,利用纯农排用户和非农排用户两个类型的历史用电数据分别形成数据集训练得到两个基学习器,以两个基学习器和一个元学习器组成分层模型,通过混合农排用户的历史用电数据训练分层模型,最终得到混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,在实际应用时,以混合农排用户的待预测用电数据为输入,利用预测纯农排用户用电量的第一模型进行预测,根据预测结果和上述得到的混合农排用户用电量与灌溉电量和非灌溉电量的线性关系,最终确定混合农排用户灌溉电量。从而可以较为准确的对混合农排用户的非农业灌溉用电进行识别,准确确定其灌溉用电量,进而能够提高“以电折水”的测算准确率,为相关部门提供数据支撑,辅助政策精准实施,且本发明无需混合农排用户额外附加电力计量设备,节省了设备成本,不增加混合农排用户负担。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模板、单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所述模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个混合农排用户灌溉电量确定方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存取存储器、电载波信号、电信信号以及软件分发介质等。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术分类

06120116526625