电力配网物资需求预测方法和装置、存储介质及电子设备

文献发布时间：2023-06-19 10:29:05

技术领域

本发明涉及电力物资预估技术领域，具体而言，涉及一种电力配网物资需求预测方法和装置、存储介质及电子设备。

背景技术

随着物联网的发展，配网建设和维护是电力系统重要工作之一，配网相关工程复杂，实施中需要消耗大量物资。通过对配网物资需求进行预测，确定未来时间段内电力建设项目中各类物资的需求总量，进行合理物资采购与调动，可以避免物资不足对配网工程造成的影响，同时降低由于超量采购造成的物资积压风险与资金浪费。

传统的配网物资需求方法采用人工方式，以及结合项目报告与现场调研进行进一步完善，但配网物资需求预测结果受决策人主观影响，预估结果与时实际的误差往往较大，预测效率较低。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种电力配网物资需求预测方法和装置、存储介质及电子设备，以至少解决传统的配网物资人工预测导致的主观判断误差较大的技术问题。

根据本发明实施例的一个方面，提供了一种电力配网物资需求预测方法，包括：对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到上述目标区域的配网物资的预处理数据集；对上述预处理数据集进行划分，得到预处理子数据集；其中，上述预处理子数据集中包括待测的电力配网建设物资项目的属性信息；对上述预处理子数据集进行聚类得到数据聚类簇；将上述数据聚类簇输入物资预估模型，以输出上述目标区域运行上述电力配网建设物资项目所需的预估物资使用量；其中，上述物资预估模型为利用样本物资数据进行多次训练得到的用于预测物资使用量的决策模型。

根据本发明实施例的另一方面，还提供了一种电力配网物资需求预测装置，包括：预处理单元，用于对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到上述目标区域的配网物资的预处理数据集；划分单元，用于对上述预处理数据集进行划分，得到预处理子数据集；其中，上述预处理子数据集中包括待测的电力配网建设物资项目的属性信息；聚类单元，用于对上述预处理子数据集进行聚类得到数据聚类簇；预估单元，用于将上述数据聚类簇输入物资预估模型，以输出上述目标区域运行上述电力配网建设物资项目所需的预估物资使用量；其中，上述物资预估模型为利用样本物资数据进行多次训练得到的用于预测物资使用量的决策模型。

根据本发明实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述的电力配网物资需求预测方法。

根据本发明实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过计算机程序执行上述的电力配网物资需求预测方法。

在本发明实施例中，采用对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到上述目标区域的配网物资的预处理数据集；对上述预处理数据集进行划分，得到预处理子数据集；其中，上述预处理子数据集中包括待测的电力配网建设物资项目的属性信息；对上述预处理子数据集进行聚类得到数据聚类簇；将上述数据聚类簇输入物资预估模型，以输出上述目标区域运行上述电力配网建设物资项目所需的预估物资使用量方式，达到了减小配网物资预估结果与时实际的误差的目的，从而实现了提升配网物资预估结果的准确性，缩短预估时间，提高物资管理部门工作效率的技术效果，进而解决了传统的配网物资人工预测导致的主观判断误差较大的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施例的一种可选的电力配网物资需求预测方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的电力配网物资需求预测方法的流程示意图；

图3是根据本发明实施例的另一种可选的电力配网物资需求预测方法的流程示意图；

图4是根据本发明实施例的一种可选的电力配网物资需求预测装置的结构示意图；

图5是根据本发明实施例的一种可选的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例的一个方面，提供了一种电力配网物资需求预测方法，可选地，作为一种可选的实施方式，上述电力配网物资需求预测方法可以但不限于应用于如图1所示的环境中。

图1中，终端设备104负责与用户102进行人机交互，终端设备104包括了存储器106、处理器108与显示器110；终端设备104可以通过网络112与服务器114之间进行交互。服务器114包括数据库116与处理引擎118；终端设备104可以将对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据，通过网络112到服务器114，服务器114输出所述目标区域运行所述电力配网建设物资项目所需的预估物资使用量，发送到终端设备104。

可选地，在本实施例中，上述终端设备104可以是配置有目标客户端的终端设备，可以包括但不限于以下至少之一：手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices，移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端等。上述网络112可以包括但不限于：有线网络，无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。上述服务器114可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器。上述仅是一种示例，本实施例中对此不作任何限定。

配网建设和维护是电力系统重要工作之一，配网相关工程复杂，实施中需要消耗大量物资，传统的配网物资需求方法采用人工方式进行预测，但预测结果误差较大，相关技术中出现了，利用数学建模的配网物资需求预测方法。这类方法通过将配网物资需求相关历史数据进行筛选与预处理后导入数学模型中进行训练，然后将训练完毕后的模型用于配网物资需求预测。然而这些方法在实际应用中仍有较大改进空间。在预测算法方面，通过神经网络可以实现效果极佳的预测模型，但需要大量预处理数据与较长的训练时间，实际工程中数据量与应用条件可能并不允许；而采用自回归移动平均模型(AutoregressiveIntegrated Moving Average Model，简称ARIMA)算法对数据质量要求较高，且本质上只能拟合线性模型，并不能很好捕捉物资需求量与影响因素间的非线性关系。在数据方面，这些方法普遍只使用了电网公司物资消耗的数据，并未考虑其他影响因素，对电力配网物资需求的预估准确性不高。

基于上述技术问题，可选地，作为一种可选的实施方式，如图2所示，上述电力配网物资需求预测方法包括：

S202，对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到目标区域的配网物资的预处理数据集；

S204，对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；

S206，对预处理子数据集进行聚类得到数据聚类簇；

S208，将数据聚类簇输入物资预估模型，以输出目标区域运行电力配网建设物资项目所需的预估物资使用量；其中，物资预估模型为利用样本物资数据进行多次训练得到的用于预测物资使用量的决策模型。

在步骤S202中，实际应用时，可以采用但不限于，电网公司在目标区域内的历史配网物资使用记录参数、电网历年投资规划数据作为模型训练数据，加入配网所覆盖区域的历年主要经济发展指标作为特征数据，能够使得电力配置物资预测结果更加准确。因为配网物资的使用量与电网规划有直接关系，而电网规划受到当地的经济发展和人口数量的影响。因此，上述电网的投资规划数据、经济发展指标、人口指标是配网物资需求预测的重要影响因素，都要作为配网物资需求预测的影响数据。因此，不仅采用电网公司历史配网物资使用记录、电网历年投资规划数据作为模型训练数据，使得接入预测的数据更加充分，还加入配网所覆盖区域的历年主要经济发展指标作为特征数据，使得预测结果更加准确。

这里，上述历史配网物资使用记录参数、电网历年投资规划数据以及配网区域经济发展数据，可以通过数据表格的形式，或者通过XLM格式的文档形式，在此不做限定。对上述历史配网物资使用记录参数、电网历年投资规划数据以及配网区域经济发展数据进行预处理，得到目标区域的配网物资的预处理数据集；其中，得到预处理数据集包括，对历史配网物资使用记录参数、电网历年投资规划数据以及配网区域经济发展数据各项根据日期进行排序，形成数据总表，这里数据总表可以包括但不限于EXCLE数据表。对于数据总表中存在的数据缺失与异常情况，需要进行检查与处理，这里，可以采用均值法进行填充缺失的数据，或者填补中位数至缺失数据的位置的方法，对于数据总表中出现的数据尖峰现象，进行数据平滑处理，进一步得到目标区域的配网物资的预处理数据集。

在步骤S204中，实际应用时，对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；这里，电力配网建设物资项目的属性可以为电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料名称等，在此不作限定。也就是说，例如，可以根据上述不同的属性，将预处理数据集进行划分，得到电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料为表头类型的多个EXCLE数据表。

在步骤S206中，实际应用时，对预处理子数据集进行聚类得到数据聚类簇，例如，将电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料为表头类型的多个EXCLE数据表。根据各个表头条目之间的余弦距离作为距离衡量标准，将各数据条目进行聚类，形成若干聚类簇，得到相似度最高的电力配网建设物资项目的属性等数据聚类簇。

在步骤S208中，实际应用时，物资预估模型可以使用但不限于极端梯度提升(eXtreme Gradient Boosting，XGBoost)预测模型，XGBoost预测模型训练速度快，数据质量要求较低，非线性因素捕捉性能好，可显著降低数据预处理复杂度，在实际工程中具有明显优势。XGBoost预测模型为一种树集成模型，其运算方式是让模型中总量为K的CART树对同一数据集进行预测，将预测结果进行求和作为最终的预测值。即：

式中，

XGBoost预测模型训练过程中各树模型采用相同形式的目标函数作为模型精度评价指标：

式中，

本实施例中可以采用平方损失函数作为损失函数，如下所示:

对于XGBoost预测模型中的单棵CART树，其复杂度函数定义为：

式中，T为模型总叶子结点个数，ω

可选地，可以使用但不限于使用预处理数据集作为训练集，划分后的预处理数据子集中均包含了完整的时间、电力物资小类调度信息和各项区域经济发展指标等特征信息，利用上述XGBoost预测模型训练物资需求量预测模型。模型参数调节采用机器学习常见的网格搜索方式，逐项调参，最终确定电力物资最优的参数组合。

此外，还可以对XGBoost预测模型的性能进行判断。当模型训练达到最优或设定要求后，取目标函数值最优的模型参数作为最终结果；反之则对模型参数进行调整重新训练。XGBoost预测模型训练成功后将各参数存储于服务器数据库中作为备份，XGBoost预测模型本身可由web端或其他应用调用使用。定期运行一段后，从服务器数据库中读取滚动更新的训练数据集，对回归预测模型进行重新训练，以保证XGBoost预测模型计算数据的实时性。

根据配网物资历史需求情况和电网历年规划数据，结合配网覆盖区域历年主要经济发展指标作为特征，采用XGBoost预测模型集成学习算法进行并行式训练，建立高精度的电力配网物资需求预测模型，协助支持电网物资部门进行物资采购和物资调度工作，降低物资短缺与物资积压风险，节约企业资金。

本发明实施例中，采用对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到上述目标区域的配网物资的预处理数据集；对上述预处理数据集进行划分，得到预处理子数据集；其中，上述预处理子数据集中包括待测的电力配网建设物资项目的属性信息；对上述预处理子数据集进行聚类得到数据聚类簇；将上述数据聚类簇输入物资预估模型，以输出上述目标区域运行上述电力配网建设物资项目所需的预估物资使用量方式，达到了减小配网物资预估结果与时实际的误差的目的，从而实现了提升配网物资预估结果的准确性，缩短预估时间，提高物资管理部门工作效率的技术效果，进而解决了传统的配网物资人工预测导致的主观判断误差较大的技术问题。

在一实施例中，步骤S202包括：对获取到的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据分别按照生成日期进行排序，再汇总以得到配网物资数据总表；按照预设的数据处理方法，将配网物资数据总表中的异常数据进行处理，得到预处理数据集。这里，日期跨度根据需求自由定义为日次、月次、年次等，在此不做限定。

在一实施例中，按照预设的数据处理方法，将配网物资数据总表中的异常数据进行处理，得到预处理数据集包括：在异常数据指示为缺失数据的情况下，在配网物资数据总表中缺失数据所在的空闲位置中，填补与缺失数据的数据类型一致的非缺失数据的平均值，得到预处理数据集；或者在异常数据指示为缺失数据的情况下，在配网物资数据总表中缺失数据所在的空闲位置中，填补与缺失数据的数据类型一致的非缺失数据的中位数，得到预处理数据集。通过上述手段，可以提高数据采集的准确性和完整性。

在一实施例中，按照预设的数据处理方法，将配网物资数据总表中的异常数据进行处理，得到配网物资的预处理数据集包括：在异常数据指示为缺失数据的情况下，在配网物资数据总表中缺失数据所在的空闲位置中进行补零处理，得预处理数据集。通过上述手段，可以提高数据采集的完整性。

在一实施例中，按照预设的数据处理方法，将配网物资数据总表中的异常数据进行处理，得到预处理数据集包括：在配网物资数据总表中的出退库记录数据出现尖峰的情况下，对尖峰的位置上的出退库记录数据进行平滑处理，得到预处理数据集；其中，历史配网物资的使用记录参数包括出退库记录数据。配网物资数据总表中出退库记录数据可能存在尖峰现象，常见形式为超正常水平多个数量级的异常数据，尖峰数据对模型训练非常不利，需要进行处理。

可选地，所述将所述配网物资数据总表中出现尖峰现象的出退库记录数据进行平滑处理包括：计算所述配网物资数据总表中每日的出退库记录的差值，得到每日净出库值；计算所述配网物资数据总表中，当前自然月中每日净出库量尖峰值的平均值P，和所述当前自然月的每日正常净出库量的平均值N；当P/N≤1.5时，将所述平均值P替换所述当前自然月中每日净出库量中的各个尖峰值；当P/N＞1.5时，则计算所述当前自然月所在季度的每日净出库量尖峰值的平均值P＇，和所述季度中每日正常净出库量的平均值N′，当P＇/N′≤1.5时，将所述平均值P＇替换所述当前自然月中每日净出库量中的各个尖峰值；当P＇/N′＞1.5时，将所述当前自然月中每日净出库量中的各个尖峰值进行删除。通过上述手段，可以提高数据采集的准确性和完整性。

在一实施例中，步骤S206包括，采用一位有效编码方式，将预处理数据集中的待测的电力配网建设物资项目的属性信息转换为向量；其中，待测的电力配网建设物资项目的属性信息包括项目类型、项目名称和项目部门；将向量化后的待测的电力配网建设物资项目的属性信息，作为预处理数据集中的数据条目特征；获取任意两个数据条目特征之间的余弦距离矩阵；基于余弦距离矩阵，对数据条目特征对应的数据条目进行聚类，得到多个数据条目特征对应的数据聚类簇；其中，每个数据聚类簇中包含有数据条目特征对应的数据条目的数组集合。

在一实施例中，步骤S208之前包括，获取目标时间段内生成的多个历史样本使用量；其中，历史样本使用量包括历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据；利用多个历史样本使用量训练初始化的物资预估模型，直至得到训练结果达到收敛条件的物资预估模型。

在一实施例中，步骤S208包括：根据待预测的物资种类与物资种类的对应时间，构建以数据条目为单位的特征信息表；将特征信息表进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；对预处理子数据集进行聚类得到数据聚类簇；将数据聚类簇输入物资预估模型，以输出与特征信息表对应的物资使用量。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。

基于上述实施例，在一应用实施例中，如图3所示，上述电力配网物资需求预测方法可以包括以下步骤：

步骤S302，数据接入；从数据源中将配网物资使用历史记录(出退库记录)、电网规划数据和区域经济发展指标导入服务器数据库中作为历史数据。配网物资使用历史记录与电网规划数据由电网公司的企业资源计划(Enterprise Resource Planning，简称为ERP)系统提供，区域经济发展指标从第三方区域发展数据源收集。

步骤S304，数据预处理；(1)将目标区域内的历史数据各项根据日期排序后一一对应，形成数据总表D

对于表中存在的数据缺失与异常情况，需要进行检查与处理，处理步骤如下：

①对于表中存在大面积连续性数据缺失，需对电网公司在对应时间段内的实际物资调动情况进行调查，判断是真实性数据缺失还是由于在对应时间段内没有物资调动导致的无记录。对于真实性数据缺失，需尽可能恢复数据，将缺失部分补全，若补全后仍存在大面积数据缺失，则将缺失数据的行删除，避免对模型训练产生不利影响。对于无记录情况，则进行补0处理。

②对于表中存在小范围跳跃性数据缺失，可采用常见的数据填补方法(如均值填充、中位数等)对缺失的数据进行处理。实际表明电网公司物资出退库总量在时间尺度上具有一定规律性，实际中可以根据前后物资调动情况进行填补。

③表中出退库记录数据可能存在尖峰现象，常见形式为超正常水平多个数量级的异常数据，尖峰数据对模型训练非常不利，需要进行处理。本发明中采用以下一种方式对出退库记录中的尖峰数据进行平滑处理：

1.计算表中出退库记录之差，得到每日净出库量信息；

2.以月为单位，计算该月每日净出库量尖峰值的平均值peak

3.当

当

4.若采用2、3方式均不能消除尖峰数据，则可采用其它常见方法进行填补或直接删除，减小对模型训练造成的干扰。经处理后的数据总表不进行覆盖式保存，单独存储为新数据总表D

(3)XGBoost算法以CART树作为基础单元，不需对输入数据进行归一化或标准化处理，但需对文本等其他非数字特征向量化。本发明中采用一位有效one-hot编码方式将数据总表D

步骤S306，本实施例中按照以下步骤将数据集进行划分：

(1)将向量化后的项目类型、项目名称、项目部门等关键字，等电力配网建设物资项目的属性信息作为各数据条目的特征，用以计算各数据条目间的余弦距离矩阵L

(3)利用DB-Scan分析算法，以L作为距离衡量标准，将各数据条目进行聚类，形成若干聚类簇，记录聚类中心坐标记录C

(3)经以上步骤对D

(4)各数据集随后按物资小类关键字，将D

各数据子集X

步骤S308，模型训练；本发明中使用D

步骤S310，判断是否满足需求；当物资需求量预测模型训练达到最优或设定要求后，取目标函数值最优的模型参数作为最终结果；如果没有达到目标函数值的最优模型参数，则进入步骤S308，对物资需求量预测模型参数进行调整重新训练。物资需求量预测模型训练成功后将各参数存储于服务器数据库中作为备份，该模型本身可由web端或其他应用调用使用。定期运行一段后，从服务器数据库中读取滚动更新的训练数据集D

步骤S312，配网物资需求预测；(1)根据需要预测的物资种类与对应时间，以数据条目为单位构建完整的特征信息表；(2)将特征信息表按第二步中的方式进行预处理形成D

在本发明实施例中，采用对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到上述目标区域的配网物资的预处理数据集；对上述预处理数据集进行划分，得到预处理子数据集；其中，上述预处理子数据集中包括待测的电力配网建设物资项目的属性信息；对上述预处理子数据集进行聚类得到数据聚类簇；将上述数据聚类簇输入物资预估模型，以输出上述目标区域运行上述电力配网建设物资项目所需的预估物资使用量方式，达到了减小配网物资预估结果与实际的误差的目的，从而实现了提升配网物资预估结果的准确性，缩短预估时间，提高物资管理部门工作效率的技术效果，进而解决了传统的配网物资人工预测导致的主观判断误差较大的技术问题。

根据本发明实施例的另一个方面，还提供了一种用于实施上述电力配网物资需求预测方法的电力配网物资需求预测装置。如图4所示，该装置包括：

预处理单元402，用于对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到目标区域的配网物资的预处理数据集；

划分单元404，用于对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；

聚类单元406，用于对预处理子数据集进行聚类得到数据聚类簇；

预估单元408，用于将数据聚类簇输入物资预估模型，以输出目标区域运行电力配网建设物资项目所需的预估物资使用量；其中，物资预估模型为利用样本物资数据进行多次训练得到的用于预测物资使用量的决策模型。

在本发明实例中，可以采用但不限于，电网公司在目标区域内的历史配网物资使用记录参数、电网历年投资规划数据作为模型训练数据，加入配网所覆盖区域的历年主要经济发展指标作为特征数据，能够使得电力配置物资预测结果更加准确。因为配网物资的使用量与电网规划有直接关系，而电网规划受到当地的经济发展和人口数量的影响。因此，上述电网的投资规划数据、经济发展指标、人口指标是配网物资需求预测的重要影响因素，都要作为配网物资需求预测的影响数据。因此，不仅采用电网公司历史配网物资使用记录、电网历年投资规划数据作为模型训练数据，使得接入预测的数据更加充分，还加入配网所覆盖区域的历年主要经济发展指标作为特征数据，使得预测结果更加准确。

在本发明实例中，对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；这里，电力配网建设物资项目的属性可以为电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料名称等，在此不作限定。也就是说，例如，可以根据上述不同的属性，将预处理数据集进行划分，得到电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料为表头类型的多个EXCLE数据表。

在本发明实例中，对预处理子数据集进行聚类得到数据聚类簇，例如，将电力建设的项目类型、项目名称、项目部门、出库材料类型、出库材料为表头类型的多个EXCLE数据表根据各个表头条目之间的余弦距离作为距离衡量标准，将各数据条目进行聚类，形成若干聚类簇，得到相似度最高的电力配网建设物资项目的属性等数据聚类簇。

在本发明实例中，物资预估模型可以使用但不限于极端梯度提升(eXtremeGradient Boosting，XGBoost)预测模型，XGBoost预测模型训练速度快，数据质量要求较低，非线性因素捕捉性能好，可显著降低数据预处理复杂度，在实际工程中具有明显优势。XGBoost为一种树集成模型，其运算方式是让模型中总量为K的CART树对同一数据集进行预测，将预测结果进行求和作为最终的预测值。即：

式中，

XGBoost模型训练过程中各树模型采用相同形式的目标函数作为模型精度评价指标：

式中，

本实施例中可以采用平方损失函数作为损失函数，如下所示:

对于XGBoost模型中的单棵CART树，其复杂度函数定义为：

式中，T为模型总叶子结点个数，ω

可选地，可以使用但不限于使用预处理数据集作为训练集，划分后的预处理数据子集中均包含了完整的时间、电力物资小类调度信息和各项区域经济发展指标等特征信息，利用XGBoost算法训练物资需求量预测模型。模型参数调节采用机器学习常见的网格搜索方式，逐项调参，最终确定电力物资最优的参数组合。

此外，还可以对XGBoost模型的性能进行判断。当模型训练达到最优或设定要求后，取目标函数值最优的模型参数作为最终结果；反之则对模型参数进行调整重新训练。XGBoost模型训练成功后将各参数存储于服务器数据库中作为备份，XGBoost模型本身可由web端或其他应用调用使用。定期运行一段后，从服务器数据库中读取滚动更新的训练数据集，对回归预测模型进行重新训练，以保证XGBoost模型计算数据的实时性。

根据配网物资历史需求情况和电网历年规划数据，结合配网覆盖区域历年主要经济发展指标作为特征，采用XGBoost集成学习算法进行并行式训练，建立高精度的电力配网物资需求预测模型，协助支持电网物资部门进行物资采购和物资调度工作，降低物资短缺与物资积压风险，节约企业资金。

根据本发明实施例的又一个方面，还提供了一种用于实施上述电力配网物资需求预测方法的电子设备，该电子设备可以是图1所示的终端设备104或服务器114。如图5所示，该电子设备包括存储器502和处理器504，该存储器502中存储有计算机程序，该处理器504被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，在对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到目标区域的配网物资的预处理数据集；

S2，对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；

S3，对预处理子数据集进行聚类得到数据聚类簇；

S4，将数据聚类簇输入物资预估模型，以输出目标区域运行电力配网建设物资项目所需的预估物资使用量；其中，物资预估模型为利用样本物资数据进行多次训练得到的用于预测物资使用量的决策模型。

可选地，本领域普通技术人员可以理解，图5所示的结构仅为示意，电子装置或电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等电子设备。图5其并不对上述电子装置电子设备的结构造成限定。例如，电子装置电子设备还可包括比图5中所示更多或者更少的组件(如网络接口等)，或者具有与图5所示不同的配置。

其中，存储器502可用于存储软件程序以及模块，如本发明实施例中的电力配网物资需求预测方法和装置对应的程序指令/模块，处理器504通过运行存储在存储器502内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的电力配网物资需求预测方法。存储器502可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器502可进一步包括相对于处理器504远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器502具体可以但不限于用于存储虚电力配网建设物资项目的属性信息等信息。作为一种示例，如图5所示，上述存储器502中可以但不限于包括上述电力配网物资需求预测装置中的预处理单元402、划分单元404、聚类单元406及预估单元408。此外，还可以包括但不限于上述电力配网物资需求预测装置中的其他模块单元，本示例中不再赘述。

可选地，上述的传输装置506用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置506包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置506为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子设备还包括：显示器508，用于显示上述电力配网建设物资项目的属性信息；和连接总线510，用于连接上述电子设备中的各个模块部件。

在其他实施例中，上述终端设备或者服务器可以是一个分布式系统中的一个节点，其中，该分布式系统可以为区块链系统，该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中，节点之间可以组成点对点(P2P，Peer To Peer)网络，任意形式的计算设备，比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。

根据本发明的实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述计算机可读的存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，在对目标区域的历史配网物资的使用记录参数、配网历史规划数据和配网区域经济发展数据进行预处理，得到目标区域的配网物资的预处理数据集；

S2，对预处理数据集进行划分，得到预处理子数据集；其中，预处理子数据集中包括待测的电力配网建设物资项目的属性信息；

S3，对预处理子数据集进行聚类得到数据聚类簇；

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：陆斯悦;徐蕙;陈平;王艳松;李香龙;张禄;王培祎;盛慧慧;严嘉慧;马龙飞;
专利申请人：国网北京市电力公司;国家电网有限公司;

上一篇：半导体刻蚀孔内膜层及三维存储器结构的制备方法
下一篇：应急物资需求预测方法和装置、存储介质及电子设备