掌桥专利:专业的专利平台
掌桥专利
首页

一种基于大数据预测物资采购方法和系统

文献发布时间:2023-06-19 18:37:28


一种基于大数据预测物资采购方法和系统

技术领域

本发明涉及大数据领域,尤其涉及一种基于大数据预测物资采购方法和系统。

背景技术

协议库存采购模式是国家电网公司特有的一种物资采购形式,协议库存采用自下而上的工作模式,由项目所在需求单位上报一定时期内的特定配网物资需求数量,经市公司、省公司层层审核及分类汇总后形成框架采购协议,国网物资公司根据协议招标确定供应商,并在需求发生时匹配需求物资和供应商,最后据此向协议供应商分批或分期结算货款。国网物资公司通过统计配网物资需求、统一采购招标,降低了重复采购的成本和管理费用,提高了供应链运营的效率,加强了物资集约化管理。

随着国家电网全面计划管理的推进,协议库存采购模式面对的问题为配网物资自下而上的汇总过程存在一定统计误差,且需求单位凭借经验进行数量申报,缺乏系统性,因此物资需求申报准确率不高,经常造成协议库存执行不达标的情况。随着物资的更新换代,采购范围的不断扩大,协议库存需求的确定越来越复杂,需要一种更系统、高效的方法来进行准确预测。

发明内容

为了克服采购物资时凭经验采购,与实际需求存在较大误差的问题,本发明提供了一种基于大数据预测物资采购方法和系统。

第一方面,为了解决上述技术问题,本发明提供了一种基于大数据预测物资采购方法,该方法应用于终端设备,终端设备分别与客户端和数据库连接,该方法包括以下步骤:

终端设备通过客户端获取多个第一物资采购数据,第一物资采购数据为采购物资时对应的采购数据;

终端设备将各个第一物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第一物资采购数据作为物资类别对应的第一输入集;

对于每个物资类别,终端设备将第一输入集输入极端梯度提升模型,得到物资类别对应的第一预测购买数量,并将第一预测购买数量返回给客户端,其中,极端梯度提升模型是通过以下方式训练得到的:

S11,终端设备通过数据库获取多个第二物资采购数据,第二物资采购数据为历史时间段内采购物资时对应的采购数据;

S12,终端设备将各个第二物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,并获取物资类别对应的真实购买数量;

S13,对于每个物资类别,终端设备将训练集输入初始模型,通过第一步骤,得到极端梯度提升模型,其中,初始模型包括多个决策树,第一步骤包括:

S131,对于每个物资类别,将第一个决策树作为当前决策树,将训练集输入当前决策树,通过当前决策树得到第二预测购买数量;

S132,对于每个物资类别,根据第二预测购买数量与真实购买数量,得到第二预测购买数量与真实购买数量之间的第一残差值,并将第一残差值作为第二输入值;

S133,对于每个物资类别,将当前决策树的下一个决策树作为当前决策树,将第二输入值输入当前决策树,得到第二输入值对应的拟合值;

S134,对于每个物资类别,根据拟合值与真实购买数量,得到拟合值与真实购买数量之间的第二残差值;

S135,对于每个物资类别,将第二预测购买数量和从第二个决策树开始的各个决策树对应的拟合值之和作为第三输入值,并根据第三输入值,确定目标值;

S136,若目标值满足预设结束条件,将满足预设结束条件时的初始模型作为极端梯度提升模型,若目标值不满足预设结束条件,将第二残差值作为新的第二输入值,以及当前决策树的下一个决策树作为当前决策树,以及调整初始网络的网络参数,并根据调整后的网络参数重新执行S133-S136,直到目标值满足预设结束条件。

采用上述进一步方案的有益效果是:在极端梯度提升模型的训练过程中,将第一个决策树预测得到的第二预测购买数量与真实购买数量之间的第一残差值作为第二输入值,并将第二输入值输入第二个决策树得到对应的拟合值,从而减小第二预测购买数量与真实购买数量之间的差异,同时,通过多个决策树不断更新拟合值,从而使得第二预测购买数量与真实购买数量之间的差异越来越小,最终使得极端梯度提升模型的预测结果更加接近真实购买数量,解决了采购物资时凭经验采购,与实际需求存在较大误差的问题。

进一步,该方法还包括:

对于每个物资类别,终端设备对各个第二物资采购数据进行预处理,得到各个第二物资采购数据对应的第三物资采购数据;

上述预处理包括:

对于每个物资类别,获取物资类别对应的预设的中位数和预设的第一阈值;

对于每个物资类别,终端设备根据各个第二物资采购数据和中位数,得到各个第二物资采购数据与中位数之间的偏差绝对值;

对于每个物资类别,终端设备根据各个偏差绝对值,得到各个偏差绝对值的第二阈值;

对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,确定各个第三物资采购数据;

对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,包括:

对于每个物资类别,终端设备将物资类别对应的各个第三物资采购数据作为所述物资类别对应的训练集。

采用上述进一步方案的有益效果是:通过中位数、第二阈值和第一阈值,对各个第二物资采购数据范围进行控制,避免少量第二物资采购数据与实际情况偏离较大,造成最后的预测的第二预测购买数量与真实需求偏差较大。

进一步,上述方法中对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,确定各个第三物资采购数据,包括:

对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,通过第一公式,得到各个第三物资采购数据,其中,第一公式为:

其中,p表示第三物资采购数据,M表示中位数,n表示第一阈值,MAD表示第二阈值,x表示第二物资采购数据。

采用上述进一步方案的有益效果是:通过第一公式,将各个第一物资采购数量控制在M+n*MAD和M-n*MAD之间,避免少量第一物资采购数据与实际情况偏离较大,造成最后的预测的第一预测购买数量与真实需求偏差较大。

进一步,上述方法中对于每个物资类别,将第一个决策树作为当前决策树,初始模型将训练集输入当前决策树,通过当前决策树得到第二预测购买数量,包括:

S31,将输入集输入当前决策树的第一层的叶节点中,将当前决策树的第一层作为当前层,将当前层的每个叶节点作为当前叶节点;

S32,对于当前层的每个当前叶节点,获取当前叶节点分裂前的第一信息量,以及获取当前叶节点分裂出两个新叶节点后的第二信息量;

S33,对于当前层的每个当前叶节点,根据第一信息量和第二信息量,通过第二公式,确定信息增益,其中,第二公式为:

Θ

其中,Θ

S34,对于当前层,若各个当前叶节点的信息增益满足预设条件,则选择当前层中最大的信息增益对应的叶节点作为目标叶节点,并将目标叶节点的输出结果作为第二预测购买数量,若各个当前叶节点的信息增益不满足预设条件,则选择当前层中最大的信息增益对应的当前叶节点分裂出的两个新叶节点分别作为新的当前叶节点,并将当前层的下一层作为当前层,重复执行S32-S34,直到各个当前叶节点的信息增益满足预设条件。

采用上述进一步方案的有益效果是:将当前层中最大的信息增益对应的当前叶节点作为分裂点,同时,通过不断的迭代,使得分裂点的信息增益越来越大,使得决策树的的纯度更高,降低了预测结果(第二预测购买数量)的不确定性,提高了预测结果的准确性。

进一步,上述方法中对于每个物资类别,根据第三输入值,确定目标值,包括:

对于每个物资类别,根据第三输入值,通过第三公式,确定目标值,其中,第三公式为:

其中,Θ

采用上述进一步方案的有益效果是:通过目标函数,使得初始模型学习了第三输入值与真实购买数量之间的偏差与方差,并通过后续不断减小偏差与方差(通过调整初始模型的网络参数进行迭代更新),不断降低第三输入值与真实购买数量之间的差异,进而得到更加准确的目标值。

第二方面,本发明提供了一种基于大数据预测物资采购系统,包括:

第一物资采购数据获取模块,用于终端设备通过客户端获取多个第一物资采购数据,第一物资采购数据为采购物资时对应的采购数据;

第一输入集获取模块,用于终端设备将各个第一物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第一物资采购数据作为物资类别对应的第一输入集;

第一预测购买数量获取模块,用于对于每个物资类别,终端设备将第一输入集输入极端梯度提升模型,得到物资类别对应的第一预测购买数量,并将第一预测购买数量返回给客户端;

极端梯度提升模型是通过第一单元训练得到的,其中,第一单元,具体用于:

第二物资采购获取模块,用于终端设备通过数据库获取多个第二物资采购数据,第二物资采购数据为历史时间段内采购物资时对应的采购数据;

训练集获取模块,用于终端设备将各个第二物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,并获取物资类别对应的真实购买数量;

模型训练模块,用于对于每个物资类别,终端设备将训练集输入初始模型,通过第二单元,得到极端梯度提升模型,其中,初始模型包括多个决策树,第二单元包括:

第二预测购买数量获取模块,用于对于每个物资类别,将第一个决策树作为当前决策树,初始模型将训练集输入当前决策树,通过当前决策树得到第二预测购买数量;

第一残差值获取模块,用于对于每个物资类别,初始模型根据第二预测购买数量与真实购买数量,得到第二预测购买数量与真实购买数量之间的第一残差值,并将第一残差值作为第二输入值;

拟合值获取模块,用于对于每个物资类别,将当前决策树的下一个决策树作为当前决策树,初始模型将第二输入值输入当前决策树,得到第二输入值对应的拟合值;

第二残差值获取模块,用于对于每个物资类别,初始模型根据拟合值与真实购买数量,得到拟合值与真实购买数量之间的第二残差值,并将第二残差值作为第二输入值;

第三输入值获取模块,用于对于每个物资类别,初始模型将第一个决策树直到当前决策树对应的输出结果之和作为第三输入值,并根据第三输入值,确定目标值;

模型迭代模块,用于若目标值满足预设结束条件,将满足预设结束条件时的初始模型作为极端梯度提升模型,若目标值不满足预设结束条件,调整初始网络的网络参数,并根据调整后的网络参数重新执行拟合值获取模块、第二残差值获取模块、第三输入值获取模块和模型迭代模块对应的功能,直到目标值满足预设结束条件。

第三方面,本发明还提供了一种电子设备,包括存储器、处理器及存储在存储器上并在处理器上运行的程序,处理器执行程序时实现如上述的一种基于大数据预测物资采购方法的步骤。

第四方面,本发明还提供了一种计算机可读存储介质,计算机可读存储介质中存储有指令,当指令在终端设备上运行时,使得终端设备执行一种基于大数据预测物资采购方法的步骤。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面结合附图和实施例对本发明作进一步说明。

图1为本发明实施例的一种基于大数据预测物资采购方法的流程示意图;

图2为本发明实施例的一种基于大数据预测物资采购系统的结构示意图。

具体实施方式

下列实施例是对本发明的进一步解释和补充,对本发明不构成任何限制。

以下结合附图描述本发明实施例的一种基于大数据预测物资采购方法和系统。

如图1所示,本发明实施例的一种基于大数据预测物资采购方法,方法应用于终端设备,终端设备分别与客户端和数据库连接。

可选的,一种基于大数据预测物资采购方法包括以下步骤:

S1,终端设备通过客户端获取多个第一物资采购数据,第一物资采购数据为采购物资时对应的采购数据。

可选的,第一物资采购数据包括项目编号、物料组、项目类型、地市、平均单价、项目资金等,现以下表1为例进行说明:

项目标号指项目在文档中的编号,以用于区分不同的项目,例如35KV交流基建项目的项目标号为17190213500G40000000。

物料组指项目采购的具体物料,一般可由字母和数字组成的标识表示,例如物料组为G1404003(布电线),其中,G表示物料类别,即该物料为电线,1404003表示物资类别中物料的具体类别,即该物料为布电线。

项目类型可通过数字表征,表示项目名称,例如项目类型分别为17和16,则17表示35KV交流基建项目,16表示110(66)KV交流基建项目。

地市指项目所在地的名称,可通过数字表征,例如地市为20和22,则20表示达州,22表示凉山。

平均单价指物料的平均价格,例如35KV交流基建项目的项目中采购的布电线的平均价格为16.06504元。

项目资金指项目预算,例如35KV交流基建项目的项目中采购布电线的总预算为18655元(总预算为平均单价*布电线的第一预测购买数量)。

S2,终端设备将各个第一物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第一物资采购数据作为物资类别对应的第一输入集。

可选的,对于终端设备将各个第一物资采购数据按物资类别进行分类,可根据实际情况进行分类,例如表1中,可通过物料组进行分类,将第一物资购买数据分为G1404003类别的数据和G1406032类别的数据,具体可参见表1中内容,第一行指的G1404003类别对应的各个第一物资采购数据,表1中第二行指的G1406032类别对应的各个第一物资采购数据。

S3,对于每个物资类别,终端设备将第一输入集输入极端梯度提升模型,得到物资类别对应的第一预测购买数量,并将第一预测购买数量返回给客户端。

可选的,极端梯度提升模型是通过以下方式训练得到的:

S11,终端设备通过数据库获取多个第二物资采购数据,第二物资采购数据为历史时间段内采购物资时对应的采购数据。

可选的,各个第二物资采购数据来源可为国家电网物资公司所建立的ESC和ERP平台,或国家电网信通公司建立的数据超市。

S12,终端设备将各个第二物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,并获取物资类别对应的真实购买数量。

可选的,各个第二物资采购数据中,存在少量超大型项目中临时需要购买大量物资,导致对于初始模型训练时,影响预测结果的准确性,因此,需要将各个第二物资采购数据控制在一定范围内,避免与真实情况误差过大,基于此,需要对各个第二物资采购数据进行预处理。

可选的,该方法还包括:

对于每个物资类别,终端设备对各个第二物资采购数据进行预处理,得到各个第二物资采购数据对应的第三物资采购数据;

上述预处理包括:

对于每个物资类别,获取物资类别对应的预设的中位数和预设的第一阈值;其中,预设的中位数为一个设定值,用于后文计算每个第二物资采购数据与该设定值之间计算偏差绝对值。

对于每个物资类别,终端设备根据各个第二物资采购数据和中位数,得到每个第二物资采购数据与中位数之间的偏差绝对值;

对于每个物资类别,终端设备根据各个偏差绝对值,得到各个偏差绝对值的第二阈值;

对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,确定各个第三物资采购数据;

对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,包括:

对于每个物资类别,终端设备将物资类别对应的各个第三物资采购数据作为所述物资类别对应的训练集。

可选的,预设的中位数和第一阈值可根据实际情况进行设置。可选的,对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,确定各个第三物资采购数据,包括:

对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,通过第一公式,得到各个第三物资采购数据,其中,第一公式为:

其中,p表示第三物资采购数据,M表示中位数,n表示第一阈值,MAD表示第二阈值,x表示第二物资采购数据。

可选的,对于每个物资类别,仅将资金类对应的第二物资采购数据转换为第三物资采购数据,非资金类对应的第二物资采购数据直接作为第三物资采购数据,资金类表征了采购物资中需要涉及到金钱的数据,例如表1中平均单价和项目资金,中位数是指各个资金类对应的第二物资采购数据的中位数,例如,对于G1404003类别,布电线各个历史采购价格为13、14、15、16、17,则中位数预设为15元。

可选的,对于每个物资类别,绝对值偏差是指各个第二物资采购数据与中位数之间的差值的绝对值,其目的是为了根据中位数,将各个第二物资采购数据控制在一定的合理范围内,避免少量项目因特殊因素导致的采购价格异常。

可选的,第二阈值即为第二物资采购数据的合理范围,若第二物资采购数据高于或低于第二阈值,则表明该项目因特殊原因导致了采购价格异常。

可选的,例如,对于G1404003类别,布电线以往时间段内各个采购价格的中位数为15元,则可以将预设的中位数设置为15,第一阈值设置为0.5,本实施例中,第二物资采购数据中其中一个布电线的采购价格为20,通过第一公式可得M+n*MAD=15+0.5*5=17.5,M-n*MAD=15-0.5*5=12.5,由于20>17.5,因此,对于G1404003类别,将该布电线的采购价格修改为17.5元,将每个布电线的采购价格通过上述方式更新后,即可得到布电线的平均价格,布电线的项目资金同理,在此不做赘述。

可选的,由于各个第二物资采购数据中包含了非数值型的数据,例如地市等,因此需要通过One-hot编码对非数值型的数据转化为数字,例如表1中提到的达州和凉山,用One-hot编码后分别为20和22,其他非数值型数据的转换方式相同,故不作赘述。

S13,对于每个物资类别,终端设备将训练集输入初始模型,通过第一步骤,得到极端梯度提升模型,其中,初始模型包括多个决策树,第一步骤包括:

S131,对于每个物资类别,将第一个决策树作为当前决策树,将训练集输入当前决策树,通过当前决策树得到第二预测购买数量;

S132,对于每个物资类别,根据第二预测购买数量与真实购买数量,得到第二预测购买数量与真实购买数量之间的第一残差值,并将第一残差值作为第二输入值;

S133,对于每个物资类别,将当前决策树的下一个决策树作为当前决策树,将第二输入值输入当前决策树,得到第二输入值对应的拟合值;

S134,对于每个物资类别,根据拟合值与真实购买数量,得到拟合值与真实购买数量之间的第二残差值;

S135,对于每个物资类别,将第二预测购买数量和从第二个决策树开始的各个决策树对应的拟合值之和作为第三输入值,并根据第三输入值,确定目标值;

S136,若目标值满足预设结束条件,将满足预设结束条件时的初始模型作为极端梯度提升模型,若目标值不满足预设结束条件,将第二残差值作为新的第二输入值,以及当前决策树的下一个决策树作为当前决策树,以及调整初始网络的网络参数,并根据调整后的网络参数重新执行S133-S136,直到目标值满足预设结束条件。

可选的,从第二个决策树开始,通过输出拟合值,不断将第二预测购买数量与真实购买数量之间的第一残差值进行缩小,最后将第一个决策树的预测结果以及各个拟合值相加,得到与真实购买数量无限接近的第二预测购买数量即第三输入值。

可选的,上述对于每个物资类别,将第一个决策树作为当前决策树,初始模型将训练集输入当前决策树,通过当前决策树得到第二预测购买数量,包括:

S31,将输入集输入当前决策树的第一层的叶节点中,将当前决策树的第一层作为当前层,将当前层的每个叶节点作为当前叶节点;

S32,对于当前层的每个当前叶节点,获取当前叶节点分裂前的第一信息量,以及获取当前叶节点分裂出两个新叶节点后的第二信息量;

S33,对于当前层的每个当前叶节点,根据第一信息量和第二信息量,通过第二公式,确定信息增益,其中,第二公式为:

Θ

其中,Θ

S34,对于当前层,若各个当前叶节点的信息增益满足预设条件,则选择当前层中最大的信息增益对应的叶节点作为目标叶节点,并将目标叶节点的输出结果作为第二预测购买数量,若各个当前叶节点的信息增益不满足预设条件,则选择当前层中最大的信息增益对应的当前叶节点分裂出的两个新叶节点分别作为新的当前叶节点,并将当前层的下一层作为当前层,重复执行S32-S34,直到各个当前叶节点的信息增益满足预设条件。

可选的,在当前层,当叶节点在分裂后,如果信息增益越大,说明决策树对于预测结果的不确定性越低,相应的,准确性越高,因此,需要当前层中信息增益最大的叶节点作为目标叶节点。如果目标叶节点信息增益满足条件,则表明该决策树的纯度足够,其预测结果的准确性较高,如果目标叶节点信息增益不满足条件,则选择目标叶节点继续分裂,直到下一层级的目标叶节点信息增益满足预设条件。

可选的,上述对于每个物资类别,根据第三输入值,确定目标值,包括:

对于每个物资类别,根据第三输入值,通过第三公式,确定目标值,其中,第三公式为:

其中,Θ

可选的,由上述可知,极端梯度提升模型需要得到与真实购买数量无限接近的第二预测购买数量即第三输入值,因此,初始模型需要学习第三输入值与真实购买数量之间的差异,基于此,在初始模型中添加目标函数,用来表示第三输入值与真实购买数量之间的差异,而第三输入值与真实购买数量之间的差异通过偏差和方差进行表示。

可选的,若目标值满足预设结束条件,则将第三输入值作为极端梯度提升模型的输出预测结果。

如图2所示,本发明实施例的一种基于大数据预测物资采购系统,包括:

第一物资采购数据获取模块201,用于终端设备通过客户端获取多个第一物资采购数据,第一物资采购数据为采购物资时对应的采购数据;

第一输入集获取模块202,用于终端设备将各个第一物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第一物资采购数据作为物资类别对应的第一输入集;

第一预测购买数量获取模块203,用于对于每个物资类别,终端设备将第一输入集输入极端梯度提升模型,得到物资类别对应的第一预测购买数量,并将第一预测购买数量返回给客户端。

可选的,上述极端梯度提升模型是通过第一单元训练得到的,其中,第一单元,具体用于:

第二物资采购获取模块,用于终端设备通过数据库获取多个第二物资采购数据,第二物资采购数据为历史时间段内采购物资时对应的采购数据;

训练集获取模块,用于终端设备将各个第二物资采购数据按物资类别进行分类,对于每个物资类别,终端设备将物资类别对应的各个第二物资采购数据作为物资类别对应的训练集,并获取物资类别对应的真实购买数量;

模型训练模块,用于对于每个物资类别,终端设备将训练集输入初始模型,通过第二单元,得到极端梯度提升模型,其中,初始模型包括多个决策树,第二单元包括:

第二预测购买数量获取模块,用于对于每个物资类别,将第一个决策树作为当前决策树,初始模型将训练集输入当前决策树,通过当前决策树得到第二预测购买数量;

第一残差值获取模块,用于对于每个物资类别,初始模型根据第二预测购买数量与真实购买数量,得到第二预测购买数量与真实购买数量之间的第一残差值,并将第一残差值作为第二输入值;

拟合值获取模块,用于对于每个物资类别,将当前决策树的下一个决策树作为当前决策树,初始模型将第二输入值输入当前决策树,得到第二输入值对应的拟合值;

第二残差值获取模块,用于对于每个物资类别,初始模型根据拟合值与真实购买数量,得到拟合值与真实购买数量之间的第二残差值,并将第二残差值作为第二输入值;

第三输入值获取模块,用于对于每个物资类别,初始模型将第一个决策树直到当前决策树对应的输出结果之和作为第三输入值,并根据第三输入值,确定目标值;

模型迭代模块,用于若目标值满足预设结束条件,将满足预设结束条件时的初始模型作为极端梯度提升模型,若目标值不满足预设结束条件,调整初始网络的网络参数,并根据调整后的网络参数重新执行拟合值获取模块、第二残差值获取模块、第三输入值获取模块和模型迭代模块对应的功能,直到目标值满足预设结束条件。

可选的,该系统还包括:

预处理模块,用于对于每个物资类别,终端设备对各个第二物资采购数据进行预处理,得到各个第二物资采购数据对应的第三物资采购数据;

预设值获取模块,用于对于每个物资类别,获取物资类别对应的预设的中位数和预设的第一阈值;

偏差绝对值获取模块,用于对于每个物资类别,终端设备根据各个第二物资采购数据和中位数,得到各个第二物资采购数据与中位数之间的偏差绝对值;

第二阈值获取模块,用于对于每个物资类别,终端设备根据各个偏差绝对值,得到各个偏差绝对值的第二阈值;

第三物资采购数据获取模块,对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,确定各个第三物资采购数据;

当第三物资采购数据获取模块确定各个第三物资采购数据后,第一单元还用于:

对于每个物资类别,终端设备将物资类别对应的各个第三物资采购数据作为所述物资类别对应的训练集。

可选的,上述第三物资采购数据获取模块,还用于:

对于每个物资类别,终端设备根据中位数,第二阈值、第一阈值和各个第二物资采购数据,通过第一公式,得到各个第三物资采购数据,其中,第一公式为:

其中,p表示第三物资采购数据,M表示中位数,n表示第一阈值,MAD表示第二阈值,x表示第二物资采购数据。

可选的,上述第一单元还用于:

对于每个物资类别,将第一个决策树作为当前决策树,初始模型将训练集输入当前决策树,当前决策树通过第三单元,得到第二预测购买数量,其中,第三单元包括:

当前决策树模块,用于将输入集输入当前决策树的第一层的叶节点中,将当前决策树的第一层作为当前层,将当前层的每个叶节点作为当前叶节点;

信息量获取模块,用于对于当前层的每个当前叶节点,获取当前叶节点分裂前的第一信息量,以及获取当前叶节点分裂出两个新叶节点后的第二信息量;

信息增益获取模块,用于对于当前层的每个当前叶节点,根据第一信息量和第二信息量,通过第二公式,确定信息增益,其中,第二公式为:

Θ

其中,Θ

信息增益判断模块,用于对于当前层,若各个当前叶节点的信息增益满足预设条件,则选择当前层中最大的信息增益对应的叶节点作为目标叶节点,并将目标叶节点的输出结果作为第二预测购买数量,若各个当前叶节点的信息增益不满足预设条件,则选择当前层中最大的信息增益对应的当前叶节点分裂出的两个新叶节点分别作为新的当前叶节点,并将当前层的下一层作为当前层,重复执行S32-S34,直到各个当前叶节点的信息增益满足预设条件。

可选的,上述第一单元还用于:

对于每个物资类别,根据第三输入值,通过第三公式,确定目标值,其中,第三公式为:

其中,Θ

本发明实施例的一种电子设备,包括存储器、处理器及存储在所述存储器上并在所述处理器上运行的程序,所述处理器执行所述程序时实现上述一种基于大数据预测物资采购方法的部分或全部步骤。

其中,电子设备可以选用电脑,相对应地,其程序为电脑软件,且上述关于本发明的一种电子设备中的各参数和步骤,可参考上文中一种基于大数据预测物资采购方法的实施例中的各参数和步骤,在此不做赘述。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

技术分类

06120115636329