掌桥专利:专业的专利平台
掌桥专利
首页

水稻产量预测方法及装置

文献发布时间:2023-06-19 09:46:20


水稻产量预测方法及装置

技术领域

本发明涉及柔性传感器薄膜的制备技术领域,尤其涉及一种水稻产量预测方法及装置。

背景技术

农作物的产量预测对制订农产品收购计划具有非常重要的参考价值,农作物预测产量是在农作物收获前采取一定方法预先测定的产量。

目前,对粮食产量的预测模型总体上分为三大类:时间序列模型、人工神经网络模型和回归模型。每个模型都有其优缺点,其中神经网络综合性能更优,但是存在计算复杂度大的问题。目前基于神经网络模型的产量预测方法,由于高计算复杂度导致局限性大,预测速度较慢。

发明内容

本发明实施例提供一种水稻产量预测方法及装置,用以满足现有技术中的需求。

本发明实施例提供一种水稻产量预测方法,包括:对水稻原始数据进行特征提取,得到水稻特征数据;将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

根据本发明一个实施例的水稻产量预测方法,所述对水稻原始数据进行特征提取之前,还包括:对模型的超参数,通过网格搜索算法进行寻优。

根据本发明一个实施例的水稻产量预测方法,对模型的超参数,通过网格搜索算法进行寻优,包括:对所有的待优化超参数进行循环遍历,得到所有可能的组合;对每一种组合,使用相同的训练集数据进行训练,并使用相同的验证集进行验证,选取准确率最高的超参数组合,作为寻优结果。

根据本发明一个实施例的水稻产量预测方法,所述超参数包括,迭代次数、叶子节点最小样本数、最大深度、gamma值、采样比例、colsample_bytree参数、reg_alpha参数、reg_lambda参数和学习速率。

根据本发明一个实施例的水稻产量预测方法,对水稻原始数据进行特征提取之前,还包括:对水稻原始数据进行数据清洗;所述数据清洗包括,异常数据删除、缺失值以零填充、对非数值数据进行编码。

根据本发明一个实施例的水稻产量预测方法,对水稻原始数据进行特征提取之前,还包括:删除影响预测的特征字段和与预测产量无关的特征字段。

根据本发明一个实施例的水稻产量预测方法,所述非数值数据,包括地址、生育期、品种和种类。

本发明实施例还提供一种水稻产量预测装置,包括:特征提取模块,用于对水稻原始数据进行特征提取,得到水稻特征数据;预测模块,用于将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述水稻产量预测方法的步骤。

本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述水稻产量预测方法的步骤。

本发明实施例提供的水稻产量预测方法及装置,通过训练后的XGBoost网络模型进行预测,XGBoost网络模型引入正则化项,加入剪枝,控制了模型的复杂度,从而可大大减少预测的计算复杂度,提高预测效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种水稻产量预测方法的流程示意图;

图2是本发明实施例提供的测试集实际产量与预测产量对比图;

图3是本发明实施例提供的一种水稻产量预测装置的结构示意图;

图4是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合图1-图4描述本发明实施例的水稻产量预测方法及装置。图1是本发明实施例提供的一种水稻产量预测方法的流程示意图,如图1所示,本发明实施例提供一种水稻产量预测方法,包括:

101、对水稻原始数据进行特征提取,得到水稻特征数据。

水稻原始数据是水稻的各种参数数据的集合,如目前的预测方法所使用的水稻各种参数的数据。

原始数据中包括,生育期、NDVI值、全段积温、全生育期积温、灌浆期NDVI值、抽穗期积温和叶绿素含量、平均产量、产量、叶面积指数和植被覆盖度等。对这些元素数据进行特征提取,得到易于输入神经网络的特征数据。

102、将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

XGBoost是一个优化的分布式梯度增强库,旨在实现高效,灵活和便携。它在Gradient Boosting框架下实现机器学习算法。XGBoost提供了并行树提升(也称为GBDT,GBM),在传统Boosting的基础上,利用cpu的多线程,引入正则化项,加入剪枝,控制了模型的复杂度,提高了模型的运行效率。

在102之前,预设的XGBoost网络模型,根据已知水稻产量的多个原始数据作为样本,经特征提取后进行训练。选用预先采集的数据集,如1436条数据,命名为RiceYSet。其中,20%用于测试。训练完成后的模型,可用于水稻产量的预测。将101提取的特征数据,输入训练后的XGBoost网络模型,便可得到水稻含量的预测结果。

本发明实施例提供的水稻产量预测方法,通过训练后的XGBoost网络模型进行预测,XGBoost网络模型引入正则化项,加入剪枝,控制了模型的复杂度,从而可大大减少预测的计算复杂度,提高预测效率。

基于上述实施例的内容,作为一种可选实施例,所述对水稻原始数据进行特征提取之前,还包括:对模型的超参数,通过网格搜索算法进行寻优。通过网格搜索算法调节超参数,以优化训练模型。运用网格搜索(grid search)来寻找模型的最佳参数。超参数包括最佳迭代次数,学习速率,每棵树的最大深度等等。通过网格搜索算法进行寻优,以提高模型的训练效率,同时还可进一步提高模型预测的准确性。

基于上述实施例的内容,作为一种可选实施例,对模型的超参数,通过网格搜索算法进行寻优,包括:对所有的待优化超参数进行循环遍历,得到所有可能的组合;对每一种组合,使用相同的训练集数据进行训练,并使用相同的验证集进行验证,选取准确率最高的超参数组合,作为寻优结果。网格搜索的具体方法如下:

首先,使用字典的方式对XGBoost算法中的不同超参数组合进行定义。其次,定义一个所需要调参的机器学习算法,本发明实施例采用XGBoost算法。在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,然后将训练集TrainData,测试集TestData输入网格搜索,最后开始进行网格搜索得到最佳模型,准确度最好的参数就是最终的结果。

以有两个参数的模型为例,参数a有3种可能,参数b有4种可能,把所有可能性列出来,可以表示成一个3*4的表格,其中每个单元格就是一个网格,循环过程就像是在每个网格里遍历和搜索。

基于上述实施例的内容,作为一种可选实施例,所述超参数包括,迭代次数、叶子节点最小样本数、最大深度、gamma值、采样比例、colsample_bytree参数、reg_alpha参数、reg_lambda参数和学习速率。

设置要优化的参数,首先是迭代次数(n_estimators),叶子节点最小样本数(min_child_weight)以及最大深度(max_depth),接着就开始调试参数:gamma、采样比例(subsample)以及colsample_bytree。紧接着就是reg_alpha和reg_lambda,最后就是学习速率(learning_rate)。

基于上述实施例的内容,作为一种可选实施例,对水稻原始数据进行特征提取之前,还包括:对水稻原始数据进行数据清洗;所述数据清洗包括,异常数据删除、缺失值以零填充、对非数值数据进行编码。

基于上述实施例的内容,作为一种可选实施例,所述非数值数据,包括地址、生育期、品种和种类。读取水稻原始数据(Data),然后将原数据进行数据清洗。数据清洗的具体操作可以为:首先,对异常值删除,缺失值用零填充;其次,对非数值类型特征进行编码,非数值类型包括地址、生育期、品种和种类字段,得到数据清洗后的数据,记为BData。

基于上述实施例的内容,作为一种可选实施例,对水稻原始数据进行特征提取之前,还包括:删除影响预测的特征字段和与预测产量无关的特征字段。

具体可以是在数据清洗后进行,读取BData中的样本数据,将样本进行特征选择。首先,运用先验知识(例如:积温高就意味着拥有更多的能量,就有获得更高产量的潜力)挑选包括温度相关字段。最后,删除影响预测的特征字段和与预测产量无关的特征字段(如平均产量),得到数据记为BCData。

读取BCData中的样本数据,随机将BCData按4:1的比例随机划分为训练集TrainData,测试集TestData。读取TrainData中的样本数据,实测产量字段作为Y标签,其余字段作为特征输入XGBoost网络进行训练,然后读取TestData中的样本数据进行测试,作为基准。

本实施例通过此数据集进行检验,采用常用的回归模型定量指标:R2。结果表明本发明提出的方法取得0.84的预测精度,图2是本发明实施例提供的测试集实际产量与预测产量对比图,如图2所示。

下面对本发明实施例提供的水稻产量预测装置进行描述,下文描述的水稻产量预测装置与上文描述的水稻产量预测方法可相互对应参照。

图3是本发明实施例提供的一种水稻产量预测装置的结构示意图,如图3所示,该水稻产量预测装置包括:特征提取模块301和预测模块302。其中,特征提取模块301用于对水稻原始数据进行特征提取,得到水稻特征数据;预测模块302用于将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。

本发明实施例提供的水稻产量预测装置,通过训练后的XGBoost网络模型进行预测,XGBoost网络模型引入正则化项,加入剪枝,控制了模型的复杂度,从而可大大减少预测的计算复杂度,提高预测效率。

图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)401、通信接口(Communications Interface)402、存储器(memory)403和通信总线404,其中,处理器401,通信接口402,存储器403通过通信总线404完成相互间的通信。处理器401可以调用存储器403中的逻辑指令,以执行水稻产量预测方法,该方法包括:对水稻原始数据进行特征提取,得到水稻特征数据;将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

此外,上述的存储器403中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的水稻产量预测方法,该方法包括:对水稻原始数据进行特征提取,得到水稻特征数据;将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的水稻产量预测方法,该方法包括:对水稻原始数据进行特征提取,得到水稻特征数据;将所述水稻特征数据,输入预设的XGBoost网络模型,得到水稻的产量预测结果;其中,所述XGBoost网络模型,根据已知水稻产量的原始数据作为样本,经特征提取后训练得到。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 水稻产量预测方法及装置
  • 一种水稻关键生育时期的产量预测方法及系统
技术分类

06120112291647