掌桥专利:专业的专利平台
掌桥专利
首页

一种基于神经网络多模型结合的虫口密度预测方法及系统

文献发布时间:2023-06-19 11:08:20


一种基于神经网络多模型结合的虫口密度预测方法及系统

技术领域

本发明涉及虫害预测领域,尤其涉及一种基于神经网络多模型结合的虫口密度预测方法及系统。

背景技术

预测茶小绿叶蝉的密度对茶树的虫害具有指导意义,茶小绿叶蝉在茶树上的虫口密度与气候因素如气温、湿度、降雨量等相关,目前的预测方法属于传统的预测方法,如通过构建传统回归模型进行预测,但是传统回归模型需要数据为平稳非白噪声序列,而气候数据如气温、湿度、降雨量等变化波动大且不具备平稳的特性,对于非平稳的气候数据的分析能力较弱,还有是使用传统专家系统预测方法,所得到的预测结果只是虫口密度或者虫害爆发时间的一个范围,而不是准确的虫口密度值或者爆发时间点。由此可知,目前的预测方法得到的预测结果准确度较低。

发明内容

为了解决上述技术问题,本发明的目的是提供一种基于神经网络多模型结合的虫口密度预测方法及系统,能够准确的预测茶小绿叶蝉虫口密度,从而准确的预测虫害发生情况。

本发明所采用的第一技术方案是:一种基于神经网络多模型结合的虫口密度预测方法,包括以下步骤:

监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集;

基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型;

按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型;

获取一段时间内的茶小绿叶蝉数据和气候数据,经过处理后输入到集成模型,输出茶小绿叶蝉虫口密度的预测结果。

进一步,所述监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集这一步骤,其具体包括:

根据茶园中检测仪器统计每天的气温、温度、降雨量和日照时长,得到气候数据;

按照选定的间隔时间基于5点取样法统计茶树上的茶小绿叶蝉每百叶的虫口数目,得到茶小绿叶蝉数据;

将气候数据和茶小绿叶蝉数据按照对应日期添加到数据集,并按照3:1的比例分为训练数据集、验证数据集。

进一步,所述基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型这一步骤,其具体包括:

将训练数据集中的各检测时间点的茶小绿叶蝉的虫口密度和各气候因素作为预构建的BP神经网络模型的输入变量,以对应的下一时间点的茶小绿叶蝉的虫口密度作为输出变量,训练预构建的BP神经网络模型,得到预训练的BP神经网络模型;

使用滑动窗口的方法,将训练数据集中的n个连续时间点的茶小绿叶蝉的虫口密度和各气候因素作为预构建的卷积神经网络模型的输入变量,以对应的下一个时间点的茶小绿叶蝉虫口密度为输出变量,训练预构建的卷积神经网络模型,得到预训练的卷积神经网络模型;

将训练数据集中最后一个监测时间点作为结束位点,从第一个时间点开始依次选择训练数据集中的时间点作为起始位点构造输入变量和输出变量,训练预构建的长短期记忆模型,得到预训练的长短期记忆模型;

基于验证数据集对预训练的BP神经网络模型、预训练的卷积神经网络模型和预训练的长短期记忆模型进行验证和参数调整,得到训练完成的BP神经网络模型、训练完成的卷积神经网络模型和训练完成的长短期记忆网络模型。

进一步,所述预构建的BP神经网络模型包括输入层、隐含层和输出层,所述输入层大小为8,所述隐含层大小为16,所述输出层大小为1。

进一步,所述预构建的卷积神经网络模型包括第一层输入层、第二层卷积层、第三层池化层、第四层全连接层和第五层输出层。

进一步,所述长短期记忆模型包括两个隐含层,每个隐含层的大小为8,隐含层之后连接两层全连接层。

进一步,所述按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型这一步骤,其具体包括:

对训练完成的BP神经网络模型、训练完成的卷积神经网络和训练完成的长短期记忆模型分配权重系数,得到多个不同权重系数组合下的集成模型;

基于验证数据集对不同权重系数组合下的集成模型进行评估,并根据评估结果得到最优的集成模型。

本发明所采用的第二技术方案是:一种基于神经网络多模型结合的虫口密度预测系统,包括:

数据处理模块,用于监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集;

训练模块,基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型;

集成模块,用于按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型;

预测模块,用于获取一段时间内的茶小绿叶蝉数据和气候数据,经过处理后输入到集成模型,输出茶小绿叶蝉虫口密度的预测结果。

本发明方法及系统的有益效果是:本发明解决了传统方法预测能力有限的问题,通过多个神经网络模型进行预测,可以对气温、湿度、降雨量等不平稳、非线性数据进行分析,并通过各神经网络模型分别捕获数据中的不同特征,根据特征间的关系提高神经网络模型预测效果。

附图说明

图1是本发明一种基于神经网络多模型结合的虫口密度预测方法的步骤流程图;

图2是本发明一种基于神经网络多模型结合的虫口密度预测系统的结构框图;

图3是本发明具体实施例集成的数据处理示意图;

图4是本发明具体实施例LSTM单元的结构图;

图5是在英红九号茶树应用本发明方法预测虫害的对比图;

图6是在黄棪茶树应用本发明方法预测虫害的对比图;

图7是在金萱茶树应用本发明方法预测虫害的对比图;

图8是单模型和集成模型分别在英红九号、黄棪和金萱的预测结果的MSE对比图;

图9是单模型和集成模型分别在英红九号、黄棪和金萱的预测结果的MAE对比图。

具体实施方式

下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

本发明解决了传统方法预测能力有限的问题,并通过集成学习结合了多神经网络模型的优点来预测差小绿叶蝉虫口密度,提高了预测准确度。

参照图1,本发明提供了一种基于神经网络多模型结合的虫口密度预测方法,该方法包括以下步骤:

S1、监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集;

S2、基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型;

S3、按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型;

S4、获取一段时间内的茶小绿叶蝉数据和气候数据,经过处理后输入到集成模型,输出茶小绿叶蝉虫口密度的预测结果。

进一步作为本方法的优选实施例,所述监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集这一步骤,其具体包括:

根据茶园中检测仪器统计每天的气温、温度、降雨量和日照时长,得到气候数据;

按照选定的间隔时间基于5点取样法统计茶树上的茶小绿叶蝉每百叶的虫口数目,得到茶小绿叶蝉数据;

具体地,使用5点取样法人工监测茶小绿叶蝉百叶虫口数目,因为小绿叶蝉百叶虫口监测成本高,所以每隔7天监测一次。使用监测仪器获取气温、湿度、降雨量、日照时长数据,将监测到的数据输入到系统中。

另外,由于气候数据是每天监测得到,而茶小绿叶蝉的虫口密度每隔7天监测一次得到的,所以为了便于模型训练,将每个茶小绿叶蝉的虫口密度监测时间点前7天(包括当天)的气候因素平均值作为该虫口密度监测时间点的气候数据。

将气候数据和茶小绿叶蝉数据按照对应日期添加到数据集,并按照3:1的比例分为训练数据集、验证数据集。

具体地,因为虫口的密度变化趋势具有以年为周期的周期性,所以基于监测时间点衍生出监测月、监测日、与下一个监测时间点的时间间隔三种特征,将数据按3:1的比例分为训练数据集、验证数据集,并对数据进行min-max标准化处理,公式为:

其中min为序列的最小值,max为序列的最大值,x

进一步作为本方法的优选实施例,所述基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型这一步骤,其具体包括:

将训练数据集中的各检测时间点的茶小绿叶蝉的虫口密度和各气候因素作为预构建的BP神经网络模型的输入变量,以对应的下一时间点的茶小绿叶蝉的虫口密度作为输出变量,训练预构建的BP神经网络模型,得到预训练的BP神经网络模型;

具体地,BP神经网络模型将各监测时间点茶小绿叶蝉的虫口密度和各气候因素作为输入变量,下一个时间点茶小绿叶蝉的虫口密度作为输出变量构造BP神经网络模型的训练数据。

使用滑动窗口的方法,将训练数据集中的n个连续时间点的茶小绿叶蝉的虫口密度和各气候因素作为预构建的卷积神经网络模型的输入变量,以对应的下一个时间点的茶小绿叶蝉虫口密度为输出变量,训练预构建的卷积神经网络模型,得到预训练的卷积神经网络模型;

具体地,选择滑动窗口的大小为4,将训练数据集中每4个连续时间点的茶小绿叶蝉的虫口密度和各气候因素作为输入变量,下一个时间点的茶小绿叶蝉虫口密度为输出变量构造卷积神经网络模型的训练数据。

将训练数据集中最后一个监测时间点作为结束位点,从第一个时间点开始依次选择训练数据集中的时间点作为起始位点构造输入变量和输出变量,训练预构建的长短期记忆模型,得到预训练的长短期记忆模型;

具体地,为了充分利用监测到的数据,若训练数据集包含n个监测时间点,则将序列中第1~n-1个监测时间点分别作为起点位点,第n个监测时间点作为结束位点构造n-1条序列作为输入变量,每条输入序列向后平移一个时间点对应的虫口密度序列组成输出变量。

基于验证数据集对预训练的BP神经网络模型、预训练的卷积神经网络模型和预训练的长短期记忆模型进行验证和参数调整,得到训练完成的BP神经网络模型、训练完成的卷积神经网络模型和训练完成的长短期记忆网络模型。

进一步作为本方法的优选实施例,所述预构建的BP神经网络模型包括输入层、隐含层和输出层,所述输入层大小为8,所述隐含层大小为16,所述输出层大小为1。

具体地,隐含层和输出层之间为tanh激活函数,tanh激活函数公式如公式(2),损失函数为公式(3):

进一步作为本方法优选实施例,所述预构建的卷积神经网络模型包括第一层输入层、第二层卷积层、第三层池化层、第四层全连接层和第五层输出层。

具体地,选定滑动窗口的大小为4,因为包含8种特征,所以第一层输入层的大小为4*8,第二层卷积层使用两个大小不同的一维卷积核,大小分别为2和3。第三层池化层采用最大池化层,第四层为全连接层。模型通过Adam优化器进行优化,损失函数公式如公式(3)。

进一步作为本方法优选实施例,所述长短期记忆模型包括两个隐含层,每个隐含层的大小为8,隐含层之后连接两层全连接层。

具体地,长短期记忆模型是一种改进的循环神经网络模型,本发明中使用双层LSTM之后连接两层全连接层的结构,LSTM的隐含层大小为8,模型通过Adam优化器进行优化,损失函数公式如公式(3),LSTM单元的结构参照图4。

进一步作为本方法优选实施例,所述按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型这一步骤,其具体包括:

对训练完成的BP神经网络模型、训练完成的卷积神经网络和训练完成的长短期记忆模型分配权重系数,得到多个不同权重系数组合下的集成模型;

基于验证数据集对不同权重系数组合下的集成模型进行评估,并根据评估结果得到最优的集成模型。

具体地,为了综合各模型提取特征的优点,提高预测效果,使用集成学习的加权平均法,给各模型分别分配权重系数,在验证集上测试在不同权重组合下,集成模型的预测效果,集成模型参照图3。

将英红九号、黄棪和金萱将已有的历史数据构造成各模型输入数据的格式,组成集成模型的输入,输入集成模型之后得到预测结果,预测结果与实际结果参照图5、图6和图7。

模型预测结果的均方误差(MSE)和平均绝对误差(MAE)分别如图8和图9所示,可见集成模型的MSE和MAE最小,说明集成模型预测效果最优。

如图2所示,一种基于神经网络多模型结合的虫口密度预测系统,包括:

数据处理模块,用于监测茶小绿叶蝉数据和气候数据并进行数据处理和数据划分,得到训练数据集和验证数据集;

训练模块,基于训练数据集和验证数据集分别对预构建的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行训练和参数调优,得到训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型;

集成模块,用于按照预设的权重系数对训练完成的BP神经网络模型、卷积神经网络模型和长短期记忆模型进行集成,得到集成模型;

预测模块,用于获取一段时间内的茶小绿叶蝉数据和气候数据,经过处理后输入到集成模型,输出茶小绿叶蝉虫口密度的预测结果。

上述方法实施例中的内容均适用于本系统实施例中,本系统实施例所具体实现的功能与上述方法实施例相同,并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

相关技术
  • 一种基于神经网络多模型结合的虫口密度预测方法及系统
  • 基于CNN-LSTM神经网络模型与ARIMA模型的时间序列预测方法及系统
技术分类

06120112809470