掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多阶段训练的农作物病害长尾图像识别方法

文献发布时间:2023-06-19 11:44:10


一种基于多阶段训练的农作物病害长尾图像识别方法

技术领域

本发明属于深度学习和图像识别领域,涉及一种基于多阶段训练的农作物病害长尾图像识别方法。

背景技术

传统的农作物病害识别方法是使用手工设计的特征去提取病斑,然后再输入到分类器中进行分类,这类方法较为繁琐且鲁棒性较差。

卷积神经网络在计算机视觉领域有着广泛的应用,在目标检测和图像识别等领域发挥着重要的作用,但是需要大量均衡的数据来训练卷积神经网络才可能是使其达到优异的性能。然而在真实世界中,数据的分布是呈现为长尾分布的状态,少数头部类占有大量的数据,其他尾部类只占有少量的数据,卷积神经网络用长尾分布的数据进行训练模型性能会出现大幅的下降。

农作物病害种类繁多且爆发难以预测,收集到的数据多为不均衡长尾分布的,难以收集到大量均衡的数据。卷积神经网络使用均衡的数据集进行训练,对农作物病害的能够达到较高的识别准确率,然而在真实的长尾分布下卷积神经网络的性能显著下降。因此提高卷积神经网络在长尾分布下的识别能力,对将神经深度学习技术部署在实际的生产环境中有巨大的推动作用。

发明内容

有鉴于此,本发明的目的在于提供一种基于多阶段训练的农作物病害长尾图像识别方法,解决自然环境中背景复杂农田环境对农作物病害识别的干扰问题,以及自然真实环境中农作物病害数据分布不均匀使得卷积神经网络模型对尾部类识别精度低的问题,用于提高自然场景下复杂的不均衡分布的病虫害图像识别准确率。

为达到上述目的,本发明提供如下技术方案:

一种基于多阶段训练的农作物病害长尾图像识别方法,具体包括以下步骤:

S1:获取长尾分布的农作物病害数据集,记为原始数据集;

S2:对原始数据集进行处理,使用CutMix进行数据增强,得到增强数据集;

S3:对原始数据集进行处理,使用平衡采样方法进行采样,得到平衡数据集;该平衡数据集每个类别具有相同的样本数量。

S4:搭建深度卷积神经网络模型;

S5:训练第一阶段,先使用原始的数据集输入到步骤S4搭建的深度卷积神经网络模型中进行训练,使CNN模块学习到原始的数据分布,第一阶段训练完成后保留训练后的模型;

S6:训练第二阶段,加载第一阶段训练后保存的模型,将增强数据集输入模型进行第二阶段的训练,由于农作物叶片相互遮挡增加识别的难度,使用CutMix进行数据增强模拟农作物叶片遮挡情况,可提高模型在实际生产环境中的鲁棒性,完成第二阶段的训练后保留模型;

S7:训练第三阶段,加载第二阶段训练后保存的模型,冻结CNN模块的参数更新,只更新DNN全连接层网络参数,使用平衡数据集作为输入进行第三阶段的训练,提升模型的对长尾数据分类性能,完成第三阶段的训练后保存模型。

进一步,步骤S1中,所述原始数据集是在自然农田环境中拍摄的实际数据,未经过人工平衡等处理环节,是不均衡的原始数据集。

进一步,步骤S2中,所述增强数据集是经过CutMix增强后所获得的数据集,表示为:

x

y

其中,x

进一步,步骤S4中,搭建的深度卷积神经网络模型中,卷积模块使用Resnet网络结构,分类模块使用DNN作为分类器,使用Cross Entropy作为损失函数。

进一步,使用Resnet模型作为骨干网络搭建卷积神经网络模型,第一阶段使用原始数据集进行训练让模型学习到原始的数据分布,第二阶段使用增强数据集进行训练增强模型的鲁棒性,第三阶段训练冻结卷积模块的参数更新,只更新全连接层参数增强模型的分类性能。

使用多阶段训练微调的训练方法,通过多阶段的训练让模型学习到较为全面的特征提取能力和分类能力。

本发明的有益效果在于:本发明方法可以提升模型在复杂农田背景下的鲁棒性,能够改善不均衡长尾数据对模型带来的不良影响。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作优选的详细描述,其中:

图1为本发明基于多阶段训练的农作物病害长尾图像识别方法流程图;

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。

请参阅图1,本发明属于长尾图像识别方法,设计思路为:使用多阶段训练的方法让模型获得良好的整体性能,提升其特征提取能力和分类能力。研究发现重采样平衡数据集的方法能够有效提升模型对长尾数据的识别准确率,但是会损害模型的特征提取能力,使用重采样平衡后的平衡数据集进行训练会造成模型对尾部类过拟合。故本发明采用多阶段训练的方法,在第一阶段训练中使用原始的数据集进行训练,让模型先学习到数据的原始分布避免过拟合问题的发生,在第二阶段的训练中使用增强数据集进行训练提升模型的鲁棒性,在第三阶段使用重采样平衡后的数据集进行训练。因为第一阶段和第二阶段的训练模型已经学习到了较好的特征提取能力,故在第三阶段模型训练的时候冻结CNN卷积模块的参数更新,保留前两阶段训练后获得的特征提取能力,只对DNN全连接层的参数进行更新提升模型的分类能力。经过三个阶段的训练后,模型能够获得一个整体的性能提升,在原始数据集和增强数据集上的训练中提升了模型的特征提取能力,在平衡数据集的训练中提升了模型的分类能力。

如图1所示,本发明优选了一种基于多阶段训练的农作物病害长尾图像识别方法,具体包括以下步骤:

步骤1:使用终端设备采集真实的农田病害数据集。

步骤2:对数据进行预处理,使用CutMix技术进行数据增强获得增强数据集,使用平衡采样技术进行采样获得平衡数据集,未进行处理的保留为原始数据集。

步骤3:搭建深度卷积神经网络模型,卷积模块使用Resnet网络结构,分类模块使用DNN作为分类器,使用Cross Entropy作为损失函数。

步骤4:使用原始农作物病害数据集进行第一阶段的训练,训练后将生成模型保存。

步骤5:加载第一阶段训练后保存的模型,使用增强农作物病害数据集进行第二阶段的训练,训练完后将生成模型保存。

步骤6:加载第二阶段训练后保存的模型,使用平衡农作物病害数据集进行第三阶段的训练,训练时冻结卷积层的参数更新,只让DNN全连接层的参数更新,训练完后保存生成模型,完成训练。

步骤7:加载模型对农作物病害进行识别。

作为其他实施方式,卷积神经网络的结构也可以根据实际需要进行设计,不局限于本实施例所使用的Resnet网络。

作为其他实施方式,DNN也可以替换为其他类型的分类器。

作为其他实施方式,不平衡的农作物病害数据也可以根据应用需求替换为其他领域的长尾图像数据。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

相关技术
  • 一种基于多阶段训练的农作物病害长尾图像识别方法
  • 一种基于多阶段训练的农作物病害长尾图像识别方法
技术分类

06120113033872