掌桥专利:专业的专利平台
掌桥专利
首页

一种用于发病初中期分析的小麦条锈病遥感监测方法

文献发布时间:2023-06-19 10:19:37


一种用于发病初中期分析的小麦条锈病遥感监测方法

技术领域

本发明涉及遥感图像分析技术领域,具体来说是一种用于发病初中期分析的小麦条锈病遥感监测方法。

背景技术

小麦条锈病主要发生在叶片上,叶片植物细胞在受到病害侵染后,细胞内部的水分含量、色素等都会逐渐发生改变,叶片上逐渐出现越来越多的锈色粉状物,这些现象会引起植被光谱反射率发生变化,然而在病害后期病菌具备有性繁殖能力,并且可以随着气流进行传播导致条锈病的大面积发生,因此对小麦条锈病进行初中期监测是十分必要的。

目前对于小麦条锈病的机理研究大多集中在病害的整个发病时期或者发生中后期,这并不利于小麦条锈病的及时防控,通过冠层高光谱数据构建小麦生长初中期条锈病菌的遥感监测模型可以及时地获取病害的发生信息,便于提前做好预防小麦条锈病大面积发生的准备,减少相应的经济损失。

现有技术中,师越等通过分析小麦冠层高光谱数据,提取14个植被指数特征,实现了冬小麦条锈、蚜虫和白粉病三种病虫害的检测与分类,但是所选研究的对象包含整个发病时期。黄文江等发现在冠层和田间尺度上利用光化学反射指数(PhotochemicalReflectance Index,PRI)可以有效地检测冬小麦条锈病的发生情况。Devada等人发现,没有光谱指数可以在叶片尺度上完全区分小麦条锈病、叶锈病和茎锈病,但花青素反射指数(Anthocyanin Reflectance Index,ARI)可以区分条锈病和健康小麦。郑琼等分析不同时期小麦条锈病冠层光谱数据发现PRI和ARI能很好地完成对条锈病的监测分类,然而ARI只是对于中后期的条锈病害具有较高的监测能力。也就是说,通过植被高光谱数据得到的植被指数特征可以在一定程度上实现对小麦条锈病严重度的监测,但缺乏针对于病害初中期的监测方法。

那么如何设计出一种针对于小麦条锈病初中期的遥感监测方法已经成为急需解决的技术问题。

发明内容

本发明的目的是为了解决现有技术中尚无针对小麦条锈病进行初中期监测的缺陷,提供一种用于发病初中期分析的小麦条锈病遥感监测方法来解决上述问题。

为了实现上述目的,本发明的技术方案如下:

一种用于发病初中期分析的小麦条锈病遥感监测方法,包括以下步骤:

小麦条锈病遥感数据的获取与预处理:获取小麦条锈病遥感数据并提取出冠层高光谱数据,并对冠层高光谱数据进行预处理;

建模特征的选择:从预处理后的小麦冠层反射率光谱曲线中提取出植被指数特征,利用相关性分析方法和随机森林特征选择方法进行筛选;

XGBoost监测模型的构建与训练:构建XGBoost监测模型并对其进行训练;

待分析小麦条锈病遥感图像的获取:获取待分析小麦条锈病遥感图像,并对其进行冠层高光谱数据的采集和预处理,按建模特征的选择步骤所筛选出的特征进行植被指数特征的提取;

小麦条锈病初中期监测结果的获得:将待分析小麦条锈病遥感图像的植被指数特征输入训练后的XGBoost监测模型,得到小麦条锈病初中期监测结果。

所述小麦条锈病遥感数据的获取与预处理包括以下步骤:

获取利用遥感设备中ASDFieldSpec地物光谱仪所采集的冠层高光谱数据,采集到小麦条锈病的光谱反射率,其中,光谱分辨率在350nm-1000nm范围内为3nm、在1000nm-2500nm范围内为10nm;

计算小麦冠层反射率光谱曲线,其计算公式如下:

式中,R

采用5步滑动平均法对小麦冠层反射率光谱曲线进行信号滤波处理。

所述建模特征的选择包括以下步骤:

从预处理后的小麦冠层反射率光谱曲线中提取敏感波段所组成的植被指数,作为初选建模特征;

利用相关性分析方法对初选建模特征进行筛选,形成预选建模特征;

利用随机森林特征选择方法对预选建模特征进行筛选,形成模型特征集。

所述XGBoost监测模型的构建与训练包括以下步骤:

设样本集中有n个小麦条锈病样本,m个最终筛选得到的植被指数特征,XGBoost监测模型中包含k个条锈病样本的基础树模型,最终的预测值则是k个树模型的结果进行求和,即为下式所示:

D={(x

其中,x

通过引入正则化项使包含植被指数特征的条锈病害模型的目标函数最小化,其表达式如下:

式中

令经过t次迭代训练后的树模型为f

将等式(5)进行泰勒二阶展开得到下式:

式中

移除第t次迭代中的泰勒二次展开常数,并假设已知条锈病害树模型结构为q,则每个样本x

对等式(5)进行转换如下:

对于叶子节点j对应的权重值

采用贪婪算法将实际运用中的树模型结构划分为I

所述利用相关性分析方法对初选建模特征进行筛选包括以下步骤:

将相关系数作为植被指数特征与条锈病情指数之间相关性的密切程度的表达方式;

建立植被指数特征与条锈病情指数之间相关系数计算表达式,对所得相关系数结果进行误差分析;

对植被指数特征与条锈病情指数之间的是否存在相关关系,采用建立相关性分析表格、绘制相关图以及计算相关系数等方式来判断两者之间的相关变化方向、形态及密切程度;

其中相关系数是反映植被指数特征与条锈病情指数之间密切程度的统计指标。其计算公式如下式所示:

式中r即为所选择的植被指数特征与条锈病情指数之间的相关系数,x和y分别表示样本植被指数特征和条锈病病情指数,

相关系数r的取值范围为-1≤r≤1,r>0表示为正相关,r<0表示为负相关,判定研究变量之间的相关程度则是通过|r|来体现,|r|越大则变量之间的密切程度越高。对所选择的植被指数特征与条锈病病情指数进行相关性分析得到其相关系数,以相关系数绝对值0.6为阈值对初选的植被指数特征进行筛选,得到相关性分析的筛选结果。

所述利用随机森林特征选择方法对预选建模特征进行筛选包括以下步骤:

根据随机森林中决策树的数量将经过相关性分析筛选过后的小麦条锈病样本的袋外数据划分为n组用来计算随机森林所有决策树的误差值,结果分别记做:err

将n组袋外数据中的第i个植被指数特征进行随机排序,保证其他植被指数特征不变,重新计算样本袋外数据误差值,结果分别记做:err

根据上述得到的误差结果计算特征重要性如以下公式所示:

为了确保特征选取的准确性,采用10折交叉验证的方法对相关性分析过后得到的植被指数特征进行迭代计算,在经过迭代后取各植被指数特征的特征重要性得分平均值完成特征重要性排序工作,以重要性得分为0.09为阈值选择则出冗余信息含量最少、分类准确率最高的植被指数特征集作为最终的特征筛选结果。

有益效果

本发明的一种于发病初中期分析的小麦条锈病遥感监测方法,与现有技术相比采用相关性分析(CA)和随机森林算法(RF)对植被指数特征进行特征筛选,利用XGBoost监测模型实时监测小麦条锈病的发生情况,为小麦条锈病的及时防治提供有效的信息。

附图说明

图1为本发明的方法顺序图;

图2为本发明实施例中小麦冠层光谱平均反射率曲线图;

图3为本发明实施例中小麦样本的冠层光谱反射率与条锈病病情指数进行相关性分析对比图;

图4为本发明实施例中进行随机森林(RF)特征重要性排序后结果对比图。

具体实施方式

为使对本发明的结构特征及所达成的功效有更进一步的了解与认识,用以较佳的实施例及附图配合详细的说明,说明如下:

如图1所示,本发明所述的一种用于发病初中期分析的小麦条锈病遥感监测方法,包括以下步骤:

第一步,小麦条锈病遥感数据的获取与预处理:获取小麦条锈病遥感数据并提取出冠层高光谱数据,并对冠层高光谱数据进行预处理。其具体步骤如下:

(1)获取利用遥感设备中ASDFieldSpec地物光谱仪所采集的冠层高光谱数据,采集到小麦条锈病的光谱反射率,其中,光谱分辨率在350nm~1000nm范围内为3nm,在1000nm~2500nm范围内为10nm;

(2)计算小麦冠层反射率光谱曲线,其计算公式如下:

式中,R

(3)采用5步滑动平均法对小麦冠层反射率光谱曲线进行信号滤波处理。滑动平均法则是通过调整新旧数据得出移动平均值,尽可能地去除偶然因素影响,找出冠层光谱曲线的变化趋势,最终达到消除信号噪声的目的。

在实际应用中,鉴于小麦在受到条锈病侵染的过程中,叶片的叶绿素含量降低,水分减少,在不同波段上出现差异性的光谱信息,可以选择波段为350nm~1100nm的冠层光谱进行小麦条锈病害初中期的监测研究。

第二步,建模特征的选择:从预处理后的小麦冠层反射率光谱曲线中提取出植被指数特征,利用相关性分析方法和随机森林特征选择方法进行筛选。

在现有的研究中,除了光谱反射率可以反映作物遭受到病害胁迫,经常被用来识别植物病害的植被指数同样可以反映小麦受条锈病菌的侵染程度。植被指数是利用植被光谱特性对可见光和近红外波段进行不同形式的构建,以此作为遥感监测的基本理论依据,从大量的研究中发现基于高光谱数据变换得到的植被指数在作物病虫害的研究上能很好地监测病虫害的发生情况。

在实际应用中,可以根据小麦条锈病光谱响应的特性,以及以往各类研究中不同植被指数选在条锈病害监测方面的应用,选取多个由可见光和近红外波段进行重组、合并得到的植被指数作为小麦条锈病初中期监测模型的候选特征。

由于候选特征是从小麦条锈病冠层光谱曲线中提取敏感波段组合形成的植被指数,特征之间存在较高的信息冗余,本发明选择相关性分析结合随机森林算法(CA-RF)对候选特征进行特征变量筛选得到最终的模型输入变量。CA-RF特征筛选算法首先采用CA对植被指数特征与条锈病病情指数进行分析得到与病害发生相关性较大的特征合集,用于筛除无关因素的干扰,之后,利用RF算法能够实现特征重要性排序的特性对CA筛选够后的植被指数特征进行二次筛选,得到每个特征的重要性得分,选择最能反应小麦早中期条锈病为害情况的特征选择结果。其具体步骤如下:

(1)从预处理后的小麦冠层反射率光谱曲线中提取敏感波段所组成的植被指数,作为初选建模特征。

(2)利用相关性分析方法对初选建模特征进行筛选,形成预选建模特征,其具体步骤如下:

A1)将相关系数作为植被指数特征与条锈病情指数之间相关性的密切程度的表达方式;

A2)建立植被指数特征与条锈病情指数之间相关系数计算表达式,对所得相关系数结果进行误差分析;

对植被指数特征与条锈病情指数之间的是否存在相关关系,采用建立相关性分析表格、绘制相关图以及计算相关系数等方式来判断两者之间的相关变化方向、形态及密切程度;

其中相关系数是反映植被指数特征与条锈病情指数之间密切程度的统计指标。其计算公式如下式所示:

式中r即为所选择的植被指数特征与条锈病情指数之间的相关系数,x和y分别表示样本植被指数特征和条锈病病情指数,

相关系数r的取值范围为-1≤r≤1,r>0表示为正相关,r<0表示为负相关,判定研究变量之间的相关程度则是通过|r|来体现,|r|越大则变量之间的密切程度越高。对所选择的植被指数特征与条锈病病情指数进行相关性分析得到其相关系数,以相关系数绝对值0.6为阈值对初选的植被指数特征进行筛选,得到相关性分析的筛选结果。

(3)利用随机森林特征选择方法对预选建模特征进行筛选,形成模型特征集。其具体步骤如下:

B1)根据随机森林中决策树的数量将经过相关性分析筛选过后的小麦条锈病样本的袋外数据划分为n组用来计算随机森林所有决策树的误差值,结果分别记做:err

B2)将n组袋外数据中的第i个植被指数特征进行随机排序,保证其他植被指数特征不变,重新计算样本袋外数据误差值,结果分别记做:err

B3)根据上述得到的误差结果计算特征重要性如以下公式所示:

为了确保特征选取的准确性,采用10折交叉验证的方法对相关性分析过后得到的植被指数特征进行迭代计算,在经过迭代后取各植被指数特征的特征重要性得分平均值完成特征重要性排序工作,以重要性得分为0.09为阈值选择则出冗余信息含量最少、分类准确率最高的植被指数特征集作为最终的特征筛选结果。

第三步,XGBoost监测模型的构建与训练:构建XGBoost监测模型并对其进行训练。

XGBoost算法是一种基于回归树提升的可扩展机器学习系统。由于XGBoost算法在系统中所具备的创新使其在任何情况下都具备可伸缩性,主要创新包括:设计了一种用于处理稀疏数据的新颖树学习算法;提出了理论上合理的加权分位数草图过程,以进行有效的提案计算;最重要的是创建一种有效的感知块结构,可以用于核外计算。XGBoost算法是结合多个弱分类器形成的强分类器,采用泰勒二阶展开来优化目标函数,并且为了防止模型过拟合,引入正则化项来控制模型。相比于其它算法,XGBoost算法在分类上具有高效率和高准确率等优势。由于XGBoost是基于分类回归树(Classification and RegressionTrees,CART)形成的一个树集成模型,假设给定的样本集中有个n样本,m个特征,算法包含k个树,最终的预测值则是k个树的结果进行求和。其具体步骤如下:

(1)设样本集中有n个小麦条锈病样本,m个最终筛选得到的植被指数特征,XGBoost监测模型中包含k个条锈病样本的基础树模型,最终的预测值则是k个树模型的结果进行求和,即为下式所示:

D={(x

其中,x

(2)通过引入正则化项使包含植被指数特征的条锈病害模型的目标函数最小化,其表达式如下:

式中

令经过t次迭代训练后的树模型为f

将等式(5)进行泰勒二阶展开得到下式:

式中

(3)移除第t次迭代中的泰勒二次展开常数,并假设已知条锈病害树模型结构为q,则每个样本x

对等式(5)进行转换如下:

对于叶子节点j对应的权重值

(4)采用贪婪算法将实际运用中的树模型结构划分为I

第四步,待分析小麦条锈病遥感图像的获取:获取待分析小麦条锈病遥感图像,并对其进行冠层高光谱数据的采集和预处理,按建模特征的选择步骤(第二步)所筛选出的特征进行植被指数特征的提取。

第五步,小麦条锈病初中期监测结果的获得:将待分析小麦条锈病遥感图像的植被指数特征输入训练后的XGBoost监测模型,得到小麦条锈病初中期监测结果。

在此,以河北省中国农业科学院廊坊中试实验基地(39°30.48′N~116°36.14′E)为例,该地区是我国典型的北方农作物种植区,土质优良,具备极为符合小麦生长的自然条件,主要研究在冠层尺度上随小麦生育期推移受条锈病侵染的光谱曲线和病情指数变化。在研究区域中采用人工接种的方式来实现小麦条锈病感染,选择的小麦实验品种为“铭贤169”,属于条锈病易感小麦品种,共分为A、B、C、D等4组,每组的面积为220m

将小麦三个生育期的条锈病样本根据病情严重度划分为健康、轻发和重发三种状态,其小麦冠层光谱平均反射率曲线如图2所示。分析图2可以看出三种状态下小麦冠层光谱曲线变化趋势均趋于一致,在可见光区域出现高吸收,在近红外波段区域的光谱反射率高,而在绿波段区域小麦冠层光谱曲线区别于其它的可见光区域,反射率明显偏高。伴随着小麦受到条锈病侵染的程度不断加深,绿波段区域500nm~570nm和近红外波段区域700nm~1100nm的光谱反射率降低,而在波段区域600nm~700nm的光谱反射率升高,其中可见波长区域400nm~700nm内可以反映叶片色素含量的变化,而近红外区域700nm~1000nm内能够表示细胞结构状态的改变。

同时对小麦样本的冠层光谱反射率与条锈病病情指数进行相关性分析,其结果如图3所示。分析图3可以看出在波段区间350nm~570nm和705nm~1100nm内的光谱反射率与条锈病病情指数的之间表现为负相关,而在波段区间575nm~703nm内表现为正相关,并且在近红外区域相关系数很高。综合图2和图3进行分析,随着小麦病情严重度的加深,小麦叶肉组织中色素含量开始变化,冠层及生理结构受到破坏从而导致部分可见光和近红外区域的光谱反射率发生变化,500nm~570nm、600nm~700nm和750nm~1100nm均是小麦条锈病的光谱敏感区间,可以在很大程度上反映出小麦条锈病的病情发生程度,以此为依据选择相应的植被指数来监测小麦条锈病的发生。从冯等人的研究中发现红边区域700~750nm的光谱波段被认为是表示植被营养状况、水分含量和叶面积的参数,并且波段750nm位于红边区域对条锈病发生表现为敏感。这个结果与Bravo等人波段区间大约750±10nm和861±10nm进行的研究结论保持一致。

为了获取冗余信息含量更小的特征变量,对筛选过后的10个植被指数特征进行随机森林(RF)特征重要性排序,其特征重要性排序结果如图4所示。从图4中可以看出特征的重要性得分,从中选择重要性大于0.09的植被指数特征作为最终的输入变量,分别是PhRI、PRI、PSRI、SIPI和ARI。从病理的角度来说,小麦受到条锈病菌侵染后,叶片变黄,细胞结构、内部色素、水分含量发生变化,SIPI、PRI和PSRI正是随着绿色植被色素含量和光合速率等改变而变化;ARI、PhRI所对应的是由光谱波段531nm、550nm和700nm运算得出,这三个波段正处于条锈病敏感波段范围,对小麦条锈病的发生相比于其它植被指数表现更为敏感。郑等人发现PRI和ARI在针对中后期条锈病的监测拥有独特的优势,这个研究结果与黄和Devada等分别针对PRI和ARI对条锈病的研究中保持一致的观点。

本发明通过相关性分析(CA)、相关性分析结合随机森林(CA-RF)两种特征选择方法从多个植被指数中筛选出最适用于监测小麦初中期条锈病的特征集合,结合常用于条锈病遥感监测的算法构建了8个监测模型,分别是CA+RF模型、CA+SVM模型、CA+BP神经网络模型、CA+XGBoost模型、CA-RF+RF模型、CA-RF+SVM模型、CA-RF+BP神经网络模型、CA-RF+XGBoost模型。通过以上8个模型对小麦条锈病病情严重度进行对比评估得到最优监测模型。

各模型监测结果如表1所示,表中列举出CA和CA-RF两种特征选择方法结合四种小麦条锈病常用监测模型的错分误差、总体监测精度以及Kappa系数。

表1不同监测模型的分析与验证结果对比表

分析表1从中可以发现,在RF、SVM、BPNN和XGBoost四种算法模型中,由CA-RF特征选择算法获取的特征集合结合RF、BPNN、SVM和XGBoost构建的模型监测精度比单一的CA筛选的特征集合所建立的模型监测精度分别提高了3.8%、11.6%、7.7%和11.6%。从错分误差的角度,CA-RF+XGBoost模型针对健康和轻发样本产生的分类误差率明显低于其它7个模型,CA-RF+XGBoost模型的监测精度和Kappa系数达到88.5%和0.797,对比CA-RF特征选择算法与RF、SVM、BPNN和XGBoost构建的模型发现,CA-RF+XGBoost模型监测精度分别比CA-RF+RF、CA-RF+SVM和CA-RF+BPNN三个模型高出3.9%、19.3%和15.4%,Kappa系数分别高出0.056、0.307和0.271。以上分析可以得出CA-RF特征选择算法可以更加有效地得到小麦病害发生的特征变量,基于利用CA-RF筛选的特征构建的模型相比基于利用单一的CA筛选的特征所建模型的监测精度更高、误差更小。与其它模型对比分析发现,CA-RF+XGBoost模型可以在冠层尺度上对小麦初中期的病害发生进行有效地预防和监测。

本发明基于冠层高光谱数据建立的CA-RF+XGBoost模型较好的实现了小麦条锈病初中期的监测,对小麦条锈病的及时防控具有重大意义。在实验验证中,根据小麦条锈病初中期的冠层光谱曲线敏感波段获取与病害相关的植被指数作为候选特征,通过相关性分析结合随机森林特征选择算法(CA-RF)筛选出PhRI、PRI、PSRI、SIPI和ARI共5个特征变量作为最终模型的输入变量,结合XGBoost算法建立小麦条锈病初中期的监测模型,该模型对小麦条锈病初中期的监测精度和Kappa系数分别达到88.5%和0.797。此外,由CA-RF特征选择算法筛选出的植被指数特征与条锈病害的发生所带来的植被变化具有极大的关联,同时也符合现有研究的实验结果。虽然模型对小麦条锈病初中期的监测具有较高的精确度,但还是需要针对不同环境、不同品种的小麦进行验证,扩大模型的适用性。小麦条锈病初中期的监测识别能够为地方农业提供及时的数据以避免小麦因条锈病导致的巨大损失,并在之后的研究中,将该模型应用于区域尺度的高光谱遥感影像,实现区域尺度的小麦条锈病初中期的监测。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

相关技术
  • 一种用于发病初中期分析的小麦条锈病遥感监测方法
  • 一种基于麦穗尺度分析的冬小麦赤霉病高光谱遥感监测方法
技术分类

06120112501543