掌桥专利:专业的专利平台
掌桥专利
首页

一种KNN优化下基于多尺度三角形表征的植物叶片识别方法

文献发布时间:2023-06-19 16:09:34



技术领域

本发明涉及计算机视觉技术领域,尤其是一种KNN优化下基于多尺度三角形表征的植物叶片识别方法。

背景技术

植物的分类调查对保护生物多样性、农业生态和生物技术安全具有重要意义,是生物学和环境科学领域的一个重要研究课题。快速准确的植物自动识别不仅对植物的分类和调查有很大作用,而且对维护生物多样性有重要意义。

传统的人工植物识别方法要求操作人员具有一定的专业知识,需要了解各种植物。此外,传统的植物识别方法往往存在工作量大、工作效率低、操作人员易受主观因素影响等问题。因此,将植物自动识别技术引入植物分类,可以大大提高分类调查的效率。更重要的是,植物自动识别该技术具有操作简单的优点,不需要操作者具有深厚的植物专业知识,也可以在一定程度上帮助有经验的植物学家和植物生态学家植物物种的识别通常需要观察植物的某些形态特征,而叶片是植物的重要无性器官。不同植物的叶子有一定的差异,所以用叶子来识别植物是一种非常普遍的方法。

叶子自动识别技术涉及叶子图像的检索和分类。许多研究者对从树叶图像中提取多尺度的轮廓特征感兴趣,他们认为轮廓特征可以普遍地描述树叶的整体布局和局部细节;这些特征是对树叶图像的轮廓点所拟合的形状,以及一系列的参数如长宽比、面积、中心点和偏心率的计算;基于纹理特征的树叶识别和检索技术提取灰阶叶子图像的共生矩阵、局部二进制模式和Gabor图谱。

无论上述方法是基于叶片轮廓特征、叶片形状区域特征还是叶片纹理特征,它们对叶片检索和分类都具有重要意义。

目前对移动设备和微型计算机的需求正在上升,叶子检索和分类程序需要更多轻量级和低消耗的算法,同一类型的植物的叶片有很大的不同,这给准确的检索带来很大的困难。为了解决上述困难,本申请提出了一种新的多尺度叶特征描述。

发明内容

针对现有技术的不足,本发明提供一种KNN优化下基于多尺度三角形表征的植物叶片识别方法,本发明利用多种三角形特征对植物叶片的特征进行提取,包括叶子轮廓特征、叶子形状面积特征和纹理特征,并且减少了原版三角形方法计算方法的计算量,降低了难度,提高了计算速度,并且通过多种特征提取方法的结合,提升了算法的精确度和鲁棒性。

本发明的技术方案为:一种KNN优化下基于多尺度三角形表征的植物叶片识别方法,包括以下步骤:

S1)、输入RGB三通道的植物叶片图片,对其进行预处理,提取植物叶片图片的轮廓点;

S2)、对于提取的植物叶片轮廓点进行标号,并且进行分组,基于多尺度的三角形特征提取方法,来获得植物叶片的三角形轮廓点角度特征TVA、三角形叶子形状面积特征TUA、三角形纹理特征TGSSL、三角形边长积分特征TSLI;

S3)、每一张植物叶片特征使用上述特征的集合进行表示,表示方法都与轮廓点的起始位置有关,对上述进行快速傅里叶变换,获得长度为N的傅里叶系数序列,根据上述特征的选择不变性,因此,起点不同不会改变傅里叶系数;

S4)、根据正则化后的特征值进行比较,每一张植物叶片图像可以使用集合(TUA,TVA,TGA,TGSD,TSLI)来对比找到叶子种类,具体方法如下:

其中,dis(α,β)表示两个数据之间的距离度量,α,β分别表示是数据集中的索引号,Γ

S5)、利用步骤S4)得到的输出,可以用于区分两张植物叶片的特征差异程度,并且根据差异信息进行图像检索、图像分类,输入一张图像之后,系统将返回图像库最佳匹配的5张图像还有他们之间的距离与类别。

作为优选的,步骤S1)中,叶子图像的预处理具体如下:

S101)、将RGB图像转换成灰度图像,通过以下公式获得灰度矩阵表示:

Gray=Red*0.3+Green*0.59+Blue*0.11;

S102)、利用python中的cv2模块中的阈值分割函数进行阈值分割:

其中,f(x)为阈值分割函数,x

P={(x

其中,第i个轮廓点的坐标表示为:p

作为优选的,步骤S2)中,基于多尺度的三角形特征提取方法,来获得植物叶片的三角形轮廓点角度特征TVA、三角形叶子形状面积特征TUA和三角形纹理特征TGSSL、三角形边长积分特征TSLI,具体如下:

S201)、三角形叶子形状面积特征TUA的提取如下:

其中,

N为提取轮廓点后植物叶片轮廓的点的总数,k是正整数,用于选择轮廓点的数量;x(k)为轮廓点p

ABS表示求绝对值,x

S202)、三角形轮廓点角度特征TVA的提取如下:

其中,

S203)、三角形纹理特征TGSSL的提取如下:

其中,G

S204)、三角形边长积分特征TSLI的提取如下:

其中,

作为优选的,步骤S3)中,对步骤S2)提取的TUA,TVA,TGSD,TSLI特征进行归一化处理,对步骤S2)的五种表征进行快速傅里叶变换,得到傅里叶系数序列TUA(T

作为优选的,步骤S3)中,特征TUA的计算如下:

S301)、计算出TUA的最大值与最小值

S302)、替换训练集已经数据集中的TUA:

本发明的有益效果为:

1)、本发明的计算成本相当低,只需要153.97ms来识别每张图片,而CSR需要2130ms是我们的10倍,因此,本发明具有很高的准确性,非常适用于实时任务;

2)、本发明的方法都有最高的准确性,当数据训练集和测试集分割比为9:1时,准确率最高,为99.43%,比GLCMFD颜色特征方法高0.33%;

3)、本发明的方法具有更好的鲁棒性,对比算法IDSC的精度下降了50.5%,MARCH下降了10.9%,本发明的方法只下降了5.35%,因此,本发明的方法具有更强的抗干扰能力。

附图说明

图1为本发明构建的基于三角形特征植物图片识别框架图;

图2为本发明植物叶片图片预处理流程图;

图3为本发明应用于植物叶片检索系统演示图。

图4为本发明三角形轮廓点提取的结构示意图。

具体实施方式

下面结合附图对本发明的具体实施方式作进一步说明:

实施例1

本实施例提供一种KNN优化下基于多尺度三角形表征的植物叶片识别方法,包括以下步骤:

S1)、输入RGB三通道的植物叶片图片,对其进行预处理,提取植物叶片图片的轮廓点;叶子图像的预处理具体如下:

S101)、将RGB图像转换成灰度图像,通过以下公式获得灰度矩阵表示:

Gray=Red

S102)、利用python中的cv2模块中的阈值分割函数进行阈值分割:

其中,f(x)为阈值分割函数,xi,yi分别表示像素i的坐标,T为设置的阈值;

S103)、利用python中的cv2模块中的findContours函数提取叶片的外轮廓线,然后按逆时针均匀采样N个点,轮廓坐标点集表示为:

P={(x

其中,第i个轮廓点的坐标表示为:pi(xi,yi);xN,yN表示第N个轮廓点的坐标。

S2)、对于提取的植物叶片轮廓点进行标号,并且进行分组,基于多尺度的三角形特征提取方法,来获得植物叶片的三角形轮廓点角度特征TVA、三角形叶子形状面积特征TUA、三角形纹理特征TGSSL、三角形边长积分特征TSLI,具体为:

具体如下:

S201)、三角形叶子形状面积特征TUA的提取如下:

其中,

N为提取轮廓点后植物叶片轮廓的点的总数,k是正整数,用于选择轮廓点的数量;x(k)为轮廓点p

ABS表示求绝对值,x

S202)、三角形轮廓点角度特征TVA的提取如下:

其中,

S203)、三角形纹理特征TGSSL的提取如下:

其中,G

S204)、三角形边长积分特征TSLI的提取如下:

其中,

S3)、每一张植物叶片特征使用上述特征的集合进行表示,表示方法都与轮廓点的起始位置有关,对上述进行快速傅里叶变换,获得长度为N的傅里叶系数序列,根据上述特征的选择不变性,因此,起点不同不会改变傅里叶系数;

本实施例对步骤S2)提取的TUA,TVA,TGSD,TSLI特征进行归一化处理,对步骤S2)的五种表征进行快速傅里叶变换,得到傅里叶系数序列TUA(T

以计算特征TUA为例:

S301)、计算出TUA的最大值与最小值

S302)、替换训练集已经数据集中的TUA:

S4)、根据正则化后的特征值进行比较,每一张植物叶片图像可以使用集合(TUA,TVA,TGA,TGSD,TSLI)来对比找到叶子种类,具体方法如下:

其中,dis(α,β)表示两个数据之间的距离度量,α,β分别表示是数据集中的索引号,Γ

S5)、利用步骤S4)得到的输出,可以用于区分两张植物叶片的特征差异程度,并且根据差异信息进行图像检索、图像分类,输入一张图像之后,系统将返回图像库最佳匹配的5张图像还有他们之间的距离与类别。

实施例2

1)数据集和训练设置

本实施例采用多种公开的图像数据集,Flavia图像数据集该公开的数据集有32个品种,每类大概有50~77张叶子图像,总共1907个叶子图像。叶片拍摄于中国长江三角地区。叶片品种有毛竹、栾树、大果冬青、海桐、腊梅等。这些叶片有很多相似的地方,要区分它们是一个挑战。

Swedish数据集该公共数据集共有1125片叶,包括15个类,每个类有75片叶。Swedish都以1:2的比例随机分为训练样本和测试样本,因此训练集中有375个样本,测试集中有750个样本。

参数设置为:轮廓点的数量N=256。规模的数量K=7,数量的比例系数为1。三角形Tik采集点H=5,取第一个M=7傅里叶变换序列的傅里叶系数。

2)实验用到的软硬件环境如表2。

表2 实验环境配置

3)实验指标

在模型对比的指标上,采用不同的分类划分标准,使用下表中的4个指标来判断模型的优劣。在发明中,主要以“MAP值”和“分类器准确率”作为判断模型效果的标准,具体如表3。

表3 模型判断指标

4)实验结果

表4 对比算法及其主要思想

表5 MAP值实验结果对比

表6 准确率实验结果对比

上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

相关技术
  • 一种KNN优化下基于多尺度三角形表征的植物叶片识别方法
  • 一种基于叶片形状和边缘特征的植物叶片识别方法
技术分类

06120114723420