掌桥专利:专业的专利平台
掌桥专利
首页

一种基于去噪学习的鸟类细粒度识别方法

文献发布时间:2023-06-19 18:46:07


一种基于去噪学习的鸟类细粒度识别方法

技术领域

本发明属于计算机视觉技术领域,尤其涉及一种基于去噪学习的鸟类细粒度识别方法。

背景技术

细粒度图像分类在学术和现实生活的应用中都备受关注。学术研究中有收集全球各地不同种类的鸟、狗、车等的图像数据,整合成数据集的研究。实际应用中有识别不同种类的害虫、对同种类商品的识别以及对高速公路上的汽车信号的识别。作为图像分类的一个分支,细粒度图像分类难在不同类别图像之间的差异较小,相同类别图像之间的差异较大,正好和一般的图像分类相反。同时细粒度图像分类数据集的标注较之一般图像分类更加复杂,需要专家级别的人才能对数据进行标注,所以细粒度图像分类往往无法收集足够多的数据集,导致模型的泛化能力较弱。

一般图像分类算法采用数据增广的方式增加训练数据量,从而提高训练数据的量级,帮助模型学习到更好的图像识别能力。这些数据增广方法中有部分方法需要从原始图片中截取或是抹去某部分,导致原始图片的特征缺失。这种特征缺失在一般图像分类算法中无关紧要,因为其主要关注的是整体特征。但是对于细粒度图像分类任务,这种类型的数据增广可能会起到反作用,导致细粒度图像分类模型的识别能力下降。因为细粒度图像分类需要识别细节才能区分不同的类,如果图片的某一细节缺失可能导致其错分类。

通过上述分析,现有技术存在的问题及缺陷为:

(1)一般图像分类算法采用数据增广的方式增加训练数据量,从而提高训练数据的量级,帮助模型学习到更好的图像识别能力。这些数据增广方法中有部分方法需要从原始图片中截取或是抹去某部分,导致原始图片的特征缺失。这种特征缺失在一般图像分类算法中无关紧要,因为其主要关注的是整体特征。但是对于细粒度图像分类任务,这种类型的数据增广可能会起到反作用,导致细粒度图像分类模型的识别能力下降。因为细粒度图像分类需要识别细节才能区分不同的类,如果图片的某一细节缺失可能导致其错分类。

发明内容

针对现有技术存在的问题,本发明提供了一种基于去噪学习的鸟类细粒度识别方法。

本发明是这样实现的,一种基于去噪学习的鸟类细粒度识别方法包括:

步骤一,收集不同鸟类的图片数据,包括有标注的图片数据和无标注的图片数据,将其整合成细粒度鸟类数据集;

步骤二,对步骤一中收集到的无标注图片数据进行人工标注,获得全部带标注的细粒度鸟类数据集;

步骤三,对步骤二中得到的细粒度鸟类数据集进行数据增广,获得增广后的细粒度鸟类数据集;

步骤四,利用步骤三中得到的增广细粒度鸟类数据集训练一个细粒度鸟类分类器;

步骤五,利用步骤四中训练完成的细粒度鸟类分类器对步骤三中获得的增广数据集进行打分,并且根据数据得分筛选出部分可信的数据,将其重新组合成新的鸟类细粒度数据集;

步骤六,重复步骤四和步骤五,直到步骤四中分类器的损失保持稳定;

步骤七,将步骤六中训练得到的稳定的鸟类细粒度图片分类器部署到树莓派中;

步骤八,给树莓派配备摄像头后,对采集得到的视频帧进行显著性检测后得到鸟类在图片中的具体位置,截取对应位置的图片区域输入到分类网络进行图片分类,输出识别结果。

进一步,所述步骤三中对图像数据先进行了以下几种数据增广:

1)随机的剪裁图片,取图像的部分作为一份数据;

2)随机的水平、竖直、斜对角的翻转图片;

3)随机的擦除图片部分区域,用黑色填充;

4)随机的进行图片颜色、明暗、对比度和饱和度的调节;

并且最后还对图片进行了归一化,将每个像素点的值转化成为零一之间的数值。

进一步,所述步骤四中采用的是Inceptionv4模型,Inceptionv4模型的输入是224×224的彩色图像。训练使用的是Adam优化器,模型的学习率是0.0001。分类的损失函数采用带权重的交叉熵损失函数,具体公式如下:

其中k

进一步,所述步骤五中的筛选方式先对步骤三中得到的全部数据进行分类,然后筛选出其中最高分类得分高于0.9的正确数据,和其中最高得分低于0.5的错误数据将数据进行重新整合后得到筛选后的数据。

进一步,所述步骤六中在前后两次迭代的分类器的分类正确率相差小于0.001时停止迭代。

进一步,所述步骤八中采用的显著性检测算法为Histogram-based Contrast算法(Cheng,Ming-Ming,et al."Global contrast based salient region detection."IEEEtransactions on pattern analysis and machine intelligence 37.3(2014):569-582),先通过该算法得到图片的显著性区域后,根据最大外接矩阵的方法得到鸟类在图片中的矩形位置。

结合上述的技术方案和解决的技术问题,请从以下几方面分析本发明所要保护的技术方案所具备的优点及积极效果为:

第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:

本方法通过去噪学习的方法筛查细粒度图像分类数据增广过程中产生的噪声数据,从而提高细粒度图像分类器的识别能力。具体而言,数据增广过程中会采用许多的方法增加训练数据,其中部分的方法会取原图的部分作为一个训练样本,这就导致了这个样本中只有原本数据的部分特征。而细粒度图像分类方法最注重的就是图片的特征的细小差别,数据增广可能会破坏图片中的这个部分。利用去噪算法可以有效的将数据增广中的噪声数据过滤,更好的利用数据增广的优势,同时也解决了数据增广所带来的问题。

第二,把技术方案看做一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:

本方法通过去噪学习的方法筛查细粒度图像分类数据增广过程中产生的噪声数据,从而提高细粒度图像分类器的识别能力。具体而言,数据增广过程中会采用许多的方法增加训练数据,其中部分的方法会取原图的部分作为一个训练样本,这就导致了这个样本中只有原本数据的部分特征。而细粒度图像分类方法最注重的就是图片的特征的细小差别,数据增广可能会破坏图片中的这个部分。利用去噪算法可以有效的将数据增广中的噪声数据过滤,更好的利用数据增广的优势,同时也解决了数据增广所带来的问题。

附图说明

图1是本发明实施例提供的基于去噪学习的鸟类细粒度识别方法流程图。

图2是本发明实施例提供的收集的鸟类细粒度图像数据集部分样本的展示结果图。

图3是本发明实施例提供的显著性检测得到的结果图。

图4是本发明实施例提供的筛选算法舍弃的数据增广图片样例。

图5是本发明实施例提供的筛选算法保留的数据增广图片样例。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

一、解释说明实施例。为了使本领域技术人员充分了解本发明如何具体实现,该部分是对权利要求技术方案进行展开说明的解释说明实施例。

如图1所示,本发明提供一种基于去噪学习的鸟类细粒度识别方法包括以下步骤:

S101,收集不同鸟类的图片数据,包括有标注的图片数据和无标注的图片数据,将其整合成细粒度鸟类数据集;

S102,对S101中收集到的无标注图片数据进行人工标注,获得全部带标注的细粒度鸟类数据集;

S103,对S102中得到的细粒度鸟类数据集进行数据增广,获得增广后的细粒度鸟类数据集;

S104,利用S103中得到的增广细粒度鸟类数据集训练一个细粒度鸟类分类器;

S105,利用S104中训练完成的细粒度鸟类分类器对S103中获得的增广数据集进行打分,并且根据数据得分筛选出部分可信的数据,将其重新组合成新的鸟类细粒度数据集;

S106,重复S104和S105,直到S104中分类器的损失保持稳定;

S107,将S106中训练得到的稳定的鸟类细粒度图片分类器部署到树莓派中;

S108,给树莓派配备摄像头后,对采集得到的视频帧进行显著性检测后得到鸟类在图片中的具体位置,截取对应位置的图片区域输入到分类网络进行图片分类,输出识别结果。

本发明提供的S103中对图像数据先进行了以下几种数据增广:

1)随机的剪裁图片,取图像的部分作为一份数据;

2)随机的水平、竖直、斜对角的翻转图片;

3)随机的擦除图片部分区域,用黑色填充;

4)随机的进行图片颜色、明暗、对比度和饱和度的调节;

并且最后还对图片进行了归一化,将每个像素点的值转化成为零一之间的数值。

本发明提供的S104中采用的是Inceptionv4模型,Inceptionv4模型的输入是224×224的彩色图像。训练使用的是Adam优化器,模型的学习率是0.0001。分类的损失函数采用带权重的交叉熵损失函数,具体公式如下:

其中k

本发明提供的S105中的筛选方式先对S103中得到的全部数据进行分类,然后筛选出其中最高分类得分高于0.9的正确数据,和其中最高得分低于0.5的错误数据将数据进行重新整合后得到筛选后的数据。

本发明提供的S106中在前后两次迭代的分类器的分类正确率相差小于0.001时停止迭代。

本发明提供的S108中采用的显著性检测算法为Histogram-based Contrast算法(Cheng,Ming-Ming,et al."Global contrast based salient region detection."IEEEtransactions on pattern analysis and machine intelligence 37.3(2014):569-582),先通过该算法得到图片的显著性区域后,根据最大外接矩阵的方法得到鸟类在图片中的矩形位置。

二、应用实施例。为了证明本发明的技术方案的创造性和技术价值,该部分是对权利要求技术方案进行具体产品上或相关技术上的应用实施例。

本方法通过去噪学习的方法筛查细粒度图像分类数据增广过程中产生的噪声数据,从而提高细粒度图像分类器的识别能力。具体而言,数据增广过程中会采用许多的方法增加训练数据,其中部分的方法会取原图的部分作为一个训练样本,这就导致了这个样本中只有原本数据的部分特征。而细粒度图像分类方法最注重的就是图片的特征的细小差别,数据增广可能会破坏图片中的这个部分。利用去噪算法可以有效的将数据增广中的噪声数据过滤,更好的利用数据增广的优势,同时也解决了数据增广所带来的问题。

应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。

三、实施例相关效果的证据。本发明实施例在研发或者使用过程中取得了一些积极效果,和现有技术相比的确具备很大的优势,下面内容结合试验过程的数据、图表等进行描述。

本方法通过去噪学习的方法筛查细粒度图像分类数据增广过程中产生的噪声数据,从而提高细粒度图像分类器的识别能力。具体而言,数据增广过程中会采用许多的方法增加训练数据,其中部分的方法会取原图的部分作为一个训练样本,这就导致了这个样本中只有原本数据的部分特征。而细粒度图像分类方法最注重的就是图片的特征的细小差别,数据增广可能会破坏图片中的这个部分。利用去噪算法可以有效的将数据增广中的噪声数据过滤,更好的利用数据增广的优势,同时也解决了数据增广所带来的问题。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

技术分类

06120115686116