掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的垃圾图像分类识别方法

文献发布时间:2024-04-18 19:54:45


一种基于深度学习的垃圾图像分类识别方法

技术领域

本发明涉及图像识别领域,具体为一种基于深度学习的垃圾图像分类识别方法。

背景技术

在城市化进程不断深入的背景下,垃圾围城现象逐渐称为城市管理的难题,垃圾分类问题愈发受到政府重视,传统垃圾分类识别方法在当识别目标垃圾数量大,种类多时,存在难以实时处理以及对多运动目标识别准确率低等问题,导致分类作业效率低下。而深度学习算法在图像识别领域应用广泛,应用于垃圾识别中能够有效提高垃圾识别的准确率。

现提出一种基于深度学习的垃圾图像分类识别方法,在提高检测速度的同时并解决了针对因为天气等外界因素导致的低质量图像的识别准确率低下的问题,提高了识别系统的鲁棒性,实现针对多目标的快速分类识别,为自动化垃圾分拣装置提供效率更高的识别方法。

发明内容

为了解决传统垃圾图像识别方法精度以及效率低的问题,本发明的目的在于提供一种基于深度学习的垃圾图像分类识别方法,具有计算时间快、精度高、能够实现大范围检测,快速识别的优点。

为实现上述目的,本发明提供如下技术方案:一种基于深度学习的垃圾图像分类识别方法,具体步骤如下:

S1:利用深度摄像头对垃圾图像进行捕获并建立数据集;

S2:建立基于Inception ResNetV2的垃圾分类识别模型;

S3:将数据输入S2中的垃圾分类识别模型中训练,得到训练好的检测模型;

S4:导出模型进行垃圾检测并通过算法进行识别准确率优化。

作为本发明的一种优选技术方案,所述S1的具体步骤如下:

S11:对摄像头捕获垃圾图像进行预处理,得到预处理后的垃圾图像;

S12:对预处理之后的图像进行数据增强,建立垃圾分类数据集;

S13:对S12的数据集进行目标标注,构建带有m种类别标签的垃圾分类数据集,其中数据集中任意一张样本图像记作θ,其维度为α×β×γ,其中α表示图像长度β表示宽度γ表示图像通道数。

作为本发明的一种优选技术方案,所述S12中数据集建立过程中划分数据集为训练集与验证集,并只对训练集进行目标标注。

作为本发明的一种优选技术方案,所述S2的具体步骤如下;

S21:采用的深度学习网络框架选用Inception ResNetV2网络,其由多个Inception块组成,包含Inception模块与Reduction模块、平均池化层、以及随机中断层以及softmax全连接层;

S22:经Stem结构提取特征,将得到的特征图通过Inception结构进一步提取特征,并对模型进行改进,对网络结构进行优化,从而减少达到预期错误率所需训练周期,在得到不同卷积核提取的特征之后,输出结果至Reduction模块,Reduction模块通过池化和卷积的方式进行下采样,减少特征图的维度大小,之后将其输出进行组合作为下一个Inception块的输入,Inception与Reduction模块的组合采用3组。

作为本发明的一种优选技术方案,所述S22中的Inception结构即将N个不同大小的卷积层并行链接,通过不同卷积核的卷积操作对同一目标进行特征提取,并最后在输出通道通过1×1的卷积核进降维输出;引入残差网络以减少普通卷积网络存在的随着网络深度增加,训练误差呈现先降低后增加的趋势。

作为本发明的一种优选技术方案,所述S3的具体步骤如下:

S31:当残差神经网络的损失函数结果收敛时,将验证集代入得到基于InceptionResNetV2的垃圾分类识别模型中进行检测得到检测结果;

S32:根据其准确率判断是否继续迭代,直至检测准确率高于设定阈值,停止训练,得到训练好的基于Inception ResNetV2的垃圾分类识别模型。

作为本发明的一种优选技术方案,所述S4采用Adam优化算法作为优化器,CrossEntropy损失函数作为模型的损失函数对训练过程进行评估,损失函数具体公式如下:

其中,m表示类别的数量,y

作为本发明的一种优选技术方案,所述S4中采用投票算法对检测准确率进行优化;具体的垃圾投票算法包括:

S41、判断捕获图像是否为背景,若为背景则会一直循环捕获直到捕获至非背景图像;

S42、对捕获垃圾进行种类判断并对判断结果计数,最后输出判断数量最多的种类。

作为本发明的一种优选技术方案,所述S4:导出已训练完成的深度学习模型进行垃圾识别,并配合垃圾投票算法进行准确率优化;其中S4中训练模型的输入图像大小应保证检测时所捕获的图像大小应与训练输入图像大小相等。

本发明的有益效果是:本发明能够针对多目标,低质量图像进行实时识别,并具有高准确率,高效率的优点,通过深度学习模型实现对摄像头捕获垃圾图像的自动识别,有效的解决了传统垃圾识别方案需要人工操作,计算时间长,识别错误率高的问题。

附图说明

图1为本发明提供的一种基于深度学习的垃圾图像分类识别方法工作流程图;

图2为本发明应用于图像分类的神经网络模型即Inception ResNetv2网络;

图3为本发明基于深度学习的垃圾分拣装置模块示意图;

图4为本发明Inception ResNetv2网络在在训练集和验证集中的图像分类预测的准确率变化情况;

图5为本发明Inception ResNetv2网络在在训练集和验证集中的图像分类预测的损失率的变化情况;

图6为本发明Inception ResNetv2网络与其他网络的识别准确率和损失率对比图。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易被本领域人员理解,从而对本发明的保护范围做出更为清楚明确的界定。

实施例:请参阅图1-6,本发明提供一种技术方案:一种基于深度学习的垃圾图像分类识别方法,如图3所示,包括以下模块:图像预处理模块,用于对捕获图像进行预处理操作,减少因外界因素造成干扰;

图像识别模块,包含数个子模块,即数据集建立模块,基于Inception ResNetV2的深度学习网络建立模块,模型训练模块,图像检测模块;

垃圾分拣模块,用于利用图像识别结果,驱动识别装置进行垃圾分拣任务。

具体的实施过程如下:

S1:实施平台条件搭建;

S11:选用PC作为图像识别处理端,配置采用处理器为i7-12700CPU,64位Windows10操作系统,GPU配置为RTX2050;

S12:摄像头选用奥尼公司开发的摄像头型号为Aoni-Sword Shadow作为本发明的摄像头,分辨率1920*1080,并配有200万像素,有效距离0.6m-4m;

S13:采用越疆机械臂型号为MG400为本发明分拣装置,最大载荷为18kg;

S2:建立深度学习模型并对图像进行识别;

S21:对垃圾图像进行捕获,并对其进行图像预处理;

具体的,预处理包括图像亮度调节,图像对比度调节,以及增加背景蒙版减少背景影响识别准确率;

S22:数据集建立;

具体的,上述数据集建立包括:对图像进行数据增强,建立垃圾分类数据集,并对其进行目标标注,构件有m种类别标签的垃圾分类数据集;

S23:构建基于Inception ResNetV2的卷积神经网络网络模块并进行训练;

具体的,Inception ResNetV2网络,由多个Inception块组成,包含Inception模块与Reduction模块、平均池化层、以及随机中断层以及softmax全连接层。首先经Stem结构提取特征,将得到的特征图通过Inception结构进一步提取特征,并对模型进行改进,对网络结构进行优化,从而减少达到预期错误率所需训练周期,在得到不同卷积核提取的特征之后,输出结果至Reduction模块,Reduction模块通过池化和卷积的方式进行下采样,减少特征图的维度大小,之后将其输出进行组合作为下一个Inception块的输入,本发明采用Adam优化算法作为优化器,Cross Entropy损失函数作为模型的损失函数对训练过程进行评估。

进一步的,Inception结构即将N个不同大小的卷积层并行链接,通过不同卷积核的卷积操作对同一目标进行特征提取,并最后在输出通道通过1×1的卷积核进降维输出;引入残差网络以减少普通卷积网络存在的随着网络深度增加,训练误差呈现先降低后增加的趋势。

更进一步的,当残差神经网络的损失函数结果收敛时,将验证集代入得到基于Inception ResNetV2的垃圾分类识别模型中进行检测得到检测结果,根据其准确率判断是否继续迭代,直至所述检测准确率高于设定阈值,停止训练,得到训练好的基于InceptionResNetV2的垃圾分类识别模型。

更进一步的,图4、图5展示了Inception ResNetv2网络在训练集和验证集中的图像分类预测的准确率以及损失率的变化情况;图6展示了同其他的典型网络如相比的结果,显然Inception ResNetv2网络模型的分类准确度优于其他的网络。

S24:输出训练完成的深度学习模型并配合图像优化算法进行检测;具体的,图像优化算法通过投票计数的方式针对图像错误识别进行纠正,提高整体系统的鲁棒性和识别准确性;

S3:视觉控制垃圾分拣装置进行垃圾分拣;具体的,通过图像处理得到垃圾位置以及类型信息进行引导并通过对机械臂的控制对已分类垃圾进行抓取与放置,实现针对不同垃圾的分拣任务。

上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

相关技术
  • 一种基于深度学习算法的异常垃圾短信识别方法及系统
  • 基于多传感器融合和深度学习的垃圾分类识别方法及装置
  • 一种基于深度学习的电涡流扫描图像分类识别方法
  • 一种基于深度学习的单一有害气体红外图像分类识别方法
技术分类

06120116381056