掌桥专利:专业的专利平台
掌桥专利
首页

基于深度学习的垃圾检测分类方法和装置

文献发布时间:2023-06-19 09:35:27


基于深度学习的垃圾检测分类方法和装置

技术领域

本发明涉及目标检测技术领域,具体涉及一种基于深度学习的垃圾检测分类方法和一种基于深度学习的垃圾检测分类装置。

背景技术

随着城市化的现象日趋加剧,城市面积日益加强,相应的城市环卫工作量随城市的发展而日益强大,因此,如果通过人工清扫的方式对路面垃圾进行清扫,那么将耗费大量的人力物力。

相关技术中,一般先对路面垃圾进行识别检测,再控制清扫车进行自动清扫。然而,相关技术中对路面垃圾进行识别检测的准确性较低,因此,无法准确有效地对路面垃圾进行清扫。

发明内容

本发明为解决上述技术问题,提供了一种基于深度学习的垃圾检测分类方法,能够准确地识别出路面待清扫的垃圾,从而确保能够准确有效地对路面待清扫垃圾进行清扫。

本发明采用的技术方案如下:

一种基于深度学习的垃圾检测分类方法,包括以下步骤:采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾;如果目标检测图像中存在待分类垃圾,则获取待分类垃圾在当前像素坐标系下的坐标;根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像;采用目标分类模型对待分类垃圾检测图像进行分类检测,以判断待分类垃圾检测图像中的待分类垃圾是否为目标垃圾。

在采用所述目标检测模型对所述目标检测图像进行目标检测之前,包括:采集路面垃圾图像数据,并对所述路面垃圾图像数据进行手工标注,以生成训练样本集;根据所述训练样本集对目标检测网络进行训练,以生成所述目标检测模型。

所述采用目标检测模型对目标检测图像进行目标检测包括:采用中值滤波、图像锐化、旋转、镜像、亮度调整、变换RGB颜色通道中的至少一种方式对所述目标检测图像进行数据增强处理;采用所述目标检测模型对数据增强处理后的目标检测图像进行目标检测。

所述采用目标分类模型对所述待分类垃圾检测图像进行分类检测,包括:采用中值滤波、图像锐化、旋转、镜像、亮度调整中的至少一种方式对所述待分类垃圾检测图像进行数据增强处理;采用所述目标分类模型对数据增强处理后的待分类垃圾检测图像进行分类检测。

深度学习的垃圾检测分类方法还包括:如果判断所述待分类垃圾检测图像中的待分类垃圾为目标垃圾,则获取所述目标垃圾在当前像素坐标系下的坐标;将所述目标垃圾在当前像素坐标系下的坐标与相机的内参矩阵进行乘法运算,以获取所述目标垃圾在当前像素坐标系下的坐标;将所述目标垃圾在当前像素坐标系下的坐标与相机坐标系和车体坐标系的变换矩阵进行乘法运算,以获取目标垃圾在所述车体坐标系下的坐标。

一种基于深度学习的垃圾检测分类装置,包括:目标检测模块,所述目标检测模块用于采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾;第一获取模块,所述第一获取模块用于在所述目标检测图像中存在所述待分类垃圾时,获取所述待分类垃圾在当前像素坐标系下的坐标;第二获取模块,所述第二获取模块用于根据所述待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像;分类检测模块,所述分类检测模块用于采用目标分类模型对所述待分类垃圾检测图像进行分类检测,以判断所述待分类垃圾检测图像中的待分类垃圾是否为目标垃圾。

一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述的基于深度学习的垃圾检测分类方法。

一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于深度学习的垃圾检测分类方法。

本发明的有益效果:

本发明先采用目标检测模型对路面垃圾进行识别,再采用目标分类模型对识别出的垃圾进行分类,以判断识别出的垃圾是否为待清扫的目标垃圾,从而能够准确地识别出路面待清扫的垃圾,进而确保能够准确有效地对路面待清扫垃圾进行清扫。

附图说明

图1为本发明实施例的基于深度学习的垃圾检测分类方法的流程图;

图2为本发明实施例的基于深度学习的垃圾检测分类装置的方框示意图;

图3为本发明一个实施例的基于深度学习的垃圾检测分类装置的方框示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是根据本发明实施例的基于深度学习的垃圾检测分类方法的流程图。

如图1所示,本发明实施例的基于深度学习的垃圾检测分类方法,可包括以下步骤:

S1,采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾。

根据本发明的一个实施例,在采用目标检测模型对目标检测图像进行目标检测之前,包括:采集路面垃圾图像数据,并对路面垃圾图像数据进行手工标注,以生成训练样本集;根据训练样本集对目标检测网络进行训练,以生成目标检测模型。

根据本发明的一个实施例,采用目标检测模型对目标检测图像进行目标检测包括:采用中值滤波、图像锐化、旋转、镜像、亮度调整、变换RGB颜色通道中的至少一种方式对目标检测图像进行数据增强处理;采用目标检测模型对数据增强处理后的目标检测图像进行目标检测。

具体而言,在采用目标检测模型对目标检测图像进行目标检测之前,需预先获取目标检测模型。

具体地,可预先通过摄像装置(例如,相机等)采集路面垃圾图像数据,并采用人工标注的方式分别对路面垃圾图像数据进行标注,以生成相应的训练样本集,以及根据该训练样本集对目标检测网络进行训练,以生成目标检测模型。其中,目标检测网络可为CenterNet网络。

进一步而言,在获取到目标检测模型后,可先采用摄像装置(例如,相机等)获取目标检测图像,再对目标检测图像进行数据增强处理,其中,可采用中值滤波、图像锐化、旋转、镜像、亮度调整、变换RGB颜色通道中的至少一种方式(如果采用多种方式,可进行随机组合)对目标检测图像进行数据增强处理,然后,采用目标检测模型对数据增强处理后的目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾(预测的垃圾)。

S2,如果目标检测图像中存在待分类垃圾,则获取待分类垃圾在当前像素坐标系下的坐标。

S3,根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像。

具体而言,在判断出目标检测图像中存在待分类垃圾后,为了提高检测的准确性,还需要对该待分类垃圾做进一步地判断,以识别该待分类垃圾是否为需要进行清理的垃圾。

因此,可先获取该待分类垃圾在当前像素坐标系下的坐标,并根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像,然后,再对待分类垃圾检测图像进行检测。

S4,采用目标分类模型对待分类垃圾检测图像进行分类检测,以判断待分类垃圾检测图像中的待分类垃圾是否为目标垃圾。

根据本发明的一个实施例,所述采用目标分类模型对所述待分类垃圾检测图像进行分类检测,包括:采用中值滤波、图像锐化、旋转、镜像、亮度调整中的至少一种方式对所述待分类垃圾检测图像进行数据增强处理;采用所述目标分类模型对数据增强处理后的待分类垃圾检测图像进行分类检测。

具体而言,在采用目标分类模型对数据增强处理后的待分类垃圾检测图像进行分类检测之前,需预先获取目标分类模型,其中,可预先获取相应的训练样本集(具体的过程可参见上述实施例),并根据获取到的相应的训练样本集对目标分类网络进行训练,以生成目标分类模型。其中,目标分类网络可为ResNet18网络。

进一步而言,在获取到目标分类模型后,采用中值滤波、图像锐化、旋转、镜像、亮度调整中的至少一种方式(如果采用多种方式,可进行随机组合)对待分类垃圾检测图像进行数据增强处理(不改变图像原有颜色),然后,采用目标分类模型对数据增强处理后的待分类垃圾检测图像进行分类检测,以判断待分类垃圾(预测的垃圾)是否为目标垃圾(即,预先规定需要进行清理的垃圾)。

由此,本发明实施例中,先采用目标检测模型对路面垃圾进行识别,再采用目标分类模型对识别出的垃圾进行分类,以判断识别出的垃圾是否为待清扫的目标垃圾,从而能够准确地识别出路面待清扫的垃圾。

下面结合具体实施例来详细说明,在识别出目标垃圾后,如何对目标垃圾进行清扫。

根据本发明的一个实施例,深度学习的垃圾检测分类方法还包括:如果判断待分类垃圾检测图像中的待分类垃圾为目标垃圾,则获取目标垃圾在当前像素坐标系下的坐标;将目标垃圾在当前像素坐标系下的坐标与相机的内参矩阵进行乘法运算,以获取目标垃圾在当前像素坐标系下的坐标;将目标垃圾在当前像素坐标系下的坐标与相机坐标系和车体坐标系的变换矩阵进行乘法运算,以获取目标垃圾在车体坐标系下的坐标。

具体而言,如果判断待分类垃圾检测图像中的待分类垃圾为目标垃圾,则获取目标垃圾在当前像素坐标系下的坐标,此时,可先将目标垃圾在当前像素坐标系下的坐标乘以相机的内参矩阵,以获取目标垃圾在当前像素坐标系下的坐标,然后,将目标垃圾在当前像素坐标系下的坐标乘以相机坐标系和车体坐标系的变换矩阵,以获取目标垃圾在车体坐标系下的坐标,即获取目标垃圾相对于清扫车的位置,从而根据目标垃圾在车体坐标系下的坐标,控制清扫车运行至目标垃圾,进而对目标垃圾进行清扫。由此,能够准确有效地对路面待清扫垃圾进行清扫。

综上所述,根据本发明实施例的基于深度学习的垃圾检测分类方法,采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾,以及在目标检测图像中存在待分类垃圾时,获取待分类垃圾在当前像素坐标系下的坐标,并根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像,以及采用目标分类模型对待分类垃圾检测图像进行分类检测,以判断待分类垃圾检测图像中的待分类垃圾是否为目标垃圾。由此,能够准确地识别出路面待清扫的垃圾,从而确保能够准确有效地对路面待清扫垃圾进行清扫。

对应上述实施例的深度学习的垃圾检测分类方法,本发明还提出一种深度学习的垃圾检测分类装置。

如图2所示,本发明实施例的深度学习的垃圾检测分类装置可包括目标检测模块100、第一获取模块200、第二获取模块300和分类检测模块400。

其中,目标检测模块100用于采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾;第一获取模块200用于在目标检测图像中存在待分类垃圾时,获取待分类垃圾在当前像素坐标系下的坐标;第二获取模块300用于根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像;分类检测模块400用于采用目标分类模型对待分类垃圾检测图像进行分类检测,以判断待分类垃圾检测图像中的待分类垃圾是否为目标垃圾。

根据本发明的一个实施例,目标检测模块100在采用目标检测模型对目标检测图像进行目标检测之前,还用于采集路面垃圾图像数据,并对路面垃圾图像数据进行手工标注,以生成训练样本集;根据训练样本集对目标检测网络进行训练,以生成目标检测模型。

根据本发明的一个实施例,目标检测模块100具体用于:采用中值滤波、图像锐化、旋转、镜像、亮度调整、变换RGB颜色通道中的至少一种方式对目标检测图像进行数据增强处理;采用目标检测模型对数据增强处理后的目标检测图像进行目标检测。

根据本发明的一个实施例,分类检测模块400具体用于:采用中值滤波、图像锐化、旋转、镜像、亮度调整中的至少一种方式对待分类垃圾检测图像进行数据增强处理;采用目标分类模型对数据增强处理后的待分类垃圾检测图像进行分类检测。

根据本发明的一个实施例,深度学习的垃圾检测分类装置还包括:第三获取模块500。其中,第三获取模块500用于:如果判断待分类垃圾检测图像中的待分类垃圾为目标垃圾,则获取目标垃圾在当前像素坐标系下的坐标;将目标垃圾在当前像素坐标系下的坐标与相机的内参矩阵进行乘法运算,以获取目标垃圾在当前像素坐标系下的坐标;将目标垃圾在当前像素坐标系下的坐标与相机坐标系和车体坐标系的变换矩阵进行乘法运算,以获取目标垃圾在车体坐标系下的坐标。

需要说明的是,本发明实施例的基于深度学习的垃圾检测分类装置更具体的实施方式可参照上述基于深度学习的垃圾检测分类方法的实施例,在此不再赘述。

根据本发明实施例的基于深度学习的垃圾检测分类装置,通过目标检测模块采用目标检测模型对目标检测图像进行目标检测,以判断目标检测图像中是否存在待分类垃圾,以及通过第一获取模块在目标检测图像中存在待分类垃圾时,获取待分类垃圾在当前像素坐标系下的坐标,并通过第二获取模块根据待分类垃圾在当前像素坐标系下的坐标从目标检测图像中抠出待分类垃圾检测图像,以及通过分类检测模块采用目标分类模型对待分类垃圾检测图像进行分类检测,以判断待分类垃圾检测图像中的待分类垃圾是否为目标垃圾,由此,能够准确地识别出路面待清扫的垃圾,从而确保能够准确有效地对路面待清扫垃圾进行清扫。

对应上述实施例,本发明还提出一种计算机设备。

本发明实施例的计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时,实现上述实施例的基于深度学习的垃圾检测分类方法。

根据本发明实施例的计算机设备,能够准确地识别出路面待清扫的垃圾,从而确保能够准确有效地对路面待清扫垃圾进行清扫。

对应上述实施例,本发明还提出一种非临时性计算机可读存储介质。

本发明实施例的非临时性计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现上述的基于深度学习的垃圾检测分类方法。

根据本发明实施例的非临时性计算机可读存储介质,能够准确地识别出路面待清扫的垃圾,从而确保能够准确有效地对路面待清扫垃圾进行清扫。

在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

相关技术
  • 基于深度学习的垃圾检测分类方法和装置
  • 智能垃圾桶及基于深度学习的垃圾分类方法
技术分类

06120112222438