掌桥专利:专业的专利平台
掌桥专利
首页

一种基于YOLOv5的快递包裹检测系统及方法

文献发布时间:2024-04-18 19:59:31


一种基于YOLOv5的快递包裹检测系统及方法

技术领域

本发明涉及人工智能技术领域,特别是涉及一种基于YOLOv5的快递包裹检测系统及方法。

背景技术

随着电子商务的迅猛发展,快递包裹的数量不断增加,快递行业也日益繁忙。为了提高快递处理效率和准确性,自动化的快递包裹检测系统变得至关重要。传统的方法主要依赖人工处理,但人工处理存在效率低、成本高和容易出错的问题。

因此,深度学习技术已被广泛应用于自动快递包裹检测系统中,以提高准确性和效率。然而,在目前的快递包裹检测系统中仍然存在以下问题:

1、一些快递包裹检测系统虽然能够提供高准确性,但在实时性方面表现不佳。这就出现需要快速处理大量包裹的场景下保持准确性和实时性的平衡问题。

2、资源消耗问题:一些深度学习模型在计算和内存资源上消耗较大,难以部署到资源受限的环境中,如嵌入式系统。

3、关键特征的准确捕捉问题:在光照、背景杂乱的环境下,快递包裹检测需要准确捕捉包裹的关键特征,以确保正确的识别。

发明内容

有鉴于此,本发明提供了一种基于YOLOv5的快递包裹检测系统及方法,以YOLOv5为基础,形成了融入注意力机制和轻量化卷积模块的改进型深度学习模型,用于实时识别和检测快递包裹的类型和位置。该系统集成了前端界面和后端模型,通过图像和视频输入,实现了高效的快递包裹检测,提供了详细的检测结果和统计信息。

为此,本发明采用以下技术方案:

本发明公开了一种基于YOLOv5的快递包裹检测系统,所述系统包括:

数据集构建模块,用于构建多类别快递包裹数据集;

模型构建模块,用于构建基于改进YOLOv5的快递包裹检测模型;所述改进YOLOv5包括:在主干网络中引入了ECA注意力机制并采用Ghost卷积模块;

静态包裹检测功能模块,由后端建立的基于YOLOv5的快递包裹检测模型实现对从前端获取到本地文件中的快递包裹图片进行预测,预测得到的结果图片通过后端返回给前端,并在网页上呈现检测后的图像文件;

展示检测结果功能模块,对上传的文件检测完毕后,对快递包裹的类别进行归纳,并通过前端页面上的用户界面呈现信息列表;

动态包裹检测功能模块,允许用户通过网页中的按钮开启摄像头,实时进行快递包裹的检测。

进一步地,所述系统通过Flask构建前端页面、处理用户上传的图像和视频文件、与后端深度学习模型进行通信以获取检测结果,并将结果呈现给用户。

进一步地,所述多类别数据集中,快递包裹根据包装材料的不同被分成五个类别,包括塑料袋、纸壳箱、泡沫箱、纸袋和气泡袋;所述多类别数据集中,包括近距离拍摄角度和复杂环境中堆叠杂乱的情景,以模拟真实的应用场景。

进一步地,所述静态包裹检测功能模块还会记录并显示检测到的不同包裹类别的数量。

进一步地,所述展示检测结果功能模块还包括了显示每个类别的检测数量,使用户能够了解每个类别的检测情况。

进一步地,所述动态包裹检测功能模块的检测结果包括类别和准确率,并在网页上动态显示。

本发明还公开了一种基于YOLOv5的快递包裹检测方法,应用于上述快递包裹检测系统;所述方法包括:

系统初始化,启动基于Flask构建的前端页面;

静态包裹检测,包括:用户在前端页面中选择并上传包含快递包裹的图片文件;后端接收到用户上传的图片文件,并保存在服务器上;从前端获取的本地文件中的快递包裹图片通过基于改进YOLOv5的快递包裹检测模型进行预测;模型预测的结果以图像的形式返回给前端,并在网页上呈现检测后的图像文件;

展示检测结果,包括:对于上传的文件,根据模型的输出对快递包裹的类别进行归纳,并计算每个类别的检测数量;前端页面上的用户界面展示信息列表,所述列表包括每个检测到的类别以及相应类别的检测数量;用户能够点击每个类别以展开或折叠相应类别的详细信息;在页面上显示总检测数量;

动态包裹检测,包括:用户通过前端页面中的相关按钮开启摄像头,启动动态包裹检测功能;系统捕捉摄像头的实时视频流;从视频流中检测出出现的快递包裹,并显示其类别与准确率;检测结果以实时方式在前端页面上动态显示,允许用户实时监测快递包裹的状态。

本发明的优点和积极效果:本发明中,通过融合注意力机制和轻量化卷积模块,提高了检测性能和计算效率,使得快递包裹的识别与检测更加准确和实时。同时,前端界面和后端模型之间的协同工作保证了用户能够方便地上传图像或视频,并获得详细的检测结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种基于YOLOv5的快递包裹检测系统结构示意图;

图2为本发明实施例中一种基于YOLOv5的快递包裹检测方法的流程图;

图3为本发明实施例中改进后的YOLOv5网络结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示,本发明实施例中的一种基于YOLOv5的快递包裹检测系统,针对企业级用户端设计;首先构建所需的快递包裹数据集,通过改进的YOLOv5检测算法,建立快递包裹检测模型;数据进入模型通过数据增强方法提升泛化能力,经过引入的注意力机制和轻量化网络结构提升模型性能。该系统主要包括以下模块:

数据集构建模块,用于构建数据集。为了训练和评估该系统,构建了一个多类别数据集,其中的快递包裹根据包装材料的不同被分成五个类别,包括塑料袋、纸壳箱、泡沫箱、纸袋和气泡袋。此外,数据集中包含了近距离拍摄角度和复杂环境中堆叠杂乱的情景,以模拟真实的应用场景,确保模型能够在各种情况下进行准确检测。

模型构建模块,用于构建基于改进YOLOv5的快递包裹检测模型。YOLOv5是YOLO系列目标检测模型的第五代版本,它在目标检测任务中取得了卓越的性能,并具有高度的灵活性和可扩展性。YOLOv5使用了一种称为Mosaic的数据增强方法。Mosaic通过将四张不同的训练图像拼接成一张大图像,然后进行训练,以模拟真实世界中目标出现的多样性。这有助于提高模型的泛化能力,使其更好地适应各种场景和目标的变化。如图3所示,本系统在原主干网络中引入了ECA(Efficient Channel Attention)注意力机制。ECA注意力机制有助于模型更好地捕捉图像特征中的重要信息,增强了模型对关键特征的关注,从而提高了检测性能。还在主干网络中采用了Ghost卷积模块。Ghost卷积模块通过减少模型的参数数量和计算量,降低了模型的复杂性,同时仍然能够保持高度的性能。这有助于加速模型的推理速度,使其更适合实时应用。多尺度检测:YOLOv5支持多尺度检测,可以同时检测不同尺寸的目标。这使得模型更具通用性,能够适应各种目标的大小和比例。其主要网络结构模块如下:

(1)Focus模块:Focus模块是YOLOv5中的一项关键技术,用于提高模型对小目标的检测性能。它通过将输入图像均分为四个部分,然后在较小的子图像上进行卷积操作,以捕获小目标的特征。这有助于改善模型对小目标的检测准确性。

(2)BottleneckCSP(Cross Stage Partial):BottleneckCSP是YOLOv5的骨干网络的一部分,用于特征提取。可以有效地提取图像特征并减少计算负担。这有助于提高模型的速度和效率。

(3)Head部分:Head部分是YOLOv5中用于预测目标位置和类别的关键组件。它包括多个检测头,每个头负责预测不同尺度的锚点框(anchor boxes)。YOLOv5支持多尺度检测,可以识别不同大小的目标。

(4)Neck部分:Neck部分用于连接骨干网络和检测头,以整合不同尺度的特征图。YOLOv5使用FPN(Feature Pyramid Network)结构,将高层次和低层次的特征图相结合,以便模型可以更好地理解不同尺度上的目标。

(5)SPP(Spatial Pyramid Pooling):SPP是YOLOv5中的一个组件,用于增加模型对目标的上下文感知能力。它通过将特征图划分为不同尺度的网格,然后在每个网格上进行池化操作,以捕获不同尺度的上下文信息。

本发明实施例中的快递包裹检测模型中引入轻量化卷积模块,以降低模型的参数数量和计算复杂度,从而提高了模型在资源受限环境中的运行效率。这有助于平衡准确性和实时性的要求。本发明实施例中的快递包裹检测模型中还引入了注意力机制,用于加强对包裹的关键特征的关注,从而提高了检测的准确性。通过注意力机制,模型能够更有效地捕捉和利用有关包裹的重要信息。

静态包裹检测功能模块,用于静态包裹检测。需要上传图片文件,上传完毕后进行静态包裹检测。由后端建立的基于YOLOv5的快递包裹检测模型实现对从前端获取到本地文件中的快递包裹图片进行预测,预测得到的结果图片通过后端返回给前端,并在网页上呈现检测后的图像文件。此外,该静态包裹检测模块还会记录并显示检测到的不同包裹类别的数量。

展示检测结果功能模块,用于展示检测结果。对上传的文件检测完毕后,对快递包裹的类别进行归纳,并通过前端页面上的用户界面呈现信息列表。用户可以点击相关按钮以查看详细信息。该展示检测结果功能模块还包括了显示每个类别的检测数量,使用户能够了解每个类别的检测情况。

动态包裹检测功能模块,用于动态包裹检测。允许用户通过网页中的按钮开启摄像头,用户根据不同需求选择按钮,实时利用快递包裹检测模型进行快递包裹的检测。检测结果将包括类别和准确率,并在网页上动态显示。用户也可以在页面上查看每个类别的检测数量,以及点击类别以查看详细信息。此外,该模块支持实时视频流中的包裹检测,使用户能够随时监测包裹的状态。

通过这些模块,本系统提供了全面的快递包裹检测功能,包括静态图像和动态视频的处理,同时提供了详细的检测结果和统计信息,以满足用户的不同需求。

本系统在前后端交互中完成快递包裹检测功能。本系统集成了前端界面和后端模型,使用户能够方便地上传图像或视频,并获得详细的检测结果和统计信息。前端界面通过用户友好的方式呈现结果,提供了交互性和可视化,使系统更易于使用。

本发明实施例中Flask被用于构建前端页面、处理用户上传的图像和视频文件、与后端深度学习模型进行通信以获取检测结果,并将结果呈现给用户。Flask是一个轻量级的框架,它提供了基本的功能和组件,但没有过多的复杂性。这使得它易于学习和使用,同时也能够满足快递包裹检测系统的需求,而不引入不必要的复杂性。Flask的API设计非常简单和直观,使得开发人员能够快速构建Web应用程序。它提供了路由、请求处理、会话管理等基本功能,同时允许开发人员根据项目的需求添加自定义功能,并且提供了大量的扩展和插件,允许开发人员根据需要定制和扩展功能。Flask集成了Jinja2模板引擎,使得前端页面的构建和渲染变得简单而灵活。这对于在前端界面中呈现检测结果和统计信息非常有用。此外,Flask天生支持构建RESTful API,这对于与深度学习模型的交互和数据传输非常有用。它允许前端界面通过HTTP请求与后端模型通信。在快递包裹检测系统中,Flask被用于构建前端页面、处理用户上传的图像和视频文件、与后端深度学习模型进行通信以获取检测结果,并将结果呈现给用户。它提供了一个可扩展、易于维护的框架,使系统更具交互性和用户友好性。Flask的使用有助于将深度学习模型与用户界面高效地整合在一起,实现了一个完整的快递包裹检测解决方案。

本发明实施例中还提供了一种基于上述快递包裹检测系统的快递包裹检测方法,如图2所示,该系统的工作过程如下:

步骤1:系统初始化;

系统初始化时,基于Flask构建的前端页面被启动,用户可以通过网页浏览器访问该页面。

步骤2:静态包裹检测;

S21、用户上传图片文件:用户在前端页面中选择并上传包含快递包裹的图片文件。

S22、后端接收文件:后端接收到用户上传的图片文件,并保存在服务器上。

S23、注意力机制和轻量化卷积模块应用:在YOLOv5模型的网络结构中,引入轻量化卷积模块以降低模型参数数量,同时利用注意力机制来提高对关键特征的关注。

S24、模型预测:从前端获取的本地文件中的快递包裹图片通过改进的YOLOv5模型进行预测。

S25、结果返回:模型预测的结果以图像的形式返回给前端,并在网页上呈现检测后的图像文件。

步骤3:展示检测结果;

S31、类别归纳:对于上传的文件,系统将根据模型的输出对快递包裹的类别进行归纳,并计算每个类别的检测数量。

S32、信息展示呈现:系统通过前端页面上的用户界面展示信息列表,该列表包括了每个检测到的类别以及相应类别的检测数量。注意力机制应用体现在信息展示部分的可视化中,改进后的模型较原模型检测结果提供的检测框更加精准,提升置信度。

S33、用户交互:用户可以点击每个类别以展开或折叠相应类别的详细信息,包括检测到的包裹的位置、准确率等。

S34、总数统计:系统还会在页面上显示总检测数量,以便用户一目了然地了解检测结果的总体情况。

步骤4:动态包裹检测;

用户操作:用户通过前端页面中的相关按钮开启摄像头,启动动态包裹检测功能。

摄像头捕捉:系统捕捉摄像头的实时视频流。

检测快递包裹:从视频流中检测出出现的快递包裹,并显示其类别与准确率。

轻量化卷积模块应用以提高实时检测的效率,同时注意力机制用于关键区域的加强关注。

动态显示:检测结果以实时方式在前端页面上动态显示,允许用户实时监测快递包裹的状态。

上述实施例中提供了一种更高效、准确且适用于多种应用场景的快递包裹检测解决方案。轻量化卷积模块和注意力机制的引入以及前后端的协同工作共同构成了本发明的核心技术。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 低噪声放大器、射频接收机及电子设备
  • 低噪声放大器、射频接收机及射频终端
技术分类

06120116518348