掌桥专利:专业的专利平台
掌桥专利
首页

一种提升灭火器状态识别准确率的方法、装置及介质

文献发布时间:2024-04-18 19:58:53


一种提升灭火器状态识别准确率的方法、装置及介质

技术领域

本申请涉及图像识别技术领域,特别是涉及一种提升灭火器状态识别准确率的方法、装置及介质。

背景技术

随着对工业生产安全的重视程度越来越高,在风险分级管控、隐患排查治理双重预防性工作机制中,提出了灭火器要定期检查,并且要确定压力表读数在绿区的要求。基于现有的图像识别技术,通过网络模型对灭火器的图像进行识别,进而实现对灭火器状态的判断,相对于人工识别而言,能够提高对大批量灭火器状态识别的效率。

灭火器的状态一般通过灭火器面板中指针所在区域来确定,而灭火器面板图像在整体灭火器图像上的占比很小。所以,通过状态识别模型直接对灭火器图像进行识别,难以精准识别灭火器图像中的灭火器面板图像,会影响对指针区域的识别和判断,进而对灭火器状态识别的准确率不够理想。

针对相关技术中存在的对灭火器状态识别准确率较低的问题,目前还没有提出有效的解决方案。

发明内容

在发明中提供了一种提升灭火器状态识别准确率的方法、装置及介质,以解决相关技术中对灭火器状态识别准确率较低的问题。

第一个方面,在本发明中提供了一种提升灭火器状态识别准确率的方法,包括以下步骤:

获取目标灭火器图像;

通过Yolov8网络模型对所述目标灭火器图像进行目标区域检测,得到目标灭火器面板图像;

通过EfficientNet网络模型对所述目标灭火器面板图像进行识别分类,根据识别分类结果确定所述目标灭火器图像中的灭火器状态。

在其中的一些实施例中,所述Yolov8网络模型包括小目标检测层,所述小目标检测层被预先配置于所述Yolov8网络模型中。

在其中的一些实施例中,所述Yolov8网络模型包括多个网络输出层,多个所述网络输出层被预先配置于所述Yolov8网络模型中。

在其中的一些实施例中,所述获取目标灭火器图像包括:

获取初始灭火器图像;

使用中值滤波法对所述初始灭火器图像进行去噪和对比度增强操作,得到所述目标灭火器图像。

在其中的一些实施例中,多个所述网络输出层包括第一网络输出层和第二网络输出层,所述第一网络输出层与所述第二网络输出层之间具有预设层数差。

在其中的一些实施例中,多个所述网络输出层包括四个网络输出层。

在其中的一些实施例中,所述网络输出层的具体层数分别为18、21、24、27层。

第二个方面,在本发明中提供了一种提升灭火器状态识别准确率的装置,包括:

采集模块,用于获取目标灭火器图像;

检测模块,用于通过Yolov8网络模型对所述目标灭火器图像进行目标区域检测,得到目标灭火器面板图像;

识别模块,用于通过EfficientNet网络模型对所述目标灭火器面板图像进行识别分类,根据识别分类结果确定所述目标灭火器图像中的灭火器状态。

第三个方面,在本发明中提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的提升灭火器状态识别准确率的方法。

第四个方面,在本发明中提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一个方面所述的提升灭火器状态识别准确率的方法。

与相关技术相比,在本发明中提供的提升灭火器状态识别准确率的方法中,通过Yolov8网络模型对目标灭火器图像进行目标区域检测,从而对灭火器面板区域进行定位,得到灭火器面板图像,然后通过EfficientNet网络模型对灭火器面板图像进行识别,实现对灭火器面板指针区域的精准识别和判断。通过Yolov8网络模型和EfficientNet网络模型的组合使用,具有提高灭火器状态识别准确率的效果,解决了相关技术中存在的对灭火器状态识别准确率较低的问题。

此外,本发明通过向Yolov8网络模型中配置小目标检测层,并且设置多个网络输出层,在一定程度上减小了图像识别定位过程中的细节损失,进一步提高了灭火器状态识别的准确率。

本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是提升灭火器状态识别准确率的方法的终端硬件结构框图。

图2是本发明提供的提升灭火器状态识别准确率的方法的流程图。

图3是本实施例的提升灭火器状态识别准确率的装置的结构框图。

具体实施方式

为更清楚地理解本申请的目的、技术方案和优点,下面结合附图和实施例,对本申请进行了描述和说明。

除另作定义外,本申请所涉及的技术术语或者科学术语应具有本申请所属技术领域具备一般技能的人所理解的一般含义。在本申请中的“一”、“一个”、“一种”、“该”、“这些”等类似的词并不表示数量上的限制,它们可以是单数或者复数。在本申请中所涉及的术语“包括”、“包含”、“具有”及其任何变体,其目的是涵盖不排他的包含;例如,包含一系列步骤或模块(单元)的过程、方法和系统、产品或设备并未限定于列出的步骤或模块(单元),而可包括未列出的步骤或模块(单元),或者可包括这些过程、方法、产品或设备固有的其他步骤或模块(单元)。在本申请中所涉及的“连接”、“相连”、“耦接”等类似的词语并不限定于物理的或机械连接,而可以包括电气连接,无论是直接连接还是间接连接。在本申请中所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。通常情况下,字符“/”表示前后关联的对象是一种“或”的关系。在本申请中所涉及的术语“第一”、“第二”、“第三”等,只是对相似对象进行区分,并不代表针对对象的特定排序。

在本发明中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是执行本发明中提供的提升灭火器状态识别准确率的方法的终端硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器120和用于存储数据的存储器140,其中,处理器120可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备160以及输入输出设备180。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。

存储器140可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本发明中的提升灭火器状态识别准确率的方法对应的计算机程序,处理器120通过运行存储在存储器140内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器140可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器140可进一步包括相对于处理器120远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备160用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备160包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备160可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。

在本发明中提供了一种提升灭火器状态识别准确率的方法,图2是本发明的提升灭火器状态识别准确率的方法的流程图,如图2所示,该流程包括如下步骤:

步骤S210,获取目标灭火器图像。其中,目标灭火器图像即为待识别的图像。

在其中的一些实施例中,为了提高目标灭火器图像的质量,可以对采集的初始灭火器图像进行预处理,得到目标灭火器图像。预处理过程包括:获取初始灭火器图像;使用中值滤波法对初始灭火器图像进行去噪和对比度增强操作,得到目标灭火器图像。

具体的,在初始灭火器图像的拍摄和传输过程中,可能会引入不必要的信号,这些信号会影响图像的质量,并且在后续对图像处理中产生相应的干扰。因此,在获取初始灭火器图像之后,通过中值滤波法对初始灭火器图像进行去噪以及对比度增强操作,从而去除图像中这些不必要的信号,提高图像的整体质量,最终得到目标灭火器图像。

步骤S220,通过Yolov8网络模型对目标灭火器图像进行目标区域检测,得到目标灭火器面板图像。

Yolov8(You Only Look Once version 8)是一种目标检测算法,用于实时目标检测任务。它是YOLO系列算法的最新版本,它的核心思想是将目标检测任务转化为一个单次前向传播过程。相比较Yolov5它具有更好的检测精度,Yolov8n在coco数据集mAP50-95是55.6%,而Yolov5n只有53.2%.

在一些精度要求更高的情况下,由于原有的Yolov8网络模型中并不具备小目标检测层,从而使得Yolov8网络模型的检测效果无法达到所需要的效果。在其中的一些实施例中,对Yolov8网络模型进行了改进,Yolov8网络模型包括小目标检测层,小目标检测层被预先配置于Yolov8网络模型中。在本实施例中,获取到目标灭火器图像之后,利用在Yolov8网络模型中添加的小目标检测层对目标灭火器图像进行特征提取,从而获取多个特征图像,其中,本实施例所配置的小目标检测层能够检测4×4以上的目标。

Yolov8网络模型包括多个网络输出层,多个网络输出层被预先配置于Yolov8网络模型中。具体的,多个网络输出层包括第一网络输出层和第二网络输出层,第一网络输出层与第二网络输出层之间具有预设层数差。多个网络输出层分别与多个特征图像相对应,在获取特征图像之后,需要选择其中的部分特征图像进行融合拼接,而特征图像的选择标准正是依据对应的第一网络输出层和第二网络输出层之间的预设层数差,其中,该预设层数差可以是2层、4层或者6层,预设层数差的设定标准可以根据实际应用时的需要进行适当增大。在本实施例中,多个网络输出层包括四个网络输出层,更具体的,Yolov8网络模型初始的网络输出层分别为15、18和21层,由于yolov8网络模型的下采样倍数比较大,特征图像的层级越深,其分辨率越低,对图像细节的感知能力较弱,并且,由于灭火器面板图像在目标灭火器图像中的占比本身就比较小,所以,为了减少在对特征图像进行融合时图像细节的损失,对网络输出层的数量进行适当的增加,具体的,本实施例中,网络输出层的具体层数分别为18、21、24、27层。最后,根据融合后的特征图像对目标灭火器图像中的灭火器面板所在区域进行定位,通过定位的矩形框使用opencv对面板区域进行裁剪并保存,从而获得目标灭火器面板图像。

步骤S230,通过EfficientNet网络模型对目标灭火器面板图像进行识别分类,根据识别分类结果确定目标灭火器图像中的灭火器状态。

EfficientNet网络模型是一种高效的卷积神经网络架构,被广泛应用于图像分类和相关的计算机视觉任务,设计思想是在网络结构中平衡参数、计算量和精度,以达到高效和准确的特点。它引入了一种Compound Scaling的方法,通过统一调整网络的深度、宽度和分辨率,来获得更好的模型表现。

在其中的一些实施例中,对于EfficientNet网络模型,可以预先对EfficientNet网络模型进行训练,训练步骤包括但不限于以下方式:构建初始EfficientNet网络模型,并预设模型参数。然后收集已知灭火器状态的灭火器面板样本图像,将灭火器面板样本图像输入初始EfficientNet网络模型进行训练,调整模型参数,直到输出的结果与对应的灭火器面板样本图像的灭火器状态一致。将此时的模型参数作为最终EfficientNet的模型参数,从而确定EfficientNet网络模型。示例性的,在确定目标灭火器图像中的灭火器状态时,可以根据目标灭火器图像的表盘中指针所在区域进行灭火器状态的判断。

通过Yolov8网络模型对目标灭火器图像进行目标区域检测,得到目标灭火器面板图像,然后利用EfficientNet网络模型对目标灭火器面板图像进行指针区域的精准识别和判断。通过Yolov8网络模型和EfficientNet网络模型的组合使用,解决了由于灭火器其他部位占比较大,面板指针区域占比较小而降低灭火器状态识别准确率的问题,实现了对灭火器面板进行定位,提高灭火器状态识别准确率的效果。

为了验证上述方法的效果,在ubuntu20.04、i9-13900k、RTX4080的硬件环境下,使用上述Yolov8n网络模型对212张目标灭火器图像进行定位,然后利用EfficientNet网络模型进行识别,最终的准确率为93.87%。而仅使用EfficientNet网络模型进行分类的准确率为97.64%,整体准确率提升了4.02%。

需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

在本发明中还提供了一种提升灭火器状态识别准确率的装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。

图3是本发明的提升灭火器状态识别准确率的装置的结构框图,如图3所示,该装置包括:

采集模块301,用于获取目标灭火器图像;

检测模块302,用于通过Yolov8网络模型对目标灭火器图像进行目标区域检测,得到目标灭火器面板图像;

识别模块303,用于通过EfficientNet网络模型对目标灭火器面板图像进行识别分类,根据识别分类结果确定目标灭火器图像中的灭火器状态。

通过检测模块中利用Yolov8网络模型对目标灭火器图像进行目标区域检测,得到目标灭火器面板图像,然后利用识别模块中的EfficientNet网络模型对目标灭火器面板图像进行指针区域的精准识别和判断。通过Yolov8网络模型和EfficientNet网络模型的组合使用,解决了由于灭火器其他部位占比较大,面板指针区域占比较小而降低灭火器状态识别准确率的问题,实现了对灭火器面板进行定位,提高灭火器状态识别准确率的效果。

需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

在本发明中还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。

可选地,在一个实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:

S1,获取目标灭火器图像。

S2,通过Yolov8网络模型对目标灭火器图像进行目标区域检测,得到目标灭火器面板图像。

S3,通过EfficientNet网络模型对目标灭火器面板图像进行识别分类,根据识别分类结果确定目标灭火器图像中的灭火器状态。

需要说明的是,本电子设备的具体示例可以参考上述方法的实施例及可选实施方式中所描述的示例,在本实施例中不再赘述。

此外,结合上述本发明中提供的提升灭火器状态识别准确率的方法,在本发明中还可以提供一种存储介质来实现。该存储介质上存储有计算机程序;该计算机程序被处理器执行时实现上述实施例中的任意一种提升灭火器状态识别准确率的方法。

应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。

显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。

“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。

相关技术
  • 一种车牌识别方法、装置、计算机装置及计算机可读存储介质
  • 接近状态识别方法、装置、终端设备及存储介质
  • 商品状态识别方法、装置、电子设备及可读存储介质
  • 交通指示灯的状态识别方法、装置、电子设备及存储介质
  • 一种提升准确率的表情识别方法、装置、存储介质及设备
  • 一种OCR识别准确率提升方法、系统、介质和设备
技术分类

06120116507264