掌桥专利:专业的专利平台
掌桥专利
首页

一种用于机器学习的人物识别方法、装置、设备终端和可读存储介质

文献发布时间:2024-04-18 19:58:53


一种用于机器学习的人物识别方法、装置、设备终端和可读存储介质

技术领域

本发明属于图像处理技术领域,具体涉及一种用于机器学习的人物识别方法、装置、设备终端和可读存储介质。

背景技术

人体识别在视频监控、视频/图像搜索、人体跟踪等领域具有广泛的应用。在图片中主要的研究为行人识别,目前最有效的行人识别算法是基于深度卷积神经网络的识别算法,以YOLO算法实时目标检测模型为代表,但是当现有技术中的图片背景复杂或人群数量较密时,该模型对于人体识别的效果差,远远不能满足人体搜索、人体跟踪等需求,为此还需要人工进行审核,但是人工审核量大,需投入大量的人力资力。

发明内容

鉴于此,本申请提供一种用于机器学习的人物识别方法、装置、设备终端和可读存储介质,并且能够根据获取到的数量信息通过计算对目标图片进行分组,分组后的图片分别采用不同专业度的人员进行审核,从而提高人工审核效率,得到人工审核后的图片。

为实现上述目的,本发明采用以下方案:

一种用于机器学习的人物识别方法,包括:

步骤1:获取图片集;

步骤2:采用人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;

步骤3:采用画框模型,基于坐标信息对图片中的特征目标进行画框标注;

步骤4:采用人群密度检测模型获取图片中特征目标的第二数量信息;

步骤5:根据第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核;

步骤6:图片子集经人工审核后,得到标注后的图片集。

优选的,根据步骤五中“第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:计算所述第一数量信息和所述第二数量信息的偏差值;根据所述偏差值在第一条件约束下,对图片分组。

优选的,所述获取图片集包括提交图片,转换图片格式后上传到服务器,解码还原图片,传给所述模型,获得图片集。

优选的,所述人体识别模型为DAMOYOLO高性能通用模型。

优选的,所述画框标签采用JavaScript-canvas画框标签。

优选的,所述人群密度检测模型采用hrnet-crowd-counting模型。

本发明还提供一种用于机器学习的图片获取的装置,所述该装置包括:

图片集获取模块,用于获取图片数据生成图片集;

第一数量信息获取模块,用于基于人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;

画框标注模块,用于基于坐标信息对图片中的特征目标进行画框标注;

第二数量信息获取模块,用于基于人群密度检测模型获取图片中特征目标的第二数量信息;

图片分组获取模块,用于对第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核;

图片存储模块,用于输出和存储标注后的图片集。

优选的,所述图片分组模块包括:步骤五中所述“根据第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:计算所述第一数量信息和所述第二数量信息的偏差值;根据所述偏差值在第一条件约束下,对图片分组。

本发明还提供一种设备终端,所述设备终端包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述设备终端执行上述任一项所述的用于机器学习的人物识别方法。

本发明还提供一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时实施上述任一项所述的用于机器学习的人物识别方法。

本申请采用的技术方案能够达到以下有益效果:

由于采用人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;采用画框标签,基于坐标信息对图片中的特征目标进行画框标注;采用人群密度检测模型获取图片中特征目标的第二数量信息。根据所述第一数量信息和所述第二数量信息,计算出数量偏差,根据偏差采用约束条件,对所述图片集进行分组,分组后的图片分别针对不同专业度的审核人员,从而提高人工审核率,解决了人工效率低的技术问题。

附图说明

图1为本发明的流程图

具体实施方式

为了便于理解本申请,下面将结合附图对本申请进行更全面的描述。并且给出了本申请的较佳实施方式。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施方式的目的是使对本申请的公开内容理解的更加透彻全面。

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本申请。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

请参看图1,本发明提供一种用于机器学习的人物识别方法,具体包括以下步骤:

步骤1:获取图片集

步骤:2:采用人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;

步骤3:采用画框标签,基于坐标信息对图片中的特征目标进行画框标注;

步骤4:采用人群密度检测模型获取图片中特征目标的第二数量信息;

步骤5:根据第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核;

步骤6:图片子集经人工审核后,得到标注后的图片集。

在本实施例中,首先由计算机设备获取图片集,获取后的图片集转换图片格式,服务器接收转换格式后的图片集,通过解码器还原图片后传给DAMOYOLO高性能通用模型,该模型具有高效的网络架构和先进的训练阶段,所述该模型获取到图片集后,通过调参数对图片集进行反复训练以获取准确度信息和图片集特征识别第一数量信息。接下来调用画框模型,所述画框模型最好采用JavaScript-canvas画框标签,根据图片点位坐标数据,用于对特征目标进行画框标注,标注后的图片集存储至服务器。接下来调用人群密度检测模型,通过对人群密度的检测输出图片中人群数量的总值,由此,可获取到所述第二数量信息。因此,根据所述第一数量信息和第二数量信息对所述图片集进行分组,得到至少两个图片子集,此图片子集由人工审核。

进一步的,步骤五中所述“根据第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:计算所述第一数量信息和所述第二数量信息的偏差值;根据所述偏差值在第一条件约束下,对图片分组。

其中,在本实施中,为更好的理解本技术方案,提供以下数据具体说明:

应用以下公式计算偏差:

公式中:X

例如,当通用人体识别模型输出第一数量信息为15,人体密度监测模型输出第二数量信息为20时,得到第一偏差值X

当通用人体识别模型输出第一数量信息为10,人体密度监测模型输出第二数量信息为20时,得到第一偏差值X

当通用人体识别模型输出第一数量信息为5,人体密度监测模型输出第二数量信息为20时,得到第一偏差值X

例如根据不同偏差值采用第一约束条件,得到以下图片组:

当0≤X

当0.5<X

当0.8≤X

综上可知,所述第一数量信息和第二数量信息的偏差值越小,所述图片组中图片的信息越简单,越容易审核;所述第一数量信息和第二数量信息的偏差值越大,所述图片组中图片的信息越复杂,审核难度较高。因此,根据所述第一图片组,第二图片组以及第三图片组可选择放弃或针对不同专业度的人员进行审核,以提高人工审核效率。

进一步的,所述步骤1还包括:提交图片,转换图片格式后上传到服务器,解码器还原图片,传给所述模型,获得图片集。

在本实施例中,计算机设备提交图片,图片转换Base64编码格式后上传给服务器,解码图片进行还原,还原后传给DAMOYOLO高性能通用模型。

进一步的,所述步骤2还包括:所述人体识别模型为DAMOYOLO高性能通用模型,用于识别图片中的人体位置,用于获取图片中第一数量信息。

其中,在本实施例中,所述DAMOYOLO高性能通用模型建立在卷积神经网络,用于识别图片中的人体位置,能对图片中包含的大部分前景物体进行定位,用于识别图片中的人体位置,用于获取图片中第一数量信息。

进一步的,所述步骤3包括:所述画框标签采用JavaScript-canvas画框标签,用于对特征目标进行画框标注。

在本实施例中,采用JavaScript-canvas画框标签,根据画框坐标在图片中画出矩形,对异常物品进行标注。

进一步的,所述步骤4包括:所述人群密度检测模型采用hrnet-crowd-counting模型,用于获取图片中第二数量信息。

在本实施例中,采用hrnet-crowd-counting模型,给定图片,能够输出图片中人群数量的总值,由此,可获取到所述第二数量信息。

此外,本发明还涉及一种用于机器学习的图片获取装置,所述该装置包括:

图片集获取模块,用于获取图片数据生成图片集;

第一数量信息获取模块,用于基于人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;

画框标注模块,用于基于坐标信息对图片中的特征目标进行画框标注;

第二数量信息获取模块,用于基于人群密度检测模型获取图片中特征目标的第二数量信息;

图片分组获取模块,用于对第一数量信息和第二数量信息对图片进行分组,得到至少两个图片子集,并对图片子集进行人工审核;

图片存储模块,用于输出和存储标注后的图片集。

进一步的,所述图片分组模块包括:根据步骤五中“第一数量信息和第二数量信息对图片进行分组”,包括以下步骤:计算所述第一数量信息和所述第二数量信息的偏差值;根据所述偏差值在第一条件约束下,对图片分组。

在本实施例中,其中,所述用于机器学习的人物识别装置用于实现上述用于机器学习的人物识别方法。

本发明提供一种设备终端,所述设备终端包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述设备终端执行所述任一项所述的用于机器学习的人物识别方法。

本发明提供一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时实施所述任一项所述的用于机器学习的人物识别方法。

本发明由于采用人体识别模型获取图片中特征目标的坐标信息,准确度信息及第一数量信息;采用画框标签,基于坐标信息对图片中的特征目标进行画框标注;采用人群密度检测模型获取图片中特征目标的第二数量信息。根据所述第一数量信息和所述第二数量信息,计算出数量偏差,根据偏差采用约束条件,对所述图片集进行分组,分组后的图片分别针对不同的审核人员,从而提高人工审核率,解决了人工效率低的技术问题。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

相关技术
  • 一种身份识别方法、计算机可读存储介质及终端设备
  • 一种浴室加热装置和用于控制浴室加热装置的方法、设备、电子设备及计算机可读存储介质
  • 一种构件识别方法、装置、设备及计算机可读存储介质
  • 一种鸡蛋品质识别方法、装置、设备及可读存储介质
  • 一种APP的自动生成方法、装置、终端设备及可读存储介质
  • 一种人物服饰识别方法、装置、设备和可读存储介质
  • 一种人脸识别方法、装置、可读存储介质及终端设备
技术分类

06120116509959