导航：首页> 铁路>一种身份识别方法、装置、设备及介质

一种身份识别方法、装置、设备及介质

文献发布时间：2024-01-17 01:26:37

技术领域

本申请涉及图像处理技术领域，尤其涉及一种身份识别方法、装置、设备及介质。

背景技术

通过步态进行身份识别是一种极具吸引力的生物特征识别方法，旨在根据用户行走的姿势来识别用户的身份，步态识别技术主要是指通过视频中的不同用户具有不同的行走姿态来判定该用户的身份。

相关技术中在通过步态进行身份识别时，通常从视频中的图像检测并分割出人体步态轮廓，根据检测并分割出的步态轮廓采用某种描述方法确定步态特征，采用相似性匹配的方法将步态特征与已知数据库中的步态特征进行相似性度量，并依据一定的准则判定其身份。然而相关技术中通过相似性匹配的方式进行身份识别，识别的准确率较低。

发明内容

本申请实施例提供一种身份识别方法、装置、设备及介质，用于解决相关技术中根据步态进行身份识别时，身份识别不准确的问题。

第一方面，本申请实施例提供了一种身份识别方法，所述方法包括：

接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息；

根据获取到的每个位置信息，确定所述图像中所述用户的中心点的位置信息，根据所述位置信息及所述中心点的位置信息，确定每个预设身体部位与所述中心点的距离；

将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

第二方面，本申请实施例还提供了一种身份识别装置，所述装置包括：

接收识别模块，用于接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息；

确定模块，用于根据获取到的每个位置信息，确定所述图像中所述用户的中心点的位置信息，根据所述位置信息及所述中心点的位置信息，确定每个预设身体部位与所述中心点的距离；

处理模块，用于将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

第三方面，本申请实施例还提供了一种电子设备，所述电子设备至少包括处理器和存储器，所述处理器用于执行存储器中存储的计算机程序时实现如上述任一项所述身份识别方法的步骤。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述身份识别方法的步骤。

在本申请实施例中，电子设备接收包含待识别身份的用户的图像，识别图像中的用户的每个预设身体部位及对应的位置信息；根据获取到的每个位置信息，确定图像中用户的中心点的位置信息，并根据每个预设身份部位的位置信息及中心点的位置信息，确定每个预设身体部位与中心点的距离；将获取到的每个预设身体部位的位置信息及每个预设身体部位与用户的中心点距离输入预先训练完成的身份识别模型，获取身份识别模型输出的用户的身份。由于在本申请实施例中，电子设备在进行身份识别时，通过预先训练完成的身份识别模型进行识别，并且根据每个预设身体部位在图像中的位置信息，及每个预设身体部位与中心点的距离进行识别，进而提高身份识别的准确性。

附图说明

为了更清楚地说明本申请的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种身份识别过程示意图；

图2为本申请实施例提供的一种人体关键点示意图；

图3为本申请实施例提供的一种确定出的人体轮廓示意图；

图4为本申请实施例提供的一种图像中用户的中心点示意图；

图5为本申请实施例提供的一种身体部位识别模型的输出示意图；

图6为本申请实施例提供的一种人体轮廓示意图；

图7为本申请实施例提供的一种身份识别过程的详细示意图；

图8为本申请实施例提供的一种身体部位识别模型的结构的示意图；

图9为本申请实施例提供的一种身份识别装置结构示意图；

图10为本申请实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图，对本申请中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本申请保护的范围。

为了准确地进行身份识别，本申请实施例提供了一种身份识别方法、装置、设备及介质。

该身份识别方法包括：接收包含待识别身份的用户的图像，识别图像中的用户的每个预设身体部位及对应的位置信息；根据获取到的每个位置信息，确定图像中用户的中心点的位置信息，并根据每个预设身份部位的位置信息及中心点的位置信息，确定每个预设身体部位与中心点的距离；将每个预设身体部位的位置信息及每个预设身体部位与用户的中心点距离输入预先训练完成的身份识别模型，获取身份识别模型输出的用户的身份。从而准确地进行身份识别。

实施例1：

图1为本申请实施例提供的一种身份识别过程示意图，该过程包括以下步骤：

S101：接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息。

本申请实施例提供的身份识别方法应用于电子设备，该电子设备可以为PC或服务器等智能设备。

为了进行身份识别，电子设备可以先接收包含待识别身份的用户的图像，具体的，可以是业务人员在有进行身份识别的需求时，在自身使用的设备的预设页面选择包含待识别身份的用户的图像，并点击预设按钮，例如“识别”按钮，电子设备即可接收到包含待识别身份的用户的图像。

此外，电子设备接收到的还可以是包含该图像的视频，其中，该视频为仅包含待识别身份的用户及背景的视频，也就是说该视频中不包含其他用户，电子设备可以将接收到的视频中任一视频帧图像确定为该包含待识别身份的用户的图像。具体的，可以是业务人员在自身使用的设备的预设页面选择包含待识别身份的用户的视频的存储位置，并点击预设按钮，例如“识别”按钮，业务人员所使用的设备在该存储位置获取该视频，并将获取到的视频发送至电子设备，电子设备即可接收到该视频。

在接收到包含待识别身份的用户的图像之后，电子设备可以识别该图像中的用户的每个预设身体部位及对应的位置信息。具体的，电子设备可以采用人体关键点检测方案，确定图像中每个人体关键点及对应的位置信息，在所确定出的每个人体关键点中筛选每个预设身体部位对应的人体关键点，进而确定出图像中每个预设身体部分及对应的位置信息。其中，每个预设身体部位包括头部、双手、双脚。

图2为本申请实施例提供的一种人体关键点示意图。

图2为两帧包含不同姿势的待识别身份的用户的图像，由图2可知，可识别出的人体关键点涵盖人体每个关键点。

此外，为了识别图像中每个预设身体部位及对应的位置信息，电子设备还可以采用人体运动目标检测方法，从图像中分割出运动的人体轮廓对其进预处理，并基于图像中用户的人体轮廓确定每个预设身体部位及对应的位置信息，例如，可以人体轮廓中确定最上(图像中的上下)侧的像素点为用户的头部，并确定该像素点的位置信息为用户的头部的位置信息；还可以确定最下(图像中的上下)侧的像素点为用户的脚部，并确定该目标像素点的位置信息为用户的脚部的位置信息；此外，电子设备还可以确定图像中用户的其他身体部位及对应的位置信息。

在确定图像中用户的人体轮廓时，电子设备可以采用光流法、帧差法、背景减除法进行确定，具体的，光流法中光流是指在视觉传感器的成像平面上对空间物体表面上的点的瞬时运动速度的表达，是指利用图像中的像素在时间域上的变化及通过相邻帧之间的相关性来找到当前帧和上一帧之间的对应关系，从而得到上一帧与当前帧之间用户的运动信息。帧差法是指在摄像机视场中，拍摄的相邻帧之间的背景区域几乎相差不大，通过差分是可以相互抵消的，当运动目标进入视场中，相邻帧图像中前景目标出现区域会有明显的差别，运动目标是通过对相邻帧图像进行差分得到的，然后对其给定一个合理的阈值进行处理得到二值图像，最后通过对前景区域进行分析判断是否存在运动目标，依据原理，当将两帧图像进行差分时，具有相同像素的背景区域部分将会项目抵消，而具有差异的前景目标部分会被显示出来。背景减除法的基本思想是通过将当前帧图像与背景帧图像之间进行对比并找到两者之间的差异来实现人体运动目标检测，背景减除法能比较完整的提取前景目标。具体的，如何通过光流法、帧差法、背景减除法确定图像中用户的人体轮廓为现有技术，在此不再赘述。

图3为本申请实施例提供的一种确定出的人体轮廓示意图。

图3为所确定出的多个图像中的人体轮廓示意图，由图3可知，即使用户的姿势不同，仍可准确地确定出图像中的人体轮廓。

S102：根据获取到的每个位置信息，确定所述图像中所述用户的中心点的位置信息，根据所述位置信息及所述中心点的位置信息，确定每个预设身体部位与所述中心点的距离。

在获取到图像中每个预设身体部位及对应的位置信息之后，电子设备可以确定图像中用户的中心点的位置信息，具体的，电子设备可以确定每个预设身体部位的中心点的位置信息，为用户的中心点的位置信息。在确定用户的中心点的位置信息后，电子设备可以针对每个预设身体部位，根据该预设身体部位的位置信息及用户的中心点的位置信息，确定该预设身体部位与中心点之间的距离，具体的，在已知两个位置信息的情况下，如何确定这两个位置信息之间的距离为现有技术，在此不再赘述，电子设备还可以确定图像中用户的质心的位置信息。

图4为本申请实施例提供的一种图像中用户的中心点示意图。

图4中每条线重合的点即为图像中用户的中心点，图像中每条线的距离分别为每个预设身体部位与中心点的距离。

S103：将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

为了准确地进行身份识别，电子设备本地保存有预先训练完成的身份识别模型，在确定每个预设身体部位在图像中的位置信息，及每个预设身体部位与中心点的距离后，电子设备可以将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型中，并获取该身份识别模型的输出，该输出即为待识别图像中包含的用户的身份，该身份可以为用户的姓名、用户的身份证号码等。其中，该身份识别模型可以为最近邻分类器(K-Nearest Neighbor，KNN)、支持向量机(Support Vector Machine，SVM)等。

其中，电子设备可以将获取到的每个位置信息及每个距离按照预设方式拼接组合成特征向量，并将该特征向量输入身份识别模型中，具体的，可以保存有信息类型与分量位置的对应关系，例如保存有第一预设身体部位在图像的位置信息与第一个分量的对应关系，电子设备可以针对获取到的每个信息，该每个信息即为获取到的每个位置信息及每个距离，根据保存的信息类型与分量位置的对应关系，确定该信息的信息类型对应的目标分量位置，将该信息放置于该目标分量位置处，从而生成对应的特征向量。例如可以将第一预设身体部位在图像的位置信息放置于特征向量的第一个分量处，将第二预设身体部位与中心点的距离放置于特征向量的最后一个分量处。

例如，预设身体部位为头部、双手、双脚，且所确定出的中心点的位置信息为(x1，y1)，头部的位置信息为(x2，y2)，左手(用户的左右)的位置信息为(x3，y3)，右手(用户的左右)的位置信息为(x4，y4)，左脚(用户的左右)的位置信息为(x5，y5)，右脚(用户的左右)的位置信息为(x6，y6)，头部、左手、右手、左脚、右脚与用户的中心点的距离分别为r1、r2、r3、r4、r5，则表示步态特征的向量，即输入身份识别模型的向量可以为[x2，y2，x3，y3，x4，y4，x5，y5，x6，y6，r1，r2、r3，r4，r5]。此处所描述的向量中的分量均表示静态特征。

为了进一步提高身份识别的准确性，电子设备在确定用户的中心点的位置信息后，可以将中心点确定为原点，并将第一预设方向确定为坐标系的x轴正方向，将第二预设方向确定为坐标系的y轴正方向，其中，该第一预设方向可以为水平向右(图像中的左右)的方向，第二预设方向可以为竖直向上(图像中的上下)的方向。并在重新建立坐标系后，确定每个预设身体部位在该重新建立的坐标系中的位置信息，采用重新确定后的位置信息进行身份的识别。由于重新建立坐标系，并基于重新建立的坐标系确定每个预设身体部位的位置信息，可以避免用户在图像中所处的区域不同，导致的位置信息相差较大，进而身份识别错误的问题，进一步提高身份识别的准确性。

由于在本申请实施例中，电子设备在进行身份识别时，通过预先训练完成的身份识别模型进行识别，并且根据每个预设身体部位在图像中的位置信息，及每个预设身体部位与中心点的距离进行识别，进而提高身份识别的准确性。

实施例2：

为了准确地确定每个预设身体部位及对应的位置信息，在上述实施例的基础上，在本申请实施例中，所述识别所述图像中的用户的每个预设身体部位及对应的位置信息包括：

将所述图像输入预先训练完成的身体部位识别模型中，获取所述身体部位识别模型输出的所述图像中的用户的每个预设身体部位及对应的位置信息。

为了准确地确定每个预设身体部位及对应的位置信息，电子设备本地保存有预先训练完成的身体部位识别模型，电子设备在接收到包含待识别身份的用户的图像后，可以将该图像输入预先训练完成的身体部位识别模型中，并获取该身体部位识别模型的输出，该输出即为图像中用户的每个预设身体部位及对应的位置信息。其中，身体部位识别模型输出的可以是用户的每个预设身体部位及每个预设身体部位所在的区域对应的检测框，电子设备可以针对每个预设身体部位，将该预设身体部位所在的区域对应的检测框的中心点或左上角(图像中的左右)的点或其他预设点位的位置信息，确定为该预设身体部位对应的位置信息。

图5为本申请实施例提供的一种身体部位识别模型的输出示意图。

由图5可知，身体部位识别模型的输出可以包括每个预设身体部位所在的区域对应的检测框，且该每个预设身份部位指的是头部、双手及双脚。

需要说明的是，上述实施例所描述的人体运动目标检测方法不能精确到人体姿态的检测，存在较大的干扰性，无论是光流法、帧差法，对环境的依懒性很强。当图像出现异常或者抖动情况时，人体轮廓容易出现错误检测的情况，此外采用背景减除法确定人体轮廓时，需要先获取背景帧图像，而获取到的背景帧图像不一定准确。此外，人体关键点检测方案中需要提前进行数据标注，且深度学习模型建模较为困难。而本申请实施例提供的身体部位识别模型可以准确地获取到图像中每个预设身体部位及对应的位置信息，进而进行身份识别。

为了准确地确定用户的身份，在上述各实施例的基础上，在本申请实施例中，所述接收包含待识别身份的用户的图像包括：

接收包含待识别身份的用户的图像，及包含所述图像的视频；

所述识别所述图像中的用户的每个预设身体部位及对应的位置信息之后，所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型之前，所述方法还包括：

针对所述视频中的每个视频帧图像，识别该视频帧图像中用户的脚部对应的位置信息，确定用户的脚部之间的距离；根据所述视频中与该视频帧图像相邻的其他视频帧图像，确定所述距离是否为距离最大值；

确定所述视频中采集时间在所述图像之前及之后确定的首个为距离最大值的两帧目标图像，确定所述两帧目标图像之间的时间间隔；

所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型。

步态是种时空运动，是周期性变化的，不同用户的步态变化的周期不同，为了进一步提高用户的身份识别的准确性，电子设备可以确定用户双脚之间距离为最大值时的时间间隔，采用该时间间隔表示步态变化的周期，将该时间间隔输入预先训练完成的身份识别模型中，进而准确地确定用户的身份。具体的，电子设备在接收图像时，还可以接收包含图像的视频，其中，该视频为包含待识别用户的视频，电子设备可以针对视频中每个视频帧图像，识别该视频帧图像中用户的脚部对应的位置信息，具体的，可以将该视频帧图像输入预先训练完成的脚部识别模型，获取该脚部识别模型输出的用户的脚部所在的区域对应的检测框，电子设备可以将该检测框的中心点、最左上侧(图像中的上下左右)的点的位置信息确定为脚部的位置信息，通过该方式电子设备即可确定出用户的两个脚部的位置信息。电子设备还可以在识别出的图像中每个预设身体部位及对应的位置信息中，获取脚部的位置信息。

在识别出用户的脚部的位置信息之后，电子设备可以确定用户的脚部之间的距离，即用户的双脚之间的距离，并根据视频中与该视频帧图像相邻的其他视频帧图像对应确定的脚部之间的距离，是否小于该视频帧图像对应确定的脚部之间的距离，确定该视频帧图像对应确定的距离是否为距离最大值，若相邻的其他视频帧图像对应确定的脚部之间的距离，均小于该视频帧图像对应确定的脚部之间的距离，则说明该图像为步态是极大值时的图像，也就是说该视频真图像对应确定的距离为距离最大值。电子设备通过该方式即可确定每个步态是极大值时的视频帧图像。

电子设备可以确定视频中采集时间在接收到的图像之前的首个为距离最大值的目标图像，例如，所确定出的为距离最大值的图像分别为图像a、图像b及图像c，若接收到的图像在图像b及图像c之间，则该目标图像即为图像b。电子设备还确定视频中采集时间在接收到的图像之后的首个为距离最大值的目标图像，例如，所确定出的为距离最大值的图像分别为图像a、图像b、图像c及图像d，若接收到的图像在图像b及图像c之间，则该目标图像即为图像c。在确定该两个目标图像之后，电子设备可以确定两个目标图像之间的时间间隔，该时间间隔可以被称为步态的周期性特征。

在获取到该时间间隔之后，电子设备可以将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型中，获取身份识别模型输出的图像中待识别用户的身份，进而提高身份识别的准确性。

本申请实施例中所确定的时间间隔为动态特征，输入到身份识别模型中的特征不仅包含图像中预设身体部位的位置信息及与用户的中心点的距离等静态特征，还包括时间间隔这一动态特征，可以提高身份识别的准确性。

图6为本申请实施例提供的一种人体轮廓示意图。

其中，图6为相邻的视频帧图像中的人体轮廓示意图，由图6可知，用户行走时双脚之间的距离具有周期性，图6中同一行的图像为双脚之间的距离较为接近的图像。

需要说明的是，电子设备在将所确定的获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型中时，可以将视频中针对每一帧图像所获取到的每个位置信息、每个距离及时间间隔均输入预先训练完成的身份识别模型中，进一步提高身份识别的准确性。

实施例3：

为了进一步提高身份识别的准确性，在上述各实施例的基础上，在本申请实施例中，所述根据所述视频中与该视频帧图像相邻的视频帧图像，确定所述距离是否为距离最大值之后，所述将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型之前，所述方法还包括：

确定每两个相邻的确定的为距离最大值的图像的时间间隔的平均值；

所述将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离、所述时间间隔及所述平均值输入预先训练完成的身份识别模型。

由于在实际应用场景中，用户行走时，随着用户行走速度的不同，步态变化的周期可能不同，为了提高身份识别的准确性，电子设备可以确定步态变化的时间间隔的平均值，根据该平均值进行身份识别，具体的，电子设备在确定视频中对应的距离为距离最大值的图像之后，获取相邻的两个确定为距离最大值的图像的时间间隔，并确定获取到的每个时间间隔的平均值，在进行身份识别时，将获取到的每个位置信息、每个距离、时间间隔及该平均值输入预先训练完成的身份识别模型中，并获取身份识别模型输出用户的身份。

图7为本申请实施例提供的一种身份识别过程的详细示意图，该过程包括以下步骤：

此处以将获取到的时间间隔及平均值均输入身份识别模型中为例进行介绍。并且此处以先确定每个预设身体部位与用户的中心点的距离，后确定双脚之间距离为距离最大值的图像之间的时间间隔为例进行介绍。

S701：接收包含待识别身份的用户的图像及包含该图像的视频。

S702：识别图像中的用户的每个预设身体部位及对应的位置信息。

S703：根据图像中每个预设身体部位的位置信息，确定图像中用户的中心点的位置信息。

S704：确定每个预设身体部位与用户的中心点的距离。

S705：识别视频中每个图像中用户的脚部之间的距离，并确定距离为距离最大值的每个图像。

S706：确定视频中采集时间在图像之前及之后确定的首个为距离最大值的两帧目标图像，确定两帧目标图像之间的时间间隔。

S707：确定获取到的每个时间间隔的平均值。

S708：将获取到的每个位置信息、每个距离、时间间隔、平均值输入预先训练完成的身份识别模型。

S709：获取身份识别模型输出的图像中用户的身份。

实施例4：

为了进一步提高身份识别的准确性，在上述各实施例的基础上，在本申请实施例中，所述接收包含待识别身份的用户的图像之后，所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型之前，所述方法还包括：

识别所述图像中的所述用户所在区域对应的检测框；确定所述检测框的长宽比；

所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离及所述长宽比输入预先训练完成的身份识别模型。

由于不同用户的身高、身材不同，为了进一步提高身份识别的准确性，电子设备可以确定用户所在区域对应的检测框的长宽比，基于该长宽比确定用户的身份。电子设备在接收到包含待识别身份的用户的图像之后，识别图像中用户所在区域对应的检测框，具体的，为了识别用户所在区域对应的检测框，电子设备本地可以保存有用户识别模型，电子设备可以将该图像输入用户识别模型中，该用户识别模型输出用户所在的区域对应的检测框，其中，输出的可以是该检测框左上角及右下角(图像中的上下左右)的位置信息，电子设备可以确定该检测框的长宽比。在进行身份识别时，可以将获取到的每个位置信息、每个距离及该长宽比输入身份识别模型中，由身份识别模型进行识别。

采用位置信息和距离多种特征组合的方式进行身份识别，同时兼顾周期性特征和静态特征，存储方式方便，计算简单，运行速度快。

其中，确定步态特征一般需要复杂的建模方式和手段，涉及到轮廓提起和分割，特征筛选和分离，需要将图像进行多维度的转换，识别精度差。步态特征筛选表示复杂，特征维度多，存在信息冗余，保存和再次处理困难，对计算和存储的以及实时性有一定的要求。而本申请实施例所提及的步态特征可以精准的表示用户行走时的静态特征及动态特征，进而可以准确地进行身份识别。

实施例：

为了提高身份识别模型识别的准确性，在上述各实施例的基础上，在本申请实施例中，所述身份识别模型为单层感知机(back propagation，BP)神经网络模型。

在本申请实施例中，身份识别模型可以为BP神经网络模型。

需要说明的是，在识别方面BP神经网络模型是一种按照误差逆向传播算法训练的多层前馈神经网络。它通过信号的前向传播和误差的反向传播，不断调节相应层之间的权重和偏置，最终达到良好的分类效果。设置含有3个隐含层，该隐含层节点数为20。激活函数为tang函数。且SVM及ANN，适合小数据样本的识别和分类，无法满脚大数据的要求，而BP神经网络模型可以满脚大数据的要求。使用BP神经网络模型进行身份识别，相对于SVM、KNN等，计算速度快，精度高，对大大数据特征有很好的适用性。

为了准确地进行预设身体部位及对应的位置信息的识别，在上述各实施例的基础上，在本申请实施例中，所述身体部位识别模型为特征金字塔(Feature Pyramid Network，FPN)+完全注意力网络(posterior attentional net，PAN)结构的模型。

在本申请实施例中，身体部位识别模型可以为FPN+PAN结构的模型。

本申请实施例中是直接采用深度学习目标检测的方法。基于卷积神经网络(Convolutional Neural Network，CNN)的目标检测算法主要有两条技术发展路线，分别为单阶段目标检测和两阶段目标检测。两阶段目标检测由于存在过多的重复计算的地方推理速度慢的问题，故本申请实施例中采用一阶段目标检测中最常用的YOLO目标检测算法进行预设身体部位检测和提取。且本申请实施例中的YOLO目标检测算法，采用FPN+PAN的结构，FPN是自顶向下，将高层的强语义特征传递下来，对整个金字塔进行增强，只增强了语义信息，对定位信息没有传递。PAN就是针对这一点，在FPN的后面添加一个自底向上的金字塔，对FPN补充，将低层的强定位特征传递上去，又被称之为“双塔战术”。可以实现对深层次特征有效提取。本申请实施例中采用的单目标检测中的yolov5目标检测器。检测精度高，目标对象提取速度快。且可以实现对人，头，手，脚等人体多个预设身体部位的确定。

图8为本申请实施例提供的一种身体部位识别模型的结构的示意图。

图8中(a)部分为FPN，图8中(b)部分为PAN，图8中(c)部分的网络层表示对PAN中每一网络层的输出进行特征融合，图8中(d)部分的网络层的输出即为图像中每个预设身体部位及对应的位置信息。图8中(e)部分的网络层在本申请实施例中并未应用，在此不做详细解释。

实施例6：

图9为本申请实施例提供的一种身份识别装置结构示意图，所述装置包括：

接收识别模块901，用于接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息；

确定模块902，用于根据获取到的每个位置信息，确定所述图像中所述用户的中心点的位置信息，根据所述位置信息及所述中心点的位置信息，确定每个预设身体部位与所述中心点的距离；

处理模块903，用于将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

在一种可能的实施方式中，所述接收识别模块901，具体用于将所述图像输入预先训练完成的身体部位识别模型中，获取所述身体部位识别模型输出的所述图像中的用户的每个预设身体部位及对应的位置信息。

在一种可能的实施方式中，所述接收识别模块901，具体用于接收包含待识别身份的用户的图像，及包含所述图像的视频；

所述处理模块903，还用于针对所述视频中的每个视频帧图像，识别该视频帧图像中用户的脚部对应的位置信息，确定用户的脚部之间的距离；根据所述视频中与该视频帧图像相邻的其他视频帧图像，确定所述距离是否为距离最大值；确定所述视频中采集时间在所述图像之前及之后确定的首个为距离最大值的两帧目标图像，确定所述两帧目标图像之间的时间间隔；

所述处理模块903，具体用于将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型。

在一种可能的实施方式中，所述处理模块903，还用于确定每两个相邻的确定的为距离最大值的图像的时间间隔的平均值；

所述处理模块903，具体用于将获取到的每个位置信息、每个距离、所述时间间隔及所述平均值输入预先训练完成的身份识别模型。

在一种可能的实施方式中，所述处理模块903，还用于识别所述图像中的所述用户所在区域对应的检测框；确定所述检测框的长宽比；

所述处理模块903，具体用于将获取到的每个位置信息、每个距离及所述长宽比输入预先训练完成的身份识别模型。

实施例7：

图10为本申请实施例提供的一种电子设备结构示意图，在上述各实施例的基础上，本申请实施例还提供了一种电子设备，如图10所示，包括：处理器1001、通信接口1002、存储器1003和通信总线1004，其中，处理器1001，通信接口1002，存储器1003通过通信总线1004完成相互间的通信；

所述存储器1003中存储有计算机程序，当所述程序被所述处理器1001执行时，使得所述处理器1001执行如下步骤：

接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息；

将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

进一步地，所述处理器1001，具体用于将所述图像输入预先训练完成的身体部位识别模型中，获取所述身体部位识别模型输出的所述图像中的用户的每个预设身体部位及对应的位置信息。

进一步地，所述处理器1001，具体用于接收包含待识别身份的用户的图像，及包含所述图像的视频；

所述处理器1001，还用于针对所述视频中的每个视频帧图像，识别该视频帧图像中用户的脚部对应的位置信息，确定用户的脚部之间的距离；根据所述视频中与该视频帧图像相邻的其他视频帧图像，确定所述距离是否为距离最大值；

确定所述视频中采集时间在所述图像之前及之后确定的首个为距离最大值的两帧目标图像，确定所述两帧目标图像之间的时间间隔；

所述处理器1001，具体用于将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型。

进一步地，所述处理器1001，还用于确定每两个相邻的确定的为距离最大值的图像的时间间隔的平均值；

所述处理器1001，具体用于将获取到的每个位置信息、每个距离、所述时间间隔及所述平均值输入预先训练完成的身份识别模型。

进一步地，所述处理器1001，还用于识别所述图像中的所述用户所在区域对应的检测框；确定所述检测框的长宽比；

所述处理器1001，具体用于将获取到的每个位置信息、每个距离及所述长宽比输入预先训练完成的身份识别模型。

上述服务器提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(Non-Volatile Memory，NVM)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述处理器可以是通用处理器，包括中央处理器、网络处理器(NetworkProcessor，NP)等；还可以是数字指令处理器(Digital Signal Processing，DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。

实施例8：

在上述各实施例的基础上，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

所述存储器中存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行如下步骤：

接收包含待识别身份的用户的图像，识别所述图像中的用户的每个预设身体部位及对应的位置信息；

将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型，获取所述身份识别模型输出的所述用户的身份。

在一种可能的实施方式中，所述识别所述图像中的用户的每个预设身体部位及对应的位置信息包括：

将所述图像输入预先训练完成的身体部位识别模型中，获取所述身体部位识别模型输出的所述图像中的用户的每个预设身体部位及对应的位置信息。

在一种可能的实施方式中，所述接收包含待识别身份的用户的图像包括：

接收包含待识别身份的用户的图像，及包含所述图像的视频；

确定所述视频中采集时间在所述图像之前及之后确定的首个为距离最大值的两帧目标图像，确定所述两帧目标图像之间的时间间隔；

所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型。

在一种可能的实施方式中，所述根据所述视频中与该视频帧图像相邻的视频帧图像，确定所述距离是否为距离最大值之后，所述将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型之前，所述方法还包括：

确定每两个相邻的确定的为距离最大值的图像的时间间隔的平均值；

所述将获取到的每个位置信息、每个距离及所述时间间隔输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离、所述时间间隔及所述平均值输入预先训练完成的身份识别模型。

在一种可能的实施方式中，所述识别所述图像中的用户的每个预设身体部位及对应的位置信息之后，所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型之前，所述方法还包括：

识别所述图像中的所述用户所在区域对应的检测框；确定所述检测框的长宽比；

所述将获取到的每个位置信息及每个距离输入预先训练完成的身份识别模型包括：

将获取到的每个位置信息、每个距离及所述长宽比输入预先训练完成的身份识别模型。

在一种可能的实施方式中，所述身份识别模型为BP神经网络模型。

在一种可能的实施方式中，所述身体部位识别模型为FPN+PAN结构的模型。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：田志新;刘秦豫;朱恩庆;
专利申请人：新奥新智科技有限公司;

上一篇：一种测试用例生成方法及装置
下一篇：一种基于站内虚拟闭塞分区的进路关联闭塞分区确定方法