掌桥专利:专业的专利平台
掌桥专利
首页

一种确定人员档案封面的方法和设备

文献发布时间:2023-06-19 13:29:16


一种确定人员档案封面的方法和设备

技术领域

本申请涉及人工智能技术领域,尤其涉及一种确定人员档案封面的方法和设备。

背景技术

针对不同场景下,抓拍采集的各种人员图片需要进行归档处理,以便于后续管理人员档案。当前,归档处理的重要途径是将人员图片与人员档案系统中的各个人员的档案封面进行比对。根据人员图片与档案封面之间的相似度确定该人员图片所属的人员档案并进行归档。

由于抓拍采集的图片中人员的穿着、抓拍的角度、抓拍的环境等影响,可能导致同一人员图片与该人员的档案封面之间存在较大偏差,影响人员归档系统的精确率,并且可能存在人员图片无法归档,导致人员归档系统召回率低的问题;其中,无法归档的图像越多,召回率越低。

发明内容

本申请实施例提供了一种确定人员档案封面的方法和设备,用于提供精确的人员档案封面实现人员归档,提升人员归档系统的精确率和召回率。

为达到上述目的,本申请实施例提供如下技术方案:

第一方面,提供了一种确定人员档案封面的方法,包括:获取第一人员的目标图像集,其中,目标图像集包括多个目标图像,目标图像是表征人员特征的图像;基于人员特征的类型,对该多个目标图像进行聚类,得到多个类中心;其中,一种类型的人员特征对应至少一个类中心;根据该多个类中心确定第一人员的档案封面。

因历史档案封面的准确度不高,可能导致根据历史档案封面进行人员归档的第一人员档案中混有归档错误的图像(即不是第一人员的图像)。通过使用本技术方案,根据人员特征的类型确定第一人员档案封面,提升人员档案封面的代表能力,根据该第一人员档案封面进行第一人员归档,有助于提升人员归档系统的精确率和召回率。

在一种可能的实现方式中,基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心,包括:计算多个目标图像中的任意两个目标图像之间的相似度;根据多个目标图像中的任意两个目标图像之间的相似度的密度分布,从多个目标图像中确定多个真值图像;基于人员特征的类型,对多个真值图像进行聚类,得到多个类中心。

该种可能的实现方式,通过在目标图像中筛选得到真值图像,并采用真值图像确定类中心,计算机设备若按照该方法确定类中心,则有助于提高人员档案中所包含该人员图像的准确度,以及有助于提升人员档案封面的代表能力,从而提升人员档案系统的精确率和召回率。

在一种可能的实现方式中,多个目标图像包括第一目标图像和第二目标图像,根据多个目标图像中的任意两个目标图像之间的相似度的密度分布,从多个目标图像中确定多个真值图像,包括:如果第一目标图像与第二目标图像之间的相似度大于等于第一阈值,则确定第一目标图像与第二目标图像之间存在连接关系;如果目标图像集中与第一目标图像之间存在连接关系的目标图像的数量大于等于第二阈值,则第一目标图像为真值图像。

该种可能的实现方式,提供了基于目标图像的密度分布确定真值图像的具体实现方式,如果计算机设备按照该方法确定真值图像,则有助于提高人员档案中所包含该人员图像之间的相关性,从而提升人员档案封面的准确性。

在一种可能的实现方式中,人员特征的类型包括第一类型,第一类型为人员特征的类型中的任意一种;基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心,包括:若第一类型的目标图像的数量满足第一预设条件,则基于第一类型,对多个目标图像进行聚类,得到第一类型的类中心。

该种可能的实现方式,提供了选定人员特征的类型的具体实现方式,通过判断人员特征的类型所包含的目标图像的数量,确定聚类的类型,有助于提升由类中心确定的人员档案封面的代表能力,从而提升人员档案系统的精确率和召回率。

在一种可能的实现方式中,获取第一人员的目标图像集,包括:获取第一图像集,第一图像集包括多个第一图像,第一图像为表征人员特征的图像,第一图像与第一人员的历史档案封面的相似度大于等于第三阈值;基于第一图像,获取第二图像,第二图像与第一图像之间的相似度满足第二预设条件;基于多个第一图像和第二图像,确定第一人员的目标图像集。

该种可能的实现方式,提供了确定按照原先的档案封面归档遗漏的第一人员的图像,有助于后续确定第一人员的档案封面时,档案封面所参考的数据量充足,从而使得档案封面更具代表性。

在一种可能的实现方式中,基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心,包括:在目标图像集中确定基于人员特征的类型的第一类中心;其中,一种类型的人员特征对应至少一个第一类中心;根据第一类中心对目标图像集进行聚类,得到基于第一类中心的聚类结果;基于聚类结果重新确定第N类中心,并根据第N类中心对目标图像集进行聚类,得到基于第N类中心的聚类结果;N为大于1的整数;其中,一种类型的人员特征对应至少一个第N类中心;当第N类中心与第N-1类中心相同时,则将第N类中心确定为多个类中心。

该种可能的实现方式,提供了确定类中心的具体实现方式,通过聚类算法确定类中心用于确定人员档案的封面,有助于提升人员档案封面的代表能力,从而提升人员档案系统的精确率和召回率。

第二方面,提供了一种计算机设备,包括:用于执行第一方面提供的任意一种方法的功能单元,各个功能单元所执行的动作通过硬件实现或通过硬件执行相应的软件实现。例如,计算机设备可以包括:获取单元、确定单元和处理单元;获取单元,用于获取第一人员的目标图像集,其中,目标图像集包括多个目标图像,目标图像是表征人员特征的图像;处理单元,用于基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心;其中,一种类型的人员特征对应至少一个类中心;确定单元,用于根据多个类中心确定第一人员的档案封面。

第三方面,提供了一种计算机设备,包括:处理器和存储器。处理器与存储器连接,存储器用于存储计算机执行指令,处理器执行存储器存储的计算机执行指令,从而实现第一方面提供的任意一种方法。

第四方面,提供了一种芯片,该芯片包括:处理器和接口电路;接口电路,用于接收代码指令并传输至处理器;处理器,用于运行代码指令以执行第一方面提供的任意一种方法。

第五方面,提供了一种计算机可读存储介质,包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行第一方面提供的任意一种方法。

第六方面,提供了一种计算机程序产品,包括计算机执行指令,当计算机执行指令在计算机上运行时,使得计算机执行第一方面提供的任意一种方法。

第二方面至第六方面中的任一种实现方式所带来的技术效果可参见第一方面中对应实现方式所带来的技术效果,此处不再赘述。

附图说明

图1为本申请实施例提供的一种计算机设备的结构示意图;

图2为本申请实施例提供的一种确定人员档案封面的方法的流程示意图;

图3为本申请实施例提供的一种确定人员档案封面的方法的流程示意图;

图4为本申请实施例提供的一种确定目标图像的方法示意图;

图5为本申请实施例提供的一种真值图像与混值图像的关系示意图;

图6为本申请实施例提供的一种基于人员特征的类型划分真值图像的示意图;

图7为本申请实施例提供的一种确定人员特征的类型的初始化类中心的示意图;

图8为本申请实施例提供的一种真值图像聚类结果的示意图;

图9为本申请实施例提供的一种计算机设备的组成示意图。

具体实施方式

在本申请的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“多个”是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

本申请实施例提供了一种确定人员档案封面的方法,可应用于计算机设备。本申请实施例对计算机设备的具体形式不作任何限制。例如,计算机设备具体可以是终端装置,也可以是网络设备。其中,终端装置可以被称为:终端、用户设备(user equipment,UE)、终端设备、接入终端、用户单元、用户站、移动站、远方站、远程终端、移动设备、用户终端、无线通信设备、用户代理或用户装置等。终端装置具体可以是手机、增强现实(augmentedreality,AR)设备、虚拟现实(virtual reality,VR)设备、平板电脑、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personaldigital assistant,PDA)等。网络设备具体可以是服务器、基站等。其中,服务器可以是一个物理或逻辑服务器,也可以是有两个或两个以上分担不同职责的物理或逻辑服务器、相互协同来实现服务器的各项功能。

在硬件实现上,上述计算机设备可以通过如图1所示的计算机设备实现。如图1所示,为本申请实施例提供的一种计算机设备10的硬件结构示意图。计算机设备10可以用于实现上述计算机设备的功能。

图1所示的计算机设备10可以包括:处理器101、存储器102、通信接口103以及总线104。处理器101、存储器102以及通信接口103之间可以通过总线104连接。

处理器101是计算机设备10的控制中心,可以是一个通用中央处理单元(centralprocessing unit,CPU),也可以是其他通用处理器等。其中,通用处理器可以是微处理器或者是任何常规的处理器等。

作为示例,处理器101可以包括一个或多个CPU,例如图1中所示的CPU 0和CPU 1。

存储器102可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。

一种可能的实现方式中,存储器102可以独立于处理器101存在。存储器102可以通过总线104与处理器101相连接,用于存储数据、指令或者程序代码。处理器101调用并执行存储器102中存储的指令或程序代码时,能够实现本申请实施例提供的确定人员档案封面的方法。

另一种可能的实现方式中,存储器102也可以和处理器101集成在一起。

通信接口103,用于计算机设备10与其他设备通过通信网络连接,该通信网络可以是以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。通信接口103可以包括用于接收数据的接收单元,以及用于发送数据的发送单元。

总线104,可以是工业标准体系结构(industry standard architecture,ISA)总线、外部设备互连(peripheral component interconnect,PCI)总线或扩展工业标准体系结构(extended industry standard architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图1中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

需要指出的是,图1中示出的结构并不构成对计算机设备10的限定,除图1所示部件之外,计算机设备10可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

为了使得本申请实施例更加清楚,以下对与本申请实施例相关的概念和部分内容作简单介绍。

1、人员档案系统

人员档案系统用于管理人员档案。人员档案包括:人员姓名、人员年龄、人员履历和人员图像等信息。

2、人员档案封面

人员档案封面,用于代表该人员档案的图像。当前,可以采用一张或多张图像作为该人员的档案封面。

3、人员归档

人员归档,是指根据人员档案封面将同一人员图像聚集在一起的过程。其中,摄像头采集的人员图像或视频可以生成模型数据,该模型数据用于计算机设备识别其对应的图像,计算机设备根据人员档案封面的模型数据,实现人员归档。

如图2所示,为本申请提供的一种确定人员档案封面的方法的流程图。该方法包括:

S201、计算机设备获取第一人员的目标图像集,其中,目标图像集包括多个目标图像,目标图像是表征人员特征的图像。

人员特征是指人员个体的特征,包括人脸特征、人体躯干特征和服饰特征。

可以理解的是,表征人员特征的目标图像应当具备上述至少一个人员特征。目标图像集是由多个具备至少一个人员特征的目标图像组成。

可选的,计算机设备通过k阶近邻的方式获取第一人员的目标图像集,其中,k为大于等于1的整数。具体地,k为1时,第一人员的目标图像集为第一人员的第一图像集。该第一图像集为依据第一人员的历史档案封面进行人员归档后的第一图像集。其中,该第一图像集中包括多个第一图像,该第一图像为表征人员特征的图像。第一图像与第一人员的历史档案封面的相似度大于等于第三阈值。

可选的,计算机设备通过第一人员的ID获取第一人员的第一图像集。示例性的,在人员档案系统中,进行人员归档后的每个人员都具备人员ID,例如身份证号码等等。通过第一人员的ID获取第一人员的第一图像集。

当k大于1时,计算机设备以第一图像集为一阶临近点,获取k阶临近点作为第二图像,其中,第二图像与第一图像之间的相似度满足第二预设条件。将第一图像集与第二图像组成目标图像集。

以k为2,采用二阶近邻的方式,第二预设条件为大于等于第四阈值为例,将各个第一图像作为一阶临近点,将人员档案系统中除第一人员之外的其他人员的图像集中的图像和/或未归档的图像作为候选图像,计算机设备将满足第一图像与候选图像之间的相似度大于等于第四阈值的图像作为第二图像,该第二图像可能为按照历史档案封面归档遗漏的第一人员的图像。多个第一图像与至少一个第二图像组成目标图像集。

需要说明的是,本申请对上述图像之间相似度的阈值设定不作限制。第三阈值和第四阈值可以相同也可以不同。示例性的,第三阈值和第四阈值可以设定为90%。

可选的,第四阈值小于第三阈值,例如第三阈值为90%,第四阈值为85%。可以理解的是,阈值设定越大,图像之间的相似度越高,满足条件的图像越少。当第四阈值小于第三阈值时,计算机设备在人员档案系统中可能获取到数量更多的第二图像,从而扩大第一人员的目标图像集,有助于后续确定第一人员的档案封面时,档案封面所参考的数据量充足,从而使得档案封面更具代表性。

S202、计算机设备基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心;其中,一种类型的人员特征对应至少一个类中心。

当人员特征包括人脸特征时,该人员特征的类型可以是基于人脸的角度分类得到的。示例性的,人脸的角度可以包括左侧脸、右侧脸、正脸、俯视和仰视。

当人员特征包括人体躯干特征时,该人员特征的类型可以是基于人体躯干部位分类得到的。示例性的,人体躯干部位包括左臂、右臂、左腿、右腿、胸腔、左手、右手、头部等等。

当人员特征包括服饰特征时,该人员特征的类型可以是基于服饰的款式或颜色分类得到的。

需要说明的是,上述人员特征的类型是计算机设备根据目标图像的模型数据得到的。图像经过图像处理得到模型数据。图像的模型数据包括多维数据,多维数据用于计算机设备识别人员特征。示例性的,通过图像识别技术结合深度学习技术识别人体骨骼点,得到多维数据,该人体骨骼点构成上述人体躯干部位。计算机设备根据该多维数据识别人体躯干特征。

可选的,计算机设备计算多个目标图像中的任意两个目标图像之间的相似度;根据多个目标图像中的任意两个目标图像之间的相似度的密度分布,从多个目标图像中确定多个真值图像;基于人员特征的类型,对多个真值图像进行聚类,得到多个类中心。因人员档案封面的准确度不高或者人员归档方法的精确度不高等原因,可能导致第一人员档案中混有归档错误的图像(即不是第一人员的图像),即第一人员的目标图像集中混有不是第一人员的图像,从而导致目标图像不能表征第一人员特征。通过上述方法,有助于发现表征第一人员特征的真值图像,根据该真值图像确定第一人员档案封面,根据该第一人员档案封面进行第一人员归档,有助于提升人员归档系统的精确率和召回率。

具体地,多个目标图像包括第一目标图像和第二目标图像,计算机设备计算第一目标图像与第二目标图像之间的相似度。如果第一目标图像与第二目标图像之间的相似度大于等于第一阈值,则确定第一目标图像与第二目标图像之间存在连接关系;如果目标图像集中与第一目标图像之间存在连接关系的目标图像的数量大于等于第二阈值,则第一目标图像为真值图像。示例性的,目标图像包括图像A、图像B和图像C,假设图像A与图像B、图像C之间的相似度都满足第一阈值,则图像A与与图像B、图像C之间都存在连接关系,且与图像A存在连接关系的图像数量为2。若该图像数量2满足第二阈值,则图像A即为真值图像。

可以理解的是,采用上述方法确定目标图像是否为真值图像,有助于提高人员档案中所包含该人员图像之间的相关性,排除可信度较低的目标图像,从而提升人员档案封面的准确性。

可选的,人员特征的类型包括第一类型,第一类型为人员特征的类型中的任意一种;若第一类型的目标图像的数量满足第一预设条件,则基于第一类型,对多个目标图像进行聚类,得到第一类型的类中心。示例性的,假设人员特征包括人脸特征时,人员特征的类型包括左侧脸和右侧脸,第一预设条件为大于等于第五阈值。若基于左侧脸对应的人脸角度所划分得到的目标图像的数量大于等于第五阈值时,则基于左侧脸进行聚类,并获取该类型的类中心;若基于右侧脸对应的人脸角度所划分得到的目标图像的数量小于第五阈值时,则不采用该类型进行聚类。

通过上述方式判断人员特征的类型所包含的目标图像的数量,确定聚类的类型,有助于提升由类中心确定的人员档案封面的代表能力。

可选的,计算机设备通过以下方式确定多个类中心,包括:计算机设备在目标图像集中确定基于人员特征的类型的第一类中心。其中,一种类型的人员特征对应至少一个第一类中心,该第一类中心可以在人员特征的类型中分别随机选取。计算机设备根据第一类中心对目标图像集进行聚类,得到基于第一类中心的聚类结果;基于聚类结果重新确定第N类中心,并根据第N类中心对目标图像集进行聚类,得到基于第N类中心的聚类结果;N为大于1的整数;其中,一种类型的人员特征对应至少一个第N类中心;当第N类中心与第N-1类中心相同时,则将第N类中心确定为多个类中心。

示例性的,当人员特征包括人脸特征时,计算机设备能够分别得到左侧脸、右侧脸、正脸、俯视和仰视的类中心,每个类型中可以包括一个或多个类中心。可以理解的是,该一个或多个类中心为一个或多个目标图像。

S203、计算机设备根据多个类中心确定第一人员的档案封面。

根据上述步骤S203确定的多个类中心对应的目标图像确定第一人员的档案封面。

可选的,第一人员的档案封面可以包含一张图像或多张图像。将多个类中心对应的目标图像作为第一人员的档案封面集,通过该档案封面集进行后续第一人员图像的归档。或者,将该多个类中心对应的目标图像进行图像融合,融合后的图像作为第一人员的档案封面。

通过上述步骤S201-S203,根据人员特征的类型确定第一人员档案封面,提升人员档案封面的代表能力,根据该第一人员档案封面进行第一人员归档,有助于提升人员归档系统的精确率和召回率。

以下,以人脸特征作为人员特征的具体示例执行确定人员档案封面的方法,如图3所示,包括:

S301、计算机设备获取第一人员的目标图像集的用于表征人脸特征的多个目标图像。

如图4所示,每个圆形代表一个图像。其中,空白圆形为第一人员的第一图像,计算机设备可以直接将其作为目标图像。

或者,采用二阶近邻法,计算机设备根据第一图像在人员档案系统中进行全局搜索。示例性的,以第一图像为一阶邻近点,计算与在人员档案系统中的候选图像之间的相似度,将相似度大于等于第四阈值的第二图像作为二阶邻近点。该第二图像如图4所示的阴影圆形表示。计算机设备将第一图像与第二图像作为该多个目标图像,即图4中所示的所有圆形。

可选的,S302、计算机设备从多个目标图像中确定多个真值图像。

如图5所示,图中每个点为根据上述步骤S301确定的目标图像,计算机设备若确定任意两个目标图像之间的相似度大于等于第一阈值,则该两个目标图像之间存在连接关系。计算机设备计算每个目标图像存在连接关系的数量,将数量大于等于第二阈值的目标图像作为真值图像。图中所示的A为真值图像所在的区域,B为存在连接关系的数据量小于第二阈值的目标图像所在的区域,该存在连接关系的数量较少的图像可以称为混值图像。

需要说明的是,第二阈值为目标图像存在连接关系的数量,一般地,在计算机设备中预设第二阈值。或者,第二阈值可根据每个目标图像存在连接关系的数量按照从小到大的顺序进行排序,将排序后五分之一处所对应的数量作为第二阈值。示例性的,假设存在10个目标图像,该10个目标图像与其他图像之间存在连接关系的数量分别为5,6,8,9,3,4,5,7,7,2;将上述数量进行排序得到2,3,4,5,5,6,7,7,8,9;该排序十分之一处所对应的数量为3,则将大于等于该3的数量对应的目标图像作为真值图像。该第二阈值还可以为其他数值,本申请不作限制。

可选的,将目标图像存在连接关系的数量的多少作为该目标图像的密度分布,存在连接关系的数量越多,该目标图像的密度越大;反之,该目标图像的密度越小。计算机设备通过判断目标图像的密度分布确定该目标图像是否为真值图像。

S303、计算机设备基于人脸的角度,对该多个真值图像进行聚类,得到多个类中心。

步骤S303的具体实现可以包括以下步骤S11-14。

S11、计算机设备将多个真值图像基于人员特征的类型进行分类。

具体地,如图6所示,上述步骤S301-S302中,目标图像中包括构成人脸特征的多维数据,该多维数据中包括人脸的角度,计算机设备根据人脸的角度将图5中确定的区域A中的真值图像进行划分,如图6所示,分为左侧脸、右侧脸、俯视、仰视和正脸五个区域,该五个区域与五个人脸特征的类型一一对应。

需要说明的是,上述人脸的角度划分方式不限于上述五个区域,还可以包括更多或更少区域。

可选的,计算机设备将真值图像划分后,进行人员特征的类型的选择。若俯视所对应的区域中的真值图像的数量不满足第一预设条件时,则计算机设备不采用该人员特征的类型进行聚类。具体地,第一预设条件可以为大于等于第五阈值。其中,第五阈值为人员特征的类型中真值图像的数量的最小值,该第五阈值可以自行设定,本申请不作限制。例如,第五阈值为5,图6所示的五个区域中,俯视对应的区域所包含的真值图像的数量小于5,其他区域所包含的真值图像的数量大于等于5,则计算机设备将不采用俯视进行聚类,而采用其他四个区域所对应的人脸角度进行聚类。

通过上述选择人员特征的类型的方式,在计算机设备确定真值图像后,进一步地选取能够代表第一人员的人员特征的类型,排除真值图像数量较少的人员特征的类型,从而避免真值图像数量少,真值图像所表征的人员特征在后续人员归档时不便于参考。

S12、计算机设备在分类后的每个人员特征的类型中分别选取一个初始化类中心。

根据上述步骤S11中选取的人员特征的类型中,随机选取一个真值图像作为该人员特征的类型的初始化类中心。初始化类中心即为上述第一类中心。

如图7所示,以格纹圆形表示初始化类中心。在图6划分的五个区域中分别随机选取一个初始化类中心,a为仰视中的初始化类中心,b为正脸中的初始化类中心,c为右侧脸中的初始化类中心,d为俯视中的初始化类中心,e为左侧脸中的初始化类中心。

S13、计算机设备根据初始化类中心对真值图像进行聚类。

如图7所示,基于该五个初始化类中心,计算区域A中其他真值图像与该五个初始化类中心的相似度,其他真值图像选取相似度最高的类中心进行聚类,归为对应的人脸角度区域中。

S14、重复上述步骤S12、S13,直到所有的真值图像所属的区域不再变动。

具体地,在重复上述步骤S12的过程中,确定第N类中心,N为大于1的整数。执行步骤S13,根据第N类中心对真值图像进行聚类,直到所有真值图像所属的区域不再变动,即各个区域的类中心也不再变动。也可以理解为,第N类中心与第N-1类中心相同。

需要说明的是,一种类型的人员特征对应至少一个上述初始化类中心或第N类中心。

如图8所示,计算机设备得到将上述步骤S13中的真值图像聚类后的结果,分别获取五个类以及各个类中不再变动的类中心。

示例性的,以格纹圆形表示类中心。a’为仰视中的类中心,b’为正脸中的类中心,c’为右侧脸中的类中心,d’为俯视中的类中心,e’为左侧脸中的类中心。

通过上述步骤S11-S14,计算机设备完成真值图像的聚类过程,得到多个聚类结果。

S304、计算机设备根据该多个类中心确定第一人员的档案封面。

该步骤与上述步骤S203相同,不再赘述。

可选的,S305、计算机设备从第一人员的图像集中,删除混值图像对应的图像。

可选的,上述确定人员档案封面的方法还包括计算机设备从第一人员的图像集中,删除混值图像,其中,混值图像是多个图像中除真值图像之外的图像。示例性的,在步骤S302中确定真值图像,将目标图像中的其他图像删除,即删除混值图像。通过该种方式有助于减小计算机设备的管理负担,此外,还可以标记该混值图像,在后续重新确定第一人员档案封面的过程中,避免将该混值图像对应的图像包含在内,增加计算负担。

需要说明的是,步骤S305可以在上述步骤S302之后的任一步骤执行,对此不作限制。

通过上述步骤S301-S305,计算机设备针对获取的图像进行筛选,确定能够表征第一人员的真值图像,避免在确定人员档案封面的过程中,由于混入其他不属于第一人员的图像而导致影响档案封面代表第一人员的能力,根据真值图像确定的第一人员的档案封面更具代表性,有利于提升后续根据该档案封面进行人员归档的精确度和召回率。

上述主要从方法的角度对本申请实施例的方案进行了介绍。可以理解的是,计算机设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和软件模块中的至少一个。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对计算机设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

示例性的,图9示出了上述实施例中所涉及的计算机设备(记为计算机设备90)的一种可能的结构示意图,该计算机设备90包括获取单元901、确定单元902和处理单元903。获取单元901,用于获取第一人员的目标图像集,其中,目标图像集包括多个目标图像,目标图像是表征人员特征的图像。例如,图2所示的步骤S201,以及图3所示的步骤S301。处理单元902,用于基于人员特征的类型,对多个目标图像进行聚类,得到多个类中心;其中,一种类型的人员特征对应至少一个类中心。例如,图2所示的步骤S202,以及图3所示的步骤S302、S303、S305。确定单元903,用于根据多个类中心确定第一人员的档案封面。例如,图2所示的步骤S203,以及图3所示的步骤S304。

可选的,处理单元902,具体用于计算多个目标图像中的任意两个目标图像之间的相似度;根据多个目标图像中的任意两个目标图像之间的相似度的密度分布,从多个目标图像中确定多个真值图像;基于人员特征的类型,对多个真值图像进行聚类,得到多个类中心。

可选的,多个目标图像包括第一目标图像和第二目标图像,处理单元902,具体用于如果第一目标图像与第二目标图像之间的相似度大于等于第一阈值,则确定第一目标图像与第二目标图像之间存在连接关系;如果目标图像集中与第一目标图像之间存在连接关系的目标图像的数量大于等于第二阈值,则第一目标图像为真值图像。

可选的,人员特征的类型包括第一类型,第一类型为人员特征的类型中的任意一种;处理单元902,具体用于若第一类型的目标图像的数量满足第一预设条件,则基于第一类型,对多个目标图像进行聚类,得到第一类型的类中心。

可选的,获取单元901,具体用于获取第一图像集,第一图像集包括多个第一图像,第一图像为表征人员特征的图像,第一图像与第一人员的历史档案封面的相似度大于等于第三阈值;基于第一图像,获取第二图像,第二图像与第一图像之间的相似度满足第二预设条件;基于多个第一图像和第二图像,确定第一人员的目标图像集。

可选的,处理单元902,具体用于在目标图像集中确定基于人员特征的类型的第一类中心;其中,一种类型的人员特征对应至少一个第一类中心;根据第一类中心对目标图像集进行聚类,得到基于第一类中心的聚类结果;基于聚类结果重新确定第N类中心,并根据第N类中心对目标图像集进行聚类,得到基于第N类中心的聚类结果;N为大于1的整数;其中,一种类型的人员特征对应至少一个第N类中心;当第N类中心与第N-1类中心相同时,则将第N类中心确定为多个类中心。

可选的,计算机设备90中还包括存储单元904。存储单元904用于存储计算机执行指令,计算机设备中的其他单元可以根据存储单元904中存储的计算机执行指令执行相应的动作。

关于上述可选方式的具体描述可以参见前述的方法实施例,此处不再赘述。此外,上述提供的任一种计算机设备90的解释以及有益效果的描述均可参考上述对应的方法实施例,不再赘述。

作为示例,结合图1,计算机设备90中的获取单元901、处理单元902、确定单元903和存储单元904中的部分或全部实现的功能可以通过图1中的处理器101执行图1中的存储器102中的程序代码实现。获取单元901还可以通过图1中的通信接口103中的接收单元实现。

本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当该计算机程序在计算机上运行时,使得该计算机执行上文提供的任一种计算机设备所执行的方法。

关于上述提供的任一种计算机可读存储介质中相关内容的解释及有益效果的描述,均可以参考上述对应的实施例,此处不再赘述。

本申请实施例还提供了一种芯片。该芯片中集成了用于实现上述计算机设备90的功能的控制电路和一个或者多个端口。可选的,该芯片支持的功能可以参考上文,此处不再赘述。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可通过程序来指令相关的硬件完成。所述的程序可以存储于一种计算机可读存储介质中。上述提到的存储介质可以是只读存储器,随机接入存储器等。上述处理单元或处理器可以是中央处理器,通用处理器、特定集成电路(application specific integrated circuit,ASIC)、微处理器(digital signal processor,DSP),现场可编程门阵列(field programmable gatearray,FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。

本申请实施例还提供了一种包含指令的计算机程序产品,当该指令在计算机上运行时,使得计算机执行上述实施例中的任意一种方法。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如SSD)等。

应注意,本申请实施例提供的上述用于存储计算机指令或者计算机程序的器件,例如但不限于,上述存储器、计算机可读存储介质和通信芯片等,均具有非易失性(non-transitory)。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

尽管在此结合各实施例对本申请进行了描述,然而,在实施所要求保护的本申请过程中,本领域技术人员通过查看附图、公开内容、以及所附权利要求书,可理解并实现公开实施例的其他变化。在权利要求中,“包括”(comprising)一词不排除其他组成部分或步骤,“一”或“一个”不排除多个的情况。单个处理器或其他单元可以实现权利要求中列举的若干项功能。相互不同的从属权利要求中记载了某些措施,但这并不表示这些措施不能组合起来产生良好的效果。

尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

相关技术
  • 一种确定人员档案封面的方法和设备
  • 一种视频封面确定方法、装置、电子设备及可读存储介质
技术分类

06120113693378