掌桥专利:专业的专利平台
掌桥专利
首页

一种图像识别方法及装置

文献发布时间:2023-06-19 11:52:33


一种图像识别方法及装置

技术领域

本申请实施例涉及图像处理领域,尤其涉及一种图像识别方法及装置。

背景技术

随着计算机技术与视频图像技术的应用于推广,人脸识别已广泛应用在身份认证、人像对比等众多场景中。

跨年龄人脸识别是人脸识别的一个子方向,可以用于寻找走失老人和儿童,抓捕长期在逃人贩等。例如,摄像头拍摄到一张15岁左右的少年图像,通过跨年龄人脸识别方法在走失人口图像库中进行查找,得到该少年与走失人口图像库中的一个5岁儿童是同一人。

随着年龄的增长,人的面部特征会发生明显的变化,如何克服年龄变化对人脸识别的影响,成为了跨年龄人脸识别的关键。

目前,主要通过擦除人脸信息中的年龄信息实现跨年龄人脸识别,或者借助年龄参考字典实现跨年龄人脸识别。

但是,现有的跨年龄人脸识别方法实现人脸识别时,精度不高,提高跨年龄人脸识别的精度尤为重要。

发明内容

本申请提供一种图像识别方法及装置,提高了跨年龄人脸(人物面部)图像的识别精度。

为了达到上述目的,本申请采用如下技术方案:

第一方面,一种图像识别方法,该方法可以包括:获取目标面部图像的身份特征,身份特征为面部图像中可识别特征中除年龄特征之外的特征;根据目标面部图像的身份特征、样本库,选取样本库中第一样本面部图像作为目标面部图像的识别结果;其中,样本库包括一个或多个样本面部图像的人脸特征及年龄特征;人脸特征为面部图像中可识别特征,年龄特征用于指示面部图像中人物的拍照年龄;第一样本面部图像为样本库中人脸特征与目标面部图像相对于第一样本面部图像的第一特征满足第一条件的样本面部图像;目标面部图像相对于第一样本面部图像的第一特征为目标面部图像的身份特征与第一样本面部图像的年龄特征之和。

通过本申请提供的图像识别方法,将目标面部图像的身份特征与样本库中的样本面部图像的年龄特征相加,得到目标面部图像的第一特征,将目标面部图像的第一特征与样本库中的人脸特征比较得到识别结果。由于第一特征与样本库中样本面部图像人脸特征在年龄上对齐,因此,本申请的识别过程相当于将跨年龄的对比转换到同年龄的对比,这样一来,识别过程就相当于补偿了年龄特征对识别精度的影响,提高了跨年龄人脸识别的精度。

其中,第一条件可以根据用户的需求进行配置,本申请对此不做具体限定。

结合第一方面,在一种可能的实现方式中,可以通过将目标面部图像输入至第一神经网,得到目标图像的身份特征。其中,第一神经网络可以为收敛的卷积神经网络,或者收敛的全连接神经网或者其他。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,根据获取的目标面部图像的身份信息,与样本库中每个样本面部图像的特征进行并行对比,即分别与每个样本面部图像的特征进行对比,以实现选取样本库中的第一样本面部图像。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,根据获取的目标面部图像的身份信息,与样本库中的样本面部图像的特征按照预设顺序对比,以实现选取样本库中的第一样本面部图像。其中,预设顺序可以根据实际需求配置,本申请不予限定。

例如,预设顺序为编码从小到大的顺序,或者为拍照时间从现在到以前的顺序,或者其他顺序,本申请不予限定。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,该方法还可以包括:获取目标面部图像的拍照年龄范围;样本库包括当前年龄在拍照年龄范围内的样本面部图像的人脸特征及年龄特征。在这种可能的实现方式中,样本库是筛选后的当前年龄在拍照年龄范围内的样本面部图像的人脸特征及年龄特征,缩小了选择的范围,提升了图像识别的处理效率,同时提高了图像识别的精度。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,可以通过将目标面部图像输入至第五神经网,得到目标图像的拍照年龄范围。其中,第五神经网络可以为收敛的卷积神经网络,或者收敛的全连接神经网或者其他。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,图像识别装置将当前日期减去基本库中每个样本面部图像的出生日期,得到每个样本面部图像的当前年龄。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,图像识别装置将当前日期减去基本库中每个样本面部图像的拍照时间加上每个样本面部图像的拍照年龄,得到每个样本面部图像的当前年龄。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,当前日期可以根据目标面部图像的属性信息得到。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,第一条件可以包括:距离小于或等于阈值或者相似度大于等于限值或者其他。其中,阈值和限值可以根据用户的经验进行设置,本申请对此不予限定。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,相似度可以包括余弦相似度。

结合第一方面或上述任一种可能的实现方式,在一种可能的实现方式中,距离可以包括下述任一项:欧氏距离、马氏距离。

结合第一方面及上述一种可能的实现方式,在另一种可能的实现方式中,若样本库中存在多个候选样本面部图像,候选样本面部图像为样本库中人脸特征与目标面部图像相对于候选样本面部图像的第一特征满足第一条件的样本面部图像;选取样本库中第一样本面部图像作为目标面部图像的识别结果,包括:选择满足第二条件的候选样本面部图像作为第一样本面部图像。在该可能的实现方式中,对候选样本面部图像进行了进一步的判断,得到的第一样本面部图像与目标面部图像的相似度更高,进一步提高了图像识别方法的精度。

第二条件可以根据用户的需求进行配置,本申请不予限定。

结合第一方面及上述一种可能的实现方式,在另一种可能的实现方式中,第二条件可以包括距离最小。

结合第一方面及上述一种可能的实现方式,在另一种可能的实现方式中,第二条件可以包括相似度最大。

结合第一方面及上述一种可能的实现方式,在另一种可能的实现方式中,第二条件可以包括候选样本面部图像中人物的当前年龄与目标面部图像的拍照年龄范围的参考值的差值最小。其中,参考值可以为范围的中间值或者其他值。

第二方面,提供一种图像识别装置,该装置可以是图像识别系统中的服务器,也可以是服务器中的装置或者芯片系统,或者是能够和服务器匹配使用的装置。该图像识别装置可以实现上述各方面或者各可能的设计中所执行的功能,所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个上述功能相应的模块。如:该图像识别装置可以包括:第一获取单元、处理单元。

其中,第一获取单元,用于获取目标面部图像的身份特征,身份特征为面部图像中可识别特征中除年龄特征之外的特征。

处理单元,用于根据目标面部图像的身份特征、样本库,选取样本库中第一样本面部图像作为目标面部图像的识别结果。

其中,样本库包括一个或多个样本面部图像的人脸特征及年龄特征;人脸特征为面部图像中可识别特征,年龄特征用于指示面部图像中人物的拍照年龄;第一样本面部图像为样本库中人脸特征与目标面部图像相对于第一样本面部图像的第一特征满足第一条件的样本面部图像;目标面部图像相对于第一样本面部图像的第一特征为目标面部图像的身份特征与第一样本面部图像的年龄特征之和。

通过本申请提供的图像识别装置,将目标面部图像的身份特征与样本库中的样本面部图像的年龄特征相加,得到目标面部图像的第一特征,将目标面部图像的第一特征与样本库中的人脸特征比较得到识别结果。由于第一特征与样本库中样本面部图像人脸特征在年龄上对齐,因此,本申请的识别过程相当于将跨年龄的对比转换到同年龄的对比,这样一来,识别过程就相当于补偿了年龄特征对识别精度的影响,提高了跨年龄人脸识别的精度。

需要说明的是,第二方面提供的图像识别装置,用于执行上述第一方面提供的图像识别方法,具体实现可以参考上述第一方面的具体实现。

第三方面,本申请实施例提供一种图像识别装置,该图像识别装置可以包括:处理器,存储器;处理器,存储器耦合,存储器可用于存储计算机程序代码,计算机程序代码包括计算机指令,当计算机指令被图像识别装置执行时,使得图像识别装置执行如第一方面或任一种可能的实现方式面所述的图像识别方法。

第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质可以包括:计算机软件指令;当计算机软件指令在计算机中运行时,使得该计算机执行如第一方面或第一方面的可能实现方式中任一项所述的图像识别的方法。

第五方面,本申请实施例提供一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行如权利要求第一方面或任一种可能的实现方式中任一项所述的图像识别的方法。

第六方面,本申请实施例提供一种芯片系统,该芯片系统应用图像识别的装置;芯片系统包括接口电路和处理器;接口电路和处理器通过线路互联;接口电路用于从图像识别装置中的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令;当处理器执行该计算机指令时,芯片系统执行如第一方面或任一种可能的实现方式中任一项所述的图像识别的方法。

应当理解的是,本申请中对技术特征、技术方案、有益效果或类似语言的描述并不是暗示在任意的单个实施例中可以实现所有的特点和优点。相反,可以理解的是对于特征或有益效果的描述意味着在至少一个实施例中包括特定的技术特征、技术方案或有益效果。因此,本说明书中对于技术特征、技术方案或有益效果的描述并不一定是指相同的实施例。进而,还可以任何适当的方式组合本实施例中所描述的技术特征、技术方案和有益效果。本领域技术人员将会理解,无需特定实施例的一个或多个特定的技术特征、技术方案或有益效果即可实现实施例。在其他实施例中,还可在没有体现所有实施例的特定实施例中识别出额外的技术特征和有益效果。

附图说明

图1为本申请实施例提供的一种图像识别系统示意图;

图2为本申请实施例提供的一种图像识别装置示意图;

图3为本申请实施例提供的一种图像识别方法流程示意图;

图4为本申请实施例提供的一种通过对抗网络辅助训练第一神经网络的过程示意图;

图5为本申请实施例提供的另一种图像识别方法流程示意图;

图6为本申请实施例提供的一种图像识别装置图像识别过程示意图;

图7为本申请实施例提供的一种图像识别装置示意图;

图8为本申请实施例提供的另一种图像识别装置示意图。

具体实施方式

本申请说明书和权利要求书及上述附图中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于限定特定顺序。

在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。

在本申请的描述中,除非另有说明,“/”表示前后关联的对象是一种“或”的关系,例如,A/B可以表示A或B;本申请中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,其中A,B可以是单数或者复数。并且,在本申请的描述中,除非另有说明,“多个”是指两个或多于两个。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。

在本申请实施例中,至少一个还可以描述为一个或多个,多个可以是两个、三个、四个或者更多个,本申请不做限制。

为了便于理解,先对本申请涉及的名词进行解释。

面部图像,可以指包含人物面部的图像。面部图像也可以称为人物的面部图像、人脸图像或者人脸图片。

目标面部图像,可以指图像识别方法中作为识别对象的面部图像。例如,目标面部图像可以为图像采集装置实时采集的,或者,可以为管理员输入的面部图像。

特征,可以指用于量化面部图像的数学表达。示例性的,特征可以是一个向量或者矩阵。

人脸特征,可以指面部图像中可识别的特征。具体的,人脸特征可以为年龄特征与身份特征之和。人脸特征可以通过神经网络提取。

年龄特征,可以为用于指示年龄的特征。年龄特征可以通过神经网络提取,或者,通过年龄转换得到。

身份特征,可以指面部图像中可识别特征中除年龄特征之外的特征。人脸特征可以通过神经网络提取。

基本库,可以为包括一个或多个样本面部图像或者一个或多个样本面部图像的特征的数据库。一个样本面部图像的特征可以包括该样本面部图像的人脸特征及年龄特征。基本库中还可以包括每个样本面部图像的年龄信息,年龄信息可以包括下述信息中一项或多项:拍照年龄、拍照时间、出生日期。

样本库,可以用于存储图像识别方法中用于对比的一个或多个样本面部图像或者一个或多个样本面部图像的特征。一个样本面部图像的特征可以包括该样本面部图像的人脸特征及年龄特征。

拍照年龄,可以指拍摄该面部图像时人物的年龄。

当前年龄,可以指面部图像中的人物的在当前日期的年龄。具体的,基本库中一个样本面部图像的当前年龄可以为当前日期减去该样本面部图像中的人物的出生日期。

目标面部图像的识别结果,可以指与该目标面部图像相似的样本面部图像。

当前,实现跨年龄人脸识别的主要方法有两种。

方法1、通过擦除人脸信息中的年龄信息实现跨年龄人脸识别。

方法1的实现过程可以为:先获取通用人脸数据库和跨年龄人脸数据库,其中,跨年龄人脸数据库中包括多个按年龄分类的人脸图像;然后用该通用人脸数据库和按年龄分类的跨年龄人脸数据库对神经网络模型进行训练,使该神经网络可以擦除人脸图像中的年龄特征;再将需要对比的人脸图像(目标面部图像和样本面部图像)输入到该神经网络模型中,通过判断该神经网络输出的去掉年龄特征后的身份特征之间的相似度,确定目标面部图像的跨年龄人脸识别的结果。

方法2、借助年龄参考字典实现跨年龄人脸识别。

方法2的实现过程可以为:先根据外部人脸数据库构建跨年龄参照字典,跨年龄参照字典中包含了不同年龄段的不同局部块的高层次特征;然后获取需要识别的人脸图像的每个局部块的高层次特征;将需要对比的人脸图像(目标面部图像和样本面部图像)的每个局部块的高层次特征与跨年龄参照字典中的不同年龄段的不同局部块的高层次特征进行编码与池化,得到模糊了年龄信息的人脸特征,最后根据模糊了年龄信息的人脸特征之间的相似度,确定目标面部图像的跨年龄人脸识别的结果。

但是,方法1在擦除年龄信息的同时会擦除与年龄高度耦合的其他信息,例如皱纹等,造成了信息的丢失;方法2在引入年龄参考字典的同时会引入噪音,并且方法2中的跨年龄依赖于年龄参考字典的建立,年龄参考字典的差异会对最终的识别结果造成不确定性,从而影响系统的稳定。所以,由于随着年龄增长,面部会发生很大变化,利用上述方法实现跨年龄人脸识别时未考虑年龄因素,忽略了年龄对面部图像的影响,即忽略了年龄特征对识别精度的影响,因此识别精度都不高。

基于此,本申请实施例提供一种图像识别方法,通过将目标面部图像的身份特征与样本库中的样本面部图像的年龄特征相加,得到目标面部图像的第一特征,将目标面部图像的第一特征与样本库中的人脸特征比较得到识别结果。由于第一特征与样本库中样本面部图像人脸特征在年龄上对齐,因此,本申请的识别过程相当于将跨年龄的对比转换到同年龄的对比,这样一来,识别过程就相当于补偿了年龄特征对识别精度的影响,提高了跨年龄人脸识别的精度。

下面将结合附图对本申请实施例的实施方式进行详细描述。

本申请实施例提供的图像识别方法可以应用于图1所示的图像识别系统中。如图1所示,该图像识别系统可以包括服务器101及管理员102。

其中,管理员102用于对服务器101进行管理。可选的,管理员102可以通过终端设备对服务器101进行管理,或者,管理员102也可以直接对服务器101进行管理。

服务器101中用于按照本申请提供的方案进行图像识别。其中,服务器101中存储了样本库。服务器101进行图像识别的目标面部图像可以由管理员102输入。

进一步的,服务器101还可以向管理员102显示图像识别的结果;或者,服务器101还可以向管理员102显示“无识别结果”字样。

可选的,服务器101可以包括显示屏,服务器101通过显示屏向管理员102显示图像识别的结果。或者,服务器101可以通过终端设备的屏幕,向管理员102显示图像识别的结果。

服务器101可以是物理服务器,或者云服务器,或者其他具有数据处理能力与存储能力的设备,本申请对此不予限定。

可选的,如图1所示,图像识别系统中还可以包括图像采集器103,用于采集面部图像,并将采集的面部图像上传给服务器101。相应的,服务器101进行图像识别的目标面部图像可以由图像采集器103上传。

其中,图像采集器103可以是独立摄像头、手机摄像头、电脑摄像头、球机摄像头、增强现实(augmented reality,AR)\虚拟现实(virtual reality,VR)设备的摄像头等,本申请对此不予限定。

示例性的,图1示意的图像识别系统,可以用于寻找走失老人和儿童,或者抓捕长期在逃犯人等。

下面结合附图,对本申请的实施例提供的方案进行具体阐述。

一方面,本申请实施例提供一种图像识别装置,用于执行本申请提供的图像识别方法。该图像识别装置可以部署于图1所示的服务器101中,该图像识别装置可以为服务器101的部分或者全部。或者,该图像识别装置也可以单独部署,例如,图像识别装置为具有相关数据处理与存储能力的电子设备或者芯片系统。

图2示意了本申请实施例提供的一种图像识别装置20。如图2所示,图像识别装置20可以包括处理器201、存储器202以及收发器203。

下面结合图2对图像识别装置20的各个构成部件进行具体的介绍:

其中,存储器202可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(read-only memory,ROM),快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者上述种类的存储器的组合,用于存储可实现本申请方法的程序代码、配置文件、数据信息、图像信息或者其他内容。

处理器201是图像识别装置20的控制中心。例如,处理器201可以是一个中央处理器(central processing unit,CPU),也可以是特定集成电路(application specificintegrated circuit,ASIC),或者是被配置成实施本申请实施例的一个或多个集成电路,例如:一个或多个微处理器(digital singnal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA)。

收发器203用于图像识别装置20与其他设备的信息交互。例如,收发器203用于图像识别装置20与图像采集器之间的信息交互。

可选的,如图2所示,图像识别装置20还可以包括图像采集器204。图像采集器204用于采集人物面部图像。

具体的,处理器201通过运行或执行存储在存储器202内的软件程序和/或模块,执行如下功能:

获取目标面部图像的身份特征,身份特征为面部图像中可识别特征中除年龄特征之外的特征;根据目标面部图像的身份特征、样本库,选取样本库中第一样本面部图像作为目标面部图像的识别结果;其中,样本库包括一个或多个样本面部图像的人脸特征及年龄特征;人脸特征为面部图像中可识别特征,年龄特征用于指示面部图像中人物的拍照年龄;第一样本面部图像为样本库中人脸特征与目标面部图像相对于第一样本面部图像的第一特征满足第一条件的样本面部图像;目标面部图像相对于第一样本面部图像的第一特征为目标面部图像的身份特征与第一样本面部图像的年龄特征之和。

另一方面,本申请实施例提供一种图像识别方法,如图3所示,该方法可以包括:

S301、图像识别装置获取目标面部图像的身份特征。

具体的,S301可以包括但不限于步骤A和步骤B。

步骤A、图像识别装置获取目标面部图像。

一种可能的实现方式中,图像识别装置可以将图像采集器采集上传的面部图像作为目标面部图像。

另一种可能的实现方式中,图像识别装置可以将管理员输入的面部图像作为目标面部图像。

需要说明的是,目标面部图像可以是一张或者多张面部图像,本申请的实施例以目标面部图像为一张面部图像为例进行说明,其他不再一一赘述。

步骤B、图像识别装置获取目标面部图像的身份特征。

具体的,图像识别装置可以将目标面部图像输入用于提取身份特征的第一神经网络,第一神经网络的输出则为目标面部图像的身份特征。

其中,第一神经网络可以为卷积神经网络或者全连接神经网络或其他。第一神经网络是训练至收敛的神经网络,对于训练第一神经网络的方法本申请不予限定。

可选的,第一神经网络可以由图像识别装置训练,或者由其他设备训练至收敛后配置于图像识别装置中。

示例性的,图4示意了一种通过对抗网络辅助训练第一神经网络的过程,该训练过程可以为:将面部图像输入第一神经网络,第一神经网络输出面部图像对应的人脸特征,将该人脸特征输入对抗网络,对抗网络输出与面部图像对应的年龄范围,同时对抗网络根据年龄范围得到年龄梯度信息,其中,该年龄梯度信息不属于面部图像对应的年龄范围;对抗网络将年龄梯度信息反向传给第一神经网络,干扰第一神经网络根据面部图像生成关于年龄相关的特征。可以通过多组面部图像对第一神经网络进行同样的训练,直至第一神经网络收敛。

S302、图像识别装置根据目标面部图像的身份特征、样本库,选取样本库中第一样本面部图像作为目标面部图像的识别结果。

其中,样本库可以包括一个或多个样本面部图像的人脸特征及年龄特征。

具体的,可以根据实际需求确定本文描述的样本库,本申请对于确定样本库的方式不予限定。可选的,确定样本库的方式可以包括但不限于下述两种方式。

第一种实现:将基本库转换为样本库。

一种可能的实现方式中,基本库中包括多个样本面部图像,可以将基本库中每个样本面部图像输入神经网络提取其人脸特征及年龄特征,将基本库中每个样本面部图像的人脸特征及年龄特征记录作为样本库。

另一种可能的实现方式中,基本库中包括多个样本面部图像及每个样本面部图像的拍照年龄,可以将基本库中每个样本面部图像输入神经网络提取其人脸特征,将基本库中每个样本面部图像的拍照年龄输入神经网络得到年龄特征,将基本库中每个样本面部图像的人脸特征及年龄特征记录作为样本库。

另一种可能的实现方式中,基本库中包括多个样本面部图像及每个样本面部图像的出生日期和拍照时间,可以将每个样本面部图像的拍照时间减去出生日期得到拍照年龄,将基本库中每个样本面部图像输入神经网络提取其人脸特征,将基本库中每个样本面部图像的拍照年龄输入神经网络得到年龄特征,将基本库中每个样本面部图像的人脸特征及年龄特征记录作为样本库。

再一种可能的实现方式中,基本库中也可以包括多个样本面部图像的人脸特征及年龄特征,那么在第一种实现中,可以直接将基本库作为样本库。

第二种实现:从基本库中通过年龄筛选得到样本库。

在第二种实现中,可以根据目标面部图像的拍照年龄范围,从基本库中筛选当前年龄在该拍照年龄范围内的样本面部图像的人脸特征及年龄特征,作为样本库。第二种实现的具体过程,可以参照下述S303和S304的过程。

具体的,S302中图像识别装置可以根据S301中获取的目标面部图像的身份信息,与样本库中每个样本面部图像进行对比,以实现S302选取样本库中的第一样本面部图像。可选的,对比方式可以包括但不限于下述两种对比方式:

对比方式a、图像识别装置可以根据S301中获取的目标面部图像的身份信息,与样本库中每个样本面部图像的特征进行并行对比,即分别与每个样本面部图像的特征进行对比,以实现S302选取样本库中的第一样本面部图像。

对比方式b、图像识别装置可以根据S301中获取的目标面部图像的身份信息,与样本库中的样本面部图像的特征按照预设顺序对比,以实现S302选取样本库中的第一样本面部图像。其中,预设顺序可以根据实际需求配置,本申请不予限定。例如,预设顺序可以为编码从小到大的顺序,或者,也可以为拍照时间从现在到以前的顺序,或者其他顺序。

其中,图像识别装置可以根据S301中获取的目标面部图像的身份信息,与样本库中每个样本面部图像的特征的对比过程相同,此处以图像识别装置根据S301中获取的目标面部图像的身份信息,与样本库中一个样本面部图像(第二样本面部图像)的图像的特征对比为例进行说明,该对比过程可以包括S3021至S3023。

S3021、图像识别装置获取目标面部图像相对于第二样本面部图像的第一特征。

其中,目标面部图像相对于第二样本面部图像的第一特征为目标面部图像的身份特征与第二样本面部图像的年龄特征之和。

需要说明的是,用户可以根据经验调整用于得到身份特征的神经网络、用于得到年龄特征的神经网络,以及用于得到人脸特征的神经网络参数,使各个神经网络输出的身份特征、年龄特征、人脸特征的向量维度保持相同,便于身份特征、年龄特征、人脸特征直接进行相关计算。

S3022、图像识别装置判断目标面部图像相对于第二样本面部图像的第一特征与第二样本面部图像的人脸特征是否满足第一条件。

其中,第一条件可以根据实际需求配置。

例如,第一条件可以包括距离小于或等于阈值或者相似度大于等于限值或者其他。其中,阈值和限值可以根据用户的经验进行设置,本申请对此不予限定。

其中,该距离可以包括下述任一项:欧氏距离、马氏距离。相似度可以包括余弦相似度。

若S3022中判断目标面部图像相对于第二样本面部图像的第一特征与第二样本面部图像的人脸特征满足第一条件,将第二样本面部图像作为候选样本面部图像。

S3023、图像识别装置确定第一样本面部图像。

一种可能的实现方式中,在S3023中,对应于对比方式a,若样本库中仅存在一个候选样本面部图像,可以将该候选样本面部图像作为第一样本面部图像。

另一种可能的实现方式中,在S3023之后,对应于对比方式a,若样本库中存在多个候选样本面部图像,可以选择满足第二条件的候选样本面部图像作为第一样本面部图像。

其中,第二条件可以根据实际需求配置。

例如,第二条件可以包括距离最小或者相似度最大;或者,第二条件可以包括候选样本面部图像中人物的当前年龄与目标面部图像的拍照年龄范围的参考值的差值最小。其中,参考值可以为范围的中间值或者其他值。

另一种可能的实现方式中,在S3023中,对应于对比方式b,获取到一个候选样本面部图像,即将其作为第一样本面部图像。

通过本申请实施例提供一种图像识别方法,将目标面部图像的身份特征与样本库中的样本面部图像的年龄特征相加,得到目标面部图像的第一特征,将目标面部图像的第一特征与样本库中的人脸特征比较得到识别结果。由于第一特征与样本库中样本面部图像人脸特征在年龄上对齐,因此,本申请的识别过程相当于将跨年龄的对比转换到同年龄的对比,这样一来,识别过程就相当于补偿了年龄特征对识别精度的影响,提高了跨年龄人脸识别的精度。

具体的,此处对S302中的第一种实现将基本库转换为样本库进行说明。

可以将一个面部图像输入用于提取人脸特征的第二神经网络,第二神经网络的输出则为该面部图像的人脸特征。可以将一个面部图像输入用于从面部图像中提取年龄特征的第三神经网络,第三神经网络的输出则为该面部图像的年龄特征。可以将一个面部图像的拍照年龄输入用于根据年龄提取年龄特征的第四神经网络,第四神经网络的输出则为该面部图像的年龄特征。

其中,第二神经网络、第三神经网络、第四神经网络可以为卷积神经网络或者全连接神经网络或其他。第二神经网络、第三神经网络、第四神经网络是训练至收敛的神经网络,对于训练第二神经网络、第三神经网络、第四神经网络的方法本申请不予限定。

可选的,第二神经网络、第三神经网络、第四神经网络可以由图像识别装置训练,或者由其他设备训练至收敛后配置于图像识别装置中。

示例性的,第二神经网络的训练过程可以为:将多个面部图像(相同人物的不同面部图像和不同人物的面部图像)输入第二神经网络,第二神经网络输出面部图像人脸特征,计算相同人物的不同面部图像的人脸特征之间的相似度、不同人物的面部图像的人脸特征之间的相似度,然后通过反向传输调整第二神经网络中的权重与偏置,直至第二神经网络收敛。

示例性的,第三神经网络的训练过程可以为:将多个面部图像输入第三神经网络,第三神经网络输出面部图像年龄特征(年龄范围对应的特征),根据第三神经网络输出的年龄特征与面部图像的实际年龄特征(人脸特征与身份特征之差)之间的误差,通过反向传输调整第三神经网络中的权重与偏置,直至第三神经网络收敛。

示例性的,第四神经网络的训练过程可以为:将多个面部图像的拍照年龄输入第四神经网络,第四神经网络输出面部图像的年龄特征,根据第四神经网络输出的面部图像对应的年龄特征与面部图像的实际年龄特征(人脸特征与身份特征之差)之间的误差,通过反向传输调整第四神经网络中的权重与偏置,直至第四神经网络收敛。

进一步的,当S302中样本库为第二种实现得到,如图5所示,在S302之前,本申请实施例提供的图像识别方法还可以包括S303和S304。

S303、图像识别装置获取目标面部图像的拍照年龄范围。

其中,可以将目标面部图像输入用于提取拍照年龄范围的第五神经网络,第五神经网络的输出则为目标面部图像的拍照年龄范围。

其中,第五神经网络可以为卷积神经网络或者全连接神经网络或其他。第五神经网络是训练至收敛的神经网络,对于训练第五神经网络的方法本申请不予限定。

可选的,第五神经网络可以由图像识别装置训练,或者由其他设备训练至收敛后配置于图像识别装置中。

示例性的,第五神经网络的训练过程可以为:将多个面部图像输入第五神经网络,第五神经网络输出面部图像对应的年龄范围的概率值,根据第五神经网络输出的面部图像对应的年龄范围的概率值与该面部图像的实际年龄范围概率(概率为1)之间的误差,反向传输调整第五神经网络中的权重与偏置,直至第五神经网络收敛。

S304、图像识别装置从基本库中筛选当前年龄在该拍照年龄范围内的样本面部图像的人脸特征及年龄特征,作为样本库。

S304可以实现为:图像识别装置获取基本库中每个样本面部图像的当前年龄,图像识别装置根据基本库中每个样本面部图像的当前年龄,从基本库中筛选出当前年龄在目标面部图像的拍照年龄范围内的样本面部图像的人脸特征及年龄特征,作为样本库。

一种可能的实现方式中,图像识别装置根据基本库中每个样本面部图像的出生日期及当前日期得到每个样本面部图像的当前年龄。其中,当前日期可以根据目标面部图像的属性信息得到,或者由管理员输入或者其他,本申请不予限定。

另一种可能的实现方式中,图像识别装置根据基本库中每个样本面部图像的拍照年龄、每个样本面部图像拍照时间及当前日期得到每个样本面部图像的当前年龄。其中,当前日期可以根据目标面部图像的属性信息得到,或者由管理员输入或者其他,本申请不予限定。

可选的,基本库和样本库中不同的样本面部图像可以通过图像标识或者ID号或者人物姓名等信息进行区分。

需要说明的是,若基本库中包括的是样本面部图像,可以按照S302中第一种实现转换为人脸特征及年龄特征后执行S304。

例如,假设图像识别装置获取的目标面部图像的拍照年龄范围为20-30岁,当前日期为2019年,基本库如表1所示。其中,表1中的一行表示一个样本面部图像的相关内容。

表1

需要说明的是,表1只是通过举例的方式对基本库进行说明,并不是具体限定。

图像识别装置可以根据当前日期与表1中每个样本面部图像的出生日期,将当前日期减去每个样本面部图像的出生日期,得到基本库中每个样本面部图像的当前年龄,此时表1示意的基本库转换为如表2所示的基本库。

表2

由于目标面部图像的拍照年龄范围为20-30岁,表2示意的基本库中当前年龄落入该拍照年龄范围的样本面部图像为样本面部图像2和样本面部图像4,可以从基本库中选取样本面部图像2和样本面部图像4的特征内容,作为样本库,该样本库可以如表3所示。

表3

需要说明的是,表3只是通过举例的方式对样本库进行说明,并不是具体限定。

进一步可选的,前述用于提取特征的第一神经网络至第五神经网络分别为独立的神经网络,可以建立一个多特征提取神经网络并训练至收敛,用于实现第一神经网络至第五神经网络的部分或者全部神经网络的功能,用于提取身份特征、年龄特征以及人脸特征中的部分或全部。其中,多特征提取神经网络的训练过程可以参考上述第一神经网络至第五神经网络的训练过程,本申请不再一一赘述。

下面以寻找走失儿童的场景为例,对本申请提供的图像识别方法进行说明。

具体的,某市公安局找到了一个走失儿童,需要确认该走失儿童的具体身份。民警通过拍照获取该走失儿童的面部图像,将该走失儿童的面部图像作为目标面部图像输入至图像识别装置。图像识别装置采用本申请提供的图像识别方法,在走失儿童的信息库中对比选择与该走失儿童的面部图像相似的面部图像。

如图6所示,图像识别装置在走失儿童的信息库中对比选择与该走失儿童的面部图像相似的面部图像的图像识别过程可以包括:

图像识别装置获取目标面部图像的身份特征和拍照年龄范围。

图像识别装置获取走失儿童的信息库(基本库),走失儿童的信息库中存储了样本面部图像1、样本面部图像2、样本面部图像3等多个样本面部图像的人脸特征、年龄特征及拍照年龄。

图像识别装置筛选出当前年龄在目标面部图像的拍照年龄范围内的样本面部图像(样本面部图像1、样本面部图像3),图像识别装置将样本面部图像1、样本面部图像3的人脸特征与年龄特征,记录作为样本库。

图像识别装置将目标面部图像的身份特征分别与样本面部图像1、样本面部图像3的年龄特征相加,得到目标面部图像相对于样本面部图像1的第一特征、目标面部图像相对于样本面部图像3的第一特征。

图像识别装置计算目标面部图像相对于样本面部图像1的第一特征与样本面部图像1的欧氏距离,计算目标面部图像相对于样本面部图像3的第一特征与样本面部图像3的欧氏距离,得到目标面部图像相对于样本面部图像1的第一特征与样本面部图像1的欧氏距离小于预设门限满足第一条件(小于预设门限),目标面部图像相对于样本面部图像3的第一特征与样本面部图像3的欧氏距离大于预设门限不满足第一条件,所以图像识别装置将样本面部图像1作为识别结果输出给用户,即认为该走失的儿童为样本面部图像1对应的人。

上述主要从图像识别装置的工作原理角度对本申请实施例提供的方案进行了介绍。可以理解的是,图像识别装置为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对图像识别的装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

在采用对应各个功能划分各个功能模块的情况下,如图7所示为本申请实施例提供的一种图像识别装置70,用于实现上述方法中图像识别装置的功能。该图像识别装置70可以是服务器,也可以是服务器中的装置,也可以是能够和服务器匹配使用的装置。其中,该图像识别装置70可以为芯片系统。本申请实施例中,芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。如图7所示,图像识别装置70可以包括:第一获取单元701、处理单元702。其中,第一获取单元701用于执行图3或图5中的S301;处理单元702用于执行图3或图5中的S302。其中,上述方法实施例涉及的各步骤的所有相关内容均可以援引到对应功能模块的功能描述,在此不再赘述。

进一步的,如图7所示,图像识别装置70还可以包括第二获取单元703。其中,第二获取单元703用于执行图5中的S303。

如图8所示,为本申请实施例提供图像识别装置80,用于实现上述方法中图像识别装置的功能。该图像识别装置80可以是服务器,也可以是服务器中的装置,也可以是能够和服务器匹配使用的装置。其中,该图像识别装置80可以为芯片系统。图像识别装置80包括至少一个处理模块801,用于实现本申请实施例提供的方法中图像识别装置的功能。示例性地,处理模块801可以用于执行图3中的过程S301、S302或者图5中的过程S301、S302、S303、S304。具体参见方法示例中的详细描述,此处不做赘述。

图像识别装置80还可以包括至少一个存储模块802,用于存储程序指令和/或数据。存储模块802和处理模块801耦合。本申请实施例中的耦合是装置、单元或模块之间的间接耦合或通信连接,可以是电性,机械或其它的形式,用于装置、单元或模块之间的信息交互。处理模块801可能和存储模块802协同操作。处理模块801可能执行存储模块802中存储的程序指令。所述至少一个存储模块中的至少一个可以包括于处理模块中。

图像识别装置80还可以包括通信模块803,用于通过传输介质和其它设备进行通信,从而用于确定图像识别装置80中的装置可以和其它设备进行通信。

当处理模块801为处理器,存储模块802为存储器,通信模块803为收发器,本申请实施例图8所涉及的图像识别装置80可以为图2所示的图像识别装置。

如前述,本申请实施例提供的图像识别装置70或图像识别装置80可以用于实施上述本申请各实施例实现的方法中图像识别装置中的功能,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请各实施例。

本申请另一些实施例还提供一种计算机可读存储介质,该计算机可读存储介质可包括计算机软件指令,当该计算机软件指令在计算机上运行时,使得该计算机执行上述3或图5所示实施例中图像识别装置执行的各个步骤。

本申请另一些实施例还提供一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得该计算机执行上述图3或图5所示实施例中图像识别装置执行的各个步骤。

本申请另一些实施例还提供一种芯片系统。芯片系统包括接口电路和处理器;接口电路和处理器通过线路互联;接口电路用于从图像识别装置的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令;当处理器执行该计算机指令时,芯片系统执行如上述图3或图5所示实施例中图像识别装置执行的各个步骤。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 图像识别方法、装置、系统及内窥镜图像识别方法、装置
  • 文字合成图像的识别方法及装置、图像识别方法
技术分类

06120113083223