掌桥专利:专业的专利平台
掌桥专利
首页

人脸模型训练方法、装置、计算机设备、存储介质

文献发布时间:2024-04-18 19:44:28


人脸模型训练方法、装置、计算机设备、存储介质

技术领域

本申请涉及人工智能技术领域,特别是涉及一种人脸模型训练方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着人工智能技术的发展,出现了人脸识别技术,人脸识别技术往往应用于身份识别中。

传统技术中,人脸识别技术的应用场景往往为相对固定的场所,如小区、学校、公司等,人脸识别技术通过对通用模型进行训练,得到符合相应场景的识别模型,进而来用该训练好的识别模型进行该场景下的人员的身份识别。

然而,目前的应用于相对固定场景下的人脸识别技术,当出现错误识别的个例时,很难通过修改通用模型的方式得到适用的识别模型,模型更新效率较低,进而导致在该固定场景下人脸识别的准确性较低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够固定场景下人脸识别准确率的人脸模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种用于模型训练设备的人脸模型训练方法。所述方法包括:

响应于针对目标场所的模型训练任务,获取样本数据集和人脸识别模型;所述模型训练任务用于对部署于所述目标场所中的各人脸识别设备上的所述人脸识别模型进行训练;所述样本数据集包括人工上传样本数据、设备上报样本数据;所述人工上传样本数据为对所述人脸识别模型识别失误的人脸数据进行标注得到的;所述设备上报样本数据为所述人脸识别模型识别成功,且与相应的人脸后台数据存在预设差异的人脸数据;

根据所述样本数据集,对所述人脸识别模型进行模型训练处理,得到训练后的人脸识别模型;

部署所述训练后的人脸识别模型至各所述人脸识别设备上。

在其中一个实施例中,所述样本数据集还包括原数据集,所述原数据集为用于所述人脸识别模型上一次训练的数据集,所述根据所述样本数据集,对所述人脸识别模型进行模型训练处理,包括:

根据所述原数据集和所述设备上报样本数据,以预设的基础学习率对所述人脸识别模型进行训练;

基于所述原数据集与所述人工上传样本数据之间的数据量关系对所述基础学习率进行调整,得到目标学习率;

根据所述人工上传样本数据,以所述目标学习率对所述人脸识别模型进行训练。

在其中一个实施例中,所述基于所述原数据集与所述人工上传样本数据之间的数据量关系对所述基础学习率进行调整,得到目标学习率,包括:

根据所述原数据集的数据量和所述人工上传样本数据的数据量,得到人工上传比例因子;所述人工上传比例因子包括所述人工上传样本数据的数据量与所述样本数据集的数据量的比值;

计算所述基础学习率与预设的峰值学习率之间的差值,得到学习率差值;

将所述学习率差值与所述人工上传比例因子进行融合,得到学习率增量;

将所述学习率增量与所述基础学习率进行加权,得到所述目标学习率。

在其中一个实施例中,所述获取样本数据集和人脸识别模型,包括:

获取所述人脸识别设备的设备标识;

根据所述设备标识,查询得到与所述人脸识别设备对应的分组标识;

根据所述分组标识,查询得到与所述分组标识对应的所述原数据集和所述人脸识别模型。

在其中一个实施例中,所述方法还包括:

获取当前时间;

若所述当前时间与上一次模型训练时间的时间间隔大于预设的训练周期阈值,则触发针对所述目标场所的模型训练任务。

在其中一个实施例中,所述部署所述训练后的人脸识别模型至各所述人脸识别设备上,包括:

根据样本数据集对所述训练好的人脸识别模型进行指标分析,得到模型指标;所述模型指标至少包括以下任一种:检测率、误检率、漏检率、检测速度;

若所述模型指标满足预设的指标阈值范围,则部署所述训练后的人脸识别模型至各所述人脸识别设备上;

若所述模型指标不满足所述指标阈值范围,则对所述模型指标对应的所述人脸识别模型重新进行训练。

第二方面,本申请提供了一种用于人脸识别设备的人脸模型训练方法。所述方法包括:

通过预部署的人脸识别模型,确定采集到的人脸数据与人脸底库数据的人脸特征相似度;

在所述人脸特征相似度大于预设的第一阈值的情况下,则确定所述人脸识别模型识别成功;

在所述人脸识别模型识别成功,且所述人脸特征值小于预设的第二阈值的情况下,则将所述人脸数据作为设备上报样本数据上传至模型训练设备,以使所述模型训练设备执行如上述第一方面中任意一项所述的人脸模型训练方法;所述第一阈值小于所述第二阈值。

第三方面,本申请还提供了一种用于模型训练设备人脸模型训练装置。所述装置包括:

数据集与模型获取模块,用于响应于针对目标场所的模型训练任务,获取样本数据集和人脸识别模型;所述模型训练任务用于对部署于所述目标场所中的各人脸识别设备上的所述人脸识别模型进行训练;所述样本数据集包括人工上传样本数据、设备上报样本数据;所述人工上传样本数据为对所述人脸识别模型识别失误的人脸数据进行标注得到的;所述设备上报样本数据为所述人脸识别模型识别成功,且与相应的人脸后台数据存在预设差异的人脸数据;

模型训练模块,用于根据所述样本数据集,对所述人脸识别模型进行模型训练处理,得到训练后的人脸识别模型;

模型部署模块,用于部署所述训练后的人脸识别模型至各所述人脸识别设备上。

第四方面,本申请还提供了一种用于人脸识别设备人脸模型训练装置。所述装置包括:

相似度确定模块,用于通过预部署的人脸识别模型,确定采集到的人脸数据与人脸底库数据的人脸特征相似度;

第一判断模块,用于在所述人脸特征相似度大于预设的第一阈值的情况下,则确定所述人脸识别模型识别成功;

第二判断模块,用于在所述人脸识别模型识别成功,且所述人脸特征值小于预设的第二阈值的情况下,则将所述人脸数据作为设备上报样本数据上传至模型训练设备,以使所述模型训练设备执行如上述第一方面中任意一项所述的人脸模型训练方法;所述第一阈值小于所述第二阈值。

第五方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现:如上述第一方面中任意一项所述的方法的步骤;或者,如上述第二方面中任意一项的方法的步骤。

第六方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现:如上述第一方面中任意一项所述的方法的步骤;或者,如上述第二方面中任意一项的方法的步骤。

第七方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现:如上述第一方面中任意一项所述的方法的步骤;或者,如上述第二方面中任意一项的方法的步骤。

上述人脸模型训练方法、装置、计算机设备、存储介质和计算机程序产品,通过获取不同数据来源的人工上传样本数据和设备上报样本数据,来对模型进行训练,并将训练好的人脸识别模型部署在人脸识别设备上用于人脸识别,而人工上传样本数据和设备上报样本数据正是在目标场景下识别难度较大的数据,将这些数据集用于对人脸识别模型的训练,从而实现对人脸识别模型的调整,提升了人脸识别模型对于目标场景的适用性,从而提升该固定场景下人脸识别的准确性。

附图说明

图1为一个实施例中人脸模型训练方法的应用环境图;

图2为另一个实施例中人脸模型训练方法的应用环境图;

图3为一个实施例中人脸模型训练方法的流程示意图;

图4为一个实施例中S320步骤的流程示意图;

图5为一个实施例中S420步骤的流程示意图;

图6为一个实施例中S310步骤的流程示意图;

图7为另一个实施例中人脸模型训练方法的流程示意图;

图8为一个实施例中S330步骤的流程示意图;

图9为另一个实施例中人脸模型训练方法的流程示意图;

图10为一个实施例中人脸模型训练装置的结构框图;

图11为另一个实施例中人脸模型训练装置的结构框图;

图12为一个实施例中计算机设备的内部结构图;

图13为另一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的人脸模型训练方法,可以应用于如图1所示的应用环境中。

图1所示的应用环境中包括:人脸识别设备110和模型训练设备120,人脸识别设备110与模型训练设备120通信连接。其中,人脸识别设备110可以但不限于是集成了图像识别功能的前端摄像机,人脸识别设备110的数量为至少一个;模型训练设备120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,人脸识别设备110用于对人脸数据的采集与识别,还用于上传人脸数据给模型训练设备120;模型训练设备120用于对部署在人脸识别设备110中的人脸识别模型进行训练,还用于将训练好的模型部署在人脸识别设备110上。

本申请实施例提供的人脸模型训练方法,还可以应用于如图2所示的应用环境中。

图2所示的应用环境中包括:人脸识别设备110和模型训练设备120,人脸识别设备110与模型训练设备120通信连接;模型训练设备120还包括管理平台121和训练平台122。其中,人脸识别设备110可以但不限于是集成了图像识别功能的前端摄像机,人脸识别设备110的数量为至少一个;管理平台121和训练平台122可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,人脸识别设备110用于对人脸数据的采集与识别,还用于上传人脸数据给模型训练设备120;管理平台121可以但不限于部署在CPU服务器上,用于对前端的至少一个人脸识别设备进行管理与数据汇总,并用于训练平台122与人脸识别设备的数据交互;训练平台122可以但不限于部署在GPU服务器上,用于对部署在人脸识别设备110中的人脸识别模型进行训练,还用于将训练好的模型部署在人脸识别设备110上。

在一个实施例中,如图3所示,提供了一种人脸模型训练方法,以该方法应用于图1中的模型训练设备120为例进行说明,包括以下步骤:

S310,响应于针对目标场所的模型训练任务,获取样本数据集和人脸识别模型;

其中,模型训练任务用于对部署于目标场所中的各人脸识别设备上的人脸识别模型进行训练;目标场所为人员相对固定的场所,目标场所可以但不限于小区、学校、公司,目标场所的特点在于,当在人脸识别过程中出现错误识别的个例时,很难通过修改通用模型的方式得到适用的模型,即找到符合所有场景的识别模型的难度较大。

具体地,人脸识别模型部署在目标场所的各个人脸识别设备上,用于各个人脸识别设备对目标场所中的人员进行人脸图像采集与身份认证。

具体地,样本数据集包括人工上传样本数据和设备上报样本数据;其中,人工上传样本数据为对人脸识别模型识别失误的人脸数据进行标注得到的;设备上报样本数据为人脸识别模型识别成功,且与相应的人脸后台数据存在预设差异的人脸数据,设备上报样本数据表征在人脸识别过程中达到一定阈值但距离最佳阈值存在预设差异的人脸数据。

其中,人工上传样本数据中标注的作用在于,利用该标注区分人工上传样本数据和设备上报样本数据,以便后续在模型训练阶段,针对不同来源的数据设置不同的学习率,进而实现对训练后模型的不同影响。

具体地,人工上传样本数据可以但不限于误检数据、漏检数据,人工上传样本数据的上报方式为:用户可以通过APP、小程序、网页平台提供的接口,通过用户和设备关系鉴权,实现人工上传样本数据的上报。

示例性地,在针对目标场所的模型训练任务发布以后,模型训练设备响应于该任务以获取到模型训练相关的数据,即样本数据集合人脸识别模型,其中,人脸识别模型为当前部署在人脸识别设备中的模型,而样本数据集用于对该人脸识别模型进行训练。

S320,根据样本数据集,对人脸识别模型进行模型训练处理,得到训练后的人脸识别模型;

其中,样本数据集根据数据来源可以分为原数据集、人工上传样本数据和设备上报样本数据等,根据数据功能可以分为训练集和测试集。

示例性地,由于样本数据集的数据来源存在差异,利用不同数据集的差异来调整不同数据集对模型的训练方式,可以有针对性地对模型进行训练,从而提升人脸识别模型对目标场景的适用性;具体地,可根据不同来源数据集的数据量对模型训练的学习率进行调整,提升模型对某些数据集的关注程度,从而提升目标场景下某类数据的识别成功率。

S330,部署训练后的人脸识别模型至各人脸识别设备上。

示例性地,人脸识别模型的部署方式可以但不限于以下两种:

(1)如图1所示,模型训练设备直接将训练好的人脸识别模型部署在人脸识别设备上;具体地,模型训练设备将训练完成后的模型参数通过通信网络发送至人脸识别设备,人脸识别设备根据模型参数对原有模型进行调整,并将调整后的人脸识别模型用于后续的人脸识别。

(2)如图2所示,训练平台将训练完成后的模型参数传递给管理平台,再由管理平台将训练好的人脸识别模型部署在人脸识别设备上;具体地,训练平台将训练完成后的模型参数传递给管理平台,管理平台再通过通信网络发送至人脸识别设备,人脸识别设备根据模型参数对原有模型进行调整,并将调整后的人脸识别模型用于后续的人脸识别。

其中,上述部署方式(1)的特点在于部署直接、响应迅速,能够较为快速地实现模型部署;部署方式(2)的特点在于将模型训练与模型部署功能分离,而相应地,管理平台与训练平台可以部署在不同的服务器中,比如,将训练平台部署在GPU服务器上而将管理平台部署在CPU服务器上,即根据不同的功能需求提供处理能力不同的服务器,来提升系统运行效率,同时,便于管理平台对前端的人脸识别设备的集中管理。

上述人脸模型训练方法中,通过获取不同数据来源的人工上传样本数据和设备上报样本数据,来对模型进行训练,并将训练好的人脸识别模型部署在人脸识别设备上用于人脸识别,而人工上传样本数据和设备上报样本数据正是在目标场景下识别难度较大的数据,将这些数据集用于对人脸识别模型的训练,从而实现对人脸识别模型的调整,提升了人脸识别模型对于目标场景的适用性,从而提升该固定场景下人脸识别的准确性。

在一个实施例中,如图4所示,图3中的S320还包括:

S410,根据原数据集和设备上报样本数据,以预设的基础学习率对人脸识别模型进行训练;

其中,原数据为样本数据集中的一种数据集,原数据集为用于人脸识别模型上一次训练的数据集,即在用于对此次模型训练前部署的人脸识别模型进行训练的数据集;设备上报样本数据为人脸识别模型识别成功,且与相应的人脸后台数据存在预设差异的人脸数据;基础学习率为用户为模型训练过程制定的固定学习率。

示例性地,本申请可为不同数据来源的数据集设置学习率,在本实施例中,将原数据集与设备上报样本数据都以基础学习率进行模型训练。

S420,基于原数据集与人工上传样本数据之间的数据量关系对基础学习率进行调整,得到目标学习率;

其中,人工上传样本数据为对人脸识别模型识别失误的人脸数据进行标注得到的人脸数据;数据量可以但不限于人脸数据的单位数量,如人脸图像数据的单位为张,当此次通过人工上传了100张人脸图像,则此次人工上传样本数据的数据量为100张。

示例性地,依据原数据集与人工上传样本数据的数据量关系来调整学习率,具体地,根据人工上传样本数据与数据集的比例值来调整学习率,即该比例值越大,目标学习率越大。

S430,根据人工上传样本数据,以目标学习率对人脸识别模型进行训练。

其中,目标学习率即为经过步骤420调整后得到的学习率。

示例性地,在进行模型训练时,将人工上传样本数据的学习率设定为目标学习率,从而有针对性地改变训练后的模型对人工上传样本数据的依赖程度。

本实施例中,通过设定原数据集和设备上报样本数据的学习率为基础学习率,并设定人工上传样本数据的学习率为目标学习率,实现了为不同数据来源的数据集提供不同的学习率,而目标学习率又与原数据集与人工上传样本数据之间的数据量关系相关,这样能够根据目标场景中不同数据集的重要程度来为其设置不同的学习率,从而使得训练得到的模型更加适用于目标场景,进而提升在目标场景中的人脸识别成功率。

在一个实施例中,如图5所示,图4中的S420还包括:

S510,根据原数据集的数据量和人工上传样本数据的数据量,得到人工上传比例因子;

其中,人工上传比例因子可以但不限于为人工上传样本数据的数据量与样本数据集的数据量的比值。

示例性地,若本次训练的样本数据集仅包括原数据集、设备上报样本数据和人工上传样本数据,原数据集的数据量为a,设备上报样本数据为b,人工上传样本数据的数据量为n,则样本数据集的数据量N=a+b+n,此时,人工上传比例因子为n/N。

S520,计算基础学习率与预设的峰值学习率之间的差值,得到学习率差值;

其中,峰值学习率为进行模型训练的最大学习率,学习率差值用于与人工上传比例因子融合来计算学习率增量;

示例性地,若基础学习率为A,峰值学习率为B,则学习率差值可以但不限于为B-A。

S530,将学习率差值与人工上传比例因子进行融合,得到学习率增量;

具体地,学习率增量用于对基础学习率进行调整来得到目标学习率;

示例性地,若人工上传比例因子为n/N,学习率差值为B-A,则学习率增量可以但不限于为(B-A)*(n/N)。

S540,将学习率增量与基础学习率进行加权,得到目标学习率。

示例性地,若学习率增量为(B-A)*(n/N),则目标学习率可以但不限于为(B-A)*(n/N)+A。

本实施例中,通过样本数据集中不同种类数据集的数据量得到整个样本数据集的数据量,进而得到人工上传比例因子,并将人工上传比例因子与学习率差值进行融合,再与基础学习率进行加权,从而达到利用样本数据集中不同来源的数据集的数据量对基础学习率进行调整的目的,由于人工上传比例因子为正值,因此目标学习率大于基础学习率,这使得针对人工上传样本数据对应的学习率有所提升,能够加强人工上传样本数据中的误检数据和漏检数据对模型的影响,进而使训练后的模型更适用于目标场景,提升在目标场景中的人脸识别的准确性。

在一个实施例中,如图6所示,图3中的S310还包括:

S610,获取人脸识别设备的设备标识;

其中,人脸识别设备包括集成了图像识别功能的前端摄像机,设备标识即为该人脸识别设备的设备ID,设备标识用于对标志该人脸识别设备的身份。

示例性地,当模型训练装置接执行针对目标场景的模型训练任务时,需要调取与该人脸识别设备相关的数据,而数据调取的依据就包括人脸识别设备的设备标识。

S620,根据设备标识,查询得到与人脸识别设备对应的分组标识;

其中,人脸识别设备的数量可以为至少两个,各个人脸识别被按照所在区域划分为不同的组别,组别划分的标志就是分组标识。

示例性地,如区域划分的划分单位为小区,则不同小区的人脸识别设备拥有不同的分组标识,通过该分组标识可以在相应的数据库中进行查询,得到与该分组标识相匹配的数据。

S630,根据分组标识,查询得到与分组标识对应的原数据集和人脸识别模型。

其中,人脸识别模型为当前部署在目标场所的各个人脸识别设备上模型,原数据集为用于人脸识别模型上一次训练的数据集。

示例性地,通过该分组标识分别在相应的数据库中进行查询,得到与该分组标识对应的原数据集和人脸识别模型,即通过查询得到最近版本的数据集与模型。

本实施例中,根据人脸识别设备的设备标识和分组标识进行查询.,得到与之匹配的原数据集和人脸识别模型,实现了所需数据的采集,进而将其用于后续的模型训练与部署过程。.

在一个实施例中,如图7所示,本申请的人脸模型训练方法还包括以下步骤:

S710,获取当前时间;

其中,当前时间指当前的系统时间,当前时间用于判断是否满足模型训练周期的时间限制,进而用于判断是否触发相应的模型训练任务。

S720,若当前时间与上一次模型训练时间的时间间隔大于预设的训练周期阈值,则触发针对目标场所的模型训练任务。

其中,训练周期阈值为系统设定的进行模型训练的最大时间周期。

示例性地,若当前时间距离上次模型训练时间的时间间隔大于训练周期阈值时,系统就会自动触发针对目标场所的模型训练任务,用于更新人脸识别模型。

需要说明的是,模型训练任务的触发方式还包括:若模型训练设备的用户有即时进行模型训练的需求时,可以控制模型训练设备发布训练任务,完成对模型的更新。

本实施例中,通过为模型训练过程配置不同的周期触发与设备主动触发的两种不同的触发方式,能够实现对训练任务触发的灵活性,使得用户可根据自身需求采用不同的训练任务触发策略。

在一个实施例中,如图8所示,图3中的S330还包括:

S810,根据样本数据集对训练好的人脸识别模型进行指标分析,得到模型指标;

模型指标至少包括以下任一种:检测率、误检率、漏检率、检测速度;

示例性地,检测率可以但不限于用训练集验证,以保证新模型对目标场景中人员的识别达到较高的检测率;误检率可以但不限于用测试集杨峥,以保证新模型对寻常人员的识别不会存在过高的误检率。

S820,若模型指标满足预设的指标阈值范围,则部署训练后的人脸识别模型至各人脸识别设备上;

示例性地,若经过S810的指标分析后,模型指标体现出对目标场景的人员的相应指标达到了指标阈值范围,则可以选择进一步提升基础阈值,从而在降低误检的基础上来提升人脸识别的准确率。

S830,若模型指标不满足指标阈值范围,则对模型指标对应的人脸识别模型重新进行训练。

示例性地,当训练后的模型的相应指标未满足预设的指标阈值范围的要求,就对该模型重新进行训练,以保证模型的质量。

在当前的人脸识别技术中,泛用模型为了保证检测通过率,不会将得分阈值设置的过高,而在本实施例中,申请通过对目标场景内人员的针对性学习,使每次模型训练结束后相应指标有一定的提升,进而通过拉高基础阈值的方式,进而提升了人脸识别的准确率。

在一个实施例中,如图9所示,提供了一种人脸模型训练方法,以该方法应用于图1中的人脸识别设备110为例进行说明,包括以下步骤:

S910,通过预部署的人脸识别模型,确定采集到的人脸数据与人脸底库数据的人脸特征相似度;

示例性地,采集到的人脸数据即为需要进行人脸识别的人脸图像,人脸底库数据为保存在数据库的人脸数据,两者的人脸特征相似度用于判断人脸识别过程成功与否。

S920,在人脸特征相似度大于预设的第一阈值的情况下,则确定人脸识别模型识别成功;

示例性地,第一阈值为系统设定的用于判断人脸识别成功与否的人脸特征相似度阈值。

S930,在人脸识别模型识别成功,且人脸特征值小于预设的第二阈值的情况下,则将人脸数据作为设备上报样本数据上传至模型训练设备,以使模型训练设备执行任意一项用于模型训练设备的人脸模型训练方法;

示例性地,第二阈值为系统设定的用于判断是否将人脸数据作为设备上报样本数据上传至模型训练设备的人脸特征相似度阈值。具体地,第一阈值小于第二阈值。

上述人脸模型训练方法中,通过得到人脸数据与人脸底库数据的人脸特征相似度,并对该人脸特征相似度进行判断,在大于预设的第一阈值的情况下确定人脸识别模型识别成功;在大于预设的第一阈值且小于预设的第二阈值的情况下,则将人脸数据作为设备上报样本数据上传至模型训练设备,实现了对数据集的更新,并可以将更新后的数据集用于后续的模型训练过程,从而提升了人脸识别模型对于目标场景的适用性,进而提升该固定场景下人脸识别的准确性。

本申请在不改变深度学习模型的前提下,针对训练集做出优化,采集固定场景下的人脸数据生成具有该固定场景特色的数据集,即人工上传样本数据、设备上报样本数据,基于泛用性识别模型自动训练,对当前模型进行纠正,得到专用性识别模型,在满足普遍识别阈值的前提下,对本固定场景的数据达到更高的识别精度,同时,人脸数据的自动采集与上报和训练触发过程都体现出模型迭代的自动化,避免目标场景下的模型训练的人力资源的浪费,并提升了模型训练的效率。

下面以一个具体的实施例详细描述人脸模型训练方法。值得理解的是,下述描述仅是示例性说明,而不是对申请的具体限制。

需要说明的是,在本实施例中,目标场景为小区,人脸识别设备为小区的人脸识别摄像机,小区内多个摄像头同属于一组,分组标识即为小区ID。

因为同一小区有权出入的人群相对固定,小区又存在多个摄像头,当该小区的模型自动迭代时,能够同时更新至该小区的多个摄像头,实现人脸识别型的同步更新,所以需要小区ID来进行区域划分。

摄像机进行日常识别工作时,会提取人脸数据的特征与人脸底库数据的人脸特征进行比对,当人脸特征相似度达到第一阈值时,选出相似度最高的人脸底库数据,系统认为该人脸数据属于该小区人员。

如果人脸特征相似度虽然达到第一阈值,但与第二阈值存在差值时,需要更新模型,避免误识别,进而将该人脸数据与其对应的用户标识、设备标识、分组标识等信息作为累积数据集中上传给模型训练平台,同时标记该数据为设备上报样本数据。

小区设备管理员也可以将日常中发现的误检、漏检、新增人员通过预处理工具,经过人工打标处理后上传至数据训练设备,加入累积数据集中,同时标记该数据为人工上传样本数据。

模型训练设备接收上述两种数据后,会根据设备标识查询到分组标识并存储。模型训练设备会定期触发模型训练任务,或者根据用户需要主动请求触发模型训练任务。

模型训练任务触发后,根据分组标识查询到最近一次的人脸识别模型、原数据集,设备上报样本数据与人工上传样本数据,并将新增数据合并至最近一次的训练集中。

在模型测试时,人工上传样本数据作为重点关注数据进行测试,如用户上传了同一人的5张不同角度的照片,则可4张用于训练,1张用于测试,而自动训练迭代的模型需要实现已标记的人工上传样本数据100%检测率,其中,人工上传样本数据中,历史标记数据与新上传的标记数据同样具有高优先性。

模型训练设备基于合并的训练集,对属于设备分组的最近一次的模型进行再训练,训练过程中会随一批次中的训练集标记使用动态学习率,调整该批次数据对模型参数的影响。

具体地,基础学习率为A,峰值学习率为B,当样本数据集工有N张数据,而一批训练数据中含有n张人工上传样本数据,则本次的学习率为(B-A)*(n/N)+A,从而加强用户上报的误检数据、漏检数据对模型的影响。

假设模型在样本数据集下准确率为99%,而目标小区中会有1%的人群识别效果不佳,此时通过设备上报样本数据,以学习率A微调模型,使模型更关注该小区的用户数据,同时增加人工上传样本数据的学习率,使得模型分布发生偏转,让其更关注该小区的用户数据,让该小区的用户数据落入99%的易识别数据区域内。

人脸识别模型的参在更新过程中有以下特征:新参数=上一次的参数-学习率*误差导数,更大的学习率会导致新参数更偏离上一次的参数,脱离原本的局部最优值点,随着学习率随着迭代缓慢下降,训练稳定后达到新的局部最优值点,从而提升对该小区的用户数据的关注度。

经过一定轮数迭代训练,得到的新模型使用训练集和测试集验证检出率与误检率等模型指标,训练集保证组内数据集满足高准确率,小区人员不会漏检;测试集保证泛用性准确率,避免过高的误检。若模型指标有所提升,则进一步提高人脸识别的阈值,从而避免误检相识度达到阈值的可能。

在模型训练结束后,模型训练设备将训练后的模型下发至设备分组钟的多台摄像机。自动训练平台将本次训练集、测试集与模型存储,同时训练集中标记重置为普通标记。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的人脸模型训练方法的人脸模型训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个人脸模型训练装置实施例中的具体限定可以参见上文中对于人脸模型训练方法的限定,在此不再赘述。

在一个实施例中,如图10所示,提供了一种用于模型训练设备的人脸模型训练装置,包括:数据集与模型获取模块101、模型训练模块102、模型部署模块103,其中:

数据集与模型获取模块,用于响应于针对目标场所的模型训练任务,获取样本数据集和人脸识别模型;模型训练任务用于对部署于目标场所中的各人脸识别设备上的人脸识别模型进行训练;样本数据集包括人工上传样本数据、设备上报样本数据;人工上传样本数据为对人脸识别模型识别失误的人脸数据进行标注得到的;设备上报样本数据为人脸识别模型识别成功,且与相应的人脸后台数据存在预设差异的人脸数据;

模型训练模块,用于根据样本数据集,对人脸识别模型进行模型训练处理,得到训练后的人脸识别模型;

模型部署模块,用于部署训练后的人脸识别模型至各人脸识别设备上。

在一个实施例中,如图11所示,提供了一种用于人脸识别设备的人脸模型训练装置,包括:相似度确定模块111、第一判断模块112、第二判断模块113,其中:

相似度确定模块,用于通过预部署的人脸识别模型,确定采集到的人脸数据与底库人脸数据的人脸特征相似度;

第一判断模块,用于在人脸特征相似度大于预设的第一阈值的情况下,则确定人脸识别模型识别成功;

第二判断模块,用于在人脸识别模型识别成功,且人脸特征值小于预设的第二阈值的情况下,则将人脸数据作为设备上报样本数据上传至模型训练设备,以使模型训练设备执行如上述第一方面中任意一项的人脸模型训练方法;第一阈值小于第二阈值。

上述人脸模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图12所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储人脸数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种人脸模型训练方法。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种人脸模型训练方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图12-13中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 机器学习模型训练方法、装置、存储介质和计算机设备
  • 语句输出、模型训练方法、装置、计算机设备及存储介质
  • 分类器训练方法、装置、设备和计算机可读存储介质
  • 一种神经网络训练方法、装置、计算机设备和存储介质
  • 人脸识别方法、装置、计算机设备及存储介质
  • 人脸质量评估方法、系统及人脸质量评估模型训练方法、系统、存储介质及计算机设备
  • 人脸检测方法、系统及人脸检测模型训练方法、系统、存储介质及计算机设备
技术分类

06120116302414