掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的人脸识别操作方法

文献发布时间:2023-06-19 13:46:35


一种基于深度学习的人脸识别操作方法

技术领域

本发明涉及深度学习和人工智能的技术领域,尤其涉及一种基于深度学习的人脸识别操作方法。

背景技术

近年来人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期,并且以美国、德国和日本的技术实现为主;人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度;“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。

迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术,它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题,提出了本发明。

因此,本发明解决的技术问题是:提出一种基于深度学习的人脸识别操作方法。

为解决上述技术问题,本发明提供如下技术方案:一种基于深度学习的人脸识别操作方法,包括采集包含人脸的图像数据;对人脸图片数据进行标注,包括使用方框框出人脸所在图片坐标位置;根据打标完成的数据,训练深度神经网络模型;开启摄像头,利用训练好的人脸检测网络模型,将拍摄到的图像传送给已经部署了人脸检测网络模型的计算单元,该计算单元会将图像中的人脸抓取出来,并提取人脸面部特征;提取出来的人脸面部特征,通过计算两个人脸特征信息相似度,判断进入车辆的人员是否为车主本人;若识别到进入车辆的人员为车主本人,车辆则会自动启动;若识别到进入车辆的人员非车主本人,车辆则不会自动启动,需要钥匙或者其他设备人为启动车辆。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:采集数据并对数据进行标注的实现,包括采用但不限于1920*1080的高清单目摄像头,在白天夜晚室内室外多种不同光线下,通过与车身摄像头相同的角度,使用单目摄像头连续拍摄需要采集的人脸的图片数据。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:对采集的数据进行标注包括,通过2D方框将人脸框出,并对人脸进行定位标注,标注出人脸在图中的像素坐标。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:根据标注的数据并对数据进行标注的实现包括,使用深度学习框架,搭建深度神经网络,人脸检测网络模型,该神经网络输入参数为图像,输出参数为预测到的人脸在输入图中的像素坐标信息以及相对应点的置信度。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:使用softmax-cross entropy作为损失函数,定义如下,

softmax函数:

cross entropy函数:

其中,L是损失,Sj是softmax其中输出向量S的第j个值,表示的是这个样本属于第j个类别的概率。yj前面有个求和符号,j的范围也是1到总类别数T,因此label标签y是一个1*T的向量,里面的T个值,而且只有其中一个值是1,其他T-1个值都是0,真实标签对应的位置的那个值是1,其他都是0。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:包括使用深度学习框架对标注好的数据进行读取,对搭建的人脸检测深度神经网络进行训练,通过损失函数计算模型预测的结果与真值的误差;根据误差的大小,通过梯度优化器,对深度神经网络模型的参数进行更新;直至训练指标平均精度均值达到98%以上。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:将训练好的深度神经网络模型部署至工程化代码,对摄像头拍摄到的画面进行逐帧预测,包括使用C++语言编写调用训练的深度神经网络模型,读取实时摄像头帧,使用深度神经网络模型对读取的帧进行实时的处理,将深度神经网络每帧处理过后的结果编写成数组,进行逻辑预测。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:将获取的结果数组取出与事先存入的车主照片提取出的人脸特征进行对比;通过欧式距离的方法计算相似度,如相似度达到设定阈值,可将结果视为识别到的人员为车主,判断结果为1;反之,则视为识别到的人员为非车主,判断结果为-1。

作为本发明所述的基于深度学习的人脸识别操作方法的一种优选方案,其中:判断结果为1,那么将视为满足车主进车条件,摄像头单元将会将启动指令发送给车辆启动系统;反之判断结果为-1,则视为不满足自动启动条件,摄像头单元不会发送指令给车辆启动单元。

本发明的有益效果:基于计算机视觉的人脸识别汽车启动系统,可以在车主坐进车内的同时,车内摄像头识别到车主则会自动启动汽车,让汽车启动更加智能自动化,避免了随身携带车钥匙的不便。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:

图1为本发明一个实施例提供的一种基于深度学习的人脸识别操作方法的基本流程示意图;

图2为本发明一个实施例提供的一种基于深度学习的人脸识别操作方法的实验结果示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图1的示意,本实施例提出一种基于深度学习的人脸识别操作方法,目前市面上的车辆基本通过插钥匙\感应钥匙的方式进行人为启动车辆,该系统的问题在于汽车钥匙电池需要定期更换,汽车钥匙容易丢失,且更换成本昂贵,本实施例通过计算机视觉的方式,准确判断进入车辆的人员是否为车主,避免了汽车钥匙电池需要定期更换,汽车钥匙容易丢失,且更换成本昂贵等问题,可以提升车主进入车辆后的启动时间,简化启动过程,同样避免了许多上述的问题。

具体的,包括,

采集包含人脸的图像数据;

对人脸图片数据进行标注,包括使用方框框出人脸所在图片坐标位置;

根据打标完成的数据,训练深度神经网络模型;

开启摄像头,利用训练好的人脸检测网络模型,将拍摄到的图像传送给已经部署了人脸检测网络模型的计算单元,该计算单元会将图像中的人脸抓取出来,并提取人脸面部特征;

提取出来的人脸面部特征,通过计算两个人脸特征信息相似度,判断进入车辆的人员是否为车主本人;

若识别到进入车辆的人员为车主本人,车辆则会自动启动;

若识别到进入车辆的人员非车主本人,车辆则不会自动启动,需要钥匙或者其他设备人为启动车辆。

采集数据并对数据进行标注的实现,包括,

采用但不限于1920*1080的高清单目摄像头,在白天夜晚室内室外多种不同光线下,通过与车身摄像头相同的角度,使用单目摄像头连续拍摄需要采集的人脸的图片数据。

对采集的数据进行标注包括,

通过2D方框将人脸框出,并对人脸进行定位标注,标注出人脸在图中的像素坐标。

根据标注的数据并对数据进行标注的实现包括,

使用MXNET深度学习框架,搭建深度神经网络,人脸检测网络模型,该神经网络输入参数为图像,输出参数为预测到的人脸在输入图中的像素坐标信息以及相对应点的置信度。

使用softmax-cross entropy作为损失函数,定义如下,

softmax函数:

cross entropy函数:

其中,L是损失,Sj是softmax其中输出向量S的第j个值,表示的是这个样本属于第j个类别的概率,yj前面有个求和符号,j的范围也是1到总类别数T,因此label标签y是一个1*T的向量,里面的T个值,而且只有其中一个值是1,其他T-1个值都是0,真实标签对应的位置的那个值是1,其他都是0。

包括使用MXNET深度学习框架对标注好的数据进行读取,

对搭建的人脸检测深度神经网络进行训练,通过损失函数计算模型预测的结果与真值的误差;

根据误差的大小,通过Stochastic Gradient Descent(SGD)梯度优化器,对深度神经网络模型的参数进行更新;

直至训练指标mean average precision(MAP)达到98%以上。

将训练好的深度神经网络模型部署至工程化代码,对摄像头拍摄到的画面进行逐帧预测,包括,

使用C++语言编写调用训练的深度神经网络模型,读取实时摄像头帧,使用深度神经网络模型对读取的帧进行实时的处理;

将深度神经网络每帧处理过后的结果编写成数组,进行逻辑预测。

将获取的结果数组取出与事先存入的车主照片提取出的人脸特征进行对比;

通过欧式距离的方法计算相似度,如相似度达到设定阈值,即相似度为99%以上,其中,相似度的计算包括:

其中,d表示欧氏距离,y

可将结果视为识别到的人员为车主,判断结果为1;

反之,则视为识别到的人员为非车主,判断结果为-1。

判断结果为1,那么将视为满足车主进车条件,摄像头单元将会将启动指令发送给车辆启动系统;

反之判断结果为-1,则视为不满足自动启动条件,摄像头单元不会发送指令给车辆启动单元。

本发明利用高清单目摄像头可以在不同光线下连续采集清晰的人脸图片,为后续人脸的准确识别作铺垫,利用深度神经网络提取脸部特征与事先存储的车主脸部特征相对比,可以快速而准确的判断是否为车主本人,提升车主进入车辆后的启动时间,简化启动过程。

实施例2

参照图2为本发明的第二个实施例,为对本方法中采用的技术效果加以验证说明,本实施例采用传统技术方案与本发明方法进行对比测试,以科学论证的手段对比试验结果,以验证本方法所具有的真实效果。

传统的方法一使用感应钥匙的方式进行人为启动车辆,其钥匙电池需要定期更换,汽车钥匙容易丢失,且更换成本昂贵,传统方法二利用视频解码器及云服务器进行人脸识别对比,其识别准确率低,启动慢,为验证本发明方法相较于传统方法具有较高的识别准确性、有较低时延、较低成本,本实施例中将采用传统方法与本发明方法分别对某一车辆的启动的时间、识别准确率进行对比。

测试环境:采用的车辆运行在仿真平台,其搭载2.0T发动机,最大功率为237马力,最大扭矩为350N〃m,与之匹配的是9速手自一体变速箱,采用1920*1080的高清单目摄像头,在白天夜晚室内室外多种不同光线下,基于传统方案和本发明方法,开启自动化测试设备并利用MATLB进行仿真,每种方法各测试90组数据,输出测试对比结果如图2及表1所示,从图2可以看出传统方法的启动时延在1.3s上下浮动,传统方法二的时延在0.8s上下浮动,而本发明方法的启动时延在0.25s上下浮动,其三种方法时延的平均值计算如表2所示。其中,随机选取多组识别准确率的实验结果进行示例:

表1:随机选组实验结果对比表。

表2:实验结果对比表。

从上表的实验结果可以看出,本发明方法相较于传统方法有较高的识别准确率,以及较低的时延,可以在车主坐进车内的同时,车内摄像头能够快速识别到车主并自动启动汽车,让汽车启动更加智能自动化,避免了随身携带车钥匙的不便以及不必要的成本。

应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

技术分类

06120113807294