掌桥专利:专业的专利平台
掌桥专利
首页

利用人工智能模块学习脸部辨识的处理方法

文献发布时间:2023-06-19 11:35:49


利用人工智能模块学习脸部辨识的处理方法

技术领域

本发明关于脸部辨识。

背景技术

脸部辨识属于一种生物特征辨识技术,特别是分析比较脸部视觉特征信息进行身分鉴别的计算机技术。脸部辨识已应用于诸多领域,例如门禁管理、手机解锁、身分认证等等。然而,对于多使用者多张脸的脸部辨识系统,还是会有辨识错误的情况,一般的脸部辨识系统是封闭式的,一般的使用者无法或不容易修正辨识的模型或更新数据,若对一张脸产生辨识错误,在下一次对同一张脸辨识仍会产生同样的辨识错误。这种做法虽然确保安全性,但在即时需求的应用情况反而造成使用的不便利。

发明内容

有鉴于上述课题,本发明的目的是提供一种利用人工智能模块学习脸部辨识的处理方法及电子装置,能让用户方便修正准则以提升下次辨识的正确率。

在一个实施例中,一种脸部辨识的处理方法,包括:从脸部影像取出特征点信息;根据特征点信息输出脸部辨识的识别结果,识别结果包括识别人名以及特征点距离信息;判断识别人名是否在名单中;当识别人名在名单中,进行移除确认步骤,用以根据特征点距离信息判断识别结果是否需移除;当识别结果不需移除时,显示识别人名;当识别结果需移除时,显示负面提示;以及动态即时回馈及更新脸部辨识的识别方法。

在一个实施例中,移除确认的步骤包括:判断识别结果是否为模棱两可;当识别结果为模棱两可时,提供多个候选人名以供使用者从中选择正确人名;当正确人名与识别人名不同时,根据正确人名与特征点距离信息更新脸部数据库。

在一个实施例中,特征点距离信息包括特征点距离,判断识别结果是否为模棱两可的步骤包括:当特征点距离小于低门槛值,识别结果为不需移除;当特征点距离大于高门槛值,识别结果为需移除,其中,高门槛值大于低门槛值;以及当特征点距离介于低门槛值与高门槛值之间,识别结果为模棱两可。

在一个实施例中,提供多个候选人名的步骤包括:计算脸部数据库中每一笔脸部特征数据以得到多笔脸部距离数据;将这些脸部距离数据排序;从这些脸部距离数据列出距离最接近的头N笔作为候选距离数据;根据这些候选距离数据所对应的人名进行人名计票;以及显示人名计票结果,人名计票结果包括这些候选人名。

在一个实施例中,更新脸部数据库的步骤包括:在脸部数据库中,移除正确人名的一笔最不近似的记录;以及在脸部数据库中,根据特征点距离信息新增正确人名的一笔记录。

在一个实施例中,移除确认步骤还包括:当正确人名与识别人名相同时,不更新脸部数据库,并显示识别人名。

在一个实施例中,处理方法还包括:当识别人名不在名单中,进行更新确认步骤,用以新增一笔人名数据在清单。

在一个实施例中,人工智能模块的神经网络用于从脸部影像取出特征点信息,该人工智能模块的分类器用于根据特征点信息输出识别结果。

在一个实施例中,一种脸部辨识的处理方法,包括:从脸部影像取出特征点信息;根据特征点信息输出脸部辨识的识别结果,识别结果包括识别人名以及特征点距离信息;判断识别人名是否在名单中;当识别人名不在名单中,进行更新确认步骤,用以新增一笔人名数据在清单;当识别人名在名单中,进行移除确认步骤,用以根据特征点距离信息判断识别结果是否需移除;当识别结果不需移除时,显示识别人名;当识别结果需移除时,显示负面提示;以及动态即时回馈及更新该脸部辨识的识别方法。其中移除确认步骤包括:判断识别结果是否为模棱两可;当识别结果为模棱两可时,提供多个候选人名以供使用者从中选择正确人名;当正确人名与识别人名相同时,不更新脸部数据库,并显示识别人名;当正确人名与识别人名不同时,根据正确人名与特征点距离信息更新脸部数据库。其中,特征点距离信息包括特征点距离,判断识别结果是否为模棱两可的步骤包括:当特征点距离小于低门槛值,识别结果为不需移除;当特征点距离大于高门槛值,识别结果为需移除,其中,高门槛值大于低门槛值;以及当特征点距离介于低门槛值与高门槛值之间,识别结果为模棱两可。其中,提供多个候选人名的步骤包括:计算脸部数据库中每一笔脸部特征数据以得到多笔脸部距离数据;将这些脸部距离数据排序;从这些脸部距离数据列出距离最接近的头N笔作为候选距离数据;根据这些候选距离数据所对应的人名进行人名计票;以及显示人名计票结果,人名计票结果包括这些候选人名。其中,更新脸部数据库的步骤包括:在脸部数据库中,移除正确人名的一笔最不近似的记录;以及在脸部数据库中,根据特征点距离信息新增正确人名的一笔记录。

在一个实施例中,一种电子装置进行脸部辨识的处理方法。

承上所述,本公开的脸部辨识的处理方法及电子装置,能让用户方便修正准则以提升下次辨识的正确率,可应用在多使用者多张脸的脸部辨识系统,即时地新增脸部数据以及回馈至识别过程,提高下次脸部辨识的正确率。

附图说明

图1为一个实施例的脸部辨识的处理方法的流程区块图。

图2为脸部特征点的示意图。

图3为图1中移除确认区块的流程区块图。

图4与图5为进行脸部辨识的处理方法的电子装置的区块图。

具体实施方式

以下将参照相关附图,说明根据本发明优选实施例的脸部辨识的处理方法及电子装置,其中相同的元件将以相同的附图标记加以说明。

如图1所示,图1为一个实施例的脸部辨识的处理方法的流程区块图。各区块代表一个步骤,各步骤可有进一步的细节步骤。脸部辨识的处理方法包括区块102至区块110及区块200至区块214,这些步骤包括:取得输入影像(区块102);从输入影像检测脸部并取出脸部影像(区块104);从脸部影像取出特征点信息(区块106);根据特征点信息输出脸部辨识的识别结果,识别结果包括识别人名以及特征点距离信息(区块108);判断识别人名是否在名单中(区块202);当识别人名在名单中,进行移除确认步骤,用以根据特征点距离信息判断识别结果是否需移除(区块204);当识别结果不需移除时,显示识别人名(区块206);当识别结果需移除时,显示负面提示(区块208);当识别人名不在名单中,进行更新确认步骤,用以新增一笔人名数据在清单中(区块212)。另外,在之前可询问使用者是否要更新(区块210),若不更新则进入区块208,若要更新才进入区块212。经由区块210、212、214以及甚至区块204,可以动态即时回馈及更新脸部辨识的识别方法。

在区块102中,影像来源可以是相机或通讯装置等等,相机可即时对使用者拍摄相片而产生输入影像,通讯装置可从远端接收影像,远端也可连接相机来拍摄相片而产生输入影像。然后,在区块104中,在影像中检测脸部,并从输入影像中取出脸部的部分,以供后续的脸部特征辨识。

在区块106中,从脸部影像取出特征点信息。举例来说,如图2所示,脸部特征点信息包括多个嵌入特征点(embedding features),人脸定位点取出(facial landmarkextraction)运用多个嵌入特征点来标示人脸的五官。此区块可以利用神经网络来实现,例如深度学习(deep learning)的神经网络。嵌入特征点的数量例如是256个点,是由深度架构(deep architecture)及L2范数(L2 norm)计算得出。

在区块108中,根据输入影像的特征点信息以及脸部数据库中的一张脸的特征点信息计算欧几里得距离(Euclidean distance),计算式如以下式(1),然后基于算出的距离利用分类器加以分类,分类的结果做为脸部辨识的识别结果,识别结果包括识别人名以及特征点距离信息。举例来说,识别人名的数量是一位,特征点距离信息是这些嵌入特征点在两张脸部影像之间的欧几里得距离。

k:嵌入特征点的数量,例如256;

Xi:是输入影像的特征点;

Yi:脸部数据库中的一张脸的特征点。

区块104至区块108可以在区块110中,区块110表示其可以实现为一个人工智能模块(A.I.module),人工智能模块可以是晶片、程序代码、或是晶片与程序代码组成的固件。区块202至区块212可以在区块200中,区块200表示其可以实现为一个计算装置,计算装置可具备处理器以及存储器,处理器被配置以执行程序代码,存储器被配置以储存程序代码与数据。举例来说,区块200可以是移动计算设备的应用程序(Application Program)。人工智能模块的神经网络用于区块106从脸部影像取出特征点信息,人工智能模块的分类器用于区块108根据特征点信息输出识别结果,区块110以及区块200的结合是利用人工智能模块学习脸部辨识的处理方法。

在区块202中,判断识别人名是否在名单中,名单中的人名代表这些人名在脸部数据库中存有对应的脸部特征数据,名单可存放在脸部数据库中。

在区块204中,当识别人名在名单中,进行移除确认步骤,用以根据特征点距离信息判断识别结果是否需移除,如果识别结果是错的,则有机制可让使用者修正回馈至识别过程,这可提高下次脸部辨识的正确率。

在区块206中,当识别结果不需移除时,显示识别人名,这代表识别结果是正确的情况。

在区块208中,当识别结果需移除时,显示负面提示,负面提示例如是错误讯息或是表达辨识结果未知。

在区块210至区块212中,当识别人名不在名单中,先询问使用者是否要更新,若不更新则进入区块208显示负面提示,若要更新才进入区块212进行更新确认步骤。更新确认步骤是新增一笔人名数据在清单中并增加对应的脸部特征信息到脸部数据库中,并且更新区块108所采用的分类器的模型(model)。在区块214中,则进一步储存区块108所采用的分类器的模型,让区块110在下次脸部辨识时能够认得本次新增的脸,并输出正确的辨识结果。另外,在区块212也可更新在图3的区块中使用到的低门槛值T1及高门槛值T2。

如图3所示,图3为图1中移除确认区块204的流程区块图。各区块代表一个步骤,各步骤可包括进一步的细节步骤。

移除确认区块所进行的步骤包括:判断识别结果是否为模棱两可(区块310);当识别结果为模棱两可时,提供多个候选人名以供使用者从中选择正确人名(区块320);当正确人名与识别人名相同时,不更新脸部数据库,并显示识别人名(区块334);当正确人名与识别人名不同时,根据正确人名与特征点距离信息更新脸部数据库(区块340)。

在区块310中,特征点距离信息包括特征点距离,区块310包括区块302至区块306。

在区块302中,取得特征点距离,并初始化低门槛值T1以及高门槛值T2,其中,高门槛值T2大于低门槛值T1。

在区块304中,判断特征点距离是否小于低门槛值T1(区块304),当特征点距离小于低门槛值T1,识别结果为不需移除,然后进入区块308;当特征点距离不小于低门槛值T1,则进入区块306。区块308是进入区块206要显示识别人名。

接着,在区块306中,判断特征点距离是否大于高门槛值T2,其中,高门槛值T2大于低门槛值T1,进入区块312代表当特征点距离大于高门槛值T2,识别结果为需移除。区块314是进入区块208要显示负面提示。当特征点距离介于低门槛值T1与高门槛值T2之间,识别结果为模棱两可然后进入区块320。

在区块320中,提供多个候选人名的步骤包括:计算脸部数据库中每一笔脸部特征数据以得到多笔脸部距离数据(区块322);将这些脸部距离数据排序(区块324);从这些脸部距离数据列出距离最接近的头N笔作为候选距离数据(区块326),过滤出N笔数据;根据这些候选距离数据所对应的人名进行人名计票(区块328);以及显示人名计票结果,人名计票结果包括这些候选人名(区块330)。

在区块322中,当下输入的脸部影像的特征数据和脸部数据库中各笔脸部特征数据分别计算欧几里得距离以分别得到一笔脸部距离数据,整体得到多笔脸部距离数据。

在区块324中,排序是以最近到最远的顺序,即距离较小为较优先。

在区块326至区块330中,N例如是10,假定10笔数据中不论顺序有5笔是人名C的数据,3笔是人名A的数据,2笔是人名B的数据,在区块328中的人名计票会依票数高低产生顺序,例如C、A、B的顺序。在区块330中会显示C、A、B的顺序以及人名,最高顺位的人名代表辨识的最佳预测结果。

在区块332中,用户可根据显示的人名计票结果来判断顺位最高的人名是否正确,若正确则可选择不需更新并采用最佳预测结果,顺位最高的人名作为识别人名,然后进入区块334,否则进入区块340。

在区块334中,不更新脸部数据库也不更新分类器,保持区块108所采用的分类器的模型,门槛值T1、T2也不更新,然后可进入区块206来显示识别人名。

在区块340中,更新脸部数据库的步骤包括:使用者输入正确人名(区块342);在脸部数据库中,移除正确人名的一笔最不近似的记录(区块344);以及在脸部数据库中,根据特征点距离信息新增正确人名的一笔记录(区块346),新增的人名作为识别人名;进入区块206来显示识别人名(区块348)。

在区块342中,使用者可从候选人名选择其中一名作为正确人名,候选人名属于名单中的人名,使用者无法选择或新增不属于名单中的人名。

在区块344中,在脸部数据库中,正确人名有多笔特征记录,这些特征记录是针对同一个人不同的脸部影像分别产生,各笔特征记录有各自的特征点距离,这些特征记录中特征点距离为最远的是被视为最不近似的,在此步骤是要被移除的记录。少一笔数据会在下一个区块步骤中补回。

在区块346中,在脸部数据库中,根据输入影像的特征点距离信息新增正确人名的一笔记录,并且更新储存区块108所采用的分类器的模型,让区块110在下次脸部辨识时能够认得本次新增的脸,并输出正确的辨识结果。另外,在区块346也可更新低门槛值T1及高门槛值T2。

图4与图5为进行脸部辨识的处理方法的电子装置的区块图。如图4所示,电子装置400可以是计算机装置,其包括处理单元402、显示单元404、拍照单元406、输入单元408、存储单元410以及辨识单元416。处理单元402耦接显示单元404、拍照单元406、输入单元408、存储单元410以及辨识单元416。处理单元402被配置以执行程序代码,程序代码及相关数据可储存于存储单元410。图1的区块200以及图3中的区块可以实现在程序代码以及执行程序代码的处理单元,举例来说,存储单元410储存校对模块412以及脸部数据库414,区块200可以是存储单元410所储存的校对模块412,校对模块412包括程序代码与数据。拍照单元406可进行区块102的功能,辨识单元416可进行区块110的功能并且可以是晶片。显示单元404可包括显示器,其可进行各区块或步骤的显示功能。输入单元408可包括输入元件例如触碰面板、或键盘等等,其可进行各区块或步骤的用户输入功能。

另外,图4的辨识单元416可改为图5的存储单元410所储存的辨识模块418,图5的电子装置400a中,区块110可以是存储单元410所储存的辨识模块418,辨识模块418包括程序代码与数据。

承上所述,本公开的脸部辨识的处理方法及电子装置能让用户方便修正准则以提升下次辨识的正确率,可应用在多使用者多张脸的脸部辨识系统,即时地新增脸部数据以及回馈至识别过程,提高下次脸部辨识的正确率。

以上公开的实施例仅用于说明本发明的各种用途。应当理解的是,鉴于上述教示,本公开的功能元件和特征的多种修改、变化和组合是可能的,且因此,在所附权利要求的范围内,并且本公开可以以不同于特别公开的方式来实施。

以上所述仅为举例性,而非为限制性。任何未脱离本发明的精神与范畴,而对其进行的等效修改或变更,均应包含于随附的权利要求范围中。

相关技术
  • 利用人工智能模块学习脸部辨识的处理方法
  • 利用辨识功能比对汉字的学习装置
技术分类

06120112985458