掌桥专利:专业的专利平台
掌桥专利
首页

证件上传识别方法、设备及计算机可读存储介质

文献发布时间:2023-06-19 13:46:35


证件上传识别方法、设备及计算机可读存储介质

技术领域

本发明涉及金融科技(Fintech)技术领域,尤其涉及证件上传识别方法、设备及计算机可读存储介质。

背景技术

随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对图像识别技术提出了更高的要求。传统的证件识别技术,要求证件拍摄图像清晰完整。但对于视障者而言,因为看不见而无法辨别出证件出现反光,或是不在屏幕内等情况,往往会因此而屡屡上传失败,导致自己难以独立操作上传证件。上述情况反映出视障者难以通过现有的证件上传识别方式独立进行证件上传识别的问题。

发明内容

本发明的主要目的在于提出一种证件上传识别方法、设备及计算机可读存储介质,旨在解决视障者难以通过现有的证件上传识别方式独立进行证件上传识别的技术问题。

为实现上述目的,本发明提供一种证件上传识别方法,所述证件上传识别方法应用于具有摄像功能的移动终端,所述证件上传识别方法包括:

在接收到上传方式选择指令时,基于所述上传方式选择指令确定目标上传方式,其中,所述目标上传方式至少包括拍摄上传;

若所述目标上传方式为拍摄上传,则控制摄像功能处于开启状态,并基于摄像功能获取对证件拍摄所得到的拍摄图像;

判断所述拍摄图像是否满足预设的上传标准;

若不满足所述上传标准,则确定调整操作策略,根据所述调整操作策略生成调整操作语音提示并输出,以供上传者对证件和/或所述移动终端进行位置调整;

获取调整后得到的拍摄图像,并基于调整后得到的拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤,直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示。

可选地,所述若所述目标上传方式为拍摄上传,则控制摄像功能处于开启状态,并基于摄像功能获取对证件拍摄所得到的拍摄图像的步骤包括:

若所述目标上传方式为拍摄上传,则在检测到针对当前页面中的语音提示区域的触发事件时,输出预设的姿势语音提示,并控制摄像功能处于开启状态,其中,所述姿势语音提示用于提示上传者按照标准识别姿势手持证件和所述移动终端;

基于所述标准识别姿势和摄像功能获取对证件拍摄所得到的拍摄图像。

可选地,所述判断所述拍摄图像是否满足预设的上传标准的步骤包括:

判断所述拍摄图像是否满足清晰度标准和完整性标准;

若所述拍摄图像满足清晰度标准和完整性标准,则判定所述拍摄图像满足所述上传标准;

若所述拍摄图像不满足清晰度标准和/或完整性标准,则判定所述拍摄图像不满足所述上传标准。

可选地,所述若不满足所述上传标准,则确定调整操作策略,根据所述调整操作策略生成调整操作语音提示并输出的步骤包括:

若不满足所述上传标准,则分析所述拍摄图像以确定异常原因,并基于所述异常原因和所述移动终端中的位置传感器确定调整操作策略;

将所述异常原因和所述调整操作策略转化为语音信息以作为所述调整操作语音提示进行输出。

可选地,所述异常原因包括位置异常原因,

所述若不满足所述上传标准,则分析所述拍摄图像以确定异常原因,并基于所述异常原因和所述移动终端中的位置传感器确定调整操作策略的步骤包括:

若不满足所述上传标准,则对所述拍摄图像进行目标检测,以确定所述位置异常原因;

针对所述位置异常原因,利用所述位置传感器计算出所述移动终端的改进移动方向,以将所述改进移动方向作为所述调整操作策略。

可选地,所述证件包括身份证,

所述直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示的步骤包括:

直至调整后得到的拍摄图像满足预设的上传标准时,确定所述拍摄图像的正反面类型;

生成包含所述正反面类型的单面识别成功语音提示,以作为所述拍摄上传成功语音提示并输出。

可选地,所述生成包含所述正反面类型的单面识别成功语音提示,以作为所述拍摄上传成功语音提示并输出的步骤之后,还包括:

生成并输出身份证翻面提示,以供上传者将身份证翻面;

获取身份证翻面后的翻面拍摄图像,并基于所述翻面拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤;

直至所述翻面拍摄图像满足所述上传标准时,生成双面识别成功语音提示并输出。

可选地,所述目标上传方式还包括相册上传,

所述在接收到上传方式选择指令时,基于所述上传方式选择指令确定目标上传方式的步骤之后,还包括:

若所述目标上传方式为相册上传,则请求开启本地相册,并在请求通过时显示本地相册中的图像;

接收图像查看指令,基于所述图像选择指令确定本地相册中的目标图像,并语音输出所述目标图像的图像描述;

在接收到针对所述目标图像的图像选中指令时,获取所述目标图像,以将所述目标图像作为证件预存图像;

判断所述证件预存图像是否符合所述上传标准,并在所述证件预存图像符合所述上传标准时,生成并输出选择上传成功语音提示。

此外,为实现上述目的,本发明还提供一种证件上传识别装置,所述证件上传识别装置包括:

目标方式确定模块,用于在接收到上传方式选择指令时,基于所述上传方式选择指令确定目标上传方式,其中,所述目标上传方式至少包括拍摄上传;

摄像功能开启模块,用于若所述目标上传方式为拍摄上传,则控制摄像功能处于开启状态,并基于摄像功能获取对证件拍摄所得到的拍摄图像;

上传标准判断模块,用于判断所述拍摄图像是否满足预设的上传标准;

调整策略确定模块,用于若不满足所述上传标准,则确定调整操作策略,根据所述调整操作策略生成调整操作语音提示并输出,以供上传者对证件和/或所述移动终端进行位置调整;

识别成功提示模块,用于获取调整后得到的拍摄图像,并基于调整后得到的拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤,直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示。

此外,为实现上述目的,本发明还提供一种证件上传识别设备,所述证件上传识别设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的证件上传识别程序,所述证件上传识别程序被所述处理器执行时实现如上所述的证件上传识别方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有证件上传识别程序,所述证件上传识别程序被处理器执行时实现如上所述的证件上传识别方法的步骤。

此外,为实现上述目的,本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的证件上传识别方法的步骤。

本发明通过在视障者选择独立拍摄上传证件时,自动开启摄像头来捕捉出现在摄像范围内的证件图像,并判断拍摄图像是否满足上传标准,在不满足时自动为视障者生成调整操作策略并语音告知,使得在拍摄图像不合规定无法上传时,能够引导视障者对移动终端或证件进行正确位置的调整,以克服异常原因,因此大大提升了证件上传成功率,同时也极大提升了视障者的用户体验;通过在视障者拍摄出合格证件图像时,向其输出识别成功的语音提示,使得视障者能够及时获知当前的拍摄操作成功的信息,从而顺利完成全流程的证件上传操作,而无需他人辅助,因此解决了视障者难以通过现有的证件上传识别方式独立进行证件上传识别的技术问题。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;

图2为本发明证件上传识别方法第一实施例的流程示意图;

图3为本发明证件上传识别方法第一实施例中一具体的标准识别姿势示意图;

图4为本发明证件上传识别方法第二实施例中一具体实施例的识别异常提示示意图;

图5为本发明证件上传识别方法第三实施例中一具体实施例的身份证双面识别提示示意图;

图6为本发明证件上传识别装置的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对图像识别技术提出了更高的要求。传统的证件识别技术,要求证件拍摄图像清晰完整。但对于视障者而言,因为看不见而无法辨别出证件出现反光,或是不在屏幕内等情况,往往会因此而屡屡上传失败,导致自己难以独立操作上传证件。上述情况反映出视障者难以通过现有的证件上传识别方式独立进行证件上传识别的问题。

为解决上述问题,本发明提供一种证件上传识别方法,即通过在视障者选择独立拍摄上传证件时,自动开启摄像头来捕捉出现在摄像范围内的证件图像,并判断拍摄图像是否满足上传标准,在不满足时自动为视障者生成调整操作策略并语音告知,使得在拍摄图像不合规定无法上传时,能够引导视障者对移动终端或证件进行正确位置的调整,以克服异常原因,因此大大提升了证件上传成功率,同时也极大提升了视障者的用户体验;通过在视障者拍摄出合格证件图像时,向其输出识别成功的语音提示,使得视障者能够及时获知当前的拍摄操作成功的信息,从而顺利完成全流程的证件上传操作,而无需他人辅助,因此解决了视障者难以通过现有的证件上传识别方式独立进行证件上传识别的技术问题。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

如图1所示,该证件上传识别装置可以包括:处理器1001,例如CPU,用户接口1003,网络接口1004,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及证件上传识别程序。

在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(程序员端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的证件上传识别程序,并执行下述证件上传识别方法中的操作。

基于上述硬件结构,提出本发明证件上传识别方法实施例。

参照图2,图2为本发明证件上传识别方法第一实施例的流程示意图。所述证件上传识别方法应用于具有摄像功能的移动终端,所述证件上传识别方法包括:

步骤S10,在接收到上传方式选择指令时,基于所述上传方式选择指令确定目标上传方式,其中,所述目标上传方式至少包括拍摄上传;

步骤S20,若所述目标上传方式为拍摄上传,则控制摄像功能处于开启状态,并基于摄像功能获取对证件拍摄所得到的拍摄图像;

步骤S30,判断所述拍摄图像是否满足预设的上传标准;

在本实施例中,具有摄像功能的移动终端通常为手机,为便于说明,以下均以手机为例。上传页面访问指令可以由视障者通过手机上的实体按键或屏幕上的虚拟按键触发,还可通过语音触发。证件具体可以是各个种类的证件,例如身份证、户口本、驾驶证等等。上传标准具体可基于完整性、清晰度等的一项或多项因素进行设置。

视障者在手机上打开证件上传页面时,页面会提供给视障者至少拍摄上传这一种上传方式,当然,除了拍摄上传方式外,也可提供其他上传方式,本实施例中主要针对拍摄上传方式进行说明。视障者在选择摄像上传方式后,手机控制摄像头持续处于开启状态。视障者既可以按照自己的方式对证件进行拍摄(例如将证件放在桌子上,将摄像头对着证件拍摄),也可以触发页面中的语音提示,以提示设定的拍摄姿势,以令证件进入手机的拍摄范围。

另外,在手机显示出证件上传页面之前,其摄像功能可以已开启,或还未开启。若已开启,则手机在显示出证件上传页面后继续保持摄像功能的开启状态;若还未开启,则手机在显示证件上传页面时就将摄像功能从关闭状态切换至开启状态。

具体地,手机在视障者将证件沿手机摄像头中心位置慢慢远离时,手机摄像头能够在摄像范围内捕捉到证件,然后拍摄到包含证件的图像。但此时所拍摄到的图像中所包含的证件可能并不完整,或是存在反光而导致的证件信息不清晰的现象。因此,需要对拍摄到的图像进行图像处理,判断其是否满足上传标准。若是满足上传标准,则可以将此拍摄图像进行处理后上传。

需要说明的是,在此过程中手机对证件的识别过程中,全屏无需对准识别,且能够横竖斜兼容识别,无需视障者将证件端正地摆在摄像屏幕正中的位置,只要出现在屏幕中的证件满足上传标准,即使是呈倾斜状态,或是靠近屏幕边缘,手机均可成功识别到,而不是像现有技术中通过识别框进行识别(需要用户将证件对准屏幕上的预设框)。

步骤S40,若不满足所述上传标准,则确定调整操作策略,根据所述调整操作策略生成调整操作语音提示并输出,以供上传者对证件和/或所述移动终端进行位置调整;

在本实施例中,调整操作策略指的是手机根据证件出现在摄像屏幕中的具体情况,智能生成的用于引导视障者调整证件在屏幕中的状态的策略。调整操作语音提示指的是直接将调整操作策略转化为语音形式的信息,或是基于调整操作策略而对应生成的语音信息。

作为一具体实施方式,若此时证件仅有左半边出现在了摄像屏幕的右侧,则手机可对应生成将证件水平向左移动,或是将手机水平向右移动,又或者是将证件旋转九十度,甚至是将手机旋转九十度的调整策略;

作为另一具体实施方式,证件完全未出现在屏幕中,则手机可语音提示“证件不在画面内”,并语音提示视障者重新作出标准姿势;

作为又一具体实施方式,证件虽然完整出现在屏幕内,但因光线过亮或过暗导致证件内容显示不清晰,因此手机可语音提示证件拍摄反光或是过暗,并对应语音提示视障者移动自身位置,以远离或接近光源。

步骤S50,获取调整后得到的拍摄图像,并基于调整后得到的拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤,直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示。

在本实施例中,拍摄上传成功语音提示指的是用于告知视障者当前识别操作流程已完成的提示信息,视障者在听到拍摄上传成功语音提示后,就可以放下手机和证件,无需再维持拍摄时的姿势。

具体地,视障者在按照语音提示进行调整后,手机再次对证件进行拍摄,获取到新的拍摄图像,并重新判定新的拍摄图像是否满足上传标准,若是还不满足,则继续提示调整操作策略,如此循环往复,直到视障者将证件和/或手机调整到手机能够拍摄到满足上传条件的证件的时候,就可视为调整完成,并输出识别生成的语音提示以及时告知视障者。

另外,作为另一具体实施方式,还可在上传过程中引入人工视频客服,通过人工语音指导视障者移动手机来正确拍摄证件。

本实施例提供一种证件上传识别方法。所述证件上传识别方法通过在视障者选择独立拍摄上传证件时,自动开启摄像头来捕捉出现在摄像范围内的证件图像,并判断拍摄图像是否满足上传标准,在不满足时自动为视障者生成调整操作策略并语音告知,使得在拍摄图像不合规定无法上传时,能够引导视障者对移动终端或证件进行正确位置的调整,以克服异常原因,因此大大提升了证件上传成功率,同时也极大提升了视障者的用户体验;通过在视障者拍摄出合格证件图像时,向其输出识别成功的语音提示,使得视障者能够及时获知当前的拍摄操作成功的信息,从而顺利完成全流程的证件上传操作,而无需他人辅助,因此解决了视障者难以通过现有的证件上传识别方式独立进行证件上传识别的技术问题。

进一步地,基于上述图2所示的第一实施例,提出本发明证件上传识别方法的第二实施例。在本实施例中,步骤S20包括:

步骤S21,若所述目标上传方式为拍摄上传,则在检测到针对当前页面中的语音提示区域的触发事件时,输出预设的姿势语音提示,并控制摄像功能处于开启状态,其中,所述姿势语音提示用于提示上传者按照标准识别姿势手持证件和所述移动终端;

步骤S22,基于所述标准识别姿势和摄像功能获取对证件拍摄所得到的拍摄图像。

在本实施例中,姿势语音提示是预先录制的用于向视障者说明证件拍摄上传标准姿势的提示信息,具体的标准姿势可根据实际需求以及实际效果灵活设置,例如,如图3所示,标准姿势动作可设置为:单手持手机垂直握在胸前,后置摄像头朝向前方。另一只手将证件中心位置贴在手机摄像头上,然后缓慢将证件远离摄像头。

具体地,视障者在当前需要上传证件时,进入手机中的证件上传界面,通过按键或语音触发上传页面访问指令。手机接收到这一证件上传界面时,开启原本处于关闭状态的摄像头,然后在视障者触摸到语音提示区域时,从服务器或是从本地获取到预设的姿势语音提示进行输出。视障者即可根据语音提示作出相应动作,例如单手持手机垂直握在胸前,后置摄像头朝向前方。另一只手将身份证中心位置贴在手机摄像头上,然后缓慢将身份证远离摄像头,手机即可捕捉到出现在摄像范围内的身份证图像。

本实施例进一步通过在视障者需要独立上传证件,且触发页面中的语音提示区域时,输出标准识别姿势的语音提示,使得视障者能够按照提示自主对证件和移动终端进行操作,将证件移动到移动终端的摄像范围,从而了提升了视障者的用户体验。

进一步地,步骤S30包括:

步骤S31,判断所述拍摄图像是否满足清晰度标准和完整性标准;

步骤S32,若所述拍摄图像满足清晰度标准和完整性标准,则判定所述拍摄图像满足所述上传标准;

步骤S33,若所述拍摄图像不满足清晰度标准和/或完整性标准,则判定所述拍摄图像不满足所述上传标准。

在本实施例中,清晰度标准可根据实际情况灵活设置,具体可根据一些图像清晰度量化指标(例如像素等)进行评判。完整性标准指的是需要证件的全部都要出现在拍摄屏幕中,不能有缺损或遮盖。在本实施例中,需要拍摄图像中所出现的证件同时满足清晰度标准和完整性标准,才可认为该证件拍摄图像满足上传标准;若是其仅满足两项标准当中的一项,甚至是一项都不满足,则认为该证件拍摄图像不满足上传标准,还需调整后重新进行拍摄。

进一步地,步骤S40包括:

步骤S41,若不满足所述上传标准,则分析所述拍摄图像以确定异常原因,并基于所述异常原因和所述移动终端中的位置传感器确定调整操作策略;

步骤S42,将所述异常原因和所述调整操作策略转化为语音信息以作为所述调整操作语音提示进行输出。

在本实施例中,手机若判定当前所拍摄到的证件图像不满足上传标准,则通过目标识别、标准比对等方式分析出不满足的异常原因,例如证件图像不完整、反光等,然后获取到解决当前异常对应的应对措施(即上述调整操作策略),这一应对措施即可以是直接以语音形式获取到的,也可以是文本等其他形式。若是其他形式,手机则需随其进行语音转换后,再将其与转化为语音形式的异常原因一同进行播报,先语音输出异常原因,然后输出调整操作策略的语音内容,以供视障者得知如何进行调整。

作为一具体实施例,如图4所示。图4中身份证的右边被其他物体遮挡,导致证件主体显示不全,因此手机可在识别图像后确定其异常原因,然后对应分析出屏幕中上下的空余位置较大,可通过改变证件的摆放位置来进行调整,最后生成并输出“证件呈现过小,可将证件旋转九十度竖向拍摄”的语音提示。

进一步地,所述异常原因包括位置异常原因,

步骤S41包括:

步骤S411,若不满足所述上传标准,则对所述拍摄图像进行目标检测,以确定所述位置异常原因;

步骤S412,针对所述位置异常原因,利用所述位置传感器计算出所述移动终端的改进移动方向,以将所述改进移动方向作为所述调整操作策略。

在本实施例中,手机若判定当前拍摄到的证件图像不满足上传标准,则对拍摄图像进行图像目标检测,以评估图像中证件主体的所在位置以及完整性,得到位置异常原因,例如,证件左半边缺失或右半边缺失等。手机再利用自带的位置传感器计算出需要移动的方向,例如,若证件左半边缺失,而屏幕右侧仍有大片空余,则手机可以水平向左移动(也即是改进移动方向为水平向左),以令证件完全出现在屏幕中。

本实施例进一步通过将文字提示都转化为了语音提示,并且通过手机位置传感器计算出手机该向哪个方向移动,显著提高了视障者上传证件的操作成功率。提供了一套标准的识别姿势,有助于降低证件出现反光、不在屏幕内的情况。

进一步地,基于上述图2所示的第一实施例,提出本发明证件上传识别方法的第三实施例。在本实施例中,所述证件包括身份证,步骤S50中所述直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示的步骤包括:

步骤S51,直至调整后得到的拍摄图像满足预设的上传标准时,确定所述拍摄图像的正反面类型;

步骤S52,生成包含所述正反面类型的单面识别成功语音提示,以作为所述拍摄上传成功语音提示并输出。

在本实施例中,由于传统的身份证识别技术,必须分别上传身份证人像面和国徽面,但是视障者因为看不见而无法分清身份证的人像面和国徽面,导致不能自己独立操作上传身份证。而本实施例取消了分别上传身份证人像面和国徽面的形式,而是采用自动识别身份证人像面和国徽面的方式。视障者在任意选择一面通过上述方式拍摄成功后,手机会自动识别出该面为国徽面还是人像面,然后结合具体类型生成单面识别成功的语音提示,例如,语音提示内容可为:国徽面已识别成功。

进一步地,步骤S52之后,还包括:

步骤S53,生成并输出身份证翻面提示,以供上传者将身份证翻面;

步骤S54,获取身份证翻面后的翻面拍摄图像,并基于所述翻面拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤;

步骤S55,直至所述翻面拍摄图像满足所述上传标准时,生成双面识别成功语音提示并输出。

在本实施例中,由于身份证的正反两面均需上传,因此在单面识别完成后,还需翻面对另一面进行拍摄识别。因此,手机此时还需生成翻面语音提示并输出,该提示可与单面识别成功提示一同输出,然后待另一面也识别成功时,手机则可输出双面识别成功的语音提示。

作为一具体实施例,如图5所示,图5左边为身份证人像面识别成功时,手机会自动输出“人像面识别成功,请翻面”的语音及文字提示,图5右边为身份证国徽面也识别成功时,手机自动输出的“国徽面识别成功”的语音及文字提示。视障者才听到人像面和国徽面均识别成功的提示后,就可以知道此时已完成身份证的上传。

进一步地,所述目标上传方式还包括相册上传,步骤S10之后,还包括:

步骤A1,若所述目标上传方式为相册上传,则请求开启本地相册,并在请求通过时显示本地相册中的图像;

步骤A2,接收图像查看指令,基于所述图像选择指令确定本地相册中的目标图像,并语音输出所述目标图像的图像描述;

步骤A3,在接收到针对所述目标图像的图像选中指令时,获取所述目标图像,以将所述目标图像作为证件预存图像;

步骤A4,判断所述证件预存图像是否符合所述上传标准,并在所述证件预存图像符合所述上传标准时,生成并输出选择上传成功语音提示。

在本实施例中,还提供了一种相册上传方式。若是视障者预先通过他人拍摄好证件图像,并存储在相册中,则可在需要上传证件时,从相册中找到预存的证件图像然后上传。

具体地,视障者在手机上打开上传界面后,选择相册上传方式,手机即将本地相册中的图像显示出来,其中,为便于视障者辨别,每张图像都设有图像描述,图像描述的内容可以包括图像名称、图像拍摄时间等。视障者可通过点击等方式选择查看图像,手机会语音播放视障者选择查看的图像的图像描述,若是播放到名称带有证件名称或是其他可表明此图像为预拍摄的证件图像的图像描述,则视障者可确定当前查看的图像为当前所需的证件图像,并通过双击等操作向手机发出图像选中指令,手机即可从本地相册中获取到该图像,作为证件预存图像,然后判断该图像是否上传标准。若是符合,则可将此图像直接上传;若是不符合,则可提示视障者使用其他方式进行上传。

另外,步骤S50之后,还可包括:

将调整后得到的拍摄图像进行位置修正和目标裁剪处理,得到标准化证件扫描图像,并将所述标准化扫描图像上传至指定终端。

在本实施例中,由于手机在拍摄时所采用的是全屏无差别识别的方式,因此直接拍摄得到的原始图像中证件在画面上的位置可能会呈现倾斜的状态,且画面中可能包含有除了证件之外的其他物体,因此,手机需要对拍摄图像进行目标分割处理,去除证件之外的背景,并修正证件的位置,以得到更为标准的证件扫描图像。手机在提到标准证件扫描图像后,即可将其(加密后)上传至指定服务器或其他终端。

本实施例以身份证识别技术为基础,将识别方式优化为全屏无差别识别、正反面自动识别、横竖斜兼容识别,增加了强弱光和身份证不在画面内的提示语音,并且提供了一套标准的识别姿势用于帮助视障者提高身份证识别效率。

如图6所示,本发明还提供一种证件上传识别装置,所述证件上传识别装置包括:

目标方式确定模块10,用于在接收到上传方式选择指令时,基于所述上传方式选择指令确定目标上传方式,其中,所述目标上传方式至少包括拍摄上传;

摄像功能开启模块20,用于若所述目标上传方式为拍摄上传,则控制摄像功能处于开启状态,并基于摄像功能获取对证件拍摄所得到的拍摄图像;

上传标准判断模块30,用于判断所述拍摄图像是否满足预设的上传标准;

调整策略确定模块40,用于若不满足所述上传标准,则确定调整操作策略,根据所述调整操作策略生成调整操作语音提示并输出,以供上传者对证件和/或所述移动终端进行位置调整;

识别成功提示模块50,用于获取调整后得到的拍摄图像,并基于调整后得到的拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤,直至调整后得到的拍摄图像满足所述上传标准时,生成并输出拍摄上传成功语音提示。

可选地,所述摄像功能开启模块20包括:

姿势语音提示单元,用于若所述目标上传方式为拍摄上传,则在检测到针对当前页面中的语音提示区域的触发事件时,输出预设的姿势语音提示,并控制摄像功能处于开启状态,其中,所述姿势语音提示用于提示上传者按照标准识别姿势手持证件和所述移动终端;

拍摄图像获取模块,用于基于所述标准识别姿势和摄像功能获取对证件拍摄所得到的拍摄图像。

可选地,所述上传标准判断模块30包括:

上传标准判断单元,用于判断所述拍摄图像是否满足清晰度标准和完整性标准;

标准第一判定单元,用于若所述拍摄图像满足清晰度标准和完整性标准,则判定所述拍摄图像满足所述上传标准;

标准第二判定单元,用于若所述拍摄图像不满足清晰度标准和/或完整性标准,则判定所述拍摄图像不满足所述上传标准。

可选地,所述调整策略确定模块40包括:

异常原因确定单元,用于若不满足所述上传标准,则分析所述拍摄图像以确定异常原因,并基于所述异常原因和所述移动终端中的位置传感器确定调整操作策略;

调整语音输出单元,用于将所述异常原因和所述调整操作策略转化为语音信息以作为所述调整操作语音提示进行输出。

可选地,所述异常原因包括位置异常原因,

所述异常原因确定单元还用于:

若不满足所述上传标准,则对所述拍摄图像进行目标检测,以确定所述位置异常原因;

针对所述位置异常原因,利用所述位置传感器计算出所述移动终端的改进移动方向,以将所述改进移动方向作为所述调整操作策略。

可选地,所述证件包括身份证,所述识别成功提示模块40包括:

正反类型确定单元,用于直至调整后得到的拍摄图像满足预设的上传标准时,确定所述拍摄图像的正反面类型;

单面识别提示单元,用于生成包含所述正反面类型的单面识别成功语音提示,以作为所述拍摄上传成功语音提示并输出。

可选地,所述识别成功提示模块50还包括:

翻面提示输出单元,用于生成并输出身份证翻面提示,以供上传者将身份证翻面;

翻面图像判断单元,用于获取身份证翻面后的翻面拍摄图像,并基于所述翻面拍摄图像返回执行判断所述拍摄图像是否满足预设的上传标准的步骤;

双面识别提示单元,用于直至所述翻面拍摄图像满足所述上传标准时,生成双面识别成功语音提示并输出。

可选地,所述目标上传方式还包括相册上传,

所述证件上传识别装置还包括:

本地相册开启模块,用于若所述目标上传方式为相册上传,则请求开启本地相册,并在请求通过时显示本地相册中的图像;

图像描述输出模块,用于接收图像查看指令,基于所述图像选择指令确定本地相册中的目标图像,并语音输出所述目标图像的图像描述;

目标图像获取模块,用于在接收到针对所述目标图像的图像选中指令时,获取所述目标图像,以将所述目标图像作为证件预存图像;

预存图像判断模块,用于判断所述证件预存图像是否符合所述上传标准,并在所述证件预存图像符合所述上传标准时,生成并输出选择上传成功语音提示。

本发明还提供一种证件上传识别设备。

所述证件上传识别设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的证件上传识别程序,其中所述证件上传识别程序被所述处理器执行时,实现如上所述的证件上传识别方法的步骤。

其中,所述证件上传识别程序被执行时所实现的方法可参照本发明证件上传识别方法的各个实施例,此处不再赘述。

本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有证件上传识别程序,所述证件上传识别程序被处理器执行时实现如上所述的证件上传识别方法的步骤。

其中,所述证件上传识别程序被执行时所实现的方法可参照本发明证件上传识别方法各个实施例,此处不再赘述。

本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的证件上传识别方法的步骤。

其中,所述计算机程序被执行时所实现的方法可参照本发明证件上传识别方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

技术分类

06120113804646