掌桥专利:专业的专利平台
掌桥专利
首页

商户签约资质审核方法、装置及电子设备

文献发布时间:2024-04-18 19:44:28


商户签约资质审核方法、装置及电子设备

技术领域

本发明涉及数据处理技术领域,具体涉及一种商户签约资质审核方法、装置及电子设备。

背景技术

商户在向目标机构申请相应资质时,需要提交资质材料,目标机构对资质材料进行真实性、完整性及有效性的审核,并向商户返回审核结果。目前,这一审核过程通常由人工审核。人工审核方式成本高、效率低,且容易出现风险漏过的情况。

发明内容

本发明的目的之一在于提供一种商户签约资质审核方法,该方法能够在用户上传资质材料后实时告知审核结果,提高资质审核效率,同时提供兜底人工审核机制,有效提升签约体验。

根据上述发明目的,本说明书实施例提出了一种商户签约资质审核方法,包括:

获取用户上传的资质材料,所述资质材料包括至少一张资质图片;

对所述至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果;

针对每一张所述资质图片,若所述预审核评价结果为不合格,则生成错误提示信息,并将所述错误提示信息反馈给用户;当该资质图片的预审核评价结果为不合格的总次数达到预设阈值时,将该资质图片提交至人工审核环节;

若所述资质材料中的每一张所述资质图片的预审核评价结果均为合格,则生成资质审核工单,并将所述资质审核工单提交至资质审核环节。

本说明书实施例中提出的商户签约资质审核方法将算法与策略有效结合,通过预审核评价环节从多方面对资质材料进行评价,实时反馈资质材料真实性的判断结果,能够提升资质审核效率,并有效检测出资质材料中存在的风险。当预审核评价结果不合格时,通过错误提示反馈引导用户重新上传资质材料,能够有效提升预审核页面的转化率以及预审核通过率;而人工审核环节作为兜底机制,保证了用户良好的签约体验。

进一步地,在一些实施方式中,所述预审核流程包括图片质量预审核;基于预设的预审核流程,对所述至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将所述资质图片输入预先训练的图片质量评价模型,得到该资质图片的图片质量评价结果;

基于所述图片质量评价结果,确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核流程包括图片类型审核;基于预设的预审核任务流程,对所述至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将所述资质图片输入预先训练的分类模型,得到该资质图片的预测类型;

将所述预测类型与预设的目标类型进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核流程包括图片文本信息核验;基于预设的预审核任务流程,对所述至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将所述资质图片输入预先训练的分类模型,确定所述资质图片的图片类型;

提取该资质图片的中的文本区域图像,对所述文本区域图像进行光学字符识别,得到文本识别结果;

基于所述图片类型,确定第三方权威机构;

基于所述第三方权威机构的公开数据,对所述文本识别结果进行核验;

基于核验结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核流程包括图标信息核验,所述图标信息核验具体包括:

将所述资质图片输入预先训练的分类模型,确定所述资质图片的图片类型;

基于所述资质图片的图片类型,确定该图片类型对应的图标识别模板;所述图标识别模板包括至少一个目标候选框,所述目标候选框的位置为待采集的图标的位置;

基于所述图标识别模板的至少一个目标候选框,确定所述资质图片中的图标区域图像;

将所述图标区域图像与预设图标模板进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述资质审核工单包括所述至少一张资质图片和与所述至少一张资质图片对应的至少一个目标字段;所述生成资质审核工单,具体包括:

针对每一张预审核评价结果为合格的资质图片,提取该资质图片的文本区域图像;

对所述文本区域图像进行光学字符识别,得到文本识别结果;

对所述文本识别结果进行关键词提取,将提取出的关键词与所述资质审核工单中的目标字段的预设选项进行匹配;

基于匹配结果,生成所述目标字段的至少一个可选项,并将所述可选项推荐给用户;

基于用户对所述可选项的选择结果,确定所述目标字段,得到所述资质审核工单。

通过图片内容识别与智能推荐来填充资质审核工单中的目标字段可有效提升基于资质材料的信息采集质量,缩短填写材料的时间成本,同时简化需要用户主动操作的步骤,优化用户的签约体验。

本发明的另一目的在于提供一种商户签约资质审核装置,该装置能够实时对用户上传的资质材料进行审核并告知审核结果,提高资质审核效率,同时提供兜底人工审核机制,有效提升签约体验。

根据上述发明目的,本说明书实施例提出了一种商户签约资质审核装置,包括:

数据获取模块,配置为获取用户上传的资质材料,所述资质材料包括至少一张资质图片;

预审核模块,配置为对所述至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果;

错误提示模块,配置为在所述资质图片的预审核评价结果为不合格时,生成针对该资质图片的错误提示信息,并将所述错误提示信息反馈给用户;以及在资质图片的预审核评价结果为不合格的总次数达到预设阈值时,则将该资质图片提交至人工审核环节;

资质审核工单生成模块,配置为在所述资质材料中的每一张所述资质图片的预审核评价结果均为合格时,生成资质审核工单,并将所述资质审核工单提交至资质审核环节。

进一步地,在一些实施方式中,所述预审核模块包括图片质量预审核模块;所述图片质量预审核模块具体用于将所述资质图片输入预先训练的图片质量评价模型,得到该资质图片的图片质量评价结果;基于所述图片质量评价结果,确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核模块包括图片类型审核模块;所述图片类型审核模块具体用于将所述资质图片输入预先训练的分类模型,得到该资质图片的预测类型;将所述预测类型与预设的目标类型进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核模块包括图片文本信息核验模块;所述图片文本信息核验模块具体用于将所述资质图片输入预先训练的分类模型,确定所述资质图片的图片类型;提取该资质图片的中的文本区域图像,对所述文本区域图像进行光学字符识别,得到文本识别结果;基于所述图片类型,确定第三方权威机构;基于所述第三方权威机构的公开数据,对所述文本识别结果进行核验,并基于核验结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述预审核模块包括图标信息核验模块;所述图标信息核验模块具体用于将所述资质图片输入预先训练的分类模型,确定所述资质图片的图片类型;基于所述资质图片的图片类型,确定该图片类型对应的图标识别模板,所述图标识别模板包括至少一个目标候选框,所述目标候选框的位置为待采集的图标的位置;基于所述图标识别模板的至少一个目标候选框,确定所述资质图片中的图标区域图像;将所述图标区域图像与预设图标模板进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

进一步地,在一些实施方式中,所述资质审核工单生成模块具体用于针对每一张预审核评价结果为合格的资质图片,提取该资质图片的文本区域图像;对所述文本区域图像进行光学字符识别,得到文本识别结果;对所述文本识别结果进行关键词提取,将提取出的关键词与所述资质审核工单中的目标字段的预设选项进行匹配;基于匹配结果,生成所述目标字段的至少一个可选项,并将所述可选项推荐给用户;基于用户对所述可选项的选择结果,确定所述目标字段,得到所述资质审核工单。

本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述商户签约资质审核方法。

本说明书实施例还提供一种电子设备,包括:

一个或多个处理器;以及

与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述商户签约资质审核方法的步骤。

本说明书实施例所述的商户签约资质审核方法的有益效果在于将算法与策略有效结合,在预审核评价环节利用通用的智能算法从图片质量、图片类型、图片文本信息、图标或者上述任意合适的组合对资质材料进行评价,实时反馈资质材料真实性的判断结果,能够提升资质审核效率,并有效检测出资质材料中存在的风险。当预审核评价结果不合格时,通过错误提示反馈引导用户重新上传资质材料,能够有效提升预审核页面的转化率以及预审核通过率;而人工审核环节作为兜底机制,保证了用户良好的签约体验。

此外,通过图片内容识别与智能推荐来填充资质审核工单中的目标字段可有效提升基于资质材料的信息采集质量,缩短填写材料的时间成本,同时简化需要用户主动操作的步骤。

本说明书实施例所述的商户签约资质审核装置同样具有上述有益效果。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种实施方式下的流程示意图。

图2示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下的应用示意图。

图3示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下应用于营业执照预审核时执行的流程示意图。

图4示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下应用于店铺招牌预审核时执行的流程示意图。

图5示例性地示出了本说明书实施例所述的商户签约资质审核装置在一种实施方式下的结构框图。

图6示例性地示出了本说明书实施例提供的一种电子设备的结构图。

具体实施方式

首先需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。另外,在不冲突的情况下,本说明书中的实施例及实施例中的特征可以相互组合。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。

随着社会经济的发展,越来越多的商户在市场中涌现,许多机构通过与商户签约建立合作关系,以拥有较稳定的资源获取渠道。为了规范交易市场,保证商品交易流程的合规与商品的质量,商户在签约时需依据目标机构的准入标准,提供能够证明其经营资质合规性以及经营活动真实性的材料,称为资质材料,包括但不限于营业执照、店铺招牌、身份证、店铺内景照。根据监管要求和风控需求,目标机构需要对商户资质进行真实性、完整性以及有效性审核,包括但不限于商户资质是否是伪造或冒用他人资质,相关证件例如营业执照是否在可用期限内,商户提供的资质材料是否完整。

传统的资质审核采用人工审核的方式来实现,为了进一步提高审核效率,降低审核成本,同时增强规避风险的能力,本说明书提出采用智能审核的方案,即通过深度学习算法实现自动化、体系化的资质审核,将算法与策略紧密结合。

在实现时,本说明书采用以下思路:在商户提交资质材料后,即进行交互式预审核,实时进行材料信息提取及内容审核,然后将资质预审核结果同步告知商户,如预审核不通过,则审核页面上实时显示错误信息并提醒商户重新提交。当商户提交的同一张资质图片多次被驳回,则页面弹出交互式文案,提示商户可补充资料信息,然后转至客服进行人工复核。

下面将结合说明书附图和具体的实施例来对本说明书实施例所述的商户签约资质审核方法及装置进行进一步地详细说明,但是该详细说明不构成对本说明书实施例的限制。

在本说明书的一个实施例中,提出了一种商户签约资质审核方法。图1示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种实施方式下的流程示意图。

如图1所示,包括:

100:获取用户上传的资质材料,资质材料包括至少一张资质图片。

本实施例中的用户可以是待签约的商户,资质材料可以是商户的营业执照图片、店铺招牌图片、身份证图片等资质凭证,由商户通过相机、智能手机、扫描仪等图像采集设备获取电子版资质图片,并按照资质审核页面的提示上传至本实施例所述的审核系统。

102:对至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果。

预审核过程包括对资质图片的完整性、真实性和有效性进行核验。一方面,资质图片的完整性预审核例如图片质量预审核,可以针对资质图片是否模糊、过曝,资质图片内容是否有遮挡、残缺来确定预审核评价结果。另一方面,资质图片的真实性预审核可以通过识别文本内容或者局部图像内容提取到具体资质信息,并与第三方权威机构中记录的商户资质信息进行比对,从而判断资质是否是伪造的,例如可以通过识别商户提交的营业执照图片中的公章,并对识别结果解析后与对应下发营业执照的工商管理部门提供的标准进行比对,基于比对结果确定预审核评价结果。又一方面,资质图片的有效性也可以通过识别图片中的文本内容进行评价,例如通过对商户提交的营业执照图片进行文本识别,基于文本信息判断该营业执照是否在有效期内、是否已注销或者被吊销、法人是否一致等,从而判断该营业执照是否有效,得到预审核评价结果。

在一些实施例中,预审核流程包括图片质量预审核;基于预设的预审核流程,对至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将资质图片输入预先训练的图片质量评价模型,得到该资质图片的图片质量评价结果;

基于图片质量评价结果,确定该资质图片的预审核评价结果。

图片质量预审核可以针对该图片是否存在残缺、模糊或者过曝等质量问题做出评价,对应的图片质量评价结果可以以图片质量评价分数的形式展现。在用户上传资质图片之前,资质材料本身可能因保存不当而存在残缺,对其进行采集的过程中也可能存在手指遮挡、设备摇晃、光线过强或者过弱等情况;而提交资质图片后,对其进行压缩、传输、显示等过程中也可能因为噪声而使图片失真,最终导致提交后的资质图片存在残缺、模糊或者过曝等问题。

在一些实施例中,将用户提交的至少一张资质图片输入预先训练过的图片质量评价模型,在该模型中,先针对图片质量评价关注的特征对资质图片进行特征提取,例如,图片内容是否有残缺、遮挡(轻微残缺、中度残缺、严重残缺),或者图片的模糊程度(轻微模糊、中度模糊、严重模糊),或者图片所处的光线环境(正常光、强光、弱光,其中强光可能会导致图片过曝),每个特征都用特定的数值来表示。图片质量评价模型对提取出的资质图片特征进行解析与分类,最终得到资质图片对应的质量评价分数,图片质量越好,则质量评价分数越高。将获得的图片质量评价结果与预先设置的图片质量评价阈值进行比较,若高于该阈值,则图片质量评价合格,预审核评价也合格;否则预审核不合格。

所述图片质量评价模型可以采用如下方法训练得到:

确定样本图片,并将样本图片对应的质量评价分数作为分类标签;

对样本图片进行特征提取,得到样本图片的特征;

将样本图片的特征输入预先搭建的图片质量评价模型中,以质量评价损失最小化为目标对图片质量评价模型进行训练。

其中,质量评价损失具体可以设置为图片质量评价模型对于样本图片的质量评价结果与样本图片的分类标签之间的差异。

在一些更具体的实施例中,图片质量评价模型可以基于CNN网络模型构建,当然,在其他实施例中,也可以采用支持向量机来构建上述图片质量评价模型。这类无参考的质量评价方法不需要高质量的图像作为参考,而是直接将图像特征作为质量评价标准,具有较强的灵活性和评价效率。

在图片处理过程中,图片的质量对需要获取的信息的充分性和准确性起着决定性作用,为了缓解图片在获取、压缩、传输、显示等过程中产生的失真现象,通过图片质量预审核滤除图片质量未达到进一步预审核要求的资质图片,可以提高资质预审核的效率。

在一些实施例中,预审核流程包括图片类型审核;基于预设的预审核任务流程,对至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将资质图片输入预先训练的分类模型,得到该资质图片的预测类型;

将预测类型与预设的目标类型进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

资质图片的类型包括但不限于营业执照、店铺招牌、身份证以及产权证。在预审核页面中,不同类型的资质图片提交的位置也不同,图片类型审核要求对应类型的资质图片上传至正确的位置,否则预审核不合格。例如,在应当提交营业执照的位置上传一张资质图片,则预设的目标类型为营业执照,将资质图片输入预先训练的分类模型,得到该资质图片的预测类型,若上传的资质图片为店铺招牌,则预测类型为店铺招牌,预测类型与目标类型匹配失败,则预审核评价结果为不合格。

在一些更具体的实施例中,分类模型可以基于CNN网络模型构建,当然,在其他实施例中,也可以采用支持向量机来构建。

所述分类模型可以采用如下方法训练得到:

确定样本图片,并将样本图片对应的类型作为分类标签;

对样本图片进行特征提取,得到样本图片的特征;

将样本图片的特征输入预先搭建的分类模型中,以分类损失最小化为目标对分类模型进行训练。

其中,分类损失具体可以设置为基于分类模型得到的样本图片的类型与样本图片的真实类型之间的差异。

图片类型审核是对资质图片内容进一步提取和分析的关键性步骤,以便后续的预审核过程中针对不同类型的资质图片采用不同的审核方法,提高预审核通过率。

在一些实施例中,预审核流程包括图片文本信息核验;基于预设的预审核任务流程,对至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果,具体包括:

将资质图片输入预先训练的分类模型,确定资质图片的图片类型;

提取该资质图片的中的文本区域图像,对文本区域图像进行光学字符识别,得到文本识别结果;

基于图片类型,确定第三方权威机构;

基于第三方权威机构的公开数据,对文本识别结果进行核验;

基于核验结果确定该资质图片的预审核评价结果。

针对不同的资质图片类型,对图片中的文本识别结果进行核验的方法也不相同。其中,光学字符识别包括OCR文字识别,可以从图像中识别出文本内容。第三方权威机构可以用于表示记录并管理用户信息的官方机构,比如下发营业执照的工商管理部门,或者可供查询身份证信息的居民身份证查询系统。

以营业执照为例,对其文本区域图像进行OCR文字识别,得到的文本识别结果包括商户名称、商户类型、商户地址、法人、营业期限、经营范围、登记单位等信息。接着基于登记单位信息可以确定下发并管理该营业执照的第三方权威机构,一般为商户所在地对应的工商管理部门。根据商户名称查询工商管理部门系统内记录的营业执照相关信息,并与从商户提交的营业执照图片中识别出的商户地址、法人、营业期限等文本信息进行比对,得到核验结果。其中,重点通过核验营业期限是否到期、营业执照是否已注销或者被吊销、法人是否一致来确定营业执照是否具备有效性。若工商管理部门系统内记录的营业执照信息与从商户提交的营业执照图片中识别出的信息经核验一致,且该营业执照依旧有效,则核验结果合格,预审核评价也合格;若工商管理部门系统内记录的营业执照信息与从商户提交的营业执照图片中识别出的信息存在不一致,或者经核验该营业执照无效,则核验不合格,预审核评价也不合格。

对提交的资质图片进行具体的图片文本信息核验能够较准确地鉴别资质图片的真实性和有效性,通过权威比对识别出伪造的资质材料,并滤除失效的资质材料。

在一些实施例中,预审核流程包括图标信息核验,图标信息核验具体包括:

将资质图片输入预先训练的分类模型,确定资质图片的图片类型;

基于资质图片的图片类型,确定该图片类型对应的图标识别模板;图标识别模板包括至少一个目标候选框,目标候选框的位置为待采集的图标的位置;

基于图标识别模板的至少一个目标候选框,确定资质图片中的图标区域图像;

将图标区域图像与预设图标模板进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

需要核验的图标是能够表示资质图片有效性的凭证,例如营业执照中的公章或者店铺招牌中的店铺logo。针对不同类型的资质图片,图标的位置和大小也不相同,例如,营业执照又可以分为企业营业执照和个体工商营业执照,其对应的登记单位公章位于不同的位置;公章的位置也根据营业执照为竖版或者横版而不相同。因此基于资质图片的不同类型预设对应的图标识别模板,用目标候选框标示出待识别图标的位置,从而针对性地进行图标信息核验。

在一些更具体的实施例中,采集到目标图标后对该图标区域图像进行特征提取,与预设图标模板中的图标特征进行特征匹配,具体可以设置为计算资质图片中的图标特征与预设图标模板中的图标特征之间的相似度,预设一个特征匹配阈值并与相似度计算结果进行比较,若相似度计算结果高于该阈值则匹配成功,否则匹配失败;当资质图片的图标区域图像与预设图标模板匹配成功时,该资质图片预审核评价结果为合格。

图标信息核验能够以更细节的层面检验资质图片的真实性和有效性,使得预审核结果更加准确可靠。

需要说明的是,上述实施例中的预审核流程所述方法可以单独执行,也可以以合适的方式组合执行,而并不一定按照本说明书示出和描述的顺序来执行相应的方法。比如,对资质图片的预审核可以从图片质量预审核、图片类型审核以及图片文本信息审核三个方面来进行,优选地,也可以基于图片质量预审核、图片类型审核、图片文本信息审核以及图标信息核验的结果确定预审核评价结果,当所有审核流程都合格时预审核评价才合格。基于多种图文多模态算法,预审核流程越全面、仔细,则预审核评价结果越准确可信。

104:针对每一张资质图片,若预审核评价结果为不合格,则生成错误提示信息,并将错误提示信息反馈给用户;当该资质图片的预审核评价结果为不合格的总次数达到预设阈值时,将该资质图片提交至人工审核环节。

针对每一张资质图片的预审核评价需要经过一个或多个方面的预审核流程,例如图片质量预审核、图片类型审核、图片文本信息审核或者图标信息核验,当某一方面审核未通过时,在页面中实时显示清晰全面的错误提示信息以描述驳回原因,引导用户改正错误后重新提交资质材料,有效实现交互式预审核,提升审核页面转化率以及资质材料提交后的通过率。

对于同一张资质图片,当累计驳回次数达到预设阈值时,为了避免算法误判影响用户体验,提供人工审核入口进行二次核验,有效提升用户签约体验。

在一些实施例中,可以将预设阈值设置为三次,当同一张资质图片的预审核评价结果为不合格的累积次数达到三次及以上时,通过弹窗提示向用户确认资料是否无误,若用户不认可审核结果,则可以通过文本和/或图片的形式填写弹窗中的补充说明,以进一步证明资质材料的真实性和有效性,接着提交至人工客服处进行二次审核。

以店铺招牌为例,用户想要将自己拍摄的店铺招牌图片上传审核页面,首次上传时却误将营业执照图片提交至店铺招牌的位置,在进行图片类型审核时分类模型预测出的图片类型(营业执照)与目标类型(店铺招牌)无法成功匹配,未通过审核,则页面将会弹窗提示用户上传正确的资质图片类型;第二次用户在正确的位置上传了正确的店铺招牌图片,却因为图片过曝未通过图片质量预审核,则页面将弹窗提示用户上传更加清晰的资质图片;第三次用户重新拍摄了清晰的店铺招牌图片进行提交,在经过图标信息核验时,由于缺乏合适的图标识别模板而未识别出有效的店铺logo导致审核不合格,此时累计驳回次数到达预设阈值,审核页面将弹窗提示用户,若用户确认所提交的资质图片无误,可以通过文本或者图片进行补充说明后交由人工客服审核。

106:若资质材料中的每一张资质图片的预审核评价结果均为合格,则生成资质审核工单,并将资质审核工单提交至资质审核环节。

资质审核工单反映了从资质材料中提取出的文本信息,这些文本信息包含用户资质相关的基本信息,例如商户经营类目或者店铺名称。

在一些实施例中,资质审核工单包括至少一张资质图片和与至少一张资质图片对应的至少一个目标字段;生成资质审核工单,具体包括:

针对每一张预审核评价结果为合格的资质图片,提取该资质图片的文本区域图像;

对文本区域图像进行光学字符识别,得到文本识别结果;

对文本识别结果进行关键词提取,将提取出的关键词与资质审核工单中的目标字段的预设选项进行匹配;

基于匹配结果,生成目标字段的至少一个可选项,并将可选项推荐给用户;

基于用户对可选项的选择结果,确定目标字段,得到资质审核工单。

通过对资质图片的内容进行实时文本识别,提取出与资质相关的基本信息与目标字段进行匹配,其中目标字段包括但不限于经营类目、店铺名称或者联系人姓名。再将匹配结果按置信度分数推荐给用户,并基于匹配结果自动填写资质审核工单中的目标字段。以经营类目填写为例,针对预审核评价结果为合格的营业执照图片,通过OCR识别提取图片中的文本信息,接着从文本识别结果中过滤出与经营类目有关的关键词,例如企业名称和经营范围,与预审核系统后端数据库中存储的经营类目名称进行匹配,得到至少一个匹配成功的经营类目名称,比如零售或者批发,自动填写到资质审核工单中。

由于资质审核工单中的目标字段内容丰富,目标字段的可选选项众多,通过实时、自动地推荐文本识别内容中提取出的相关关键词,可有效避免用户随意选择,减少用户需主动输入的字段,降低签约成本,且提高信息采集质量。

下面将结合一个更具体的实施例来对本说明书实施例所述的商户签约资质审核方法进行进一步地详细说明,但是该详细说明不构成对本说明书实施例的限制。

图2示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下的应用示意图。

在一个更具体的实施例中,用户需要在预审核页面提交经营信息、店铺信息以及联系人信息,通过上传营业执照图片和店铺招牌图片进行预审核,如图2所示。

用户上传营业执照原件图片后,首先采用图片分类技术进行图片识别,以确认图片类型是否正确,再利用图片OCR技术识别图片中的文本信息;接着基于文本识别结果,与对应的第三方权威机构提供的权威数据源进行信息核验,以判断营业执照信息的真实性和有效性,包括是否伪造、是否过期、法人是否一致等。当对营业执照图片的预审核通过后,再基于经过核验的文本识别结果自动推荐经营类目字段,从而完成经营信息的预审核。

图3示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下应用于营业执照预审核时执行的流程示意图。

针对营业执照图片更具体的交互式预审核流程如图3所示,预审核系统首先对用户提交的营业执照图片进行图片类型识别与审核,采用预先训练的分类器判断所提交的图片的类型是否为营业执照,若不是,则该次审核不合格,通过弹窗实时提示用户重新提交;若确认提交的为营业执照,则进一步进行资质有效性判断,即通过图片文本信息核验以及图标信息核验,从营业执照是否过期、是否注销或吊销、法人是否一致、是否具备登记单位红章等方面判断该营业执照是否真实有效,若信息核验失败或者判断出营业执照无效,则弹窗提示用户具体问题所在,引导用户重新提交;否则,营业执照预审核合格,最终基于图片文本信息中提取出的关键词进行信息推荐,自动填写行业类目,完成经营信息预审核。

接着,用户上传店铺招牌图片,首先利用通用图片识别技术,通过伪冒检测剔除非实拍、盗用等手段获取的伪造图片,通过质量检测过滤质量不满足要求的图片,例如模糊、残缺、过曝的店铺招牌图片;再采用图片分类技术进行专项图片识别,以确认图片类型是否正确;然后利用图片OCR技术识别图片中的文本信息,从中提取出与店铺信息相关的关键词推荐给用户,从而自动填写店铺名称,再由用户补充填写店铺地址,完成店铺信息预审核。

图4示例性地示出了本说明书实施例所述的商户签约资质审核方法在一种具体实施方式下应用于店铺招牌预审核时执行的流程示意图。

针对店铺招牌图片更具体的交互式预审核流程如图4所示,预审核系统首先通过图标信息核验等方法对用户提交的店铺招牌图片进行伪冒检测,以识别出通过截屏、拍屏、PS等手段盗用图片的情况,例如通过水印检测判断是否伪造,利用摩尔纹识别判断是否翻拍自电脑,以及通过边框识别判断是否翻拍自手机,若识别出伪造的店铺招牌图片,则弹窗提示用户重新上传真实的图片;否则通过伪冒检测,接着利用预先训练的图片质量评价模型对店铺招牌图片进行质量检测,若检测出模糊、过曝等严重影响图片内容的图片质量问题,则预审核不合格,弹窗提示用户上传更加清晰的图片;若通过质量检测,则通过OCR识别获取图片中的店铺名称信息,并基于置信度排名自动填写预审核页面中的店铺名称,再由用户补充填写店铺地址,完成店铺信息预审核。

最后的联系人信息可以由用户自行填写,也可以如上述方法上传身份证照片后进行预审核,审核合格后自动填写相关信息,从而完成所有预审核流程,将该页面提交至正式的资质审核环节,能够大大降低正式审核过程中的工作量,提高审核效率,同时优化资质验真效果,规避资质信息伪造、盗用风险。

需要说明的是,当同一张资质图片的预审核评价结果为不合格的累积次数,即驳回累积次数达到三次及以上时,进入人审兜底机制环节,通过弹窗提示向用户确认资料是否无误,若用户不认可审核结果,则可以通过文本和图片的形式填写弹窗中的补充说明,以进一步证明资质材料的真实性和有效性,接着提交至人工客服处进行二次审核。

本说明书实施例提供的商户签约资质审核方法基于图文多模态算法,通过在资质图片上传环节进行资质预审核,实现实时的交互式预审核,不仅提高了资质审核效率,而且使得审核结果更加准确;另外添加的兜底人工审核机制有利于避免算法的失误,增强系统鲁棒性,优化了用户的签约体验。

在本说明书的另一个实施例中,提出了一种商户签约资质审核装置。图5示例性地示出了本说明书实施例所述的商户签约资质审核装置在一种实施方式下的结构框图。

如图5所示,包括:

数据获取模块20,配置为获取用户上传的资质材料,资质材料包括至少一张资质图片;

预审核模块22,配置为对至少一张资质图片进行预审核,得到每张资质图片的预审核评价结果;

错误提示模块24,配置为在资质图片的预审核评价结果为不合格时,生成针对该资质图片的错误提示信息,并将错误提示信息反馈给用户;以及在资质图片的预审核评价结果为不合格的总次数达到预设阈值时,则将该资质图片提交至人工审核环节;

资质审核工单生成模块26,配置为在资质材料中的每一张资质图片的预审核评价结果均为合格时,生成资质审核工单,并将资质审核工单提交至资质审核环节。

数据获取模块中的用户可以是待签约的商户,资质材料可以是商户的营业执照图片、店铺招牌图片、身份证图片等资质凭证,由商户通过相机、智能手机、扫描仪等图像采集设备获取电子版资质图片,并按照资质审核页面的提示上传至本实施例所述的审核系统。

预审核模块用于对资质图片的完整性、真实性和有效性进行核验。一方面,资质图片的完整性预审核例如图片质量预审核,可以针对资质图片是否模糊、过曝,资质图片内容是否有遮挡、残缺来确定预审核评价结果。另一方面,资质图片的真实性预审核可以通过识别文本内容或者局部图像内容提取到具体资质信息,并与第三方权威机构中记录的商户资质信息进行比对,从而判断资质是否是伪造的,例如可以通过识别商户提交的营业执照图片中的公章,并对识别结果解析后与对应下发营业执照的工商管理部门提供的标准进行比对,基于比对结果确定预审核评价结果。又一方面,资质图片的有效性也可以通过识别图片中的文本内容进行评价,例如通过对商户提交的营业执照图片进行文本识别,基于文本信息判断该营业执照是否在有效期内、是否已注销或者被吊销、法人是否一致等,从而判断该营业执照是否有效,得到预审核评价结果。

在一些实施例中,预审核模块包括图片质量预审核模块;图片质量预审核模块具体用于将资质图片输入预先训练的图片质量评价模型,得到该资质图片的图片质量评价结果;基于图片质量评价结果,确定该资质图片的预审核评价结果。

图片质量预审核模块可以针对该图片是否存在残缺、模糊或者过曝等质量问题做出评价,对应的图片质量评价结果可以以图片质量评价分数的形式展现。在用户上传资质图片之前,资质材料本身可能因保存不当而存在残缺,对其进行采集的过程中也可能存在手指遮挡、设备摇晃、光线过强或者过弱等情况;而提交资质图片后,对其进行压缩、传输、显示等过程中也可能因为噪声而使图片失真,最终导致提交后的资质图片存在残缺、模糊或者过曝等问题。

在一些实施例中,图片质量预审核模块将用户提交的至少一张资质图片输入预先训练过的图片质量评价模型,在该模型中,先针对图片质量评价关注的特征对资质图片进行特征提取,例如,图片内容是否有残缺、遮挡(轻微残缺、中度残缺、严重残缺),或者图片的模糊程度(轻微模糊、中度模糊、严重模糊),或者图片所处的光线环境(正常光、强光、弱光,其中强光可能会导致图片过曝),每个特征都用特定的数值来表示。图片质量评价模块对提取出的资质图片特征进行解析与分类,最终得到资质图片对应的质量评价分数,图片质量越好,则质量评价分数越高。图片质量预审核模块将获得的图片质量评价结果与预先设置的图片质量评价阈值进行比较,若高于该阈值,则图片质量评价合格,预审核评价也合格;否则预审核不合格。

所述图片质量评价模型可以采用如下方法训练得到:

确定样本图片,并将样本图片对应的质量评价分数作为分类标签;

对样本图片进行特征提取,得到样本图片的特征;

将样本图片的特征输入预先搭建的图片质量评价模型中,以质量评价损失最小化为目标对图片质量评价模型进行训练。

其中,质量评价损失具体可以设置为图片质量评价模型对于样本图片的质量评价结果与样本图片的分类标签之间的差异。

在一些更具体的实施例中,图片质量评价模型可以基于CNN网络模型构建,当然,在其他实施例中,也可以采用支持向量机来构建上述图片质量评价模型。这类无参考的质量评价方法不需要高质量的图像作为参考,而是直接将图像特征作为质量评价标准,具有较强的灵活性和评价效率。

在图片处理过程中,图片的质量对需要获取的信息的充分性和准确性起着决定性作用,为了缓解图片在获取、压缩、传输、显示等过程中产生的失真现象,图片质量预审核模块通过图片质量预审核滤除图片质量未达到进一步预审核要求的资质图片,可以提高资质预审核的效率。

在一些实施例中,预审核模块包括图片类型审核模块;图片类型审核模块具体用于将资质图片输入预先训练的分类模型,得到该资质图片的预测类型;将预测类型与预设的目标类型进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

资质图片的类型包括但不限于营业执照、店铺招牌、身份证以及产权证。在预审核页面中,不同类型的资质图片提交的位置也不同,图片类型审核模块要求对应类型的资质图片上传至正确的位置,否则预审核不合格。例如,在应当提交营业执照的位置上传一张资质图片,则预设的目标类型为营业执照,将资质图片输入预先训练的分类模型,得到该资质图片的预测类型,若上传的资质图片为店铺招牌,则预测类型为店铺招牌,预测类型与目标类型匹配失败,则预审核评价结果为不合格。

在一些更具体的实施例中,分类模型可以基于CNN网络模型构建,当然,在其他实施例中,也可以采用支持向量机来构建。

所述分类模型可以采用如下方法训练得到:

确定样本图片,并将样本图片对应的类型作为分类标签;

对样本图片进行特征提取,得到样本图片的特征;

将样本图片的特征输入预先搭建的分类模型中,以分类损失最小化为目标对分类模型进行训练。

其中,分类损失具体可以设置为基于分类模型得到的样本图片的类型与样本图片的真实类型之间的差异。

图片类型审核模块是对资质图片内容进一步提取和分析的关键性模块,以便后续的预审核过程中针对不同类型的资质图片采用不同的审核方法,提高预审核通过率。

在一些实施例中,预审核模块包括图片文本信息核验模块;图片文本信息核验模块具体用于将资质图片输入预先训练的分类模型,确定资质图片的图片类型;提取该资质图片的中的文本区域图像,对文本区域图像进行光学字符识别,得到文本识别结果;基于图片类型,确定第三方权威机构;基于第三方权威机构的公开数据,对文本识别结果进行核验,并基于核验结果确定该资质图片的预审核评价结果。

针对不同的资质图片类型,对图片中的文本识别结果进行核验的方法也不相同。其中,光学字符识别包括OCR文字识别,可以从图像中识别出文本内容。第三方权威机构可以用于表示记录并管理用户信息的官方机构,比如下发营业执照的工商管理部门,或者可供查询身份证信息的居民身份证查询系统。

以营业执照为例,图片文本信息核验模块对其文本区域图像进行OCR文字识别,得到的文本识别结果包括商户名称、商户类型、商户地址、法人、营业期限、经营范围、登记单位等信息。接着基于登记单位信息可以确定下发并管理该营业执照的第三方权威机构,一般为商户所在地对应的工商管理部门。图片文本信息核验模块根据商户名称查询工商管理部门系统内记录的营业执照相关信息,并与从商户提交的营业执照图片中识别出的商户地址、法人、营业期限等文本信息进行比对,得到核验结果。其中,图片文本信息核验模块重点通过核验营业期限是否到期、营业执照是否已注销或者被吊销、法人是否一致来确定营业执照是否具备有效性。若工商管理部门系统内记录的营业执照信息与从商户提交的营业执照图片中识别出的信息经核验一致,且该营业执照依旧有效,则核验结果合格,预审核评价也合格;若工商管理部门系统内记录的营业执照信息与从商户提交的营业执照图片中识别出的信息存在不一致,或者经核验该营业执照无效,则核验不合格,预审核评价也不合格。

对提交的资质图片进行具体的图片文本信息核验能够较准确地鉴别资质图片的真实性和有效性,通过权威比对识别出伪造的资质材料,并滤除失效的资质材料。

在一些实施例中,预审核模块包括图标信息核验模块;图标信息核验模块具体用于将资质图片输入预先训练的分类模型,确定资质图片的图片类型;基于资质图片的图片类型,确定该图片类型对应的图标识别模板,图标识别模板包括至少一个目标候选框,目标候选框的位置为待采集的图标的位置;基于图标识别模板的至少一个目标候选框,确定资质图片中的图标区域图像;将图标区域图像与预设图标模板进行匹配,基于匹配结果确定该资质图片的预审核评价结果。

需要核验的图标是能够表示资质图片有效性的凭证,例如营业执照中的公章或者店铺招牌中的店铺logo。针对不同类型的资质图片,图标的位置和大小也不相同,例如,营业执照又可以分为企业营业执照和个体工商营业执照,其对应的登记单位公章位于不同的位置;公章的位置也根据营业执照为竖版或者横版而不相同。因此图标信息核验模块基于资质图片的不同类型预设对应的图标识别模板,用目标候选框标示出待识别图标的位置,从而针对性地进行图标信息核验。

在一些更具体的实施例中,图标信息核验模块采集到目标图标后对该图标区域图像进行特征提取,与预设图标模板中的图标特征进行特征匹配,具体可以设置为计算资质图片中的图标特征与预设图标模板中的图标特征之间的相似度,预设一个特征匹配阈值并与相似度计算结果进行比较,若相似度计算结果高于该阈值则匹配成功,否则匹配失败;当资质图片的图标区域图像与预设图标模板匹配成功时,该资质图片预审核评价结果为合格。

图标信息核验能够以更细节的层面检验资质图片的真实性和有效性,使得预审核结果更加准确可靠。

需要说明的是,上述实施例中的预审核模块可以单独执行,也可以以合适的方式组合执行,而并不一定按照本说明书示出和描述的顺序来执行。比如,预审核模块可以包括图片质量预审核模块、图片类型审核模块以及图片文本信息审核模块三个模块,优选地,也可以包括图片质量预审核模块、图片类型审核模块、图片文本信息审核模块以及图标信息核验模块所有模块,当所有模块审核结果都合格时预审核评价才合格。基于多种图文多模态算法,预审核流程越全面、仔细,则预审核评价结果越准确可信。

针对每一张资质图片的预审核评价需要经过一个或多个方面的预审核模块,当某一审核模块未通过时,错误提示模块在页面中实时显示清晰全面的错误提示信息以描述驳回原因,引导用户改正错误后重新提交资质材料,有效实现交互式预审核,提升审核页面转化率以及资质材料提交后的通过率。

对于同一张资质图片,当累计驳回次数达到预设阈值时,为了避免算法误判影响用户体验,错误提示模块提供人工审核入口进行二次核验,有效提升用户签约体验。

在一些实施例中,可以将预设阈值设置为三次,当同一张资质图片的预审核评价结果为不合格的累积次数达到三次及以上时,错误提示模块通过弹窗提示向用户确认资料是否无误,若用户不认可审核结果,则可以通过文本和/或图片的形式填写弹窗中的补充说明,以进一步证明资质材料的真实性和有效性,接着提交至人工客服处进行二次审核。

以店铺招牌为例,用户想要将自己拍摄的店铺招牌图片上传审核页面,首次上传时却误将营业执照图片提交至店铺招牌的位置,在进行图片类型审核时分类模型预测出的图片类型(营业执照)与目标类型(店铺招牌)无法成功匹配,未通过审核,则页面将会弹窗提示用户上传正确的资质图片类型;第二次用户在正确的位置上传了正确的店铺招牌图片,却因为图片过曝未通过图片质量预审核,则页面将弹窗提示用户上传更加清晰的资质图片;第三次用户重新拍摄了清晰的店铺招牌图片进行提交,在经过图标信息核验时,由于缺乏合适的图标识别模板而未识别出有效的店铺logo导致审核不合格,此时累计驳回次数到达预设阈值,审核页面将弹窗提示用户,若用户确认所提交的资质图片无误,可以通过文本或者图片进行补充说明后交由人工客服审核。

资质审核工单反映了从资质材料中提取出的文本信息,这些文本信息包含用户资质相关的基本信息,例如商户经营类目或者店铺名称。

在一些实施例中,资质审核工单生成模块具体用于针对每一张预审核评价结果为合格的资质图片,提取该资质图片的文本区域图像;对文本区域图像进行光学字符识别,得到文本识别结果;对文本识别结果进行关键词提取,将提取出的关键词与资质审核工单中的目标字段的预设选项进行匹配;基于匹配结果,生成目标字段的至少一个可选项,并将可选项推荐给用户;基于用户对可选项的选择结果,确定目标字段,得到资质审核工单。

资质审核工单生成模块通过对资质图片的内容进行实时文本识别,提取出与资质相关的基本信息与目标字段进行匹配,其中目标字段包括但不限于经营类目、店铺名称或者联系人姓名。再将匹配结果按置信度分数推荐给用户,并基于匹配结果自动填写资质审核工单中的目标字段。以经营类目填写为例,针对预审核评价结果为合格的营业执照图片,通过OCR识别提取图片中的文本信息,接着从文本识别结果中过滤出与经营类目有关的关键词,例如企业名称和经营范围,与预审核系统后端数据库中存储的经营类目名称进行匹配,得到至少一个匹配成功的经营类目名称,比如零售或者批发,自动填写到资质审核工单中。

由于资质审核工单中的目标字段内容丰富,目标字段的可选选项众多,资质审核工单生成模块通过实时、自动地推荐文本识别内容中提取出的相关关键词,可有效避免用户随意选择,减少用户需主动输入的字段,降低签约成本,且提高信息采集质量。

本说明书中的一种实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述商户签约资质审核方法。

本说明书中的一种实施方式还提供一种电子设备,包括:

一个或多个处理器;以及

与一个或多个处理器关联的存储器,存储器用于存储程序指令,程序指令在被一个或多个处理器读取执行时,执行上述商户签约资质审核方法的步骤。

图6示例性地示出了本说明书实施例提供的一种电子设备的结构图。

如图6所示的,在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

需要注意的是,以上列举的仅为本发明的具体实施例,显然本发明不限于以上实施例,随之有着许多的类似变化。本领域的技术人员如果从本发明公开的内容直接导出或联想到的所有变形,均应属于本发明的保护范围。

相关技术
  • 处方审核分配方法、装置、电子设备及存储介质
  • 处方审核改进方法、装置、电子设备及存储介质
  • 处方审核保密方法、装置、电子设备及存储介质
  • 处方审核推送方法、装置、电子设备及存储介质
  • 审核合同的方法、装置、电子设备及计算机可读存储介质
  • 中药供应商的资质审核方法、装置、电子设备及存储介质
  • 一种基于双模型融合的供应商资质审核方法和审核装置
技术分类

06120116303077