掌桥专利:专业的专利平台
掌桥专利
首页

图像信息审核方法、装置、电子设备及可读存储介质

文献发布时间:2023-06-19 10:16:30


图像信息审核方法、装置、电子设备及可读存储介质

技术领域

本发明涉及图像处理技术领域,尤其涉及一种图像信息审核方法、装置、电子设备及可读存储介质。

背景技术

随着信息化社会的发展,多元化的信息对人们的生活产生了越来越多的影响,图片信息也逐渐替代了单纯的文本信息成为了人们信息交流的主要方式,为了避免不良信息对人们生活的影响,因此需要对图片信息进行审核,如审核金融广告图片中的宣传信息是否违规。

但目前的图片信息审核只能通过识别图片的关键词进行单维度审核,不能判断信息违规程度,审核的准确度不高。

发明内容

本发明提供一种图像信息审核方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高图片信息审核的准确度。

为实现上述目的,本发明提供的一种图像信息审核方法,包括:

获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像;

对所述标准图像进行文本识别处理,得到文本信息;

利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;

对所述目标实体进行初步审核,得到第一审核结果;

利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果;

根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并

将所述目标审核结果发送至预设终端设备。

可选地,所述对所述初始图像进行去干扰预处理,得到标准图像,包括:

对所述初始图像进行灰度化处理,得到灰度化图像;

对所述灰度化图像进行滤波处理,得到所述标准图像。

可选地,所述利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体之前,还包括:

构建实体抽取模型;

获取历史文本信息集,对所述历史文本信息集进行预设实体标记,得到第一训练集;

利用所述第一训练集对所述实体抽取模型进行迭代训练,直至所述实体抽取模型收敛,得到所述训练完成的实体抽取模型。

可选地,所述构建实体抽取模型,包括:

利用深度学习网络模型构建初始抽取模型;

在所述初始抽取模型中增加全连接网络,用于计算输入至所述初始抽取模型中的每个字符属于预设实体的概率,根据所述概率得到预设实体对应的字符组合;及

在所述全连接网络之后加入序列化标注算法网络,用于对所述全连接网络得到的字符组合的顺序进行约束,得到所述实体抽取模型。

可选地,所述所述对所述历史文本信息集进行预设实体标记,得到第一训练集,包括:

根据预设实体构建包含非预设实体字符标签、预设实体开始字符标签、预设实体中间字符标签的标签集合;

利用所述标签集合中对应的标签对所述历史文本信息集中的每个字符进行标记,得到第一训练集。

可选地,所述利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果之前,还包括:

构建多任务始识别模型;

根据预设维度对所述历史文本信息集进行不同维度的多标签标记,得到第二训练集;

利用所述第二训练集对所述多任务始识别模型进行迭代训练,直至所述多任务始识别模型收敛,得到训练完成的多任务识别模型。

可选地,所述根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,包括:

判断所述第一审核结果是否违规;

若所述第一审核结果为违规,则根据预设规则得到审核分数;

若所述第一审核结果为未违规,则根据所述第二审核结果利用对应的预设权重公式进行计算,得到审核分数;

利用预设的划分规则对所述审核分数进行审核结果划分,得到所述目标审核结果。

为了解决上述问题,本发明还提供一种图像信息审核装置,所述装置包括:

文本识别模块,用于获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像;对所述标准图像进行文本识别处理,得到文本信息;利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;

信息审核模块,用于对所述目标实体进行初步审核,得到第一审核结果;利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果;

权重计算模块,用于根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并将所述目标审核结果发送至预设终端设备。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

存储器,存储至少一个计算机程序;及

处理器,执行所述存储器中存储的计算机程序以实现上述所述的图像信息审核方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的图像信息审核方法。

本发明实施例获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像,提高了后续文本识别的准确率;对所述标准图像进行文本识别处理,得到文本信息;利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;对所述目标实体进行初步审核,得到第一审核结果;利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果,通过多维度的分类识别提高的审核的准确率;根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并将所述目标审核结果发送至预设终端设备,将多个审核结果融合计算进一步地提高的审核的准确度。因此,本发明实施例提出的图像信息审核方法、装置、电子设备及计算机可读存储介质提高了图像信息审核的准确度。

附图说明

图1为本发明一实施例提供的图像信息审核方法的流程示意图;

图2为本发明一实施例提供的图像信息审核方法中得到训练完成的实体抽取模型的流程示意图;

图3为本发明一实施例提供的图像信息审核装置的模块示意图;

图4为本发明一实施例提供的实现图像信息审核方法的电子设备的内部结构示意图;

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供一种图像信息审核方法。所述图像信息审核方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述图像信息审核方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。

参照图1所示的本发明一实施例提供的图像信息审核方法的流程示意图,在本发明实施例中,所述图像信息审核方法包括:

S1、获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像。

本发明其中一个实施例可以在接收一个审核请求时,响应所述审核请求,获取所述审核请求对应的初始图像。

本发明实施例中,所述审核请求为对初始图像的违规性审核请求。进一步地,所述获取所述审核请求对应的初始图像可以是,例如,审核请求为对初始图像A进行审核,因此,在预设的待审核数据库中获取初始图像A。

本发明实施例中,所述初始图像可以是金融广告图像,本发明实施例可以识别出所述金融广告图像中是否有金融违规广告,例如某个金融广告图像中存在“保本、零风险”等广告用语,则认为该金融广告图像违规。

为了避免拍摄因素对图片造成的影响,本发明实施例,对所述初始图像进行去干扰处理,得到所述标准图像。

详细地,由于所述初始图像可能存在不同的颜色,为了降低数据量、减少存储空间、降低图像处理时间,本发明实施例中所述去干扰处理可以包括对所述初始图像进行灰度化处理;进一步地,由于所述初始图像中存在图像噪声,为了降低图像噪声对后续处理的影响,本发明实施例中所述去干扰处理还可以包括对所述初始图像进行滤波处理,较佳地,本发明实施例利用中值滤波算法对所述初始图像进行滤波处理。

因此,综上所述,本发明实施例中,所述对所述初始图像进行去干扰处理,包括:对所述初始图像进行灰度化处理,得到灰度化图像;对所述灰度化图像进行滤波处理,得到所述标准图像。

S2、对所述标准图像进行文本识别处理,得到文本信息;

为了获取所述标准图像中文本信息,本发明实施例采用文本提取算法对所述标准图像进行文本化处理,以将所述标准图像中的文字提取出来。本发明其中一个实施例中,所述文本提取算法可以为已知的OCR(Optical Character Recognition,光学字符识别)算法。

S3、利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;

本发明实施例中,需要判断所述标准图像中的广告信息是否违规,因此,需要确定所述标准图像对应的目标实体,即所述标准图像中的广告信息的投放公司。本发明实施例通过对所述文本信息进行预设实体的抽取,抽取出所述文本信息中的命名实体,得到目标实体,即广告信息的投放公司的名称,某金融有限公司。

详细地,参阅图2所示,本发明实施例中利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体之前,还包括:

S31、构建实体抽取模型;

本发明实施例中利用深度学习网络模型构建初始抽取模型;较佳地,利用Bertbase网络模型作为初始抽取模型,在所述初始抽取模型后面接一层全连接网络和一层序列化标注算法网络,得到所述实体抽取模型,即在所述初始抽取模型中增加全连接网络,用于计算输入至所述初始抽取模型中的每个字符属于预设实体的概率,根据所述概率得到预设实体对应的字符组合;及在所述全连接网络之后加入序列化标注算法网络,用于对所述全连接网络得到的字符组合的顺序进行约束,得到所述实体抽取模型。例如:利用所述全连接网络计算字符“某金融”属于金融实体的开始字符概率最高、计算字符“有限公司”属于金融实体中间字符的概率最高,因此,通过全连接层得到的金融实体为“某金融有限公司”或“有限公司某金融”,由于全连接层不能确定字符组合的顺序,因此,本发明实施例通过序列化标注算法网络确定金融实体开始字符应该在姓名中间字符前面,因此,得到金融实体对应的最终字符组合为“某金融有限公司”。

S32、获取历史文本信息集,对所述历史文本信息集进行预设实体标记,得到第一训练集;

本发明实施例中,所述历史文本信息集可以为与所述识别出来的文本信息具有不同内容但属于相同类型的数据。进一步地,本发明实施例使用BIO标记法对所述历史文本信息集进行预设实体标记,得到第一训练集。

详细地,所述对所述历史文本信息集进行预设实体标记,得到第一训练集,包括:根据预设实体构建包含非预设实体字符标签、预设实体开始字符标签、预设实体中间字符标签的标签集合;利用所述标签集合中对应的标签对所述历史文本信息集中的每个字符进行标记,得到第一训练集。例如:历史文本信息集包含的文本信息为“某金融公司提供零利率贷款”,预设实体为金融实体,标签实体集合包括:非金融实体字符标签、金融实体开始字符标签、金融实体中间字符标签,那么利用标签实体集合对文本信息“某金融公司提供零利率贷款”进行标记,“某金融”字符利用金融实体开始字符标签标记为金融实体开始字符,“公司”字符利用金融实体中间字符标签标记为金融实体中间字符,“提供”字符利用非金融实体字符标签标记为非金融实体字符,“零利率”字符利用非金融实体字符标签标签标记为非金融实体字符,“贷款”字符利用非金融实体字符标签标记为非金融实体字符。

S33、利用所述第一训练集对所述实体抽取模型进行迭代训练,直至所述实体抽取模型收敛,得到所述训练完成的实体抽取模型。

本发明实施例利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到所述预设实体对应的字符组合,将该字符组合确定为目标实体,如:预设实体为金融实体,得到的金融实体对应的字符组合为A金融有限公司,那么目标实体为A金融有限公司。

S4、对所述目标实体进行初步审核,得到第一审核结果;

可选地,本发明实施例将所述目标实体与预设的实体审核表进行比较,判断所述目标实体是否在所述实体审核表中,以及若所述目标实体在所述实体审核表中时,获取该目标实体对应的资质信息。本发明实施例中,所述实体审核表为金融实体金融审核表包含不同的金融实体及其资质,所述金融实体金融审核表可从国家工商部门的官方网站进行获取。

例如:所述实体审核表包含A金融有限公司,其金融资质为未拥有金融资质,所述目标实体为A金融有限公司,因此,所述第一审核结果为拥有金融资质。

S5、利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果;

由于上述S4只是对所述初始图像中的对应的信息发布实体进行审核,没有从所述初始图像中的对应的信息内容方面进行审核,无法完整的反应出所述初始图像的违规程度,因此,本发明实施例进一步对所述初始图像中的对应的信息内容进行审核。由于对内容审核是多维度的,如需要审核内容违规判定类别、违规内容及违规类别,因此需要对所述文本信息进行分类识别,进一步地,由于不同的维度审核之间是有关联关系的,因此,利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果。

详细地,本发明实施例中利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果之前,还包括:

步骤A、构建多任务始识别模型;

本发明实施例可以利用深度学习网络模型作为主干模型,在所述主干模型后面增加两层全连接网络,得到所述多任务识别模型,较佳地,所述深度学习网络模型为Bertbase网络模型,其中,所述主干模型中的最后一层全连接网络违规判定类别的识别,在主干模型后面增加一层全连接网络进行违规内容识别,在主干模型后面的一层全连接网络之后再增加一层全连接网络作为违规类别的识别。

步骤B、根据预设维度对所述历史文本信息集进行不同维度的多标签标记,得到第二训练集;

本发明实施例中,所述历史文本信息集可以与上述S32中的历史文本信息集相同,也可以与上述S32中的历史文本信息集不相同。为了让所述多任务始识别模型具有多维识别能力,本发明实施例中根据预设维度对所述历史文本信息集进行不同维度的多标签标记,得到第二训练集。其中,所述预设的维度可以包括违规判定类别、违规内容、违规类别等。因此,本发明实施例对所述历史文本信息集的文本信息进行违规判定类别、违规内容、违规类别三种标签标记,得到所述第二训练集。

步骤C、利用所述第二训练集对所述多任务始识别模型进行迭代训练,直至所述初始识别模型收敛,得到训练完成的多任务识别模型。

本发明实施例中将所述文本信息输入训练完成的多任务识别模型,汇总所述多任务识别模型中不同全连接网络的输出结果,得到第二审核结果。例如:所述多任务识别模型中不同的全连接网络的输出结果为不同维度的识别结果,所述多任务识别模型中倒数第一层全连接网络负责违规类别的识别,所述多任务识别模型中倒数第二层全连接网络负责违规内容的识别,所述多任务识别模型中倒数第三层全连接网络负责违规判定类别的识别,例如,倒数第三层全连接网络的输出结果为违规判定类别为“显性违规”、倒数第二层全连接网络的输出结果为违规内容维度识别结果为违规内容数量1个为“绝对健康”、倒数第一层全连接网络的输出结果为违规类别“暗示无风险”,汇总这三层全连接网络的输出结果,得到所述第二审核结果。

S6、根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果并将所述目标审核结果发送至预设终端设备。

本发明实施例中,根据所述第一审核结果及所述第二审核结果进行权重审核计算。

详细地,本发明实施例中根据所述第一审核结果及所述第二审核结果进行权重审核计算,包括:判断所述第一审核结果是否违规;若所述第一审核结果为违规,则根据预设规则得到审核分数,如未拥有金融资质,则直接得到审核分数为100分;若所述第一审核结果为未违规,则根据所述第二审核结果利用对应的预设权重公式进行计算,得到审核分数,所述权重公式如下:

Score=0(违规判断类别为没有违规)

Score=λ

Score=Score

其中,Score为审核分数,Score

进一步地,本发明实施例利用预设的划分规则对所述审核分数进行审核结果划分,得到所述目标审核结果,,其中,所述预设的划分规则为审核分数0-40分为轻度违规、审核分数41-70为中度违规;审核分数为71-100为重度违规。

本发明的另一实施例中,为了保证数据的安全性,所述目标审核结果可以存储在区块链节点中。

进一步地,本发明实施例中,将所述目标审核结果发送至预设终端设备,如所述审核请求发起人的终端设备,所述终端设备包括但不限于:电脑、手机、平板。

如图3所示,是本发明图像信息审核装置的功能模块图。

本发明所述图像信息审核装置100可以安装于电子设备中。根据实现的功能,所述图像信息审核装置可以包括文本识别模块101、信息审核模块102、权重计算模块103,本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

在本实施例中,关于各模块/单元的功能如下:

所述文本识别模块101用于获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像;对所述标准图像进行文本识别处理,得到文本信息;利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体。

本发明其中一个实施例可以在接收一个审核请求时,响应所述审核请求,获取所述审核请求对应的初始图像。

本发明实施例中,所述审核请求为对初始图像的违规性审核请求。进一步地,所述获取所述审核请求对应的初始图像可以是,例如,审核请求为对初始图像A进行审核,因此,在预设的待审核数据库中获取初始图像A。

本发明实施例中,所述初始图像可以是金融广告图像,本发明实施例可以识别出所述金融广告图像中是否有金融违规广告,例如某个金融广告图像中存在“保本、零风险”等广告用语,则认为该金融广告图像违规。

为了避免拍摄因素对图片造成的影响,本发明实施例,对所述初始图像进行去干扰处理,得到所述标准图像。

详细地,由于所述初始图像可能存在不同的颜色,为了降低数据量、减少存储空间、降低图像处理时间,本发明实施例中所述文本识别模块101对所述初始图像进行灰度化处理;进一步地,由于所述初始图像中存在图像噪声,为了降低图像噪声对后续处理的影响,本发明实施例中所述文本识别模块101对所述初始图像进行滤波处理,较佳地,本发明实施例利用中值滤波算法对所述初始图像进行滤波处理。

因此,综上所述,本发明实施例中,所述文本识别模块101利用下述手段对所述初始图像进行去干扰处理:对所述初始图像进行灰度化处理,得到灰度化图像;对所述灰度化图像进行滤波处理,得到所述标准图像。

为了获取所述标准图像中文本信息,本发明实施例所述文本识别模块101采用文本提取算法对所述标准图像进行文本化处理,以将所述标准图像中的文字提取出来。本发明其中一个实施例中,所述文本提取算法可以为已知的OCR(Optical CharacterRecognition,光学字符识别)算法。

本发明实施例中,需要判断所述标准图像中的广告信息是否违规,因此,需要确定所述标准图像对应的目标实体,即所述标准图像中的广告信息的投放公司。本发明实施例通过对所述文本信息进行预设实体的抽取,抽取出所述文本信息中的命名实体,得到目标实体,即广告信息的投放公司的名称,某金融有限公司。

详细地,本发明实施例中所述文本识别模块101利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体之前,还用于执行下述步骤:

步骤Ⅰ:构建实体抽取模型;

本发明实施例中利用深度学习网络模型构建初始抽取模型;较佳地,利用Bertbase网络模型作为初始抽取模型,在所述初始抽取模型后面接一层全连接网络和一层序列化标注算法网络,得到所述实体抽取模型,即在所述初始抽取模型中增加全连接网络,用于计算输入至所述初始抽取模型中的每个字符属于预设实体的概率,根据所述概率得到预设实体对应的字符组合;及在所述全连接网络之后加入序列化标注算法网络,用于对所述全连接网络得到的字符组合的顺序进行约束,得到所述实体抽取模型。例如:利用所述全连接网络计算字符“某金融”属于金融实体的开始字符概率最高、计算字符“有限公司”属于金融实体中间字符的概率最高,因此,通过全连接层得到的金融实体为“某金融有限公司”或“有限公司某金融”,由于全连接层不能确定字符组合的顺序,因此,本发明实施例通过序列化标注算法网络确定金融实体开始字符应该在姓名中间字符前面,因此,得到金融实体对应的最终字符组合为“某金融有限公司”。

步骤Ⅱ:获取历史文本信息集,对所述历史文本信息集进行预设实体标记,得到第一训练集;

本发明实施例中,所述历史文本信息集可以为与所述识别出来的文本信息具有不同内容但属于相同类型的数据。进一步地,本发明实施例使用BIO标记法对所述历史文本信息集进行预设实体标记,得到第一训练集。

详细地,所述对所述历史文本信息集进行预设实体标记,得到第一训练集,包括:根据预设实体构建包含非预设实体字符标签、预设实体开始字符标签、预设实体中间字符标签的标签集合;利用所述标签集合中对应的标签对所述历史文本信息集中的每个字符进行标记,得到第一训练集。例如:历史文本信息集包含的文本信息为“某金融公司提供零利率贷款”,预设实体为金融实体,标签实体集合包括:非金融实体字符标签、金融实体开始字符标签、金融实体中间字符标签,那么利用标签实体集合对文本信息“某金融公司提供零利率贷款”进行标记,“某金融”字符利用金融实体开始字符标签标记为金融实体开始字符,“公司”字符利用金融实体中间字符标签标记为金融实体中间字符,“提供”字符利用非金融实体字符标签标记为非金融实体字符,“零利率”字符利用非金融实体字符标签标签标记为非金融实体字符,“贷款”字符利用非金融实体字符标签标记为非金融实体字符。

步骤Ⅲ:利用所述第一训练集对所述实体抽取模型进行迭代训练,直至所述实体抽取模型收敛,得到所述训练完成的实体抽取模型。

本发明实施例利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到所述预设实体对应的字符组合,将该字符组合确定为目标实体,如:预设实体为金融实体,得到的金融实体对应的字符组合为A金融有限公司,那么目标实体为A金融有限公司。

所述信息审核模块102用于对所述目标实体进行初步审核,得到第一审核结果;利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果。

可选地,本发明实施例所述信息审核模块102将所述目标实体与预设的实体审核表进行比较,判断所述目标实体是否在所述实体审核表中,以及若所述目标实体在所述实体审核表中时,获取该目标实体对应的资质信息。本发明实施例中,所述实体审核表为金融实体金融审核表包含不同的金融实体及其资质,所述金融实体金融审核表可从国家工商部门的官方网站进行获取。

例如:所述实体审核表包含A金融有限公司,其金融资质为未拥有金融资质,所述目标实体为A金融有限公司,因此,所述第一审核结果为拥有金融资质。

由于上述步骤只是对所述初始图像中的对应的信息发布实体进行审核,没有从所述初始图像中的对应的信息内容方面进行审核,无法完整的反应出所述初始图像的违规程度,因此,本发明实施例进一步对所述初始图像中的对应的信息内容进行审核。由于对内容审核是多维度的,如需要审核内容违规判定类别、违规内容及违规类别,因此需要对所述文本信息进行分类识别,进一步地,由于不同的维度审核之间是有关联关系的,因此,所述信息审核模块102利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果。

详细地,本发明实施例中所述信息审核模块102利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果之前,还用于执行下述步骤:

步骤A:构建多任务始识别模型;

本发明实施例可以利用深度学习网络模型作为主干模型,在所述主干模型后面增加两层全连接网络,得到所述多任务识别模型,较佳地,所述深度学习网络模型为Bertbase网络模型,其中,所述主干模型中的最后一层全连接网络违规判定类别的识别,在主干模型后面增加一层全连接网络进行违规内容识别,在主干模型后面的一层全连接网络之后再增加一层全连接网络作为违规类别的识别。

步骤B:根据预设维度对所述历史文本信息集进行不同维度的多标签标记,得到第二训练集;

本发明实施例中,所述历史文本信息集可以与前述步骤中的历史文本信息集相同,也可以与前述步骤中的历史文本信息集不相同。为了让所述多任务始识别模型具有多维识别能力,本发明实施例中根据预设维度对所述历史文本信息集进行不同维度的多标签标记,得到第二训练集。其中,所述预设的维度可以包括违规判定类别、违规内容、违规类别等。因此,本发明实施例对所述历史文本信息集的文本信息进行违规判定类别、违规内容、违规类别三种标签标记,得到所述第二训练集。

步骤C:利用所述第二训练集对所述多任务始识别模型进行迭代训练,直至所述初始识别模型收敛,得到训练完成的多任务识别模型。

本发明实施例中将所述文本信息输入训练完成的多任务识别模型,汇总所述多任务识别模型中不同全连接网络的输出结果,得到第二审核结果。例如:所述多任务识别模型中不同的全连接网络的输出结果为不同维度的识别结果,所述多任务识别模型中倒数第一层全连接网络负责违规类别的识别,所述多任务识别模型中倒数第二层全连接网络负责违规内容的识别,所述多任务识别模型中倒数第三层全连接网络负责违规判定类别的识别,例如,倒数第三层全连接网络的输出结果为违规判定类别为“显性违规”、倒数第二层全连接网络的输出结果为违规内容维度识别结果为违规内容数量1个为“绝对健康”、倒数第一层全连接网络的输出结果为违规类别“暗示无风险”,汇总这三层全连接网络的输出结果,得到所述第二审核结果。

所述权重计算模块103用于根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并将所述目标审核结果发送至预设终端设备。

本发明实施例中,根据所述第一审核结果及所述第二审核结果进行权重审核计算。

详细地,本发明实施例中所述权重计算模块103利用下述手段进行权重审核计算,包括:判断所述第一审核结果是否违规;若所述第一审核结果为违规,则根据预设规则得到审核分数,如未拥有金融资质,则直接得到审核分数为100分;若所述第一审核结果为未违规,则根据所述第二审核结果利用对应的预设权重公式进行计算,得到审核分数,所述权重公式如下:

Score=0(违规判断类别为没有违规)

Score=λ

Score=Score

其中,Score为审核分数,Score

进一步地,本发明实施例利用预设的划分规则对所述审核分数进行审核结果划分,得到所述目标审核结果,,其中,所述预设的划分规则为审核分数0-40分为轻度违规、审核分数41-70为中度违规;审核分数为71-100为重度违规。

本发明的另一实施例中,为了保证数据的安全性,所述目标审核结果可以存储在区块链节点中。

进一步地,本发明实施例中,所述权重计算模块103将所述目标审核结果发送至预设终端设备,如所述审核请求发起人的终端设备,所述终端设备包括但不限于:电脑、手机、平板。

如图4所示,是本发明实现图像信息审核方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如信息审核程序12。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如信息审核程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如信息审核程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。

所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。

进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的信息审核程序12是多个计算机程序的组合,在所述处理器10中运行时,可以实现:

获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像;

对所述标准图像进行文本识别处理,得到文本信息;

利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;

对所述目标实体进行初步审核,得到第一审核结果;

利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果;

根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并将所述目标审核结果发送至预设终端设备。

具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。

本发明实施例还可以提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

获取待审核的初始图像,对所述初始图像进行去干扰预处理,得到标准图像;

对所述标准图像进行文本识别处理,得到文本信息;

利用训练完成的实体抽取模型,从所述文本信息中抽取预设实体,得到目标实体;

对所述目标实体进行初步审核,得到第一审核结果;

利用预构建的多任务识别模型对所述文本信息进行分类识别,得到第二审核结果;

根据所述第一审核结果及所述第二审核结果进行权重审核计算,得到目标审核结果,并将所述目标审核结果发送至预设终端设备。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

相关技术
  • 图像信息审核方法、装置、电子设备及可读存储介质
  • 信息审核方法、装置、电子设备及计算机可读取存储介质
技术分类

06120112480311