掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明属于电子信息技术领域,涉及一种文件审批系统,尤其涉及一种文件安全扫描及自动审批系统及方法。

背景技术

机构组织因业务需要将生产数据落地到本地或外发至外部,存在有敏感数据泄漏风险,影响公司利益,需要严格把关数据落地,明确数据用途和外发方式,规范数据外发流程,防止未知的生产数据外泄。

现有文件安全扫描系统通过运营系统的现有审批流程,人工审核外发申请的生产数据。其存在如下缺陷:(1)流程复杂,审批及时性差,影响业务正常运转;(2)生产数据文件类型多种多样,人工审核难免会存在遗漏情况;(3)人工审批处理的量级有限,且极大影响员工工作效率。

有鉴于此,如今迫切需要设计一种新的文件审批系统,以便克服现有文件审批系统存在的上述至少部分缺陷。

发明内容

本发明提供一种文件安全扫描及自动审批系统及方法,可实现敏感数据外发精准识别,并实时快速准确审批。

为解决上述技术问题,根据本发明的一个方面,采用如下技术方案:

一种文件安全扫描及自动审批系统,所述文件安全扫描及自动审批系统包括:

文件列表获取模块,用以获取文件列表;

文件审批状态判断模块,用以判断所述文件列表获取模块获取文件列表中各文件的审批状态;

文件获取模块,用以从所述文件列表中下载需要的文件,并加载对应文件的相关描述信息;

文件扫描识别模块,用以扫描并识别所述文件获取模块获取文件的内容,所述内容包括文字信息或/和图片信息;

敏感数据识别模块,用以对所述文件扫描识别模块获取得到的文件内容进行识别,判断文件中是否存在敏感数据;

自动审批模块,用以在所述敏感数据识别模块未检测到敏感数据的状态下,对应文件审批通过,在所述敏感数据识别模块检测到敏感数据的状态下,对应文件转入复核接口。

作为本发明的一种实施方式,所述文件安全扫描及自动审批系统进一步包括文件导出模块,所述文件导出模块用以从设定文件系统中获取文件列表。

作为本发明的一种实施方式,所述系统进一步包括通信接口模块,所述通信接口模块用以绑定设定通信软件,通过设定通信软件反馈处理结果。

作为本发明的一种实施方式,所述敏感数据识别模块用以进行敏感数据匹配正则细致定向化,数据分片进行正则匹配,提升识别的准确性。

作为本发明的一种实施方式,所述敏感数据识别模块包括:

手机号校验识别单元,用以进行手机号校验识别,区分号码段,手机号合法长度11位校验,根据设定的号码段,自动生成正则匹配语句;

身份证号校验识别单元,用以进行身份证号校验识别,区分省市地区,身份证长度18位校验,身份证校验位检测;

银行卡号校验识别单元,用以进行银行卡号校验识别,使用设定正则匹配检验字符串;

姓名校验识别单元,用以进行姓名校验识别,建立姓氏列表,匹配疑似姓名的数据,判断字符串的长度,且除第一个字符外其他字符为中文字符;

邮箱校验识别单元,用以进行邮箱校验识别,使用设定正则匹配字符串;

住址校验识别单元,用以进行用户详细住址校验识别,判断数据总是个否带有省、市、区、路、栋、村信息,如果有,则对住址信息进行进一步判断。

根据本发明的另一个方面,采用如下技术方案:一种文件安全扫描及自动审批方法,所述文件安全扫描及自动审批方法包括:

文件列表获取步骤;获取文件列表;

文件审批状态判断步骤;判断所述文件列表获取步骤获取文件列表中各文件的审批状态;

文件获取步骤;从所述文件列表中下载需要的文件,并加载对应文件的相关描述信息;

文件扫描识别步骤;扫描并识别所述文件获取步骤获取文件的内容,所述内容包括文字信息或/和图片信息;

敏感数据识别步骤;对所述文件扫描识别步骤获取得到的文件内容进行识别,判断文件中是否存在敏感数据;

自动审批步骤;在未检测到敏感数据的状态下,对应文件审批通过,在检测到敏感数据的状态下,对应文件转入复核接口。

作为本发明的一种实施方式,所述方法进一步包括文件导出步骤;从设定文件系统中获取文件列表。

作为本发明的一种实施方式,所述方法进一步包括:绑定设定通信软件,通过设定通信软件反馈处理结果。

作为本发明的一种实施方式,所述敏感数据识别步骤中,进行敏感数据匹配正则细致定向化,数据分片进行正则匹配,提升识别的准确性。

作为本发明的一种实施方式,所述敏感数据识别步骤包括:

手机号校验识别步骤,进行手机号校验识别;区分号码段,手机号合法长度11位校验,根据设定的号码段,自动生成正则匹配语句;

身份证号校验识别步骤,进行身份证号校验识别;区分省市地区,身份证长度18位校验,身份证校验位检测;

银行卡号校验识别步骤,进行银行卡号校验识别;使用设定正则匹配检验字符串;

姓名校验识别步骤,进行姓名校验识别;建立姓氏列表,匹配疑似姓名的数据,判断字符串的长度,且除第一个字符外其他字符为中文字符;

邮箱校验识别步骤,进行邮箱校验识别;使用设定正则匹配字符串;

住址校验识别步骤,进行用户详细住址校验识别;判断数据总是个否带有省、市、区、路、栋、村信息,如果有,则对住址信息进行进一步判断。

本发明的有益效果在于:本发明提出的文件安全扫描及自动审批系统及方法,可实现敏感数据外发精准识别,通过敏感数据分片进行正则匹配,可实现实时的数据导出审批,提高审批时效;依据敏感数据正则匹配的识别,精准捕获敏感数据并实时发送企业微信审批消息推送。本发明通过清晰的敏感数据匹配,极大降低对审批人员的响应要求,提升数据审批处理效率。通过启动运行该系统,实现未包含敏感数据的文件外发审批单秒批,包含有敏感信息的文件外发审批单,发送企业微信消息提醒,实现敏感数据外发精准识别,并实时快速准确审批。

附图说明

图1为本发明一实施例中文件安全扫描及自动审批系统的组成示意图。

图2为本发明一实施例中文件安全扫描及自动审批方法的流程图。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。

该部分的描述只针对几个典型的实施例,本发明并不仅局限于实施例描述的范围。相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。

说明书中各个实施例中的步骤的表述只是为了方便说明,本申请的实现方式不受步骤实现的顺序限制。

说明书中的“连接”既包含直接连接,也包含间接连接。

本发明揭示了一种文件安全扫描及自动审批系统,图1为本发明一实施例中文件安全扫描及自动审批系统的组成示意图;请参阅图1,所述文件安全扫描及自动审批系统包括:文件列表获取模块1、文件审批状态判断模块2、文件获取模块3、文件扫描识别模块4、敏感数据识别模块5及自动审批模块6。

所述文件列表获取模块1用以获取文件列表。如可以通过登录文件导出系统获取文件列表。

所述文件审批状态判断模块2用以判断所述文件列表获取模块1获取文件列表中各文件的审批状态。

所述文件获取模块3用以从所述文件列表中下载需要的文件,并加载对应文件的相关描述信息。所述文件获取模块3可以在所述文件审批状态判断模块2判断所述文件列表获取模块1获取文件列表中存在未审批状态的文件时,从所述文件列表中下载需要的文件,并加载对应文件的相关描述信息。

所述文件扫描识别模块4用以扫描并识别所述文件获取模块3获取文件的内容,所述内容包括文字信息或/和图片信息。

所述敏感数据识别模块5用以对所述文件扫描识别模块4获取得到的文件内容进行识别,判断文件中是否存在敏感数据。

所述自动审批模块6用以在所述敏感数据识别模块5未检测到敏感数据的状态下,对应文件审批通过,在所述敏感数据识别模块5检测到敏感数据的状态下,对应文件转入复核接口。

在本发明的一实施例中,所述系统还可以包括文件导出模块7、通信接口模块8,所述文件导出模块7用以从设定文件系统中获取文件列表。所述通信接口模块8用以绑定设定通信软件,通过设定通信软件反馈处理结果。

在本发明的一实施例中,所述敏感数据识别模块5用以进行敏感数据匹配正则细致定向化,数据分片进行正则匹配,提升识别的准确性。所述敏感数据识别模块5包括:手机号校验识别单元51、身份证号校验识别单元52、银行卡号校验识别单元53、姓名校验识别单元54、邮箱校验识别单元55及住址校验识别单元56。

所述手机号校验识别单元51用以进行手机号校验识别,区分号码段(联通号段、移动号段、电信号段、虚拟号段),手机号合法长度11位校验,根据设定的号码段,自动生成正则匹配语句;

所述身份证号校验识别单元52用以进行身份证号校验识别,区分省市地区(华北、东北、华东、中南、西南、西北、特别行政区),身份证长度18位校验,身份证校验位检测;

所述银行卡号校验识别单元53用以进行银行卡号校验识别,使用设定正则'(?P([1-9]{1})(\d{14}|\d{18}))'匹配检验字符串;

所述姓名校验识别单元54用以进行姓名校验识别,建立姓氏列表,匹配疑似姓名的数据,判断字符串的长度(不超过4位),且除第一个字符外其他字符为中文字符;

所述邮箱校验识别单元55用以进行邮箱校验识别,使用设定正则'.*?(?P[_a-z0-9-]+(\.[_a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*(\.[a-z]{2,}))'匹配字符串;

所述住址校验识别单元56用以进行用户详细住址校验识别,判断数据总是个否带有省、市、区、路、栋、村等信息,如果有,则对住址信息进行进一步判断。

本发明进一步揭示一种文件安全扫描及自动审批方法,所述文件安全扫描及自动审批方法包括:

步骤S1、文件列表获取步骤;获取文件列表;

步骤S2、文件审批状态判断步骤;判断所述文件列表获取步骤获取文件列表中各文件的审批状态;

步骤S3、文件获取步骤;从所述文件列表中下载需要的文件,并加载对应文件的相关描述信息;

步骤S4、文件扫描识别步骤;扫描并识别所述文件获取步骤获取文件的内容,所述内容包括文字信息或/和图片信息;

步骤S5、敏感数据识别步骤;对所述文件扫描识别步骤获取得到的文件内容进行识别,判断文件中是否存在敏感数据;

步骤S6、自动审批步骤;在未检测到敏感数据的状态下,对应文件审批通过,在检测到敏感数据的状态下,对应文件转入复核接口。

在本发明的一实施例中,所述方法可以进一步包括文件导出步骤;从设定文件系统中获取文件列表。所述还可以包括:绑定设定通信软件(如微信等),通过设定通信软件反馈处理结果。

在本发明的一实施例中,所述敏感数据识别步骤中,进行敏感数据匹配正则细致定向化,数据分片进行正则匹配,提升识别的准确性。在一实施例中,所述敏感数据识别步骤包括:

手机号校验识别步骤,进行手机号校验识别;区分号码段(联通号段、移动号段、电信号段、虚拟号段),手机号合法长度11位校验,根据设定的号码段,自动生成正则匹配语句;

身份证号校验识别步骤,进行身份证号校验识别;区分省市地区(华北、东北、华东、中南、西南、西北、特别行政区),身份证长度18位校验,身份证校验位检测;

银行卡号校验识别步骤,进行银行卡号校验识别;使用设定正则'(?P([1-9]{1})(\d{14}|\d{18}))'匹配检验字符串;

姓名校验识别步骤,进行姓名校验识别;建立姓氏列表,匹配疑似姓名的数据,判断字符串的长度(不超过4位),且除第一个字符外其他字符为中文字符;

邮箱校验识别步骤,进行邮箱校验识别;使用设定正则'.*?(?P[_a-z0-9-]+(\.[_a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*(\.[a-z]{2,}))'匹配字符串;

住址校验识别步骤,进行用户详细住址校验识别;判断数据总是个否带有省、市、区、路、栋、村等信息,如果有,则对住址信息进行进一步判断。

综上所述,本发明提出的文件安全扫描及自动审批系统及方法,可实现敏感数据外发精准识别,通过敏感数据分片进行正则匹配,可实现实时的数据导出审批,提高审批时效;依据敏感数据正则匹配的识别,精准捕获敏感数据并实时发送企业微信审批消息推送。本发明通过清晰的敏感数据匹配,极大降低对审批人员的响应要求,提升数据审批处理效率。通过启动运行该系统,实现未包含敏感数据的文件外发审批单秒批,包含有敏感信息的文件外发审批单,发送企业微信消息提醒,实现敏感数据外发精准识别,并实时快速准确审批。

需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施;例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一些实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中;例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现;例如,作为与处理器配合从而执行各个步骤或功能的电路。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。实施例中所涉及的效果或优点可因多种因素干扰而可能不能在实施例中体现,对于效果或优点的描述不用于对实施例进行限制。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

技术分类

06120115968865