掌桥专利:专业的专利平台
掌桥专利
首页

一种信息实时审核方法、系统、电子设备及存储介质

文献发布时间:2023-06-19 19:23:34


一种信息实时审核方法、系统、电子设备及存储介质

技术领域

本发明涉及一种互联网应用技术领域,特别地涉及一种信息实时审核方法和系统。

背景技术

传统的招聘方式是企业招贴求职信息,求职者递交个人纸质简历,两方面对面进行面试交流。如今,随着互联网技术的发展,招聘企业和求职者也有了更多的选择模式,从传统的纸媒招聘模式和线下的人才市场招聘模式转换到互联网招聘的模式。通过互联网进行招聘与求职,相比传统的招聘模式,对于求职者可以更及时的了解招聘企业和招聘信息,对于企业用户可以更方便获取求职者简历,从而更能快速地甄选出适合的求职者。互联网招聘模式缩短了整个招聘求职的流程,既节省了线下招聘的场地和人力成本,也不受时间和空间因素的限制,所以互联网招聘模式逐步发展为求职者找工作的首选,也逐渐成为企业招聘的常态化模式。

但是互联网招聘模式也存在一些缺陷和风险。例如有些非法用工企业进行的虚假招聘、泄露或倒卖求职者的简历等。另外,有些恶意求职者在招聘平台上通过网络招聘进行诸如获取竞争对手企业商业秘密等非法活动。所以,对于招聘平台来说,保证招聘企业和求职者双方的信息安全是非常重要的,这就使得审核发布招聘信息的企业和求职者成为招聘平台工作的非常重要的一个环节。可是,随着招聘规模的增长,需要审核的信息数量也越来越多,而且由于招聘平台业务的不断扩展,招聘平台审核的内容也越来越多,不同业务各有各的审核系统,使得审核人员针对同一企业或同一求职者在审核例如职位、公司、广告等信息时,不得不对相同数据重复审查,这种冗余性的工作不但增加了审核人员的工作量,同时使得审核效率非常低。

发明内容

针对现有技术中存在的技术问题,本发明提出了一种信息实时审核方法和系统,能够在同一个系统从多个维度审核用户提交的信息,用以提高审核效率,减少人工劳动量。

为了解决上述技术问题,根据本发明的一个方面,本发明提供了一种信息实时审核方法,其中包括:

接收用户提交的数据,并将其处理成为待审核任务,其中,所述用户包括招聘用户和求职用户;

建立审核任务队列,将所述待审核任务依次加入到所述审核任务队列中;

依次对所述审核任务队列中的待审核任务进行多维度分析,其中,所述的多维度分析为基于用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息中的一种或多种按照多种审核指标及对应的审核策略进行的多角度分析;

响应于对待审核任务的多维度分析结果为低危类别,将所述待审核任务对应的数据分发至自动发布队列,用于对所述待审核任务对应的用户数据自动发布上线;以及

响应于对待审核任务的多维度分析结果为高危类别,将所述待审核任务分发至人工审核队列,用于进行人工审核。

根据本发明的另一个方面,本发明提供了一种信息实时审核系统,所述系统包括待审核任务模块,经配置以接收用户提交的数据,并将其处理成为待审核任务;任务队列模块,其与所述待审核任务模块相连接,经配置以建立审核任务队列,将所述待审核任务依次加入到所述审核任务队列中;分析模块,其与所述任务队列模块相连接,经配置以依次对所述审核任务队列中的待审核任务按照多种审核指标及对应的审核策略进行多维度分析,其中,进行多维度分析时使用的用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息中的一种或多种存储于多维度信息库;以及结果处理模块,其与所述分析模块相连接,经配置以在对待审核任务的多维度分析结果为低危类别时,将所述待审核任务对应的数据分发至自动发布队列,用于对所述待审核任务对应的用户数据自动发布上线;在对待审核任务的多维度分析结果为高危类别时,将所述待审核任务分发至人工审核队列,用于进行人工审核。

根据本发明的另一个方面,本发明提供了一种电子设备,其包括处理器和存储器,其中所述存储器中存储有程序指令集,当所述处理器执行所述程序指令集时实现前述的信息实时审核方法。

根据本发明的另一个方面,本发明提供了一种计算机可读存储介质,其中存储有程序指令集,当所述程序指令集被处理器执行时实现前述的信息实时审核方法。

根据本发明的另一个方面,本发明提供了一种计算机程序产品,其包括程序指令集,所述计算机程序指令被处理器执行时实现前述的信息实时审核方法。

通过以上本发明提供的方法和系统可见,本发明能够支持海量数据的实时审核,本发明能够从多个维度对各种类型数据在同一个审核系统中进行审核和操作;本发明基于自动审核策略将部分审核通过的信息自动发布上线,部分审核没有通过的信息转由人工审核,既减少了人工审核数据量、减轻了人工劳动量,也能够保证数据审核质量;另外,本发明提供的系统能够从多维度信息库获得分析时所需要的用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息等各上信息,因而在人工审核时,不需要再根据审核内容切换不同的系统,不会再受不同审核系统切换时的加载等待、界面不同、数据格式不同等的困扰,因而既提高了人工审核效率,也有利于审核信息的管理维护。

附图说明

下面,将结合附图对本发明的优选实施方式进行进一步详细的说明,其中:

图1是根据本发明的一个实施例提供的信息实时审核方法流程图;

图2是根据本发明的一个实施例提供的建立审核任务队列的步骤流程图;

图3是根据本发明的一个实施例提供的检测消息队列是否异常的步骤流程图;

图4是根据本发明的一个实施例提供的对审核任务队列中的一个待审核任务进行多维度流程图;

图5是根据本发明的一个实施例提供的信息实时审核系统的原理框图;

图6是根据本发明的另一个实施例提供的信息实时审核系统的原理框图;

图7是根据本发明的一个实施例提供的待审核任务模块的原理框图;

图8是根据本发明的一个实施例提供的任务队列模块的原理框图;

图9是根据本发明的一个实施例提供的分析模块的原理框图;以及

图10是根据本发明一个实施例的一种电子设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在以下的详细描述中,可以参看作为本申请一部分用来说明本申请的特定实施例的各个说明书附图。在附图中,相似的附图标记在不同图式中描述大体上类似的组件。本申请的各个特定实施例在以下进行了足够详细的描述,使得具备本领域相关知识和技术的普通技术人员能够实施本申请的技术方案。应当理解,还可以利用其它实施例或者对本申请的实施例进行结构、逻辑或者电性的改变。

由于互联网的招聘模式存在缺陷和风险,如有些用工企业会进行虚假招聘、泄露或倒卖求职者的简历等非法行为,有些恶意求职者在招聘平台上通过网络招聘进行一些非法活动,诸如获取竞争对手企业商业秘密等,因此,对于招聘平台来说保证招聘企业和求职者双方的信息安全是非常重要的,这就使得审核企业和求职者发布的信息成为招聘平台工作的非常重要的一个环节。但是,随着招聘规模的增长,需要审核的数量也越来越多,而且由于招聘平台业务的不断扩展,招聘平台审核的内容也越来越多,不同业务各有各的审核系统,使得审核人员针对同一企业或同一求职者在审核例如职位、公司、广告等信息时,不得不对相同数据重复审查,这种冗余性的工作不但增加了审核人员的工作量,同时使得审核效率非常低。针对这些问题,本发明提出了一种信息实时审核方法和系统。

图1是根据本发明的一个实施例提供的信息实时审核方法流程图。所述方法包括以下步骤:

步骤S1,接收用户提交的数据,并将其处理成为待审核任务,其中,所述用户包括招聘用户和求职用户。在一个实施例中,本发明的信息实时审核系统接收来自招聘用户和求职用户发布的大量数据信息,并将接收到的用户所提交的数据按标准化格式进行处理。其中,所述标准化格式的内容包括标签类型、对象ID和审核信息字段数组。其中,所述标签类型进一步包括以下类型中的一种或多种:公司、部门、职位、简历和职位所在地。所述对象ID为一组数字编号,例如可以将对象ID表示为:123456。因为,招聘用户和求职用户的所有的待审核信息都在同一系统中,也就是在同一数据表里,但是由于待审核信息的来源系统不同,所以待审核信息的对象ID是有可能重复的,需要加上标签类型就不会出现重复的情况了。

其中,所述审核信息字段数组包括原始信息的数据和需要新发布信息的数据。其中,所述审核信息字段数组内的信息类型包括文字类型和图片类型。需要说明的是所述待审核任务中包括一个或多个审核信息字段数组。

在本实施例中,所述审核信息字段数组格式的形式为:

[{jobname:{old:java开发,new:Java开发工程师,type:string},

postid:{old:pic/job/postid/123_202207201619.jpg,

new:pic/job/postid/123_202207201619.jpg,type:pic}}]

例如,上述格式中的old字段中的内容为原始信息,即为需要修改的信息,new字段中的内容为需要发布的新信息,在本实施例中,“java开发”为原始信息,“Java开发工程师”为待发布的新信息,用以替换原始信息,此时,type(类型)字段中的内容为string,代表这组所述审核信息字段数组的原始信息的数据和需要新发布信息的数据为string字符串类型。又例如,所述审核信息字段数组内的信息类型除了包括文字类型,还包括图片类型。上述格式中的type字段中的内容为pic为英文picture的缩写,代表这组所述审核信息字段数组的原始信息的数据和需要新发布信息的数据为图片类型。

步骤S2,建立审核任务队列,将所述待审核任务依次加入到所述审核任务队列中。在本实施例中,当完成将接收到的用户所提交的数据按标准化格式处理成为待审核任务后,依次将所述待审核任务加入到所述信息实时审核系统的审核任务队列中。

步骤S3,依次对所述审核任务队列中的待审核任务进行多维度分析,其中,所述的多维度分析为基于用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息中的一种或多种按照多种审核指标及对应的审核策略进行的多角度分析。然后,根据判断策略给出当前所分析的待审核任的分析结果,并将结果分为两种类别,分别是低危类别和高危类别。

其中,所述基础库用以提供所述招聘用户的工商信息,其包括招聘用户的经营状态、经营范围、注册地址中的一种或多种,以及用以提供所述招聘用户是否优质企业、分线等级等维度的相关信息。

所述待审核任务的用户行为信息的获取是通过大数据组提供的,其中,所述行为信息包括所述用户的登录、聊天、投递简历等行为信息。

投诉信息也是进行审核时的重要辅助信息和审核内容。在本实施例中,所述信息实时审核系统还连接举报投诉系统,从中获取投诉信息。求职用户或招聘用户通过所述投举报诉系统对某个企业、某个个人进行举报,投举报诉系统根据举报信息生成具有一定格式的投诉信息,如用户ID,投诉内容等,如以诈骗为目的的招聘、或者一些以传销等非法目的的虚假招聘等。

另外,所述信息实时审核系统还连接记录历史审核记录信息的数据库,所述数据库中存储有历史审核结果。在进行多维度分析时,可根据当前审核信息对应的招聘用户或者求职用户,从所述数据库中获取其一个预置时间段的发布信息的审核记录,从中可以得到该段时间内的历史发布信息,并将所述历史发布信息作为对所述用户进行分析判断的一个维度。

步骤S4a,响应于对待审核任务的多维度分析结果为低危类别,将所述待审核任务对应的数据分发至自动发布队列。此时,信息自动发布系统将分发至自动发布队列中的数据自动发布上线。在一个实施例中,对自动发布队列中的数据进行人工抽查。例如,针对自动发布的信息,审查人员会按比例进行抽样,并对抽查到的信息进行复查反馈,从而优化完善低危信息判断策略。

步骤S4b,响应于对待审核任务的多维度分析结果为高危类别,将所述待审核任务分发至人工审核队列。由审核人员对人工审核队列中的该待审核任务进行进一步判定。在一个实施例中,基于审核人员对待审核任务的订阅消息,将人工审核对列中的待审核任务分发至审核人员,由审核人员基于用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息中的一种或多种对该待审核任务进行人工审核,以最终确定其是否为真正的高危类别。在本实施例中,如果该待审核任务被认定为高危类别,审核人员可以对违规用户采取封禁的方式,或者将其列入黑名单中,或者对其会员、公司、职位等进行锁定,以限制所述违规用户在所述信息实时审核系统上的行为。

图2是根据本发明的一个实施例提供的建立审核任务队列的步骤流程图。在本实施例中,建立审核任务队列后,将所述待审核任务依次加入到所述审核任务队列中,另外,所述建立审核任务队列的方法进一步包括以下步骤:

步骤S21,将待审核任务存入数据库任务表。所述信息实时审核系统将待审核任务存入到相对应的数据库任务表中,用以对其进行持久化存储。在本实施例中,所述信息实时审核系统利用oracle数据库任务表对其进行持久化存储,用以防止服务器出现宕机等情况时导致重要数据丢失。

步骤S22,记录每个所述待审核任务的任务状态。由于oracle数据任务表里的每条数据都是还未处理的数据,因而设置每条数据,即每个待审核任务的中间状态为“待审核”或“待处理”状态。

步骤S23,将所述数据库任务表中的待审核队务依次转入消息队列。在本实施例中,将所述oracle数据库任务表中的待审核队务依次转入到消息队列中,例如转入到第三方系统Rabbitmq中,Rabbitmq是实现了高级消息队列协议(AMQP)的开源消息代理软件,也称面向消息的中间件。Rabbitmq可以对消息队列中的消息进行持久化,即对消息实现了从内存到硬盘,再从硬盘加载到内存的过程。其中,所述消息队列中的每条数据,即待审核任务,根据其是否被处理分为“未处理”状态和“处理中”状态。例如,在对待审核任务进行多维度分析时,依次从Rabbitmq消息队列中读取一个数据,对其进行分析,在分析过程中,消息队列中的所述数据的状态为“处理中”,其它未进行分析的数据的状态为“未处理”。当处理完成时,根据处理结果,或者将其转移动自动发布队列,或者将其转移动人工审核队列,因而消息队列中的数据随着分析处理而不断向移动,当消息队列中有空位时将数据库任务表中的数据向消息队列补充,从而不断地推进信息的审核进行。

在另一个实施例中,当分析处理过程因系统宕机、服务器宕机等情况而停止时,为了确保对用户提交的数据能够及时、有效地审核,本发明提供的方法还包括检测消息队列是否异常的步骤,图3是根据本发明的一个实施例提供的检测消息队列是否异常的步骤流程图。在本实施例中,所述方法包括以下步骤:

步骤S231,定时轮询所述数据库任务表中的第一待审核任务的任务状态。其中,所述第一待审核任务为在定时起始时刻存储到所述数据库任务表中的待审核任务。在所述信息实时审核系统运行过程中,如果出现服务器宕机的情况,Rabbitmq的所述消息队列就会被阻塞,使得所述消息队列内的任务无法进入到后续对所述待审核任务进行多维度分析的流程,审核流程就会被卡住。因此,为了及时发现上述问题,本实施例设定了定时轮询的机制,每当达到所设定的时长,就会启动定时任务来判断所述消息队列状态是否异常。在本实施例中,根据大多数审核任务完成的时长,设置定时的时长为十分钟,每十分钟轮询oracle数据表里的所述第一待审核任务的数据,也就是说此数据为在定时起始时刻存储到所述数据库任务表中的待审核任务的数据,此待审核任务被定义为第一待审核任务。

步骤S232,响应于第一待审核任务的任务状态为未处理状态,确认所述消息队列异常。在本实施例中,正常的情况下,当有待审核任务进入到审核任务队列中,并进行多维度分析所需的时长小于十分钟,也就是说正常的情况下十分钟之内应该处理完所述待审核任务,所以当达到定时轮询的时长十分钟后,去查询所述消息队列,如果此时读取到的数据为空,则所述数据库任务表中的审核任务已执行完成,说明所述消息队列状态正常。本实施例的定时轮询操作只进行查询,不执行其操作,即相当于空跑状态,所以所述定时轮询机制为一种容错机制。反之,如果此时读取到的数据非空,则表明所述数据库任务表中还有未完成的审核任务,所述消息队列状态异常,即存在未处理的任务。

步骤S233,响应于所述消息队列异常,将所述未处理的第一待审核任务加入所述审核任务队列。在本实施例中,所述信息实时审核系统响应于所述消息队列异常,将未完成审核任务的异常的消息队列重新进行任务分配,再次加入到所述审核任务队列中。

图4是根据本发明的一个实施例提供的对审核任务队列中的一个待审核任务进行多维度流程图。在本实施例中,所述方法包括以下步骤:

步骤S31,按照多种审核指标及对应的审核策略进行的多角度分析逐个维度地对所述待审核任务进行审核。

步骤S32,响应于所述待审核任务通过全部审核指标,确定所述待审核任务的多维度分析结果为低危类别。

步骤S33,响应于所述待审核任务中包括有符合审核策略中驳回的信息,生成驳回消息并发送给用户。

步骤S34,响应于所述待审核任务中包括有符合审核策略中高危类别的信息确定所述待审核任务的多维度分析结果为高危类别。

在步骤S31中,所述信息实时审核系统根据实际需求设定多种审核指标,并根据审核指标设置对应的审核策略,形成对待审核任务的判断策略。基于判断策略依次对审核任务队列中的审核任务进行审核,具体包括以下内容:

识别高危用户:即判断所述用户是否为高危名单中的高危用户。其中,所述高危名单例如由人工进行维护,对于个人举报、HR举报、日常的巡查、审核过程出现的纠纷涉及到的用户都会被列入到高危名单中。如果当前正在审核的任务对应的用户在高危名单中,则可以确定正在审核的任务包括审核策略中高危类别的信息,因而确定所述待审核任务的多维度分析结果为高危类别,此时将所述待审核任务分发列入到人工审核流程,并将其从所述审核任务队列中移除。在本实施例中,针对招聘用户和求职用户各有一份高危名单。在现有技术中,一份高危名单要提供给多个系统使用,相应地用于判断的代码也需要写多套以与之相配套,这就需要系统设计人员花费很多时间去做重复性的代码编程工作。另外,对于不同的系统,其提供的页面不同,操作方式也不同,这就需要审核人员花费很多时间去熟悉各个系统,经常还会对一些指标在不同系统中进行重复审核。本发明提供的多维度审核系统的优势就是通过统一的系统实现快速地多角度地对所述待审核任务分析及审核。

识别工商状态:当所述待审核任务的用户为招聘用户时,获取其在基础库中的工商信息,其中,所述基础库用以提供所述招聘用户的工商信息,其包括招聘用户的经营状态、经营范围、注册地址中的一种或多种,以及用以提供所述招聘用户是否为优质企业、分线等级等维度的相关信息。如果其工商状态异常,例如,所述招聘用户的工商执照上的经营状态为吊销、过期、注销等,则待审核任务被判定为高危类别,将所述待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

识别新用户:通过所述待审核任务对象ID类型信息,判断所述招聘用户是否为新用户;如果是新用户,虽然新用户不属于高危用户,但是为了谨慎处理新用户的数据,也将新用户类别确定为符合审核策略中高危类别的信息。进一步的处理包括获取所述待审核任务的职位标签类型信息,并将其新发布的前几个职位信息所属的待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

识别图片内容:获取所述待审核任务中的审核信息类型为图片类型,也就是所述审核信息字段数组内的信息type类型为图片类型时,在本实施例中,利用第三方系统审核相关图片,例如通过百度提供的第三方软件的图片审核接口,判断招聘用户和/或者求职用户发布的图片内容是否有违规。审核的违规内容包括该图片是否为黄图、侮辱性的图片、政治敏感图片、嫁接的违规图片等。如果所述检查结果认定所述图片违规,则待审核任务被判定为高危类别,将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。利用第三方系统审核相关图片可以有效地节省人工成本。

识别待审核任务的字数长度:当所述审核任务的用户为招聘用户时,并且所述审核信息字段数组的信息类型为文字类型时,获取其中的字段,其包括职位描述、公司详情等信息;计算所述描述字段的字数长度,并与设定的合理字数长度的预设值进行比较;如果字数长度没有达到预设值,例如,招聘用户的公司和职位描述过短时,比如少于预设值30字,所述信息实时审核系统判定其不符合常理,则待审核任务被判定为高危类别,将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

识别白名单:当所述审核任务中的用户为招聘用户时,获取所述待审核任务的标签类型中的职位所在地类型,同时获取所述招聘用户在基础库中的工商注册地,检查所述职位所在地与所述招聘用户的工商注册地是否一致,如果不一致,则检查所述招聘用户是否在白名单中,其中,所述白名单为异地发布职位的白名单。一般来说,招聘用户的工商注册地与职位的工作地在同一个省或同一个城市,当出现工商注册地与职位的工作地不一致时,有可能会出现违法违规的虚假招聘的情况,例如诈骗、传销等。但是,有些正常招聘的用户,其在不同城市有其子公司,会有跨省、跨市的招聘需求,对于正常招聘情况的公司,通过人工审核确认后就会加入到白名单中。在本实施例中,所述白名单主要由审核人员或者系统操作人员进行人工维护。

识别信息修改前后的相似度:获取所述待审核任务,通过特定算法比较原始信息数据和新发布的数据中两个字符串的相似度,并将得到的相似度值与设定的预设值进行比较,如果相似度值小于所述预设值,则待审核任务被判定为高危类别,将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。例如,所述标签类型的职位描述原始信息数据可能是java的开发的描述,但是新发布的数据更改为与原始信息数据完全不相关的信息数据,所述信息实时审核系统判定该职位相对风险比较高,一般来说,修改职位描述不会修改成相似度很低的内容。在本实施例中,所述信息实时审核系统通过特定算法比较修改前后两个字符串的相似度,当两者的相似度低于60%时,表示整个职位描述和原来不同。

识别高亮词:当所述审核信息字段数组的信息类型为文字类型时,获取新发布的数据中的字段信息,检查所述信息中是否匹配到高亮词库中的高亮词。当检查到存在高亮词时确定该任务属于高危类别。在本实施例中,其中所述高亮词由审核人员自定义配置,在一段时间内,审核人员认为有些关键词可能存在比较高的风险,针对这些关键词,都需要审核人员进行人工复查。例如有些带有时效性的关键词,比如之前关于时事政治的总裁秘书、网约车类型的公司或者职位,通过高亮这些风险比较高的词汇,提示审查人员对这些公司和职位进行审核。

识别IP地址:获取所述待审核任务的用户登录信息,如果检查到其IP地址与高危IP池子匹配,并且检查到同一IP地址对应的用户为黑用户,则待审核任务被判定为高危类别,将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除,其中所述黑用户包括招聘用户和求职用户。在本实施例中,其中高危IP池子中的高危IP地址由公司的安全部门提供,黑用户名单由审核人员维护。

识别被举报情况:当所述待审核任务的用户为招聘用户时,检查在举报投诉系统中的信息是否与所述用户信息相匹配,如果相匹配,则表示所述招聘用户包括其会员、公司下的其他信息被举报过,而且被举报的信息已经被举报系统证实。在本实施例中,求职用户可以通过在所述信息实时审核系统页面上的举报职位通道举报HR聊天,举报信息会进入到的所述举报系统之中。例如,当求职用户在招聘平台上通过文本聊天的方式与招聘用户的HR聊天时,发现该HR有涉嫌违法违规的言语,就可以通过在页面上的举报职位通道举报HR聊天。又例如,招聘平台会实时监控异常聊天,当发现招聘用户的HR一个人同时和多人聊天,聊天人数达到几百甚至几千人时,或者在聊天过程中提及多个微信号时,招聘平台会自动举报该招聘用户,当通过审核人员确认违规后,该招聘用户就被记录在举报系统中。当所述用户信息相匹配与举报系统中内容相匹配时,所述待审核任务被判定为高危类别,则将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

识别用户行为信息:通过大数据组提供的所述待审核任务的用户行为信息,如果所述用户有违规操作,所述待审核任务被判定为高危类别,则将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除;其中,所述行为信息包括所述用户的登录、聊天、投递简历等行为信息。在本实施例中,通过大数据组检查所述用户近一个月内有无聊天异常行为,比如有无诈骗行为、涉及冒充公司法人实施违法行为、同时跟异常多的人聊天、聊天内容包含违规词、聊天内容中提及多个微信号等等,当涉及和不同的人提及不同的微信的情况,可能涉及到非法传销的行为。当所述用户行为信息与大数据组提供的所述待审核任务的用户行为信息相匹配时,所述待审核任务被判定为高危类别,则将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

识别异常投递行为:当所述待审核任务的用户为求职用户时,如果在举报投诉系统中检查有其被招聘用户HR投诉举报的信息,则检查其是否异常的投递行为,在本实施例中,所述异常投递行为主要指在短时间内投递几百个职位,甚至几千个职位,而且这些职位间互不相关,也就是说在所投递的职位中各种职能都有的投递行为。如果所述求职用户有异常投递行为,所述待审核任务被判定为高危类别,则将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除。

在所述的判断策略中还包括了一些不属于高危,但在某些方面不能上线发布的信息,例如,用户提交的信息中,在公司、部门、职位等信息中出现违规词时,需要用户重新提交信息,因而,在对待审核任务进行多维度分析时,获取所述待审核任务的标签类型内的字段信息,包括公司、部门、职位等信息,检查所述信息中是否匹配到违规词库中的违规词,如果包含有违规词,则驳回所述待审核任务,即生成驳回消息并通知对应的用户。进一步地,当匹配到违规词时,将所述违规词会被替换成一个或多个字符,如“***”。对于此类问题系统自动驳回所述待审核任务,并生成驳回消息并发送给用户,提示所述用户对违规词进行修改。

在一个进一步的实施例中,当所述待审核任务因其标签类型内的字段信息中的相关信息不符合要求而被驳回的次数超过预设的超限值,比如超限3次,将其列为高危类别,则将待审核任务分发列入到人工审核流程,并将其从所述审核任务队列移除,在进行人工审核时,当审核人员确定多次驳回的用户信息属于蓄意破坏系统的情况,审核人员进行拉黑处理,即将其列入黑名单中。

图5是根据本发明的一个实施例提供的信息实时审核系统的原理框图。在本实施例中,所述信息实时审核系统100包括待审核任务模块1、任务队列模块2、分析模块3和结果处理模块4。

其中,所述待审核任务模块1用以接收用户提交的数据,并将其处理成为待审核任务。所述任务队列模块2,其与所述待审核任务模块1相连接,用以建立审核任务队列,将所述待审核任务依次加入到所述审核任务队列中。所述分析模块3,其与所述任务队列模块2相连接,用以依次对所述审核任务队列中的待审核任务按照多种审核指标及对应的审核策略进行多维度分析,其中,进行多维度分析时使用的用户基础库信息、用户行为信息、举报投诉信息和历史审核记录信息中的一种或多种存储于多维度信息库。所述结果处理模块4,其与所述分析模块3相连接,用以在对待审核任务的多维度分析结果为低危类别时,将所述待审核任务对应的数据分发至自动发布队列,用于对所述待审核任务对应的用户数据自动发布上线;在对待审核任务的多维度分析结果为高危类别时,将所述待审核任务分发至人工审核队列,用于进行人工审核。

图6是根据本发明的另一个实施例提供的信息实时审核系统的原理框图。在另一个实施例中,所述信息实时审核系统100包括待审核任务模块1、任务队列模块2、分析模块3、结果处理模块4、定时轮询模块5和异常处理模块6。

其中,所述定时轮询模块5,其与所述任务表单元22相连接,用以定时轮询所述任务表中第一待审核任务的任务状态,其中,所述第一待审核任务为在定时起始时刻存储到所述数据库任务表中的待审核任务;在所述第一待审核任务的任务状态为未处理状态时确认所述消息队列异常。在所述信息实时审核系统运行过程中,如果出现服务器宕机的情况,所述消息队列就会被阻塞,使得所述消息队列内的任务无法进入到后续对所述待审核任务进行多维度分析的流程,审核流程就会被卡住。因此,为了及时发现上述问题,本实施例设定了定时轮询的机制,每当达到所设定的时长,就会启动定时任务来判断所述消息队列状态是否异常。在本实施例中,所述定时轮询模块5每十分钟轮询oracle数据表里的所述第一待审核任务的数据,也就是说此数据为在定时起始时刻存储到所述数据库任务表中的待审核任务的数据。当达到所述定时轮询模块5的时长十分钟后,去查询所述消息队列,如果此时读取到的数据为空,则所述数据库任务表中的审核任务已执行完成,说明所述消息队列状态正常。本实施例的定时轮询操作只进行查询,不执行其操作,即相当于空跑状态,所以所述定时轮询机制为一种容错机制。反之,如果此时读取到的数据非空,则表明所述数据库任务表中还有未完成的审核任务,所述消息队列状态异常,即存在未处理的任务。

所述异常处理模块6,其与所述定时轮询模块5相连接,用以在所述消息队列异常时,将所述未处理的第一待审核任务加入所述审核任务队列。

图7是根据本发明的一个实施例提供的待审核任务模块的原理框图。在本实施例中,所述待审核任务模块1还包括接收单元11和标准化单元12。

其中,所述接收单元11,用以接收用户提交的数据。其中所述用户包括招聘用户和求职用户。

所述标准化单元12,其与所述接收单元11相连接,用以将用户提交的数据按标准化格式进行处理;其中,所述标准化格式的内容包括标签类型、对象ID和审核信息字段数组;其中,所述待审核任务中包括一个或多个审核信息字段数组。所述标准化格式如步骤S1中所述,在此不再赘述。

图8是根据本发明的一个实施例提供的任务队列模块的原理框图。在本实施例中,所述任务队列模块2还包括审核任务队列单元21、任务表单元22和消息队列单元23。

其中,所述审核任务队列单元21。当完成将接收到的用户所提交的数据按标准化格式处理成为待审核任务后,依次将所述待审核任务加入到所述信息实时审核系统的所述审核任务队列单元21中。

所述任务表单元22,用以将待审核任务存入数据库任务表,并记录每个所述待审核任务的任务状态。所述信息实时审核系统将待审核任务存入到所述任务表单元22中,用以对其进行持久化存储。在本实施例中,所述信息实时审核系统利用oracle数据库任务表对其进行持久化存储,用以防止服务器出现宕机等情况,导致重要数据丢失。

所述消息队列单元23,其与所述任务表单元22相连接,用以将所述数据库任务表中的待审核任务依次转入消息队列。在本实施例中,将所述数据库任务表中的待审核任务依次转入第三方软件Rabbitmq中,转入成为消息队列。Rabbitmq可以对消息队列中的消息进行持久化。其中,所述消息队列单元23的消息队列中的任务状态与所述待审核任务的任务状态相对应,例如在所述待审核任务的任务状态为“待审核”状态时,所述消息队列单元23的消息队列中相对应的待审核任务的任务状态为“处理中”状态。

图9是根据本发明的一个实施例提供的分析模块的原理框图。在本实施例中,所述分析模块3还包括策略处理单元31、结果判断单元32、驳回处理单元33和计数单元34。

其中,所述策略处理单元31,用以按照多种审核指标及对应的审核策略逐个维度地对所述待审核任务进行审核。所述信息实时审核系统还还连接了提供了用于所述策略处理单元31进行分析参考的数据库,其包括:基础库、行为信息库和举报投诉系统。

其中,所述基础库,即招聘用户基础库,提供工商信息第三方数据,包括经营状态、经营范围、注册地址等工商信息,以及是否为优质企业,将上述信息提供给审核人员,帮助其进行审核判断。

所述行为信息库,利用大数据提供用户登录、聊天、投递简历等行为信息。

所述举报投诉系统,其提供举报相关数据。求职用户或招聘用户通过所述投举报诉系统对某个企业、某个个人进行举报,投举报诉系统根据举报信息生成具有一定格式的投诉信息,如用户ID,投诉内容等,如以诈骗为目的的招聘、或者一些以传销等非法目的的虚假招聘等。因此,投诉信息也是审核时的重要辅助信息。

所述结果判断单元32,其与所述策略处理单元31相连接,用以在所述待审核任务通过全部审核指标时确定所述待审核任务的多维度分析结果为低危类别;在所述待审核任务中包括有符合审核策略中高危类别的信息时或者驳回次数达到预置次数时,确定所述待审核任务的多维度分析结果为高危类别;在所述待审核任务中包括有符合审核策略中驳回的信息,确定所述待审核任务应被驳回。

所述驳回处理单元33,其与所述结果判断单元32相连接,用以在所述待审核任务应被驳回时生成驳回消息并发送给用户。驳回的信息包括提示用户修改相关信息错误,或者对用户不当行为的警示或告知等内容。

所述计数单元34,其与所述结果判断单元33相连接,用以当所述待审核任务被确定为驳回时对驳回次数进行计数。为了避免出现误驳回的情况,每次进行自动驳回时,所述计数单元34会自动计数,当自动驳回超过限制次数时,例如超限3次时,进行人工审核。

图10是根据本发明一个实施例的一种电子设备的硬件结构示意图,所述电子设备可以实施为作为服务端的服务器,其中包括处理器601和存储器602,所述存储器602上存储有程序指令集,在处理器601执行存储器602上的程序指令集时实现前述的信息实时审核方法。

具体地,上述处理器601可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本发明实施例的一个或多个集成电路。

存储器602可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器602可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或多个以上这些的组合。在合适的情况下,存储器602可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器602可在综合网关容灾设备的内部或外部。在特定实施例中,存储器602是非易失性固态存储器。

存储器可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行本发明提供的信息实时审核方法。

在一个示例中,电子设备还可包括通信接口603和总线604。其中,如图10所示,处理器601、存储器602、通信接口603通过总线604连接并完成相互间的通信。本发明实施例中的电子设备可以是服务器或其他计算设备,也可以是云端服务器。

通信接口603主要用于实现本发明实施例中各模块、装置、单元和/或设备之间的通信。

总线604包括硬件、软件或两者,将在线数据流量计费设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线604可包括一个或多个总线。尽管本发明实施例描述和示出了特定的总线,但本发明考虑任何合适的总线或互连。

本发明还提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令可以被处理器执行时实现前述实施例中的前述的信息实时审核方法。所述计算机可读存储介质可以是可有形地包含或存储计算机可执行指令以供指令执行系统、装置和设备使用或与其结合的任何介质。存储介质可以是暂态计算机可读存储介质或非暂态计算机可读存储介质。非暂态计算机可读存储介质可包括但不限于磁存储装置、光学存储装置和/或半导体存储装置。此类存储装置对应的实施例例如包括磁盘、基于CD、DVD或蓝光技术的光盘以及持久性固态存储器诸如闪存、固态驱动器等。

本发明还提供一种计算机程序产品,其包括计算机程序指令,所述计算机程序指令被处理器执行时实现前述实施例中的前述的信息实时审核方法。所述计算机程序产品包括但不限于公布于网站、应用商店中的应用安装包、应用插件、可以运行于某些应用中的小程序等形式。

上述实施例仅供说明本发明之用,而并非是对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明范围的情况下,还可以做出各种变化和变型,因此,所有等同的技术方案也应属于本发明公开的范畴。

相关技术
  • 一种硬件信息采集方法、系统及电子设备和存储介质
  • 一种分布式系统部署方法、系统、电子设备及存储介质
  • 一种操作系统的预安装方法、系统、电子设备及存储介质
  • 一种信息展示方法、电子设备及存储介质
  • 一种语音信息推送方法、装置、电子设备及存储介质
  • 一种影像信息的审核方法、装置、电子设备及存储介质
  • 一种合同信息审核方法、装置、电子设备及存储介质
技术分类

06120115891529