掌桥专利:专业的专利平台
掌桥专利
首页

信息异常检测方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 11:32:36


信息异常检测方法、装置、电子设备和存储介质

技术领域

本申请涉及NLP(Natural Language Processing,自然语言处理)、云计算等AI(Artificial Intelligence,人工智能)领域,尤其涉及信息异常检测方法、装置、电子设备和存储介质。

背景技术

人工客服是处理客户售前、售后问题的常见服务形态,客服与客户通过对话系统进行交互,产生大量的对话记录。通过对客服与客户之间的对话记录进行语义检测,能够识别对话记录中是否存在不合理话术(比如存在不文明用词、存在重复句子、存在不合理的电话号码或地址、情感倾向负向等等),从而可以评估客服的工作质效,其目的在于提升客服的整体水平与服务质量。

发明内容

本申请提供了一种用于信息异常检测方法、装置、电子设备以及存储介质。

根据本申请的一方面,提供了一种信息异常检测方法,包括:

获取待处理的信息内容,以及所述信息内容所属的业务场景;

获取所述业务场景对应的异常条件表达式,其中,所述异常条件表达式中包括多个异常条件以及所述多个异常条件之间的逻辑关系;

根据所述多个异常条件中的异常检测算子对所述信息内容进行检测,以获取所述信息内容在所述多个异常条件下的检测结果;

根据所述检测结果以及所述多个异常条件之间的逻辑关系,确定所述信息内容是否存在异常。

根据本申请的另一方面,提供了一种信息异常检测装置,包括:

第一获取模块,用于获取待处理的信息内容,以及所述信息内容所属的业务场景;

第二获取模块,用于获取所述业务场景对应的异常条件表达式,其中,所述异常条件表达式中包括多个异常条件以及所述多个异常条件之间的逻辑关系;

检测模块,用于根据所述多个异常条件中的异常检测算子对所述信息内容进行检测,以获取所述信息内容在所述多个异常条件下的检测结果;

第一确定模块,用于根据所述检测结果以及所述多个异常条件之间的逻辑关系,确定所述信息内容是否存在异常。

根据本申请的又一方面,提供了一种电子设备,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请上述实施例提出的信息异常检测方法。

根据本申请的再一方面,提供了一种计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请上述实施例提出的信息异常检测方法。

根据本申请的还一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请上述实施例提出的信息异常检测方法。

应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本申请的限定。其中:

图1是本申请实施例一所提供的信息异常检测方法的流程示意图;

图2为本申请实施例二所提供的信息异常检测方法的流程示意图;

图3为本申请实施例三所提供的信息异常检测方法的流程示意图;

图4为本申请实施例四所提供的信息异常检测方法的流程示意图;

图5为本申请实施例中的异常检测系统的结构示意图;

图6为本申请实施例五所提供的信息异常检测装置的结构示意图;

图7示出了可以用来实施本申请的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

现有技术中,主要通过以下两种方式,对客服和客户之间的对话记录进行语义检测:

第一种方式,由于业务逻辑以及检测规则的复杂性,通过质检人员人工对客服和客户之间的对话记录进行语义检测,判断对话记录中是否存在不合理话术,从而评估客服的服务质量。

第二种方式,使用机器学习模型对客服和客户之间的对话记录进行语义检测,例如,可以使用情感分析模型检测客服对应的回复内容的态度是否积极,使用主题分析模型判断客服的回复与客户的提问是否属于同一话题等等。

然而,第一种通过人工经验对对话记录进行语义检测的方式,主要存在以下几方面问题:第一,检测效率较低;第二,对话记录以抽查为主进行语义检测,覆盖率较低;第三,实时性较差,发现问题具有滞后性,可能导致客户大量投诉的情况发生。而第二种方式下,对特定业务场景的适用性较差。

因此,本申请主要针对上述问题,提出一种信息异常检测方法、装置、电子设备和存储介质。

下面参考附图描述本申请实施例的信息异常检测方法、装置、电子设备和存储介质。

图1为本申请实施例一所提供的信息异常检测方法的流程示意图。

本申请实施例以该信息异常检测方法被配置于信息异常检测装置中来举例说明,该信息异常检测装置可以应用于任一电子设备中,以使该电子设备可以执行信息异常检测功能。

其中,电子设备可以为任一具有计算能力的设备,例如可以为PC(PersonalComputer,个人电脑)、移动终端、服务器等,移动终端例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。

如图1所示,该信息异常检测方法可以包括以下步骤:

步骤101,获取待处理的信息内容,以及信息内容所属的业务场景。

其中,业务场景例如可以为购物场景、充值场景、订餐场景、订票场景等等。

本申请实施例中,信息内容可以为任一待处理的信息内容,该信息内容可以为线下采集的,或者也可以为线上采集的,或者,也可以为电子设备本地存储的,等等,对此不作限制。

作为一种示例,以信息内容为对话内容进行示例,可以理解的是,客服系统是指客户和客服的对话系统,用于存储客户和客服之间的对话记录。因此,本申请中,可以从客服系统,获取待处理的信息内容,即对话内容。作为一种可能的实现方式,可以从客服系统中,提取预设时间段内的一个客服方和一个客户方之间的对话记录,作为待处理的信息内容。

在本申请实施例的一种可能的实现方式中,可以根据获取的信息内容,确定该信息内容所属的业务场景,例如,可以对该信息内容进行语义识别,以确定该信息内容所属的业务场景。

举例而言,以信息内容为对话内容进行示例性说明,当信息内容为“客户:我购买的衣服质量有问题。客服:您能描述的更仔细些吗?衣服的型号以及哪里不好?”,对该信息内容进行语义识别,可以确定信息内容所属的业务场景为购物场景。

在本申请实施例的另一种可能的实现方式中,以信息内容为客服方与客户方之间的信息内容,比如对话内容进行示例,还可以确定信息内容中的客服方,根据信息内容中客服方的属性信息,确定信息内容所属的业务场景。由此,根据客服方的属性信息,确定信息内容所属的业务场景,可以提升业务场景确定的可靠性和准确性。

举例而言,当客户在购物后,商品有质量问题时,该客户可以咨询商场客服,根据商场客服的属性信息,可以确定信息内容所属的业务场景为购物场景;当客户想要订餐时,可以咨询订餐客服,根据订餐客服的属性信息,可以确定信息内容所属的业务场景为订餐场景。

由此,根据不同方式,确定信息内容所属的业务场景,可以提升该方法的灵活性和适用性。

需要说明的是,本申请实施例中的信息内容可以为文本内容,或者也可以为语音内容,或者也可以为图片内容,本申请对此并不作限制。当信息内容为语音内容时,可以基于语音识别技术,将语音形式的信息内容转换为文本形式的信息内容,再对文本形式的信息内容进行业务场景的识别,以及后续异常检测;而当信息内容为图片内容时,可以基于图像识别技术,将图片形式的信息内容转换为文本形式的信息内容,再对文本形式的信息内容进行业务场景的识别,以及后续异常检测,由此,可以避免发生遗漏识别存在异常的信息内容的情况。

需要说明的是,上述仅以信息内容为对话内容进行示例,但本申请并不限于此,信息内容可以为任一需要进行异常检测的文本内容、语音内容和图片内容中的至少一种,本申请对此并不作限制。

步骤102,获取业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系。

应当理解的是,由于业务逻辑的复杂性,不同业务场景对应的异常条件表达式可以不同,比如,业务场景1对应的异常条件表达式为:异常条件1&异常条件2,业务场景2对应的异常条件表达式为:异常条件1&异常条件2|异常条件3,业务场景3对应的异常条件表达式为:异常条件4|异常条件5,等等。其中,“&”表示逻辑关系且,“|”表示逻辑关系或。

本申请实施例中,可以预先存储不同业务场景与异常条件表达式之间的对应关系,比如,可以在规则库中存储不同业务场景与异常条件表达式之间的对应关系。从而本申请中,在确定信息内容对应的业务场景后,可以根据该业务场景查询上述对应关系,确定该业务场景对应的异常条件表达式。

步骤103,根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果。

本申请实施例中,每个异常条件具有对应的异常检测算子,异常检测算子,可以理解为用于对信息内容进行异常检测的方法,比如,为了提升信息异常检测的全面性,异常检测算子可以包括基于字符匹配的关键字检测算子、正则表达式检测算子、基于训练模型的语义重复检测算子、情感分析检测算子等等。

本申请实施例中,可以根据异常条件表达式中的各异常条件对应的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果。其中,每个异常条件下的检测结果,用于指示信息内容对该异常条件的命中度。可选地,标记命中度为sim,其中,sim∈[0,1],0表示信息内容未命中异常条件,1表示信息内容完全命中异常条件。

步骤104,根据检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。

本申请实施例中,可以根据每个异常条件的检测结果,以及各异常条件之间的逻辑关系,确定信息内容是否存在异常。

举例而言,以异常条件表达式为:异常条件1|异常条件2、异常条件1对应的异常检测算子为基于字符匹配的关键字检测算子、异常条件2为情感分析检测算子进行示例,假设信息内容中出现不文明用语,则可以确定该信息内容命中异常条件1对应的异常检测算子,并且,该信息内容的情感倾向负向,则可以确定信息内容命中异常条件2对应的异常检测算子,根据异常条件表达式中各异常条件之间的逻辑关系,可以确定:命中|命中=命中,从而可确定信息内容存在异常。

再例如,以异常条件表达式为:异常条件1&异常条件2、异常条件1对应的异常检测算子为基于训练模型的语义重复检测算子、异常条件2为正则表达式检测算子进行示例,假设信息内容中未出现重复信息或重复对话,则可以确定该信息内容未命中异常条件1对应的异常检测算子,并且,该信息内容的情感倾向负向,则可以确定信息内容命中异常条件2对应的异常检测算子,根据异常条件表达式中各异常条件之间的逻辑关系,可以确定:命中&未命中=未命中,从而可确定信息内容未存在异常。

本申请实施例的信息异常检测方法,通过获取待处理的信息内容和该信息内容所属的业务场景,并获取该业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系,之后根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果,从而可根据检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。由此,基于业务场景对应的异常条件表达式,对信息内容进行异常检测,不仅可以提升检测效率,而且,还可以提升检测结果的可靠性。此外,还能够适用于不同的业务场景中,提升该方法的适用性。

需要说明的是,本申请的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。

在本申请实施例的一种可能的实现方式中,每个异常检测算子,具有对应的检测范围,本申请中,针对每个异常检测算子,可提取与该异常检测算子对应的检测范围匹配的信息内容,并采用该异常检测算子,对提取的信息内容进行检测,以获取检测结果。下面结合实施例二,对上述过程进行详细说明。

图2为本申请实施例二所提供的信息异常检测方法的流程示意图。

如图2所示,该信息异常检测方法可以包括以下步骤:

步骤201,获取待处理的信息内容,以及信息内容所属的业务场景。

步骤202,获取业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系。

步骤201至202的执行过程可以参见上述实施例中步骤101至102的执行过程,在此不做赘述。

步骤203,针对每个异常条件中的异常检测算子,根据该异常检测算子对应的检测范围提取信息内容中的待检测内容。

本申请实施例中,不同的异常检测算子对应的检测范围可以相同,或者也可以不同,本申请对此并不作限制。举例而言,基于字符匹配的关键字检测算子对应的检测范围可以为信息内容中的每句话;正则表达式检测算子对应的检测范围可以为信息内容中的邮编号码、手机号码、地址等;以信息内容为对话内容进行示例,基于训练模型的语义重复检测算子对应的检测范围可以为信息内容中每轮对话中的答复内容;情感分析检测算子对应的检测范围可以为信息内容中的每句话。

本申请实施例中,针对每个异常条件中的异常检测算子,可以根据异常检测算子对应的检测范围,提取信息内容中的待检测内容。

举例而言,当异常条件中的异常检测算子为基于字符匹配的关键字检测算子时,提取的待检测内容可以为信息内容中的每句话;当异常条件中的异常检测算子为正则表达式检测算子时,提取的待检测内容可以为包含邮编号码、手机号码、地址等具有设定格式的信息内容;以信息内容为对话内容进行示例,当异常条件中的异常检测算子为基于训练模型的语义重复检测算子时,提取的待检测内容可以为信息内容中每轮信息中的答复内容;当异常条件中的异常检测算子为情感分析检测算子时,提取的待检测内容可以为信息内容中的每句话。

步骤204,采用该异常检测算子对待检测内容进行检测,以获取信息内容在对应异常条件下的检测结果。

本申请实施例中,可以采用异常检测算子,对提取到的待检测内容进行检测,以获取检测结果。其中,检测结果可以为待检测内容对异常条件的命中度。

也就是说,异常检测算子的输入为提取得到的待检测内容,异常检测算子对待检测内容进行计算,输出的可以包括命中度、命中的文本内容,其中,命中度是指异常检测算子与待检测内容的命中程度,或异常检测算子对应的异常条件与待检测内容的命中程度,命中度∈[0,1],0表示待检测内容未命中异常检测算子或异常检测算子对应的异常条件,1表示待检测内容完全命中异常检测算子或异常检测算子对应的异常条件。

举例而言,以业务场景为订餐场景,异常检测算子为正则表达式检测算子进行示例,假设待检测内容为:“餐厅的联系方式为1234567890”,当采用正则表达式检测算子对该待检测内容进行合理性检测时,输出的命中度可以为1(即待检测内容中的电话号码并不合理),命中文本为“联系方式为1234567890”。

步骤205,根据信息内容在多个异常条件下的检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。

步骤205的执行过程可以参见上述实施例中步骤104的执行过程,在此不做赘述。

本申请实施例的信息异常检测方法,通过针对每个异常条件中的异常检测算子,根据异常检测算子对应的检测范围提取信息内容中的待检测内容;采用异常检测算子对待检测内容进行检测,以获取检测结果。由此,仅对与异常检测算子对应的检测范围匹配的待检测内容进行异常检测,不仅可以提升检测效率,还可以提升检测结果的可靠性。

在本申请实施例的一种可能的实现方式中,为了提升信息内容异常检测结果的可靠性,可以根据信息内容在各异常条件下的检测结果,以及各异常条件对应的命中度阈值,来确定信息内容在各异常条件下的命中结果,根据信息内容在各异常条件下的命中结果,以及各异常条件之间的逻辑关系,来确定信息内容是否存在异常。下面结合实施例三,对上述过程进行详细说明。

图3为本申请实施例三所提供的信息异常检测方法的流程示意图。

如图3所示,该信息异常检测方法可以包括以下步骤:

步骤301,获取待处理的信息内容,以及信息内容所属的业务场景。

步骤302,获取业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系。

步骤301至302的执行过程可以参见上述实施例中步骤101至102的执行过程,在此不做赘述。

步骤303,根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果;其中,检测结果为信息内容对异常条件的命中度。

步骤303的执行过程可以参见上述实施例中步骤103或步骤203至204的执行过程,在此不做赘述。

步骤304,针对每个异常条件,根据信息内容在异常条件下的检测结果以及异常条件对应的命中度阈值,确定信息内容在异常条件下的命中结果。

本申请实施例中,每个异常条件对应一个命中度阈值,不同异常条件对应的命中度阈值可以相同,或者也可以不同,对此不作限制。例如,各异常条件对应的命中度阈值可以为0.5、0.6、0.7等等。

本申请实施例中,针对每个异常条件,可以根据信息内容在该异常条件下的检测结果,以及该异常条件对应的命中度阈值,确定信息内容在该异常条件下的命中结果,其中,命中结果用于指示信息内容是否命中该异常条件。

在本申请实施例的一种可能的实现方式中,针对每个异常条件,当信息内容在该异常条件下的检测结果,即信息内容对该异常条件的命中度大于或者等于该异常条件对应的命中度阈值时,信息内容在该异常条件下的命中结果,用于指示信息内容命中该异常条件,例如,此时的命中结果可以用true来表示。而当信息内容在该异常条件下的检测结果,即信息内容对该异常条件的命中度小于该异常条件对应的命中度阈值时,信息内容在该异常条件下的命中结果,用于指示信息内容未命中该异常条件,例如,此时的命中结果可以用false来表示。

举例而言,针对某个异常条件,假设采用该异常条件的异常检测算子对待检测内容进行检测,得到的信息内容对该异常条件的命中度为0.6,且该异常条件对应的命中度阈值为0.5,则信息内容在该异常条件下的命中结果,可以指示信息内容命中该异常条件,比如,命中结果可以用true来表示。

步骤305,根据信息内容在多个异常条件下的命中结果以及多个异常条件之间的逻辑关系,确定信息内容的命中结果。

本申请实施例中,在确定信息内容在每个异常条件下的命中结果后,可以根据信息内容在多个异常条件下的命中结果,以及多个异常条件之间的逻辑关系,确定信息内容的命中结果,其中,信息内容的命中结果包括命中或未命中。

举例而言,假设异常条件表达式为:异常条件1&异常条件2,信息内容在异常条件1下的命中结果为true,信息内容在异常条件2下的命中结果为false,则信息内容的命中结果为true&false=false,即命中结果为未命中。再例如,当信息内容在异常条件1下的命中结果为true,信息内容在异常条件2下的命中结果为true,则信息内容的命中结果为true&true=true,即命中结果为命中。再例如,当信息内容在异常条件1下的命中结果为false,信息内容在异常条件2下的命中结果为false,则信息内容的命中结果为false&false=false,即命中结果为未命中。

步骤306,在信息内容的命中结果为命中时,确定信息内容存在异常。

步骤307,在信息内容的命中结果为未命中时,确定信息内容未存在异常。

本申请实施例中,在信息内容的命中结果为命中时,可以确定信息内容存在异常,而在信息内容的命中结果为未命中时,可以确定信息内容未存在异常。

本申请实施例的信息异常检测方法,通过针对每个异常条件,根据信息内容在异常条件下的检测结果以及异常条件对应的命中度阈值,确定信息内容在异常条件下的命中结果;根据信息内容在多个异常条件下的命中结果以及多个异常条件之间的逻辑关系,确定信息内容的命中结果;在信息内容的命中结果为命中时,确定信息内容存在异常;在信息内容的命中结果为未命中时,确定信息内容未存在异常。本申请中,通过根据信息内容在多个异常条件下的命中结果以及多个异常条件之间的逻辑关系,确定信息内容的命中结果,可以提升信息内容异常检测结果的可靠性。

在本申请实施例的一种可能的实现方式中,在确定信息内容存在异常后,可以将存在异常的信息内容作为候选信息内容。可以理解的是,不同的候选信息内容对应的异常程度可以不同,例如有的候选信息内容异常程度较轻,而有的候选信息内容异常程度较重。一般情况下,对于异常程度相对较轻的候选信息内容,客户可能不会投诉客服,而对于异常程度相对较重的候选信息内容,可能发生客户投诉客服的情况,因此,本申请中,为了便于质检人员对异常程度相对较重的候选信息内容进行优先处理,从而能够及时处理异常信息内容,降低客户投诉的情况发生,可以对各候选信息内容进行排序,从而质检人员可以优先处理排序在前的候选信息内容。

下面结合图4,对上述过程进行详细说明。

图4为本申请实施例四所提供的信息异常检测方法的流程示意图。

如图4所示,在图1至图3任一实施例的基础上,该信息异常检测方法还可以包括以下步骤:

步骤401,获取存在异常的多个候选信息内容,以及多个候选信息内容在对应的多个异常条件下的检测结果,其中,检测结果为,候选信息内容对异常条件的命中度。

本申请实施例中,候选信息内容,是指通过上述任一方法实施例检测得到的存在异常的信息内容。

本申请实施例中,针对每个候选信息内容,可以通过上述任一方法实施例,确定该候选信息内容所属的业务场景,以及业务场景对应的异常条件表达式,并根据异常条件表达式中多个异常条件中的异常检测算子,对该候选信息内容进行检测,以获取候选信息内容在多个异常条件下的检测结果。

可选地,标记候选信息内容所属的业务场景对应的异常条件表达式中包括n个异常条件,其中,n为大于1的正整数,候选信息内容在异常条件i下的检测结果,即候选信息内容对异常条件i的命中度为sim

步骤402,针对每个候选信息内容,根据候选信息内容在对应的多个异常条件下的命中度以及每个异常条件的权重,确定候选信息内容的异常数值。

本申请实施例中,各异常条件对应的权重为预先设置的,例如,可以在规则库中预设不同异常条件和权重之间的对应关系。

可选地,标记异常条件i对应的权重为s

步骤403,根据异常数值对多个候选信息内容进行排序,得到排序结果。

本申请实施例中,可以根据各候选信息内容对应的异常数值,对各候选信息内容进行排序,得到排序结果,例如,可以按照异常数值的取值大小,由大至小顺序排列,得到排序结果。

步骤404,将排序结果提供给用户。

本申请实施例中,可以将排序结果提供给用户,比如质检人员,从而质检人员可以优先处理排序在前的候选信息内容,即质检人员可以对异常程度相对较重的候选信息内容进行优先处理,从而能够及时处理异常信息内容,降低客户投诉的情况发生。

作为一种可能的实现方式,可以在计算机设备的展示界面,展示排序结果,其中,展示方式不作限定,比如,可以以提示框的形式展示排序结果,或者,可以以滚动字幕的形式展示排序结果,或者,可以以信息推送的形式,展示排序结果,等等,对此不作限制。

作为另一种可能的实现方式,还可以向用户(比如质检人员)所持的外部设备发送排序结果,比如,可以通过短信、邮件等方式,向用户所持的外部设备发送排序结果。

作为一种示例,以信息内容为对话内容进行示例性说明,信息异常检测系统可以如图5所示,该异常检测系统可以包括客服系统、实时语义检测系统和评价系统。其中,客服系统是客户和客服的对话系统,负责存储对话记录,并将对话记录实时传输至实时语义检测系统;实时语义检测系统包含规则库和规则执行器,规则库用于存储不同业务场景下的检查规则,规则执行器用于根据对话记录和检查规则,判断客服话术是否合理,并将结果输出至评价系统。

其中,检查规则为一个异常条件表达式,该异常条件表达式由异常条件以及各异常条件之间的逻辑运算符组成,例如,异常条件表达式可以为:条件1&条件2|条件3,其中,“&”表示关系且,“|”表示关系或,将条件表达式的值作为检查规则的值,记为R。

异常条件由检测范围和异常检测算子组成,输入为带有上下文的对话内容,输出为布尔类型的条件值,true表示异常条件命中,false表示异常条件未命中。

检测范围为对话内容的检测范围,如对话记录的第M条至第N条。

异常检测算子为上述检测范围内的对话内容的检测方法,例如,基于字符匹配的关键字检测算子、正则表达式检测算子、基于训练模型的语义重复检测算子、情感分析检测算子等。异常检测算子的输入为检测范围内的对话内容,异常检测算子对检测范围内的对话内容进行计算,输出结构包括:命中度sim,命中文本。其中,sim∈[0,1]表示异常检测算子与对话内容的命中程度,0表示未命中,1表示完全命中。

实时语义检测系统的检测流程为:客服系统将对话内容实时发送到规则执行器,规则执行器接收并存储对话内容,将当前接收的对话内容标记为Dialog;从规则执行器提取Dialog的上下文,根据客服所负责的业务场景,从规则库中提取业务场景对应的检查规则;依次执行检查规则中的异常条件,判断Dialog是否在异常条件的检测范围内,如果Dialog在检测范围内,将检测范围内的对话内容输入到异常条件的异常检测算子中,根据异常检测算子输出的sim值设置条件值,例如,如果sim≥0.5,所在条件值为true,如果sim<0.5,所在条件值为false;而如果Dialog不在检测范围内,设置条件值为false;执行完检查规则中的所有异常条件后,计算检查规则的值R,如果R等于true,则确定对话内容存在异常,若果R等于false,则确定对话内容未存在异常。

评价系统可以对存在异常的对话内容进行评分,具体地,从规则库查询检查规则中各异常检测算子或各异常条件的权重s

综上,本申请中基于检查规则,对信息内容进行实时语义检测,相比于人工抽样的检测方式,检查效率、覆盖率和准确率均有显著的提高。发明人利用本申请的信息异常检测方法,对客服系统中的对话记录进行检测,覆盖率可达到100%,准确率可达到90%以上。并且,利用不同的异常检测算子,对对话内容进行检测,可以使得检测方式更符合实际的业务场景,提升检测结果的可靠性。

与上述图1至图4施例提供的信息异常检测方法相对应,本申请还提供一种信息异常检测装置,由于本申请实施例提供的信息异常检测装置与上述图1至图4施例提供的信息异常检测方法相对应,因此在信息异常检测方法的实施方式也适用于本申请实施例提供的信息异常检测装置,在本申请实施例中不再详细描述。

图6为本申请实施例五所提供的信息异常检测装置的结构示意图。

如图6所示,该信息异常检测装置600可以包括:第一获取模块610、第二获取模块620、检测模块630以及第一确定模块640。

其中,第一获取模块610,用于获取待处理的信息内容,以及信息内容所属的业务场景。

第二获取模块620,用于获取业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系。

检测模块630,用于根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果。

第一确定模块640,用于根据检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。

进一步地,在本申请实施例的一种可能的实现方式中,信息内容为客服方与客户方之间的信息内容;第一获取模块610,具体用于:获取信息内容以及信息内容中的客服方;根据信息内容中客服方的属性信息,确定信息内容所属的业务场景。

进一步地,在本申请实施例的一种可能的实现方式中,检测模块630,具体用于:针对每个异常条件中的异常检测算子,根据异常检测算子对应的检测范围提取信息内容中的待检测内容;采用异常检测算子对待检测内容进行检测,以获取检测结果。

进一步地,在本申请实施例的一种可能的实现方式中,异常检测算子包括以下算子中的至少一种:基于字符匹配的关键字检测算子、正则表达式检测算子、基于训练模型的语义重复检测算子和情感分析检测算子。

进一步地,在本申请实施例的一种可能的实现方式中,检测结果为,信息内容对异常条件的命中度;第一确定模块640,具体用于:针对每个异常条件,根据信息内容在异常条件下的检测结果以及异常条件对应的命中度阈值,确定信息内容在异常条件下的命中结果;根据信息内容在多个异常条件下的命中结果以及多个异常条件之间的逻辑关系,确定信息内容的命中结果;在信息内容的命中结果为命中时,确定信息内容存在异常;在信息内容的命中结果为未命中时,确定信息内容未存在异常。

进一步地,在本申请实施例的一种可能的实现方式中,该信息异常检测装置600还可以包括:

第三获取模块,用于获取存在异常的多个候选信息内容,以及多个候选信息内容在对应的多个异常条件下的检测结果,其中,检测结果为,候选信息内容对异常条件的命中度。

第二确定模块,用于针对每个候选信息内容,根据候选信息内容在对应的多个异常条件下的命中度以及每个异常条件的权重,确定候选信息内容的异常数值。

排序模块,用于根据异常数值对多个候选信息内容进行排序,得到排序结果。

提供模块,用于将排序结果提供给用户。

本申请实施例的信息异常检测装置,通过获取待处理的信息内容和该信息内容所属的业务场景,并获取该业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系,之后根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果,从而可根据检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。由此,基于业务场景对应的异常条件表达式,对信息内容进行异常检测,不仅可以提升检测效率,而且,还可以提升检测结果的可靠性。此外,还能够适用于不同的业务场景中,提升该装置的适用性。

为了实现上述实施例,本申请还提供一种电子设备,该电子设备可以包括至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请上述任一实施例提出的信息异常检测方法。

为了实现上述实施例,本申请还提供一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本申请上述任一实施例提出的信息异常检测方法。

为了实现上述实施例,本申请还提供一种计算机程序产品,该计算机程序产品包括计算机程序,计算机程序在被处理器执行时实现本申请上述任一实施例提出的信息异常检测方法。

根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本申请的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图7所示,设备700包括计算单元701,其可以根据存储在ROM(Read-OnlyMemory,只读存储器)702中的计算机程序或者从存储单元707加载到RAM(Random AccessMemory,随机访问/存取存储器)703中的计算机程序,来执行各种适当的动作和处理。在RAM703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。I/O(Input/Output,输入/输出)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于CPU(Central Processing Unit,中央处理单元)、GPU(Graphic Processing Units,图形处理单元)、各种专用的AI(Artificial Intelligence,人工智能)计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital SignalProcessor,数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如上述信息异常检测方法。例如,在一些实施例中,上述信息异常检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的信息异常检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述信息异常检测方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、FPGA(Field Programmable Gate Array,现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、ASSP(Application Specific StandardProduct,专用标准产品)、SOC(System On Chip,芯片上系统的系统)、CPLD(ComplexProgrammable Logic Device,复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory,可擦除可编程只读存储器)或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory,便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode-Ray Tube,阴极射线管)或者LCD(Liquid Crystal Display,液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:LAN(LocalArea Network,局域网)、WAN(Wide Area Network,广域网)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(VirtualPrivate Server,虚拟专用服务器)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。

其中,需要说明的是,人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

云计算(cloud computing),指的是通过网络接入弹性可扩展的共享物理或虚拟资源池,资源可以包括服务器、操作系统、网络、软件、应用和存储设备等,并可以以按需、自服务的方式对资源进行部署和管理的技术体系。通过云计算技术,可以为人工智能、区块链等技术应用、模型训练提供高效强大的数据处理能力。

根据本申请实施例的技术方案,通过获取待处理的信息内容和该信息内容所属的业务场景,并获取该业务场景对应的异常条件表达式,其中,异常条件表达式中包括多个异常条件以及多个异常条件之间的逻辑关系,之后根据多个异常条件中的异常检测算子对信息内容进行检测,以获取信息内容在多个异常条件下的检测结果,从而可根据检测结果以及多个异常条件之间的逻辑关系,确定信息内容是否存在异常。由此,基于业务场景对应的异常条件表达式,对信息内容进行异常检测,不仅可以提升检测效率,而且,还可以提升检测结果的可靠性。此外,还能够适用于不同的业务场景中,提升该方法的适用性。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

相关技术
  • 信息异常检测方法、装置、电子设备和存储介质
  • 异常检测方法和装置、电子设备及计算机可读存储介质
技术分类

06120112965292