掌桥专利:专业的专利平台
掌桥专利
首页

数据处理系统

文献发布时间:2023-06-19 11:42:32


数据处理系统

技术领域

本发明属于问卷领域,具体而言,涉及一种数据处理系统。

背景技术

相关技术方案中,智能客服由于其具有减轻客服压力、降低运行成本、提高营销能力、规范行业知识库、树立服务形象、提升满意度的特点逐渐被广泛使用。

本领域的技术人员发现,当用户与智能客服进行对话时,用户输入的信息并不一定与答案选项完全匹配,故现有智能客服无法准确确定用户输入的信息所对应的选项。

发明内容

本发明旨在解决现有技术或相关技术中存在的技术问题之一。

为此,本发明的第一方面提出了一种数据处理系统。

有鉴于此,根据本发明的第一方面提出了一种数据处理系统,包括:问卷系统,问卷系统被配置为输出第一问题、第一问题所对应的多个答案选项以及接收针对第一问题的输入信息;语义理解系统,语义理解系统被配置为对输入信息进行处理,以得到输入信息对应的第一意图信息;以及根据多个答案选项的私有话术和/或公有话术构建第一词袋,并将第一意图信息与第一词袋进行匹配,以得到输入信息对应的答案选项。

在本发明提出了一种数据处理系统,具体地,数据处理系统包括问卷系统和语义理解系统,其中,问卷系统被配置为输出第一问题和第一问题所对应的多个答案选项,以便用户在看到第一问题以及对应的多个答案选项后,反馈针对第一问题的输入信息,在问卷系统接收到是输入信息后,将输入信息发送至语义理解系统,以便语义理解系统对输入信息进行处理,以便得到输入信息对应的第一意图信息,并获取多个答案选项的私有话术和/或公有话术,并基于多个答案选项的私有话术和/或公有话术构建第一词袋,以便将处理得到的第一意图信息与第一词袋进行匹配,以便可以知悉用户反馈的输入信息所对应的答案选项。在此过程中,即便用户反馈的输入信息繁荣,也可以确定对应的答案选项,因此,提高了客服系统的交互体验。

通常情况下,相同的输入信息对应的不同的问题所对应的含义是不一样的,因此,所对应的答案选项也不一样的,可以理解的是,私有话术是对每一个问题下的每一个选项设定的一段话、一个词,其中,私有话术与对应的答案选项相绑定,当输入信息是私有话术时,可以直接确定与私有话术绑定的答案选项,而公有话术与私有话术所代表的含义相反,公有话术在不同问题上所代表的含义是相同的,因此,可以通过将多个答案选项的私有话术和/或公有话术构建成第一词袋,并利用第一词袋与第一意图信息来确定输入信息所对应的答案选项,进而提高客服系统的交互体验。

另外,根据本发明提供的上述技术方案中的数据处理系统,还可以具有如下附加技术特征:

在上述技术方案中,语义理解系统还被配置为:将输入信息与多个答案选项进行匹配;确定输入信息与多个答案选项中任意一个匹配不一致,执行根据多个答案选项的私有话术和/或公有话术构建第一词袋的步骤。

在该技术方案中,还包括将输入信息与多个答案选项进行匹配,可以理解的是,语义理解系统在确定输入信息对应的答案选项的过程中,优先使用完全匹配的方式来确定输入信息对应的答案选项,只有在输入信息与多个答案选项中任意一个匹配不一致情况下,在执行根据多个答案选项的私有话术和/或公有话术构建第一词袋的步骤,以此来降低语义理解系统的信息处理量,进而降低数据处理系统的能耗。

在上述任一技术方案中,问卷系统还被配置为:获取用户的个人信息以及业务信息;将个人信息、业务信息和输入信息对应的答案选项与任一问卷问题的准入条件进行比较;将个人信息、业务信息和输入信息对应的答案选项满足准入条件的问卷问题作为第二问题,并进行输出。

在该技术方案中,问卷系统还用于获取用户的个人信息以及业务信息,并根据个人信息、业务信息和输入信息对应的答案选项与任一问卷问题的准入条件进行比较,将个人信息、业务信息和输入信息对应的答案选项满足准入条件的问卷问题作为第二问题,并进行输出,在此过程中,问卷系统输出的问题不再是一成不变的,而是随着互动不断变化的,具体地,问卷系统可以配置任一问卷问题的准入条件,当个人信息、业务信息和输入信息对应的答案选项满足任一问卷问题的准入条件时,将该问卷问题作为第二问题输出,以提高由输出的问卷问题所组成的实例的多样性,同时,也便于记录足够多的语料来满足数据处理系统中用于确定输入信息对应的第一意图信息的模型的生成要求。

进一步地,由于每个用户的输入信息可能完全不同,因此,通过准入条件输出的第二问题能够实现为用户提供个性化问卷,以满足每个用户的实际问卷需求。

其中,个人信息可以包括如性别、年龄、生活区域、学历等信息。业务信息可以是当前处理的业务名称、业务中涉及到的名词等。

在上述任一技术方案中,语义理解系统还被配置为:将所有公有话术中不包含多个答案选项的公有话术的部分作为第二词袋;将输入信息与第二词袋进行匹配,以确定输入信息对应的第二意图信息。

在该技术方案中,通过将输入信息与第二词袋进行匹配,以便判断用户反馈的输入信息是否存在其他意图(即本文中的第二意图信息),当存在第二意图信息时,可以进行意图切换。

在上述任一技术方案中,问卷系统被配置为:使用文档主题生成模型对输入信息进行处理,以得到输入信息对应的第一意图信息。

在该技术方案中,由于问卷系统与用户之间的交互过程属于一问一答的过程,因此,不同问题之间的关联性不强,因此,可以使用文档主题生成模型来对输入信息进行处理,以得到输入信息对应的第一意图信息,进而实现输入信息对应的答案选项的确定。

在上述任一技术方案中,语义理解系统具体被配置为:通过意图特征确定输入信息所对应的第一意图信息和/或第二意图信息;其中,意图特征包括以下一种或多种:中文名称、英文标识、触发话术、返回问题、返回函数。

在该技术方案中,通过判断输入信息中是否存在中文名称、英文标识、触发话术、返回问题、返回函数,当判定输入信息包含上述意图特征中的一种或多种,将特征信息所对应的意图信息作为第一意图信息,或将特征信息所对应的意图信息作为第二意图信息,以实现输入信息所对应的意图信息的确定,进而便于确定输入信息对应的答案选项以及输入信息对应其他意图的确定。

在上述任一技术方案中,还包括:意图管理系统,意图管理系统被配置为:判断第一问题是否归属在问卷意图下;确定第一问题归属在问卷意图下,执行对输入信息进行处理,以得到输入信息对应的第一意图信息的步骤;确定第一问题不归属在问卷意图下,将第一意图信息与所有的公有话术进行匹配,以得到输入信息对应的第二意图信息。

在该技术方案中,数据处理系统还包括:意图管理系统,通过设置意图管理系统,以便用户可以知悉第一问题是否归属问卷意图,进而在第一问题不归属问卷意图时,可以将第一意图信息与所有的公有话术进行匹配,以得到输入信息对应的第二意图信息,以实现非问卷意图下,输入信息所对应的意图确定,进而便于进行不同意图切换,以提高数据处理系统的交互体验。

在上述任一技术方案中,意图管理系统还被配置为:构建公有话术的数据库,以便问卷系统根据数据库建立公有话术与多个答案选项的绑定关系。

在该技术方案中,意图管理系统通过构建公有话术的数据库,以便问卷系统可以将数据库中的公有话术与多个答案选项进行绑定,以提高输入信息确定对应的答案选项的可信度。

在上述任一技术方案中,意图管理系统还被配置为:构建场景,以及设定场景所包含的意图和/或不同意图之间的切换方式。

在该技术方案中,为了避免不同意图之间的随意切换,影响用户的交互体验,引入场景这一概念,并对场景所包含的意图进行设定,以便在问卷系统的对话过程中不会跳转至没有被设定到的意图上。

进一步地,场景下的不同意图之间可以执行绑定,如将问卷意图与其他意图(如促销意图)进行绑定,以提高用户的交互体验。

在上述任一技术方案中,意图管理系统还被配置为:输出场景下的意图轨迹信息。

在该技术方案中,意图管理系统还被配置为输出场景下的意图轨迹信息,以便数据处理系统的维护人员可以查看数据处理系统在实际运行过程中的意图变化情况,可以将场景中不合理的意图进行调整,以数据处理系统更加适合用户的实际交互需求。

本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1示出了根据本发明的一个实施例中数据处理系统的示意框图;

图2示出了根据本发明的另一个实施例中数据处理系统的示意框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。

根据本发明的第一方面提出了一种数据处理系统100,如图1和图2所示,包括:问卷系统102,问卷系统102被配置为输出第一问题、第一问题所对应的多个答案选项以及接收针对第一问题的输入信息;语义理解系统104,语义理解系统104被配置为对输入信息进行处理,以得到输入信息对应的第一意图信息;以及根据多个答案选项的私有话术和/或公有话术构建第一词袋,并将第一意图信息与第一词袋进行匹配,以得到输入信息对应的答案选项。

在本发明提出了一种数据处理系统100,具体地,数据处理系统100包括问卷系统102和语义理解系统104,其中,问卷系统102被配置为输出第一问题和第一问题所对应的多个答案选项,以便用户在看到第一问题以及对应的多个答案选项后,反馈针对第一问题的输入信息,在问卷系统102接收到是输入信息后,将输入信息发送至语义理解系统104,以便语义理解系统104对输入信息进行处理,以便得到输入信息对应的第一意图信息,并获取多个答案选项的私有话术和/或公有话术,并基于多个答案选项的私有话术和/或公有话术构建第一词袋,以便将处理得到的第一意图信息与第一词袋进行匹配,以便可以知悉用户反馈的输入信息所对应的答案选项。在此过程中,即便用户反馈的输入信息繁荣,也可以确定对应的答案选项,因此,提高了客服系统的交互体验。

通常情况下,相同的输入信息对应的不同的问题所对应的含义是不一样的,因此,所对应的答案选项也不一样的,可以理解的是,私有话术是对每一个问题下的每一个选项设定的一段话、一个词,其中,私有话术与对应的答案选项相绑定,当输入信息是私有话术时,可以直接确定与私有话术绑定的答案选项,而公有话术与私有话术所代表的含义相反,公有话术在不同问题上所代表的含义是相同的,如“是”、“对”、“可以”等都表示肯定,“不是”、“不好”、“没有”等都表示否定。因此,可以通过将多个答案选项的私有话术和/或公有话术构建成第一词袋,并利用第一词袋与第一意图信息来确定输入信息所对应的答案选项,进而提高客服系统的交互体验。

在其一实施例中,私有话术被划分至私有类词袋,公有话术被划分至公有类词袋,可以根据配置的接口参数来对应获取,在获取多个答案选项的私有话术和/或公有话术的过程中,调用私有类词袋中存储的多个答案选项的私有话术,以及调用公有类词袋中存储的多个答案选项的公有话术,以便根据获取得到的多个答案选项的私有话术和/或公有话术构建第一词袋。

另外,根据本发明提供的上述实施例中的数据处理系统100,还可以具有如下附加技术特征:

在上述实施例中,语义理解系统104还被配置为:将输入信息与多个答案选项进行匹配;确定输入信息与多个答案选项中任意一个匹配不一致,执行根据多个答案选项的私有话术和/或公有话术构建第一词袋的步骤。

在该实施例中,还包括将输入信息与多个答案选项进行匹配,可以理解的是,语义理解系统104在确定输入信息对应的答案选项的过程中,优先使用完全匹配的方式来确定输入信息对应的答案选项,只有在输入信息与多个答案选项中任意一个匹配不一致情况下,在执行根据多个答案选项的私有话术和/或公有话术构建第一词袋的步骤,以此来降低语义理解系统104的信息处理量,进而降低数据处理系统100的能耗。

在上述任一实施例中,问卷系统102还被配置为:获取用户的个人信息以及业务信息;将个人信息、业务信息和输入信息对应的答案选项与任一问卷问题的准入条件进行比较;将个人信息、业务信息和输入信息对应的答案选项满足准入条件的问卷问题作为第二问题,并进行输出。

在该实施例中,问卷系统102还用于获取用户的个人信息以及业务信息,并根据个人信息、业务信息和输入信息对应的答案选项与任一问卷问题的准入条件进行比较,将个人信息、业务信息和输入信息对应的答案选项满足准入条件的问卷问题作为第二问题,并进行输出,在此过程中,问卷系统102输出的问题不再是一成不变的,而是随着互动不断变化的,具体地,问卷系统102可以配置任一问卷问题的准入条件,当个人信息、业务信息和输入信息对应的答案选项满足任一问卷问题的准入条件时,将该问卷问题作为第二问题输出,以提高由输出的问卷问题所组成的实例的多样性,同时,也便于记录足够多的语料来满足数据处理系统100中用于确定输入信息对应的第一意图信息的模型的生成要求。

进一步地,由于每个用户的输入信息可能完全不同,因此,通过准入条件输出的第二问题能够实现为用户提供个性化问卷,以满足每个用户的实际问卷需求。

而当需要更改数据处理系统100的输出的问卷问题的顺序,只需要更改任一问题的准入条件即可实现,因此,可以有效降低了数据处理系统100的维护工作量。

其中,个人信息可以包括如性别、年龄、生活区域、学历等信息。业务信息可以是当前处理的业务名称、业务中涉及到的名词等。

在其一实施例中,准入条件采用表达式引擎来设定,其中,表达式引擎,即动态的将表达式编译成字节码并运行。

在该实施例中,使用表达式引擎可以支持绝大多数运算操作符,如包括算术操作符、关系运算符、逻辑操作符、位运算符、正则表达式的匹配操作符、三元表达式等;同时还具有支持操作符优先级和括号强制设定优先级、逻辑运算符支持短路运算、支持丰富类型,例如nil、整数和浮点数、字符串、正则表达式、日期、变量等、支持自动类型转换、可自定义函数,易于扩展、支持可重载操作符以及支持大数运算(BigInteger)和高精度运算(BigDecimal),同时还可以内置一套常用函数库。

在上述任一实施例中,语义理解系统104还被配置为:将所有公有话术中不包含多个答案选项的公有话术的部分作为第二词袋;将输入信息与第二词袋进行匹配,以确定输入信息对应的第二意图信息。

在该实施例中,通过将输入信息与第二词袋进行匹配,以便判断用户反馈的输入信息是否存在其他意图(即本文中的第二意图信息),当存在第二意图信息时,可以进行意图切换。

在上述任一实施例中,问卷系统102被配置为:使用文档主题生成模型对输入信息进行处理,以得到输入信息对应的第一意图信息。

在该实施例中,由于问卷系统102与用户之间的交互过程属于一问一答的过程,因此,不同问题之间的关联性不强,因此,可以使用文档主题生成模型来对输入信息进行处理,以得到输入信息对应的第一意图信息,进而实现输入信息对应的答案选项的确定。

在其一实施例中,文档主题生成模型是词袋LDA模型,LDA(Latent DirichletAllocation,潜在狄利克雷分布),具体地,词袋LDA模型公式可以表示为:

其中,词袋LDA模型是一种无监督的贝叶斯模型,同时也是一种主题模型,它可以将文档集中每篇文档的主题按照概率分布的形式给出,由于其属于一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是档集以及指定主题的数量即可,同时,词袋LDA模型作为一种词袋模型,可以认为是一篇文档是由一组词构成的一个集合,词与词之间没有顺序以及先后的关系。

在上述任一实施例中,语义理解系统104具体被配置为:通过意图特征确定输入信息所对应的第一意图信息和/或第二意图信息;其中,意图特征包括以下一种或多种:中文名称、英文标识、触发话术、返回问题、返回函数。

在该实施例中,通过判断输入信息中是否存在中文名称、英文标识、触发话术、返回问题、返回函数,当判定输入信息包含上述意图特征中的一种或多种,将特征信息所对应的意图信息作为第一意图信息,或将特征信息所对应的意图信息作为第二意图信息,以实现输入信息所对应的意图信息的确定,进而便于确定输入信息对应的答案选项以及输入信息对应其他意图的确定。

在上述任一实施例中,如图2所示,还包括:意图管理系统106,意图管理系统106被配置为:判断第一问题是否归属在问卷意图下;确定第一问题归属在问卷意图下,执行对输入信息进行处理,以得到输入信息对应的第一意图信息的步骤;确定第一问题不归属在问卷意图下,将第一意图信息与所有的公有话术进行匹配,以得到输入信息对应的第二意图信息。

在该实施例中,数据处理系统100还包括:意图管理系统106,通过设置意图管理系统106,以便用户可以知悉第一问题是否归属问卷意图,进而在第一问题不归属问卷意图时,可以将第一意图信息与所有的公有话术进行匹配,以得到输入信息对应的第二意图信息,以实现非问卷意图下,输入信息所对应的意图确定,进而便于进行不同意图切换,以提高数据处理系统100的交互体验。

在上述任一实施例中,意图管理系统106还被配置为:构建公有话术的数据库,以便问卷系统102根据数据库建立公有话术与多个答案选项的绑定关系。

在该实施例中,意图管理系统106通过构建公有话术的数据库,以便问卷系统102可以将数据库中的公有话术与多个答案选项进行绑定,以提高输入信息确定对应的答案选项的可信度。

在其一实施例中,意图管理系统106还被配置为:对公有话术进行管理,如删除或新增。

在其一实施例中,为了避免出现私有话术和公有话术出现混淆,公有话术仅通过意图管理系统106进行设定。

在上述任一实施例中,意图管理系统106还被配置为:构建场景,以及设定场景所包含的意图和/或不同意图之间的切换方式。

在该实施例中,为了避免不同意图之间的随意切换,影响用户的交互体验,引入场景这一概念,并对场景所包含的意图进行设定,以便在问卷系统102的对话过程中不会跳转至没有被设定到的意图上。

进一步地,场景下的不同意图之间可以执行绑定,如将问卷意图与其他意图(如促销意图)进行绑定,以提高用户的交互体验。

在其一实施例中,场景的主要特征包括当前意图、下一意图以及当前意图与下一意图的切换方式。

在其一实施例中,意图管理系统106还被配置为:对任一意图设定或修改意图特征,其中,意图特征与本文中的意图特征一致,包括如中文名称、英文标识、触发话术、返回文本、返回函数中的一种或多种。

在上述任一实施例中,意图管理系统106还被配置为:输出场景下的意图轨迹信息。

在该实施例中,意图管理系统106还被配置为输出场景下的意图轨迹信息,以便数据处理系统100的维护人员可以查看数据处理系统100在实际运行过程中的意图变化情况,可以将场景中不合理的意图进行调整,以数据处理系统100更加适合用户的实际交互需求。

在其一实施例中,意图管理系统106还被配置为:创建机器人任务,其中,机器人任务包括:选定机器人,选定机器人的过程可以是新增,当新增机器人时,需要和外呼系统的端口绑定;填写手机号,多个手机号可逗号分隔,也可以通过上传的方式;选定场景,目前一个任务只支持一个场景的主叫功能;选定时间,作为机器人来说可随时打电话,但肯定要选择合适的时间来和用户沟通,所以这个参数主要是为了防止骚扰到用户。

在该实施例中,通过创建机器人任务,以便问卷系统102可以通过控制机器人执行与用户的问卷交互。

在其一实施例中,机器人任务可以以列表的形式展示出来,同时还可以展示任一机器人的对话记录,当意图管理系统106配置好场景时,还可以展示设定好的场景,如显示问卷详情、问卷时间以及手机号等参数。

在其一实施例中,意图管理系统106还被配置为:将输入信息中无法识别的语句和数据处理系统100的用户输入的与无法识别的语句进行绑定并将绑定后的数据发送至语义理解系统104,以便语义理解系统104可以进行学习,以提高其对输入信息的识别能力。

在其一实施例中,问卷系统102、语义理解系统104、意图管理系统106布设在服务器上,问卷系统102、语义理解系统104、意图管理系统106可以通过处理器执行存在存储器上的计算机程序实现上述功能,其中,意图管理系统106中配置问卷系统102和语义理解系统104的服务地址,问卷系统102中配置语义理解系统104的服务地址,在问卷系统102配置问卷、问题、问题答案、问题答案私有话术且意图管理系统106需要配置公有话术、意图、场景后,语义理解系统104则是通过自己暴露的接口,在问卷系统102和意图管理系统106中对其进行初始化或更新操作。

在问卷系统102和意图管理系统106配置完成后,数据处理系统100通过意图管理系统106中的接口对外提供服务,企业的呼叫中心可通过接口直接调用数据处理的服务。

在本发明中,术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 数据处理系统和操作数据处理系统的方法
  • 数据处理系统以及配置和操作数据处理系统的方法
技术分类

06120113023021