掌桥专利:专业的专利平台
掌桥专利
首页

一种会话信息的处理方法及装置

文献发布时间:2023-06-19 11:44:10


一种会话信息的处理方法及装置

技术领域

本申请涉及计算机技术领域,尤其涉及一种会话信息的处理方法及装置。

背景技术

如今随着人机对话技术的成熟,智能客服系统已经在一定程度上取代了人工客服。在一些情况下,智能客服系统会结合与用户的多轮对话确定用户意图,从而为用户解决相关问题。也就是说在多轮对话中,智能客服系统需要联系对话的上下文语境进行语义分析,实现对于用户意图的判断。

在现有技术中,可以根据上一轮对话内容确定状态向量,而状态向量中可以包括智能客服系统在上一轮对话中暂时对于用户意图的判断。再结合上一轮的状态向量与当前轮的对话内容,即可在语义分析中达到“联系上文”的效果。

但是,状态向量中包括的对于用户意图的判断,也仅仅是一种暂时的分析结果,就是说该判断并不一定是正确的。所以现有技术中通过状态向量作为语义分析中联系上下文语境的依据,容易出现对于用户意图的错误判断,准确率有待提高。

发明内容

本申请提供一种会话信息的处理方法及装置。

第一方面,本申请提供一种会话信息的处理方法,包括:

确定上一轮对话对应的期望向量和实际向量;

根据所述期望向量和所述实际向量,确定当前轮对话对应的第一状态向量;

根据所述当前轮对话对应的第一状态向量,和所述当前轮对话的对话信息,确定所述当前轮对话对应的目标状态向量。

优选的,所述确定所述上一轮对话对应的期望向量包括:

根据所述上一轮对话对应的历史状态向量,确定期望关键词;

根据所述期望关键词,确定所述期望向量。

优选的,所述确定所述上一轮对话对应的实际向量包括:

根据所述上一轮对话的对话信息,确定所述实际向量。

优选的,所述根据所述期望向量和所述实际向量,确定当前轮对话对应的第一状态向量包括:

确定所述期望向量和所述实际向量的相似指数;

根据所述相似指数,分别确定所述期望向量和所述实际向量的权重系数;

根据所述期望向量、所述实际向量和所述权重系数,确定所述第一状态向量。

优选的,所述根据所述相似指数,分别确定所述期望向量和所述实际向量的权重系数包括:

根据所述相似指数,确定所述期望向量的第一权重系数;所述第一权重系数和所述相似指数正相关;

根据所述相似指数,确定所述实际向量的第二权重系数;所述第二权重系数和所述相似指数负相关。

优选的,在确定所述当前轮对话对应的目标状态向量之前,还包括:

根据所述上一轮对话的对话信息,确定所述当前轮对话对应的第二状态向量。

优选的,所述根据所述当前轮对话对应的第一状态向量,和所述当前轮对话的对话信息,确定所述当前轮对话对应的目标状态向量包括:

根据所述第一状态向量、所述第二状态向量和所述当前轮对话的对话信息,确定所述当前轮对话对应的目标状态向量。

优选的,还包括:

根据所述当前轮对话对应的目标状态向量,确定下一轮对话对应的输出信息。

优选的,还包括:

根据所述下一轮对话对应的输出信息,确定所述下一轮对话对应的期望向量。

第二方面,本申请提供一种会话信息的处理装置,包括:

历史向量确定模块,用于确定所述上一轮对话对应的期望向量和实际向量;

第一状态向量确定模块,用于根据所述期望向量和所述实际向量,确定当前轮对话对应的第一状态向量;

目标状态向量确定模块,用于根据所述当前轮对话对应的第一状态向量,和所述当前轮对话的对话信息,确定所述当前轮对话对应的目标状态向量。

与相关技术相比,本申请提供的一种会话信息的处理方法及装置,提供了一种全新的会话信息的处理方式。

附图说明

图1示出了本申请一实施例所述的一种会话信息的处理方法的流程示意图;

图2示出了本申请另一实施例所述的一种会话信息的处理方法的流程示意图;

图3示出了本申请一实施例所述的一种会话信息的处理装置的结构示意图。

具体实施方式

为使本申请的目的、特征、优点能够更加的明显和易懂,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而非全部实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

智能客服系统会结合与用户的多轮对话确定用户意图,从而为用户解决相关问题;也就是可以联系对话的上下文语境进行语义分析,实现对于用户意图的判断。一些情况下,系统可以根据上一轮对话内容确定状态向量,而状态向量中可以包括系统在上一轮对话中暂时对于用户意图的判断。再结合上一轮的状态向量与当前轮的对话内容,即可在语义分析中达到“联系上文”的效果。

但是,上述的状态向量中对于用户意图的判断,也仅仅是一种暂时的分析结果,就是说该判断并不一定是正确的。所以现有技术中通过状态向量作为语义分析中联系上下文语境的依据,容易出现对于用户意图的错误判断,准确率有待提高。

因此,本申请实施例将提供一种会话信息的处理方法。如图1所示,本实施例中方法包括以下步骤:

步骤101、确定上一轮对话对应的期望向量和实际向量。

在多轮对话的场景下,对话的具体内容可称为对话信息。通常智能客服系统与客户的一次问答被定义为一轮对话。在一轮对话中,系统输出的对话信息可称为输出信息,系统接收到的来自用户的对话信息可称为输入信息。根据上一轮对话的对话信息,可确定相应的期望向量和实际向量。

上一轮对话对应的期望向量,代表在上一轮对话开始之前,系统原本期望通过上一轮对话获悉的某些信息。具体的,确定上一轮对话对应的期望向量包括:根据上一轮对话对应的历史状态向量,确定期望关键词;根据期望关键词,确定期望向量。

假设在更早的对话当中,用户向系统询问“天气”,表明了该用户的“意图”。在语义分析中结合该“意图”确定的对话状态,可以构成历史状态向量。进而系统需在上一轮对话中明确的是,用户要询问的是“哪里的天气”,以便于准确的满足用户意图。因此在上一轮对话中,系统的输出信息可以是“您需要询问哪里的天气”,以期待用户回复关于“地点”的输入信息。也就是说,上一轮对话对应的期望关键词就是“地点”;该期望关键词在本领域中通常也可称之为“槽位”。而期望向量则可通过“地点”这一期望关键词来体现。

不过,用户在对话中的意图可能发生改变,并且用户给出的输入信息也可能规范或不规范。所以用户在上一轮对话中实际给出的输入信息,内容可能与系统的期望相符,也可能不相符。本步骤中,可根据用户在上一轮对话中实际给出的输入信息,确定相应的实际向量。实际向量体现了用户在上一轮对话中实际表达出的信息。

步骤102、根据期望向量和实际向量,确定当前轮对话对应的第一状态向量。

可以理解的是,期望向量与实际向量可能相关性较强,也可能相关性较弱。结合上述举例说明,当期望向量的期望关键词为“地点”时,则实际向量中如包含有关“地点”的信息,则二者相关性强;如不包含有关“地点”的信息,则二者相关性弱。

假设期望向量与实际向量相关性强,可能说明用户准确的回答的系统提出的问题。这一定程度上能够说明系统此前对于对话状态的判断是正确的,或者说系统对于用户意图的识别是准确的。

反之,假设期望向量与实际向量相关性弱,则可能说明用户的意图发生了改变;或者系统未能准确识别到用户意图,导致系统与用户无法相互理解,对话出现障碍。即认为系统此前对于对话状态的判断出现一定误差。

因此可根据期望向量和实际向量,去重新确认上一轮对话结束后、当前轮对话开始前的对话状态,即确定第一状态向量。具体的,可以确定期望向量和实际向量的相似指数;根据相似指数,分别确定期望向量和实际向量的权重系数;根据期望向量、实际向量和权重系数,确定第一状态向量。

相似指数,即是量化衡量期望向量与实际向量的相关性强弱的指标。本实施例中对于相似指数的计算过程不做限定,任何可以实现相同或类似效果的算法均可结合在本实施例当中。

可以理解的是,若相似指数越高,即期望向量与实际向量的相关性越强,说明系统此前对于对话状态的判断越准确。则此时可以更多的根据“上文”,也就是根据历史状态向量确定的期望向量来确定第一状态向量,以延续并强化上下文的关联性。反之,若相似指数越低,即期望向量与实际向量的相关性越弱,说明系统此前对于对话状态的判断误差较大。则此时可以更多的根据“用户的最新情况”,也就是根据上一轮对话的输入信息确定的实际向量来确定第一状态向量,以弱化上下文的关联性,试图重新判断用户可能的新意图,或者未被识别到的意图。

也就是说,应当根据相似指数,确定期望向量的第一权重系数;第一权重系数和相似指数正相关。根据相似指数,确定实际向量的第二权重系数;第二权重系数和相似指数负相关。进而加权计算期望向量、实际向量、第一权重系数和第二权重系数,确定第一状态向量。

步骤103、根据当前轮对话对应的第一状态向量,和当前轮对话的对话信息,确定当前轮对话对应的目标状态向量。

在本实施例中,可以根据第一状态向量,确定系统在当前轮的输出信息。或者也可以根据当前轮的其他状态向量,确定系统在当前轮的输出信息。例如根据基于上一轮对话的对话信息所确定的第二状态向量,来确定系统在当前轮的输出信息。在系统向用户提供当前轮的输出信息后,可得到用户基于当前轮的输出信息反馈的输入信息。当前轮的输出信息和输入信息将构成当前轮完整的对话信息。

进一步的,可以根据当前轮对应的第一状态向量和当前轮的对话信息,确定当前轮对话对应的目标状态向量。其中,根据当前轮的对话信息可判断当前轮实际涉及的对话语义内容。根据第一状态向量,可结合先前的若干轮对话,实现联系上文的语义分析。

并且由于第一状态向量中存在期望向量与实际向量的权重配置,因此可在原有的对话状态判断正确的情况下,延续并强化上下文的关联性;也可在原有的对话状态判断错误的情况下,试图重新判断用户可能的新意图,或者未被识别到的意图。由此避免了现有技术中,错误的对话状态判断扰乱联系上文语境的语义分析,致使出现对于用户意图的错误判断的情况。

通过以上技术方案可知,本实施例存在的有益效果是:利用期望向量与实际向量确定第一状态向量,并利用第一状态向量确定当前轮的模板状态向量;实现了在多轮对话中,结合上下文语义对于当前轮的对话状态的判断和用户意图的识别;并且由此避免了在上文中错误的对话状态判断扰乱联系上文语境的语义分析,致使出现对于用户意图的错误判断的情况。

图1所示仅为本申请所述方法的基础实施例,在其基础上进行一定的优化和拓展,还能够得到所述方法的其他优选实施例。

如图2所示,为本申请提供的一种会话信息的处理方法的另一个具体实施例。本实施例在前述实施例的基础上,进行进一步拓展。所述方法具体包括以下步骤:

步骤201、确定上一轮对话对应的期望向量和实际向量。

步骤202、根据期望向量和实际向量,确定当前轮对话对应的第一状态向量。

上述步骤201~步骤202中内容与前述实施例一致,在此不赘述。

步骤203、根据上一轮对话的对话信息,确定当前轮对话对应的第二状态向量。

本实施例中,将根据上一轮对话的对话信息,对于对话状态进行进一步判断,确定用户在上一轮对话时所表达的意图;即确定第二状态向量。在分析当前轮对话时结合第二状态向量,同样能够在一定程度上实现多轮对话中的联系上下文语境。

步骤204、根据第一状态向量、第二状态向量和当前轮对话的对话信息,确定当前轮对话对应的目标状态向量。

本实施例中由于既已确定第二状态向量,所以在确定目标状态向量的过程中,将结合第一状态向量、第二状态向量和当前轮对话的对话信息三者共同确定。由此,目标状态向量中可涉及更多与上文语境相关的信息,可进一步的提高对于当前轮对话信息的语义分析的准确性。

步骤205、根据当前轮对话对应的目标状态向量,确定下一轮对话对应的输出信息。

步骤206、根据下一轮对话对应的输出信息,确定下一轮对话对应的期望向量。

实际上,在多轮对话当中,任意一轮对话都可能作为本实施例中所谓的当前轮。而任意的当前轮对话,也可能作为其下一轮对话相对的“上一轮”。也就是说,上述的确定当前轮对话的目标状态向量的过程,是可以在多轮对话中循环进行的。

具体的,可以根据当前轮对话对应的目标状态向量,确定下一轮对话对应的输出信息;同时根据下一轮对话对应的输出信息,确定下一轮对话对应的期望向量。进而开始下一轮对话,然后同理的确定下一轮对话对应的目标状态向量。

由此,本实施例中方法将随着多轮对话的进行,根据每一轮的对话信息和先前的对话信息,持续的确定对话状态,以便于更加准确的判断用户意图,提高智能客服系统人机对话的体验。

如图3所示,为本申请提供的一种会话信息的处理装置的一个具体实施例。本实施例装置,即用于执行图1~2所述方法的实体装置。其技术方案本质上与上述实施例一致,上述实施例中的相应描述同样适用于本实施例中。本实施例中装置包括:

历史向量确定模块301,用于确定上一轮对话对应的期望向量和实际向量;

第一状态向量确定模块302,用于根据期望向量和实际向量,确定当前轮对话对应的第一状态向量;

目标状态向量确定模块303,用于根据当前轮对话对应的第一状态向量,和当前轮对话的对话信息,确定当前轮对话对应的目标状态向量。

另外在图3所示实施例的基础上,优选的,还包括:

历史向量确定模块301包括:

期望向量确定单元311,用于根据上一轮对话对应的历史状态向量,确定期望关键词;根据期望关键词,确定期望向量。

实际向量确定单元312,用于根据上一轮对话的对话信息,确定实际向量。

第一状态向量确定模块302包括:

相似指数确定单元321,用于确定期望向量和实际向量的相似指数。

权重确定单元322,用于根据相似指数,分别确定期望向量和实际向量的权重系数。

第一状态向量确定单元323,用于根据期望向量、实际向量和权重系数,确定第一状态向量。

权重确定单元322包括:

第一权重子单元3221,用于根据相似指数,确定期望向量的第一权重系数;第一权重系数和相似指数正相关。

第二权重子单元3222,用于根据相似指数,确定实际向量的第二权重系数;第二权重系数和相似指数负相关。

还包括:

第二状态向量确定模块304,用于根据上一轮对话的对话信息,确定当前轮对话对应的第二状态向量。

则目标状态向量确定模块303根据第一状态向量、第二状态向量和当前轮对话的对话信息,确定当前轮对话对应的目标状态向量。

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

相关技术
  • 一种会话信息处理方法、装置、服务器和可读存储介质
  • 一种会话信息处理方法、装置、服务器和可读存储介质
技术分类

06120113034337