掌桥专利:专业的专利平台
掌桥专利
首页

一种办公场景的任务型多轮对话方法及系统

文献发布时间:2023-06-19 09:30:39


一种办公场景的任务型多轮对话方法及系统

技术领域

本发明涉及办公场景的任务对话领域,特别是涉及一种办公场景的任务型多轮对话方法及系统。

背景技术

人机交互作为信息时代人类与计算机之间信息交流的基础技术,受到学术界和工业界的广泛关注。人机对话是人机交互技术的核心领域,旨在最大限度地模仿人与人之间的对话方式,使得人类能够用更自然的方式与机器进行交流。一般来说,人机对话系统大致可分为两种:任务对话系统和非任务型对话系统,非任务型系统又称为闲聊机器人。

以微软小冰为代表的聊天机器人使得人机对话技术更具实用价值和商业价值,但仍在自然性、逻辑性和流畅性等方面和人类有一定的差距。任务型对话系统因场景明确,易于评估对话质量等特点,相比于非任务型具有更大的应用价值。任务型对话系统面向垂直领域,目的是使用尽可能少的对话轮数帮助用户完成预定任务或动作,例如预定机票、酒店和餐馆等。

随着互联网技术的发展,办公系统也不断普及和发展,在办公系统中加入任务型对话系统,能够帮助用户完成任务,更好地处理办公场景。目前的任务型多轮对话构建过程有完全基于深度学习算法,可以利用大数据的优势。但是办公领域的数据量较少,对于业务完成的准确度有一定要求,因此完全基于深度学习算法并不能获得很好的效果。此外,也有使用单轮对话或者简单多轮对话的系统,对于办公系统来说不能完全满足需求。

发明内容

本发明的目的是提供一种办公场景的任务型多轮对话方法及系统,能够覆盖不同的办公任务场景,准确完成用户的需求,提升办公的效率。

为实现上述目的,本发明提供了如下方案:

一种办公场景的任务型多轮对话方法,包括:

对不同办公应用任务进行场景定义,得到不同办公应用任务的意图和槽值;

将所述不同办公应用任务的意图和槽值进行数据采集,得到采集后的数据;

根据所述采集后的数据使用深度学习模型训练方法和定制规则处理方法,确定意图识别模型和槽提取模型;

进行对话管理,直到收集必要信息;

根据所述意图识别模型、所述槽提取模型和所述必要信息,确定当前用户意图和当前槽值;

根据所述当前用户意图和当前槽值执行业务。

可选地,所述根据所述采集后的数据使用深度学习模型训练方法和定制规则处理方法,确定意图识别模型和槽提取模型,具体包括:

根据所述采集后的数据对深度学习模型Bert+TextCnn进行训练,得到意图识别模型;

根据所述采集后的数据对Bert-BiLSTM-CRF模型进行训练,得到非时间槽提取模型;

采用基于常识日期的正则表达式规则对所述采集后的数据进行处理,得到时间槽提取模型。

可选地,所述进行对话管理,直到收集必要信息,具体包括:

为不同的办公应用任务指定回复的话术和模板,与用户多轮对话直到收集必要信息。

可选地,所述根据所述当前用户意图和当前槽值执行业务,具体包括:

根据所述当前用户意图判断所述任务是否符合任务需求;

若符合任务需求,则根据所述槽值执行指定的业务调用;

若不符合任务需求,则通过问答相似度匹配方法执行业务。

一种办公场景的任务型多轮对话系统,包括:

场景定义模块,用于对不同办公应用任务进行场景定义,得到不同办公应用任务的意图和槽值;

数据采集模块,用于将所述不同办公应用任务的意图和槽值进行数据采集,得到采集后的数据;

自然语言理解模块,用于根据所述采集后的数据使用深度学习模型训练方法和定制规则处理方法,确定意图识别模型和槽提取模型;

对话管理模块,用于进行对话管理,直到收集必要信息;

当前用户意图和当前槽值确定模块,用于根据所述意图识别模型、所述槽提取模型和所述必要信息,确定当前用户意图和当前槽值;

业务执行模块,用于根据所述当前用户意图和当前槽值执行业务。

可选地,所述自然语言理解模块,具体包括:

意图识别模型确定单元,用于根据所述采集后的数据对深度学习模型Bert+TextCnn进行训练,得到意图识别模型;

非时间槽提取模型确定单元,用于根据所述采集后的数据对Bert-BiLSTM-CRF模型进行训练,得到非时间槽提取模型;

时间槽提取模型确定单元,用于采用基于常识日期的正则表达式规则对所述采集后的数据进行处理,得到时间槽提取模型。

可选地,所述对话管理模块,具体包括:

对话管理单元,用于为不同的办公应用任务指定回复的话术和模板,与用户多轮对话直到收集必要信息。

可选地,所述业务执行模块,具体包括:

判断单元,用于根据所述当前用户意图判断所述任务是否符合任务需求;

第一业务执行单元,用于当符合任务需求时,执行指定的业务调用;

第二业务执行单元,用于当不符合任务需求时,通过问答相似度匹配方法执行业务。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明提供一种办公场景的任务型多轮对话方法及系统,能够在特定业务流程中更加准确的完成用户的需求,同时便于任务场景的添加和管理;使用模板生成数据达到数据增强的效果;在槽提取过程中,结合深度学习和定制规则,使提取结果更加明确;对不在办公任务场景中的需求,使用基于相似度的问答匹配。整个多轮对话方法能够覆盖不同的办公任务场景,准确完成用户的需求,提升办公效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明办公场景的任务型多轮对话方法流程图;

图2为本发明场景定义示意图;

图3为本发明对话管理示意图;

图4为本发明业务执行示意图;

图5为本发明办公场景的任务型多轮对话系统结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种办公场景的任务型多轮对话方法及系统,能够覆盖不同的办公任务场景,准确完成用户的需求,提升办公的效率。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明办公场景的任务型多轮对话方法流程图。如图1所示,一种办公场景的任务型多轮对话方法包括:

步骤101:对不同办公应用任务进行场景定义,得到不同办公应用任务的意图和槽值。

在场景定义的过程中,根据办公任务的不同,划分不同任务中用户的自然语言以及意图,根据场景的任务需要设置槽值。

场景需求定义,具体方式如下:

根据办公场景中的用户对不同功能的需求,定义相应的任务。

比如请假、派车、会议室预定等,这些任务的执行需要用户提供一定的参数(以下称为槽),比如时间、地点、请假类型等等;

这些槽的提供仅通过单轮对话无法实现,因此需要设计多轮对话。

根据办公场景中的不同任务,定义用户的意图和相应的槽,并设计多轮对话的回复和流程,以便对话系统能够完整精确地获取需要的信息。如图2所示。

步骤102:将所述不同办公应用任务的意图和槽值进行数据采集,得到采集后的数据。

首先通过用户收集,在用户使用办公系统的过程中,对于办公业务的使用有一定的习惯,因此可以收集用户的真实对话语料,比如“我明天想要请事假”。除了用户提供的真实数据,在用户的真实数据中,将其中的槽去掉,比如“我**想要请*假”,得到模板,利用模板生成一部分新的数据。

模板数据主要为了弥补数据的不足,比如用户提供的真实数据中,不会包含全部的请假类型。在请假这个任务场景中,请假类型为多个,因此可以将用户数据中的请假类型替换,进行数据增强。

填充模板需要不同的槽值,某些槽的值是办公场景中的专有名词。比如会议室预定任务中,会议室名称来源为固定的几个,派车任务中的车辆类型也是现有的。因此将这些名词采集起来用于生成新的数据。

步骤103:根据所述采集后的数据使用深度学习模型训练方法和定制规则处理方法,确定意图识别模型和槽提取模型,具体包括:

根据所述采集后的数据对深度学习模型Bert+TextCnn进行训练,得到意图识别模型;

根据所述采集后的数据对Bert-BiLSTM-CRF模型进行训练,得到非时间槽提取模型;

采用基于常识日期的正则表达式规则对所述采集后的数据进行处理,得到时间槽提取模型。

自然语言理解的目的是将用户的输入映射到预先根据不同场景定义的语义槽中,通常包括意图识别和语义槽提取。

自然语言理解应尽可能完整、清晰和准确地将用户输入转化为计算机能够理解的形式。意图识别和槽提取的方式有分开建模和联合建模两种方式,本发明分别对意图识别和槽提取进行建模。

意图识别:

意图识别属于文本分类任务,它根据当前用户的输入判断出用户的意图和涉及的领域,用户的意图和涉及的领域来自于步骤101中的需求定义,即派车、请假、会议室预定等。

对于文本分类任务,早期使用统计学习模型,比如SVM、朴素贝叶斯等。随着人工智能技术的发展,深度学习模型在文本分类任务中取得了不错的效果。在收集了用户数据,并使用模板生成进行数据增强。在这些数据中使用深度学习模型,能够获取更高层次的特征,对于意图识别的效果更好。

使用步骤102中获得的数据对深度学习模型Bert+TextCnn模型进行训练,使用训练好的模型对用户的对话进行意图识别,判断是任务型的对话即派车、请假、会议室预定等;还是非任务型比如询问报销流程。

槽提取:

槽提取与领域识别、意图检测不同,其本质上属于序列标注问题,旨在识别句子中的语义槽和其对应的值。办公场景中不同的需求有不同的参数。比如请假这个需求,需要提取用户的请假类型和请假时间等参数。因此根据步骤101中定义的场景需求,确定不同功能所需要的参数(槽),将收集到的数据应用到模型训练中,得到槽提取模型。

使用步骤102中获得的数据对Bert-BiLSTM-CRF模型进行训练,使用训练好的模型实现对不同场景的除了时间槽的其他槽的准确提取。

在不同的办公场景中,都需要使用到“时间”这个槽。“时间”槽有许多种表述,比如有具体的日期,或者“明天”、“下周三”等,还有持续时间“请假三天”等,使用基于常识日期的正则表达式规则进行处理,在用户对话过程中识别时间槽以及开始和结束的时间。

结合深度学习和规则,从用户的对话中提取业务所需的槽,为后续的业务执行提供信息。

步骤104:进行对话管理,直到收集必要信息,具体包括:

为不同的办公应用任务指定回复的话术和模板,与用户多轮对话直到收集必要信息。图3为本发明对话管理示意图。

用户的对话过程包含了针对具体任务需求的意图,比如请假申请,需要进行多轮对话才能收集完成任务所需要的槽,因此需要进行多轮对话管理。对话管理主要功能在于更新对话状态和信息,并选择一个或多个预定的系统动作。每个预定的动作和需要收集的槽相关联,比如“请问您的请假类型是什么?”用于引导用户回答请假类型这个槽。

考虑到办公场景中的任务比较明确,当意图识别到用户的具体意图,则在接下来的多轮对话中,围绕当前的意图进行回复和引导,直到收集完任务所需要的槽。用户的一次对话中存在多个槽,比如“明天我要请事假”,当前对话系统通过槽填充得到“明天”和“事假”两个槽,接下来不会再针对“开始时间”和“请假类型”这两个槽进行询问,避免重复提问效率降低。

用户可能当前处于请假意图,并在中间进行了意图切换,比如换成了派车意图。此时对话管理需要进行用户的意图澄清,即对用户进行询问并确认是否跳转到新的意图中。当用户确认之后,跳转到新的意图,并针对该意图的任务重新进行多轮对话。

除了任务的多轮对话,用户可能询问其他的意图,比如询问报销流程等答案比较固定的问题。此时,使用基于相似度的匹配,为用户返回问题最相关的答案。

步骤105:根据所述意图识别模型、所述槽提取模型和所述必要信息,确定当前用户意图和当前槽值;

步骤106:根据所述当前用户意图和当前槽值执行业务,具体包括:

根据所述当前用户意图判断所述任务是否符合任务需求;

若符合任务需求,则根据所述槽值执行指定的业务调用;

若不符合任务需求,则通过问答相似度匹配方法执行业务。如图4所示。

当收集某个具体任务所需要槽之后,将这些槽作为参数,调用办公场景中的接口,比如进行请假申请、会议室预定等。

对于非任务型的对话需求,比如询问报销流程,预先定义问答对,通过基于词向量的余弦相似度匹配方法,找到相似的问题及对应答案,返回该答案。

a.预训练词向量,使用步骤102中获得的公开语料预训练出词向量。

b.对于输入语句,进行jieba分词,获得每个词的词向量,并拼接成词向量序列。

c.将输入语句的词向量和步骤a中训练好的问题语句词向量进行余弦相似度匹配,找出和输入语句最相似的问题语句。余弦相似度匹配公式如下:

其中A和B为两个语句的词向量序列。

d.将问题语句对应的答案作为输出。

本发明提出了一种办公场景的任务型多轮对话系统构建方法。首先根据办公场景的不同需求,定义不同的任务场景;收集用户真实数据,并使用模板生成一部分数据进行数据增强;自然语言理解,结合深度学习模型和规则,通过训练的深度学习模型意图识别和槽值提取,对于部分槽值,利用领域规则进行处理;对话管理,根据任务需要的槽,制定回复模板和多轮对话流程;执行业务,包括业务调用和问答匹配。

本发明对办公场景任务的定制,能够准确地处理不同需求,利用用户数据制定模板进行数据增强,同时结合深度学习和规则,更有效地进行信息获取。

对应于本发明的一种办公场景的任务型多轮对话方法,本发明还提供一种办公场景的任务型多轮对话系统,如图5所示,一种办公场景的任务型多轮对话系统包括:

场景定义模块201,用于对不同办公应用任务进行场景定义,得到不同办公应用任务的意图和槽值。

数据采集模块202,用于将所述不同办公应用任务的意图和槽值进行数据采集,得到采集后的数据。

自然语言理解模块203,用于根据所述采集后的数据使用深度学习模型训练方法和定制规则处理方法,确定意图识别模型和槽提取模型。

对话管理模块204,用于进行对话管理,直到收集必要信息。

当前用户意图和当前槽值确定模块205,用于根据所述意图识别模型、所述槽提取模型和所述必要信息,确定当前用户意图和当前槽值。

业务执行模块206,用于根据所述当前用户意图和当前槽值执行业务。

所述自然语言理解模块203,具体包括:

意图识别模型确定单元,用于根据所述采集后的数据对深度学习模型Bert+TextCnn进行训练,得到意图识别模型。

非时间槽提取模型确定单元,用于根据所述采集后的数据对Bert-BiLSTM-CRF模型进行训练,得到非时间槽提取模型。

时间槽提取模型确定单元,用于采用基于常识日期的正则表达式规则对所述采集后的数据进行处理,得到时间槽提取模型。

所述对话管理模块204,具体包括:

对话管理单元,用于为不同的办公应用任务指定回复的话术和模板,与用户多轮对话直到收集必要信息。

所述业务执行模块206,具体包括:

判断单元,用于根据所述当前用户意图判断所述任务是否符合任务需求。

第一业务执行单元,用于当符合任务需求时,执行指定的业务调用。

第二业务执行单元,用于当不符合任务需求时,通过问答相似度匹配方法执行业务。

本发明通过办公场景分析,数据增强,结合深度学习和规则,构建了办公场景的任务型多轮对话方法和系统,可以自动与办公用户进行多轮对话收集信息,并执行相应业务,提高了办公效率。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种办公场景的任务型多轮对话方法及系统
  • 一种针对电子商务导购场景任务型对话系统的构建方法
技术分类

06120112192149