掌桥专利:专业的专利平台
掌桥专利
首页

一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统

文献发布时间:2023-06-19 11:22:42


一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统

技术领域

本发明属于信息获取领域,具体地,涉及一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统。

背景技术

在日益激烈的市场竞争环境下,为了提高市场竞争力以及提高公司的服务效率,除了销售生产的商品之外,企业对与商品配套的服务也越来越重视,客户服务也成为一个公司生态圈中不可或缺的关键组成部分。随着技术的进步和互联网的普及,传统的以电话服务为主导的客户服务在客户咨询量较大的情况下,常常会出现呼叫时间过长甚至呼叫失败的状况,严重影响到客户的服务质量。为了提高顾客的满意度,以及降低企业成本,一些新型的在线客服方式开始出现。这些客服系统作为企业与顾客进行沟通的工具,同时也是一个集数据信息管理和智能化于一体的系统软件,有利于企业标准管理方法,提高工作效率,进一步提高企业的产出。

目前,随着深度学习技术的发展,人工智能技术也开始应用于企业智能客服领域。这些客服系统不仅具有传统的以电话服务为主导的客服系统的所有功能,同时通过客服机器人实现客户服务的自动化。客服系统拥有的功能也越来越多,使用的技术也越来越复杂。

如(郭玲.一种企业智能客服系统的设计[J].电子世界,2020(21):114-117+122.)通过自建云呼叫中心,应用语音识别技术,在专业的语音服务的基础上构建系统,由客服机器人处理相关的业务,为客户带来全新的互动自主服务体验。在用户和系统进行交互的过程中,由于系统基于语音识别技术,如果用户操作不当或者所处环境存在噪音,都会降低语音识别的准确性,导致系统无法正确对用户的需求进行响应。由于语音识别会因说话人所处的环境引入语音噪声,降低系统的性能,因此大多数智能客服系统都是在文本的基础上上进行设计。

如(张子轩.神经网络在文本型智能客服系统的应用[D].燕山大学,2019.)提出了一个由意图识别模块、语义匹配模块和闲聊模块三个部分组成的文本型智能客服系统,该系统在不仅能处理用户的业务需求,并且能够和用户进行简单的闲聊对话。但由于该系统使用的模型是在基本的GRU网络上进行改进得到的,因此依旧存在类似RNN网络中当前隐藏状态的计算依赖于前一个隐藏状态而无法加速并行计算的问题,降低了系统的响应速度。为了提高系统的响应速度,一些智能客服系统,采用问答对的形式来组织常用问题集合,通过返回系统中与用户问题相似问题的答案来响应用户需求。

如(邓志捷.基于阅读理解技术的问答系统设计与实现[D].北京邮电大学,2019.)会将可能包含用户问题答案的文档作为答案的来源,通过深度学习技术抽取出针对用户问题的相关文档集合,并从中抽取出答案。按照这种方法抽取答案的准确率不高,并且容易受到文档质量的影响。

现有技术具有以下缺点:

1.基于常用问题集的智能客服系统只能回答相对常见的问题,对于问答库之外的问题,系统无法从相关说明文档中获取答案。

2.目前的智能客服系统在面对需要人工客服回答处理的问题时,直接将问题传至人工客服,由人工客服直接回答问题,无法为人工客服提供针对问题的候选答案,降低了人工客服的工作效率。

发明内容

本发明为了解决上述问题,提出了一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统,本发明除了从常用问题集中获取答案之外,还可以从相关文档中抽取出若干答案,帮助人工客服寻找正确答案,提高人工客服的效率,并在系统运行的过程中,可根据与用户的聊天信息同步更新系统的问答库。

本发明是通过以下方法实现的:

一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统,所述系统具体包括基于常问问题集FAQ的自动客服模块和以文档说明为辅助的人工客服模块两部分组成;

当用户输入问题时,系统先将用户提问输入到基于常问问题集FAQ的自动客服模块,该模块利用问题相似度计算技术,从FAQ中选择与用户问题最相似的问题,并将答案返回给客户;

若基于常问问题集FAQ的自动客服模块无法回答用户的问题,即基于常问问题集合中没有和用户问题相关的答案,系统则将用户问题推送到以文档说明为辅助的人工客服模块,在所述人工客服模块中,系统通过基于文档的答案抽取技术,从产品说明文档中抽取出可能包含答案的文档片段,将所述文档片段与用户问题发送给人工客服,经人工客服编辑后,将答案返回给客户,同时将所述答案和原问题加入常问问题集FAQ中,使系统再次面对类似问题的时候,可以直接回答用户问题。

进一步地、基于常问问题集FAQ的自动客服模块由一系列人工标注的问答对组成,对于问题集合中的一条记录r,用(Q,A)进行表示,其中Q表示问题,A表示对应该问题的标准答案;

基于常问问题集FAQ的自动客服模块利用问题相似度计算技术从FAQ中找到最相似的问题,并返回相应的标准答案;

以BERT模型为基础的问题相似度计算模型,所述BERT模型由12层Transformer叠加而成,经由预训练建模句子的语义信息,并判断句子之间是否相似。

进一步地、以BERT模型为基础的问题相似度计算模型分为两个部分,第一部分以BERT预训练训练模型为基础的表示层,第二部分为匹配层;所述表示层以两个句子作为输入,得到两个句子的向量表示,句子之间由特殊的符号进行分割;所述匹配层使用两个句子语义向量来计算他们之间的匹配分数,将匹配分数最高的句子作为用户问题的答案。

进一步地、以文档说明为辅助的人工客服模块使用基于文档的答案抽取技术从说明文档集合中抽取出和用户提问相关的片段作为候选答案,从多篇相关文档中得到用户问题的候选答案集合,人工客服从所述候选答案集合中筛选编辑后,给出用户问题的答案。

进一步地、所述基于文档的答案抽取技术的过程分为相关文档检索和答案抽取;

相关文档检索:对于用户的问题,在已有的文档库中查询可能存在答案的相关文档,然后将相关文档返回;

答案抽取:设计一个基于多文档的抽取式阅读理解模型,所述模型分为词嵌入层、文档编码层、文档和问题交互层和指针输出层;所述词嵌入层用于将文本中的每一个词与转换成机器能够处理的向量级表示,所述文档编码层在词嵌入层的基础上进一步挖掘句子级别的上下文信息,所述文档和问题交互层采用注意力机制将问题和篇章进行对齐,找出文档中与问题最相关的部分,所述指针输出层根据篇章中每一个单词的概率值预测答案的起始位置和结束位置。

进一步地、以文档说明为辅助的人工客服模块将编辑后的答案和原问题一起存入基于常问问题集FAQ的自动客服模块的问答库中,当系统再次遇到类似问题时,能直接回答该问题。

本发明有益效果

(1)本发明通过基于文档集的答案抽取技术可以从相关文档中抽取出用户问题的答案,帮助人工客服构造正确答案,减少了人工客服查找答案需要的时间,显著提高人工客服的工作效率;

(2)经人工客服回答的问题会和用户问题一起录入问答库系统中,使客服机器人在再次遇到类似问题时,可直接进行解答。

附图说明

图1为本发明的智能客服系统处理流程;

图2为本发明的基于BERT的相似度计算模型;

图3为本发明的抽取式阅读理解的模型。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统,所述系统具体包括基于常问问题集FAQ的自动客服模块和以文档说明为辅助的人工客服模块两部分组成;

当用户输入问题时,系统先将用户提问输入到基于常问问题集FAQ的自动客服模块,该模块利用问题相似度计算技术,从FAQ中选择与用户问题最相似的问题,并将答案返回给客户;

若基于常问问题集FAQ的自动客服模块无法回答用户的问题,即基于常问问题集合中没有和用户问题相关的答案,系统则将用户问题推送到以文档说明为辅助的人工客服模块,在所述人工客服模块中,系统通过基于文档的答案抽取技术,从产品说明文档中抽取出可能包含答案的文档片段,将所述文档片段与用户问题发送给人工客服,经人工客服编辑后,将答案返回给客户,同时将所述答案和原问题加入常问问题集FAQ中,使系统再次面对类似问题的时候,可以直接回答用户问题。

基于常问问题集FAQ的自动客服模块由一系列人工标注的问答对组成,对于问题集合中的一条记录r,用(Q,A)进行表示,其中Q表示问题,A表示对应该问题的标准答案;

基于常问问题集FAQ的自动客服模块利用问题相似度计算技术从FAQ中找到最相似的问题,并返回相应的标准答案;

以BERT模型为基础的问题相似度计算模型,所述BERT模型由12层Transformer叠加而成,经由预训练建模句子的语义信息,并判断句子之间是否相似。

以BERT模型为基础的问题相似度计算模型分为两个部分,第一部分以BERT预训练训练模型为基础的表示层,第二部分为匹配层;所述表示层以两个句子作为输入,得到两个句子的向量表示,句子之间由特殊的符号进行分割;所述匹配层使用两个句子语义向量来计算他们之间的匹配分数,将匹配分数最高的句子作为用户问题的答案。

以文档说明为辅助的人工客服模块使用基于文档的答案抽取技术从说明文档集合中抽取出和用户提问相关的片段作为候选答案,从多篇相关文档中得到用户问题的候选答案集合,人工客服从所述候选答案集合中筛选编辑后,给出用户问题的答案。

所述基于文档的答案抽取技术的过程分为相关文档检索和答案抽取;

相关文档检索:对于用户的问题,在已有的文档库中查询可能存在答案的相关文档,然后将相关文档返回;

答案抽取:设计一个基于多文档的抽取式阅读理解模型,所述模型分为词嵌入层、文档编码层、文档和问题交互层和指针输出层;所述词嵌入层用于将文本中的每一个词与转换成机器能够处理的向量级表示,所述文档编码层在词嵌入层的基础上进一步挖掘句子级别的上下文信息,所述文档和问题交互层采用注意力机制将问题和篇章进行对齐,找出文档中与问题最相关的部分,所述指针输出层根据篇章中每一个单词的概率值预测答案的起始位置和结束位置。

进一步地、以文档说明为辅助的人工客服模块将编辑后的答案和原问题一起存入基于常问问题集FAQ的自动客服模块的问答库中,当系统再次遇到类似问题时,能直接回答该问题。

实施例

以用户输入“套膜机控制柜操作面板有哪些控制元件组成”和“200摄氏度是否超出了封口机温度控制的范围?”为例来说明系统执行的流程。在系统接收到问题“套膜机控制柜操作面板有哪些控制元件组成”之后,首先基于FAQ的自动客服模块通过问题相似度计算技术计算输入问题和FAQ库中每个问题之间的句子相似度,其中得到相似度最高的三个问题及对应的得分如下表所示:

由于问题“套膜机控制柜操作面板有哪些控制元件?”和用户问题的相似度最高,因此该问题的答案“套膜机控制柜操作操作面板由触摸屏、钥匙开关、急停按钮和平头按钮组成”会直接返回给用户。

当系统收到问题“200摄氏度是否超出了封口机温度控制的范围?”时,系统同样使用问题相似度计算技术计算输入问题和FAQ库中每个问题之间的句子相似度,其中得到相似度最高的三个问题及对应的得分如下表所示:

由于FAQ中与用户提问相似度最高的三个问题的得分均没有超过0.5,也即FAQ中不包含和用户提问相关的问题,因此需要将用户提问提交至以文档为辅助的人工客服模块。此时,系统首先利用基于文档的答案抽取技术从文档集合中抽取出相关片段“本控制系统采用的温度控制器,温度控制范围可在100~180℃,目标温度可通过面板按钮方便地进行设定,并具有报警输出等功能。”。接着,人工客服以该片段为辅助进行编辑,得到最终的答案“200度超出了封口机温度控制的范围。”并返回给用户。同时,该问答对被录入到FAQ集合中,当再有其他用户查询类似问题时,系统可以直接给出相应答案。

在基于FAQ的自动客服模块语义相似度分数的计算过程中,除了使用BERT来对句子进行编码之外,还可以使用CNN来对句子进行编码。在以文档说明为辅助的人工客服模块模块,可以使用Transformer代替双向LSTM。

以上对本发明所提出的一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统,进行了详细介绍,本文中对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种以说明文档为辅助的可迭代的基于常用问题集的智能客服系统
  • 一种基于迭代式学习的智能辅助标注方法及系统
技术分类

06120112901057