掌桥专利:专业的专利平台
掌桥专利
首页

应答消息的生成方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:58:21


应答消息的生成方法、装置、电子设备及存储介质

技术领域

本公开涉及人工智能技术领域,特别涉及一种应答消息的生成方法、装置、电子设备及存储介质。

背景技术

大型语言模型(Large Language Model,LLM)本质上为对话模型,其能够理解和生成人类语言,实现与用户的日常对话以及解决用户的各种问题。

但是,目前的LLM在应答用户的问题时,仅考虑对话过程的前文语境,并未结合对话所涉及领域的专业知识或者与用户的历史对话过程中的相关内容。因此,在与相关技术中的LLM进行交互时,每一轮对话均需要为其提供丰富的问题描述作为提示,无疑增加了用户的交互成本;若不为LLM提供较丰富的问题描述,那么其给出的应答消息通常与用户所需结果相差较大,难以达到人机交互体的目的,降低了用户的人机交互体验。

发明内容

为了解决前文所述的至少一个问题,本公开提供了一种应答消息的生成方法、装置、电子设备及存储介质。

根据本公开的一个方面提供了这样一种应答消息的生成方法,包括:对提问文本进行处理,确定与所述提问文本相关联的提示数据,其中所述提示数据包括语境关联数据、历史关联数据和关联知识文档;基于问答模型的词例调用阈值,对所述提示数据进行数量优化,以形成目标提示信息;以及调用所述问答模型对所述目标提示信息进行分析,生成对应于所述提问文本的应答消息。

在一些实施方式中,所述对提问文本进行处理,确定与所述提问文本相关联的提示数据,包括:将所述提问文本转换成提问向量,其中所述提问向量用于表征所述提问文本的语义信息;在知识文档库中提取与所述提问向量相匹配的多个知识关联文档;在历史对话数据库中提取与所述提问向量相关联的多个问答对,以形成由多个所述问答对构成的历史关联数据;以及在目标场景中提取与所述提问文本的提问时间相邻接的多轮对话信息,以形成语境关联数据。

在一些实施方式中,在所述对提问文本进行处理,确定与所述提问文本相关联的提示数据之后,包括:将所述提问文本、所述提示数据和所述问答模型的角色描述进行整合,形成原始提示信息。

在一些实施方式中,所述基于问答模型的词例调用阈值,对所述提示数据进行数量优化,以形成目标提示信息,包括:将所述原始提示信息的词例数量与所述问答模型的词例调用阈值进行比较,获得比较结果;响应于所述比较结果为所述词例数量大于所述词例调用阈值,对所述提示数据中的多个关联知识文档进行文档截断,保留任一所述关联知识文档;以及当存在唯一所述关联知识文档的原始提示信息中词例数量小于或等于所述词例调用阈值时,形成由语境关联数据、历史关联数据和唯一所述关联知识文档构成的所述目标提示信息。

在一些实施方式中,在所述对所述提示数据中的多个关联知识文档进行文档截断,保留任一所述关联知识文档之后,还包括:当存在唯一所述关联知识文档的原始提示信息中词例数量大于所述词例调用阈值时,对所述语境关联数据中多轮对话信息进行截断,保留在时序上与所述提问文本直接相邻的唯一对话信息;以及响应于存在唯一所述对话信息的原始提示信息中词例数量小于或等于所述词例调用阈值,形成由唯一所述对话信息、所述历史关联数据和唯一所述关联知识文档构成的所述目标提示信息。

在一些实施方式中,在所述对所述语境关联数据中多轮所述对话信息进行截断,保留在时序上与所述提问文本直接相邻的唯一对话信息之后,还包括:当存在唯一所述对话信息的原始提示信息中词例数量大于所述词例调用阈值时,对唯一所述对话信息进行预先计算,以形成加速对话信息;以及响应于存在所述加速对话信息的原始提示信息中词例数量小于或等于所述词例调用阈值,形成由唯一加速对话信息、历史关联数据和唯一所述关联知识文档构成的所述目标提示信息;或者响应于存在所述加速对话信息的原始提示信息中词例数量大于所述词例调用阈值,删除所述语境关联数据,形成由所述历史关联数据和唯一所述关联知识文档构成的所述目标提示信息。

在一些实施方式中,在所述对提问文本进行处理,确定与所述提问文本相关联的提示数据之前,包括:对历史问答文档进行处理,形成包括多个对话文档向量的历史对话数据库,其中所述对话文档向量对应于所述历史问答文档中的问答对,包括:将多个所述历史问答文档进行离散,获得多个具有目标词例数量的问答对;对每一个所述问答对进行编码,获得对应于所述问答对的所述对话文档向量;以及整合各个所述对话文档向量,形成所述历史对话数据库。

根据本公开的另一个方面提供了这样一种应答消息的生成装置,包括:提示数据确定模块,用于对提问文本进行处理,确定与所述提问文本相关联的提示数据,其中所述提示数据包括语境关联数据、历史关联数据和关联知识文档;目标提示信息构建模块,用于基于问答模型的词例调用阈值,对所述提示数据进行数量优化,以形成目标提示信息;以及应答消息生成模块,用于调用所述问答模型对所述目标提示信息进行分析,生成对应于所述提问文本的应答消息。

根据本公开的又一个方面提供了这样一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,以实现如上述任一实施方式所述的应答消息的生成方法。

根据本公开的再一个方面提供了一种可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序适于处理器进行加载,以执行如上述任一实施方式所述的应答消息的生成方法。

附图说明

附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。

图1为本公开的一个实施方式的应答消息的生成方法流程图。

图2为本公开的一个实施方式的应答消息的生成架构示意图。

图3为本公开的一个实施方式的语境关联数据示意图之一。

图4为本公开的一个实施方式的语境关联数据示意图之二。

图5为本公开的一个实施方式的词例数量调整架构图。以及

图6为公开的一个实施方式的应答消息的生成装置框图。

具体实施方式

下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。

需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开的技术方案。

除非另有说明,否则示出的示例性实施方式/实施例将被理解为提供可以在实践中实施本公开的技术构思的一些方式的各种细节的示例性特征。因此,除非另有说明,否则在不脱离本公开的技术构思的情况下,各种实施方式/实施例的特征可以另外地组合、分离、互换和/或重新布置。

本文使用的术语是为了描述具体实施例的目的,而不是限制性的。如这里所使用的,除非上下文另外清楚地指出,否则单数形式“一个(种、者)”和“所述(该)”也意图包括复数形式。此外,当在本说明书中使用术语“包含”和/或“包括”以及它们的变型时,说明存在所陈述的特征、整体、步骤、操作、部件、组件和/或它们的组,但不排除存在或附加一个或更多个其它特征、整体、步骤、操作、部件、组件和/或它们的组。还要注意的是,如这里使用的,术语“基本上”、“大约”和其它类似的术语被用作近似术语而不用作程度术语,如此,它们被用来解释本领域普通技术人员将认识到的测量值、计算值和/或提供的值的固有偏差。

图1为本公开的一个实施方式的应答消息的生成方法流程图;图2为本公开的一个实施方式的应答消息的生成架构示意图。下面结合图1至图2对应答消息的生成方法S100进行详细说明。

步骤S102,对提问文本进行处理,确定与提问文本相关联的提示数据。

提问文本在对话场景中由用户提出的问题或者下达的信息获取指令所构成的文本。每个对话场景通常具有多轮对话,每轮对话的对话信息由用户的提问文本和问答模型的应答消息构成。

提示数据是问答模型生成应答消息提供数据支持的文件,至少包括语境关联数据、历史关联数据和关联知识文档。相关技术中,问答模型在执行人机交互的过程,通常仅考虑语境关联数据,但是用户每轮对话提出的问题未必是相互关联的,很容易曲解用户语义,生成与提问文本毫无关联的应答消息,降低用户对话体验。本公开通过扩展提示数据的类型,将历史关联数据和关联知识文档一并作为提示数据,为提问文本的分析提供数据支持,最大化保证模型输出的应答消息与用户的需求之间的关联。

语境关联数据用于表征问答模型和用户在当前对话场景的前几轮对话信息,为问答模型提供上下文语境信息。这些对话信息我们通常称之为问答模型的短期记忆,是原始提示信息的一部分。语境关联数据能够塑造具有不同表述方式和应答能力的问答模型。

图3为本公开的一个实施方式的语境关联数据示意图之一。如图3所示,展示了用户和问答模型的四轮对话信息,Q1、Q2、Q3和Q4是用户的四次提问,A1、A2和A3是用户问答模型分别应对Q1、Q2和Q3的应答。其中,A表示用户的提问,Q表示问答模型的应答。在第四轮对话信息中,用户提出了问题Q4,问答模型在分析提问Q4时,以本轮对话信息之前的三轮对话信息作为语境关联数据,也即上下文语境信息,进而结合Q4以及其他提示信息分析出应答消息A4。

但是,随着对话轮数的增加,以及问答模型在目标提问信息中所能调用词例的数量限制,本公开提出了对语境关联数据的数量设定,即,以与提问文本在时序上相邻接的多轮对话信息作为语境关联数据,其余较早发生的对话将从短期记忆中删除。也就是说,设置预设数量个在时序上与提问文本邻接的多轮对话信息作为语境关联数据。

图4为本公开的一个实施方式的语境关联数据示意图之二。参考图4,当交互场景中出现更多轮的对话信息时,例如Q5、A5、Q6、A6、Q7、A7和Q8时,那么前面提到的前四轮对话信息将从语境关联数据中剔除,保留Q5、A5、Q6、A6、Q7和A7等三轮对话信息作为新的语境关联数据。此时,Q8为提问文本,A8为问答模型的应答信息。当然,与提问文本的邻接对话信息的预设数量可根据问答模型的处理能力设定,不限于三轮,其他数量均落入本公开的保护范围。

历史关联数据是用户和问答模型在历史交互的过程中所产生的与提问文本相关联的问答对。由于每次对话结束之后,所发生的对话信息都被清空,那么用户在重新调度问答模型进行对话时,无法参考之前的交互数据。但是,用户和模型每次对话结束时,也就意味着用户获取到了其需求的应答结果,因此在新一轮的对话过程中,历史交互数据是具备参考性的。我们把每个对话场景所产生的短期记忆进行处理和存储,并以此作为问答模型的长期记忆,以便于问答模型调取历史关联数据作为分析提问文本的数据支持。

关联知识文档是用户上传的与当前提问文本具有相同或相似知识分类的专业文件,为问答模型分析提问文本提供知识背景的支持,以便问答模型的回答不回存在知识漏洞。另外,由于同一概念可能对应不同知识分类,因此在用户指定的文件中筛选关联知识文档,可以提升应答消息与用户需求的匹配度。

步骤S104,基于问答模型的词例调用阈值,对提示数据进行数量优化,以形成目标提示信息。

问答模型是具有长期记忆能力和短期记忆能力的大语言模型,其具备调取当前对话场景中语境关联数据、历史对话所产生的历史关联数据以及关联知识文档等多种数据的能力,因此问答模型在分析用户的提问文本时,能够更了解用户需求且具有专业行业知识作数据支持。

词例调用阈值是问答模型接受提示信息时所能调用的最大词例数量。因为问答模型的本质是大语言模型,属于神经网络模型的一种,其神经网络结构所支持的输入是有限的,例如2048个词例,因此在确定目标提示信息之前,需要根据问答模型自身的调用能力对提示数据进行处理,以保证问答模型能够完全调用这些词例。

词例是对原始提示信息进行切割的结果,每一词例可以理解为一个具有含义的词语。其中,原始提示信息是包含提示数据且具备输入格式的模型提示信息,但是原始提示信息的词例数量与问答模型的处理能力未必相匹配,因此需要对其所包含的提示数据进行数量优化,优化之后形成的目标提示信息则可作为问答模型的输入数据。

目标提示信息是对提示数据的数量优化结果,其词例数量小于或等于问答模型的词例调用阈值。在确定提示数据之后,将至少将提示数据和提问文本进行整合,获得原始提示信息;基于词例调用阈值,对原始提示信息中的提示数据进行数量优化,即可形成由数量优化后的提示数据和提问文本构成的目标提示信息。

步骤S106,调用问答模型对目标提示信息进行分析,生成对应于提问文本的应答消息。

应答消息是问答模型综合语境关联数据、历史关联数据以及关联知识文档等数据,对提问文本的分析结果。应答消息符合上下文语境,也满足用户在历史对话过程中所透露的个性化应答需求;同时,应答消息也具备解决提问本文中问题的行业专业能力。

在一些实施方式中,步骤S102的执行过程包括:将提问文本转换成提问向量,其中提问向量用于表征提问文本的语义信息;在知识文档库中提取提问向量相匹配的多个知识关联文档;在历史对话数据库中提取与提问向量相关联的多个问答对,以形成由多个问答对构成的历史关联数据;以及在目标场景中提取与提问文本的提问时间相邻接的多轮对话信息,以形成语境关联数据。

具体地,当用户输入了提问文本之后,将其编码成提问向量,以便于与知识文档库中的知识文档向量以及历史对话数据库中的对话文档向量进行匹配,同时也便于数据的传输。提问向量至少用于表征提问文本的语义信息。

当获得了提问向量之后,在知识文档库中提取与提问向量相匹配的多个知识关联文档。其中,知识文档库为一个FAISS(Facebook AI Similarity Search,快速相似性搜索)计算库,计算提问向量和各个知识文档之间的向量距离,向量间的计算方式可例如欧几里得距离和向量点积等,提取与提问向量所计算的距离值中较小的几个知识文档作为提问向量的知识关联文档。当然,对知识关联文档的召回数量可根据需求设定,在此不做限制。

在历史对话数据库中提取与提问向量相关联的多个问答对,并以多个问答对作为提问文本的历史关联数据。其中,历史对话数据库实质上也是一个FAISS计算库,其中存储有历史交互过程所产生的问答对,并由此生成对应于各个问答对的对话文档向量。进而,通过对提问向量与各个对话文档向量进行向量的距离计算,提取与提问向量所计算的距离值中较小的几个对话文档,并以这些对话文档中的问答对作为提问向量的历史关联数据。当然,由于问答对的时效性,将所召回的多个问答对按照发生时间的先后顺序进行倒序排列,使得最新发生的问答对在历史关联数据中排在首尾。

根据当前对话场景中的各轮对话发生的时间顺序,提取与当前提问文本在时间上邻接的多轮对话信息作为语境关联数据。这些对话信息为分析提问文本提供上下文语境的数据支持。当然,对对话信息的提取轮数可根据需求设定,在此不做限制。

在一些实施方式中,在步骤S102之后,包括:将提问文本、提示数据和问答模型的角色描述进行整合,形成原始提示信息。

原始提示信息中的词例数量可能存在超过词例调用阈值的情况,因此在调用问答模型时需要先对原始提示信息进行处理。原始提示信息具备问答模型的提示输入格式,以及提问文本、提示数据和角色描述等信息。

问答模型的角色描述为问答模型的应答消息提供表达风格引导和任务设定,不同的角色描述对应于不同的表达风格。

当获得了提问文本、提示数据和问答模型的角色描述之后,可以构建原始提示信息,提示输入格式可例如:

"″"

{role}

从下文中提取有用的内容进行回答,如果不在下文提到的内容,

可以生成相关的内容。

{knowledge}

{history}

{memory}

问题:{query}

回答:

"″"

其中,role表示角色描述,knowledge表示提示数据中的知识关联文档,history表示提示数据中的历史关联数据,memory表示语境关联数据,query表示提问文本。

首先获取角色描述,可例如:“你现在扮演一个秘书。你的任务是:能帮我分析文章内容。你的说话风格是:语句精炼,内容简介。你能帮我记录我说过的话,在接下来的对话中我可以查询这些对话内容”。

进一步,获取提示数据。在用户上传的知识文档库中检索到四个知识关联文档,将其通过符号“ ”进行拼接;在历史对话数据库中检索与当前提问文本最新相关的问答对,默认选取两个问答对,并将其按照时间倒序进行排列;在当前对话语境中提取最新发生的三轮对话,按照时间倒序进行排列。

最终,将角色描述、提示数据和提问文本进行融合,以单轮问答的方式形成原始提示信息,例如:

messages=[{'role':'user','content':' 你现在扮演一个秘书。你的任务是:能帮我分析文章内容。你说话的风格:语句精炼,内容简洁。你能帮我记录我说过的话,在接下来的对话中我可以查询这些对话内容。 从下文中提取有用的内容进行回答,如果不在下文提到的内容,可以生成相关的内容。 我一会儿要去买什么 您一会儿需要去买的东西是土豆、白菜和猪肉。 记一下端午节是6月3日 端午节是每年的农历五月初五,对应阳历的日期会有所不同,今年(2023年)的端午节是在6月3日。 帮我记一下一会要去超市 好的,请告诉我您需要去超市购买什么物品,我会帮您记录下来。 土豆白菜西红柿 您要去超市购买土豆、白菜和西红柿。 问题:一会儿去超市干嘛呀 回答:'}]。

其中,messsages表示原始提示信息,user表示角色role的具体角色值,content表示角色的执行任务和风格。

“我一会儿要去买什么”和“您一会儿需要去买的东西是土豆、白菜和猪肉”为其中一个问答对;“记一下端午节是6月3日”和“端午节是每年的农历五月初五,对应阳历的日期会有所不同,今年(2023年)的端午节是在6月3日”是另一个问答对。“帮我记一下一会要去超市”和“好的,请告诉我您需要去超市购买什么物品,我会帮您记录下来”是当前对话场景中的一组对话信息;“土豆白菜西红柿”和“您要去超市购买土豆、白菜和西红柿”是当前对话场景中的一组对话信息。“一会儿去超市干嘛呀”为提问文本。需要说明的是,符号“ ”表示不同类别提示信息之间的分隔符。

在一些实施方式中,在获得了原始提示信息之后,步骤S104包括:将原始提示信息的词例数量与问答模型的词例调用阈值进行比较,获得比较结果;响应于比较结果为词例数量大于词例调用阈值,对提示数据中的多个关联知识文档进行文档截断,保留任一关联知识文档;以及当存在唯一关联知识文档的原始提示信息中词例数量小于或等于词例调用阈值时,形成由语境关联数据、历史关联数据和唯一关联知识文档构成的目标提示信息。

理论上将前文所获得的提示数据全部作为提示信息输入至问答模型,是一种最佳的提示方式。但是由于问答模型对词例数量的调用局限,需要对原始提示信息进行词例数量确定和控制,以适应问答模型的处理能力。

图5为本公开的一个实施方式的词例数量调整架构图。

参考图5,首先比较原始提示信息的词例数量与问答模型的词例调用阈值之间的大小,若词例数量小于或等于词例调用阈值,则可以直接结束对原始提示信息的处理,并以原始提示信息作为目标提示信息输入至问答模型。

反之,若词例数量大于词例调用阈值,则需要对原始提示信息中的提示数据进行数量截取。那么,我们首先考虑对关联知识文档进行文档截断,保留任一关联知识文档,删除其余关联知识文档。这样,仅保留唯一的关联知识文档作为行业专业知识的数据支持,通常也是可以满足应答需求的。

进而,再判断仅包含唯一关联知识文档的原始提示信息的词例数量是否小于或等于词例调用阈值;若小于或等于词例调用阈值,则以包含唯一关联知识文档的原始提示信息作为目标提示信息,其余提示数据、角色描述以及提问文本的内容不做改动。

在一些实施方式中,若出现仅包含唯一关联知识文档的原始提示信息的词例大于词例调用阈值的情况,我们将执行以下步骤:当存在唯一关联知识文档的原始提示信息中词例数量大于词例调用阈值时,对语境关联数据中多轮对话信息进行截断,保留在时序上与提问文本直接相邻的唯一对话信息;以及响应于存在唯一对话信息的原始提示信息中词例数量小于或等于词例调用阈值,形成由唯一对话信息、历史关联数据和唯一关联知识文档构成的目标提示信息。

因为语境关联数据在召回的时候仅考虑时效性,不考虑关联性,很容易出现语境关联数据与提问文本无关的情况,所以在这时我们优先考虑对语境关联数据中的对话信息进行截断,而保留历史关联数据中确实与提问文本存在关联的问答对。

在这个过程中,先保留与提问文本发生时间最接近的唯一对话信息,删除其他对话信息。对仅存在唯一对话信息且仅存在唯一关联知识文档的原始提示信息进行词例数量的判断。若此时的词例数量小于或等于词例调用阈值,那么就以包含唯一对话信息和唯一关联知识文档的原始提示信息作为目标提示信息,其余提示数据、角色描述以及提问文本的内容不做改动。

在一些实施方式中,若出现存在唯一所述对话信息的原始提示信息中词例数量大于所述词例调用阈值的情况时,我们将执行以下步骤:当存在唯一对话信息的原始提示信息中词例数量大于词例调用阈值时,对唯一对话信息进行预先计算,以形成加速对话信息。

预先计算主要起到加速的作用,能够删减对话信息中的无关词例。进而,对存在唯一对话信息的原始提示信息进行词例数量的判断,若小于或等于词例调用阈值,则以其为目标提示信息,其余提示数据、角色描述以及提问文本的内容不做改动。

反之,则响应于存在加速对话信息的原始提示信息中词例数量大于词例调用阈值,删除语境关联数据,形成由历史关联数据和唯一关联知识文档构成的目标提示信息。

当然,如果此时词例用量还大于词例调用阈值,也可以丢弃历史关联数据,仅保留一条关联知识文档,以形成目标提示信息,保障应答消息的专业性。

在一些实施方式中,在步骤S102之前,包括:对历史问答文档进行处理,形成包括多个对话文档向量的历史对话数据库,其中对话文档向量对应于历史问答文档中的问答对。

具体地,将多个历史问答文档进行离散,获得多个具有目标词例数量的问答对;对每一个问答对进行编码,获得对应于问答对的所述对话文档向量;以及整合各个对话文档向量,形成历史对话数据库。

历史问答文档实质上是作为问答模型的长期记忆而存储的,每次进行对话时,在历史问答文档中选取相关联的问答对作为历史关联数据。这样做的好处就是,避免了相关技术中利用历史问答文档对问答模型进行权重微调时,对大量问答数据的数量要求;以克服了微调过程对问答模型的算力要求,具有普适性。因此,我们选择将历史问答对以历史问答文档的形式存储于历史对话数据库中,将该数据库作为问答模型的外部数据库,每次对话时在该数据库中调取相关联的问答对,以为问答模型提供长期记忆。

更具体地,我们将历史发生的问答对整理为文档的形式,每个文档对应一个或少数个问答对,以保证每个文档的用例数量不会太大,进而能够将每一份问答文档都具备输入问答模型的条件。进而,用编码服务对每份问答文档进行编码,形成对话文档向量,这个对话文档向量是神经网络对问答文档的压缩结果。然后,将每个问答文档所对应的对话文档向量整合为一个历史对话数据库,它是一个FAISS计算库,它的键是文档的向量,对应的值是相应的问答文档。当用户提出提问文本时,在历史对话数据库查询这个提问文本的提问向量,并以查询的结果作为历史关联数据,实现了长期记忆的查询。

在一些实施方式中,我们还对用户通过文档路径上传的知识文档进行知识文档库的建立。由于知识文档的内容可能过长,首先对文档进行切片,将其切分成多个文档分块,每个文档分块作为一条记录,为了保证文档分块的句子完整性,首先使用分割符将文档内容切分为最小粒度的文本单元,分割符可为:[“ ”、“。”、“?”、“?”、“;”、“;”、“,”、“,”、“”]中的任意一个。切分时,遍历知识文档中的每个分割符,当遇到如上所示的分割符时,将文本切分。然后,依次将各个最小粒度的文本单元拼接在一起,每拼接一个最小粒度的文本单元之前,先计算拼接结果的文本词例数量,若文本词例数量没有超过预设分块词例阈值,则执行拼接;否则,将拼接之前的文本单元作为一个文档分块,待拼接的文本单元作为下一个文档分块的开始部分,重复上述步骤。

当获得整个知识文档的多个文档分块之后,构建各个文档分块对应的向量索引。即调用编码服务对各个文档分块进行编码,形成知识文档向量,并形成FAISS形式的知识文档库。

本公开的应答消息的生成方法,搜索了与提问文本相关联的历史关联数据、知识关联文档和语境关联数据等多种类型的提示数据作为目标提示信息,为问答模型提供了长期记忆、专业知识和短期记忆等多维度的数据支持,保证了其所生成的应答消息的精准度,提升了每轮对话的效率,最大化避免在对话过程中出现的所问非所答的情况。另外,还考虑了问答模型对词例的调用能力,对目标提示信息的词例进行了数量优化,保证了目标提示信息和问答模型的适配度。

图6为公开的一个实施方式的应答消息的生成装置框图。

参考图6,本公开提供了这样一种应答消息的生成装置1000,包括:提示数据确定模块1002,用于对提问文本进行处理,确定与提问文本相关联的提示数据,其中提示数据包括语境关联数据、历史关联数据和关联知识文档;目标提示信息构建模块1004,用于基于问答模型的词例调用阈值,对提示数据进行数量优化,以形成目标提示信息;以及应答消息生成模块1006,用于调用问答模型对目标提示信息进行分析,生成对应于提问文本的应答消息。

应答消息的生成装置1000中的各个模块均是为了解决应答消息的生成方法的各个步骤而设置的,其执行原理和步骤可参考前述,不再赘述。

该装置1000可以包括执行上述流程图中各个或几个步骤的相应模块。因此,可以由相应模块执行上述流程图中的每个步骤或几个步骤,并且该装置可以包括这些模块中的一个或多个模块。模块可以是专门被配置为执行相应步骤的一个或多个硬件模块、或者由被配置为执行相应步骤的处理器来实现、或者存储在计算机可读介质内用于由处理器来实现、或者通过某种组合来实现。

该硬件结构可以利用总线架构来实现。总线架构可以包括任何数量的互连总线和桥接器,这取决于硬件的特定应用和总体设计约束。总线1100将包括一个或多个处理器1200、存储器1300和/或硬件模块的各种电路连接到一起。总线1100还可以将诸如外围设备、电压调节器、功率管理电路、外部天线等的各种其它电路1400连接。

总线1100可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,该图中仅用一条连接线表示,但并不表示仅有一根总线或一种类型的总线。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本公开的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本公开的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如,本公开中的方法实施方式可以被实现为软件程序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中,软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之一。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体实现在任何可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。

本公开的应答消息的生成装置,搜索了与提问文本相关联的历史关联数据、知识关联文档和语境关联数据等多种类型的提示数据作为目标提示信息,为问答模型提供了长期记忆、专业知识和短期记忆等多维度的数据支持,保证了其所生成的应答消息的精准度,提升了每轮对话的效率,最大化避免在对话过程中出现的所问非所答的情况。另外,还考虑了问答模型对词例的调用能力,对目标提示信息的词例进行了数量优化,保证了目标提示信息和问答模型的适配度。

就本说明书而言,“可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在存储器中。

应当理解,本公开的各部分可以用硬件、软件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施方式方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,的程序可以存储于一种可读存储介质中,该程序在执行时,包括方法实施方式的步骤之一或其组合。

此外,在本公开各个实施方式中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读存储介质中。存储介质可以是只读存储器,磁盘或光盘等。

本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。

相关技术
  • 一种消息处理方法、装置、电子设备及存储介质
  • 消息处理方法、装置、电子设备及存储介质
  • 类文件生成方法、装置、电子设备及存储介质
  • 无人机迁移轨迹生成方法、装置、电子设备和存储介质
  • 视频摘要生成方法、装置、存储介质和电子设备
  • 一种应答消息的生成方法、装置、电子设备及存储介质
  • 消息存储方法、消息生成方法、装置、电子设备及计算机可读介质
技术分类

06120116480055