掌桥专利:专业的专利平台
掌桥专利
首页

一种问答方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:59:31


一种问答方法、装置、电子设备及存储介质

技术领域

本申请属于人工智能技术领域,尤其涉及一种问答方法、装置、电子设备及存储介质。

背景技术

近年来,随着计算机技术和算法的快速发展,大语言模型(Large LanguageModel,简称LLM)技术取得了突飞猛进的进步,在数据分析、内容创作等领域都取得了很好的效果,大大降低了使用成本,提高了工作效率。

但LLM直接应用在低容错领域的场景中时,由于LLM没有获得充分的低容错领域数据训练,对专业知识的理解和应用存在局限,容易产生“幻觉”,导致回答问题不够准确。

发明内容

本申请实施例的目的是提供一种问答方法、装置、电子设备及存储介质,以解决相关技术中在低容错领域的场景中,LLM容易产生“幻觉”,导致回答问题不够准确的问题。

为实现上述目的,本申请实施例采用下述技术方案:

第一方面,本申请实施例提供一种问答方法,包括:获取待应答的问题对应的实体识别结果;根据所述实体识别结果在所述问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果;根据所述实体识别结果和所述初始检索结果之间的第一相似度,从所述初始检索结果中筛选出目标检索结果;根据所述问题和所述目标检索结果生成拼接文本;将所述拼接文本输入至大语言模型中,得到所述问题的答案,其中,所述大语言模型用于将所述拼接文本映射为第一向量,根据所述第一向量生成第二向量,将所述第二向量映射为文本形式的所述答案。

第二方面,本申请实施例提供一种问答装置,包括:获取模块,用于获取待应答的问题对应的实体识别结果;检索模块,用于根据所述实体识别结果在所述问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果;根据所述实体识别结果和所述初始检索结果之间的第一相似度,从所述初始检索结果中筛选出目标检索结果;第一生成模块,用于根据所述问题和所述目标检索结果生成拼接文本;第二生成模块,用于将所述拼接文本输入至大语言模型中,得到所述问题的答案,其中,所述大语言模型用于将所述拼接文本映射为第一向量,根据所述第一向量生成第二向量,将所述第二向量映射为文本形式的所述答案。

第三方面,本申请实施例提供一种电子设备,包括:处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如本申请第一方面实施例所述方法的步骤。

第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如本申请第一方面实施例所述方法的步骤。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:

本申请实施例根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请的一个实施例提供的一种问答方法的流程示意图;

图2为本申请的另一个实施例提供的一种问答方法的流程示意图;

图3为本申请的一个实施例提供的一种问答方法的整体流程示意图;

图4为本申请的一个实施例提供的一种问答装置的结构示意图;

图5为本申请的另一个实施例提供的一种问答装置的结构示意图;

图6为本申请的一个实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应理解,这样使用的数据在适当情况下可以互换,以便本申请实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,本申请中的“和/或”表示所连接的对象的至少其中之一,字符“/”一般表示前后关联对象是一种“或”的关系。需要说明的是,本申请涉及的数据均在获得用户授权的前提下获取。

近年来,随着计算机技术和算法的快速发展,大语言模型LLM技术取得了突飞猛进的进步,例如ChatGPT、GPT-4、Claude等语言模型,在数据分析、内容创作等领域都取得了很好的效果,大大降低了使用成本,提高了工作效率。这些LLM虽然效果很好,但直接应用在低容错领域的场景中时,由于没有获得充分的低容错领域数据训练,对专业知识的理解和应用存在局限,容易产生“幻觉”,导致回答问题不够准确,即生成的答案的准确度无法达到真正专业人员的水平。为此,本申请提出了一种问答方法、装置、电子设备及存储介质,以解决在低容错领域的场景中,LLM容易产生“幻觉”,导致回答问题不够准确的问题。

以下结合附图,详细说明本申请各实施例提供的技术方案。

图1为本申请的一个实施例提供的一种问答方法的流程示意图。如图1所示,本申请实施例的问答方法,具体可包括以下步骤:

S101,获取待应答的问题。

在本申请实施例中,本申请实施例的问答方法的执行主体为问答装置,该问答装置可以设置于电子设备中。该电子设备可以是终端设备,也可以是服务端。其中,终端设备可以是手机、平板电脑、台式计算机、便携式笔记本、车载设备等;服务端可以是独立的服务器,也可以是由多个服务器组成的服务器集群。

本申请实施例中的问题,即用户输入的待应答的问题或待给出答案的问题,例如“介绍一下婺源篁岭有哪些地方值得去玩”、“我明天要去上海迪士尼玩,你快点告诉我”。

在一些实施例中,用户可通过鼠标、键盘等输入设备输入文本格式的问题。

在另一些实施例中,用户可通过语音的方式输入语音格式的问题,具体的:问答装置通过声音采集设备例如麦克风等采集用户语音输入的问题,并将语音格式的问题转换为文本格式的问题。

S102,获取问题对应的实体识别结果。

在本申请实施例中,可以基于知识图谱等,获取问题中的关键词对应的实体识别结果,实现对问题的语义解析。知识图谱中包括多个实体和实体之间的关系,可以根据问题中的关键词,在知识图谱中进行检索,获取关键词对应的实体,并根据关键词和对应的实体生成实体识别结果。例如,问题为“我明天要去上海迪士尼玩,你快点告诉我”,关键词为“上海、迪士尼、快点”,实体识别结果为“[上海]地名、[迪士尼]景点”。

S103,根据实体识别结果在问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果,根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果。

在本申请实施例中,可以基于步骤S102获取的实体识别结果,通过传统方式检索相关结果,得到检索出的初始检索结果。

其中,传统方式具体可包括但不限于知识库检索和网络检索等。通过网络检索,可以进一步扩大知识的范围和新鲜度。

知识库检索,是基于实体识别结果,在问题所属领域(例如旅游领域)的本地知识库中进行检索,检索到与实体识别结果相关的多条知识文本,作为初始检索结果。根据实体识别结果和各知识文本之间的相似度(记为第一相似度),在这些知识文本中确定出至少一个知识文本,作为目标检索结果。

网络检索,是基于实体识别结果,利用网络检索插件在网络(例如旅游攻略网站、游记平台的网页,以及旅游应用程序(Application,简称APP))中进行检索,检索到与实体识别结果相关的多条网络结果,作为初始检索结果。根据实体识别结果和各网络结果之间的相似度(记为第一相似度),在这些网络结果中确定出至少一个网络结果,作为目标检索结果。

本领域技术人员可以理解,为减少计算量,提高效率,可以在初始检索结果中选择出排序靠前的、设定数量(例如10条)的初始检索结果,进行后续的相似判断。

此处需要说明的是,本地知识库中存储的可以是知识文本对应的向量,即知识向量。可以将问题所属领域的知识文本,通过词嵌入的方式转换为知识向量,存储至本地知识库的向量数据库中。

相应的,在网络中检索到与实体识别结果相关的多条网络结果后,可以将网络结果通过文本转向量算法转换为网络向量,进行后续的相似判断。

此处需要说明的是,获取到与实体识别结果最相似的知识向量和/或网络向量后,需将知识向量和/或网络向量通过向量转文本算法转换为文本形式,作为目标检索结果。

S104,根据问题和目标检索结果生成拼接文本。

在本申请实施例中,可以采用字符串拼接的方式,将步骤S101获取的问题和步骤S103获取的目标检索结果进行文本拼接,生成拼接文本。例如,问题为“介绍一下迪士尼”,目标检索结果为“迪士尼公司,全称‘沃尔特-迪士尼公司’(The Walt Disney Company),是全球最大的媒体和娱乐集团之一,总部位于美国加利福尼亚州的伯班克”,则生成的拼接文本为“介绍一下迪士尼,迪士尼公司,全称‘沃尔特-迪士尼公司’(The Walt DisneyCompany),是全球最大的媒体和娱乐集团之一,总部位于美国加利福尼亚州的伯班克”。

S105,将拼接文本输入至大语言模型中,得到问题的答案。

在本申请实施例中,将拼接文本输入至大语言模型中,得到大语言模型输出的问题的答案。大语言模型将输入的拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案,并输出该答案。

例如,输入的拼接文本为“介绍一下迪士尼,迪士尼公司,全称‘沃尔特-迪士尼公司’(The Walt Disney Company),是全球最大的媒体和娱乐集团之一,总部位于美国加利福尼亚州的伯班克”,输出的问题的答案为“迪士尼公司,全名为沃尔特-迪士尼公司(TheWalt Disney Company),是全球最大的媒体和娱乐集团之一,总部位于美国加利福尼亚州的伯班克。迪士尼公司成立于1923年,由沃尔特·迪士尼和罗伊·奥利·迪士尼兄弟创立,起初是一家动画制作公司。随着时间的推移,迪士尼逐渐发展成一个综合性媒体和娱乐帝国,涵盖了电影制作、电视广播、主题公园、出版、音乐、消费品和数字媒体等多个领域”。

综上,本申请实施例的问答方法,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。

图2为本申请的另一个实施例提供的一种问答方法的流程示意图。如图2所示,在图1所示实施例的基础上,本申请实施例的问答方法具体可包括以下步骤:

S201,获取待应答的问题。

在本申请实施例中,步骤S201与上述实施例中的步骤S101相同,此处不再赘述。

上述实施例中的步骤S102“获取问题对应的实体识别结果”,具体可包括以下步骤S202-S204。

S202,对问题进行文本纠错处理。

在本申请实施例中,考虑到用户输入的问题可能存在错别字、语法错误等,为保证输入的问题文本的正确性,可以利用文本纠错算法对问题进行文本纠错处理。例如,问题为“我明天去要上海迪士尼完,你快点告诉我”,文本纠错处理后为“我明天要去上海迪士尼玩,你快点告诉我”。

另外,为更好的分析问题的意图,还可以使用问句改写技术将问句形式的问题转换为陈述句形式的问题,例如,问题为“我明天要去上海迪士尼玩,你快点告诉我(问号)”,转换为陈述句形式为“我明天要去上海迪士尼玩,你快点告诉我。”。

S203,对问题进行分词处理,得到分词结果。

在本申请实施例中,可以采用基于词典的分词方法、基于统计模型的分词方法,以及规则方法和统计方法相结合的分词方法等,对纠错后的问题进行分词处理,得到分词结果。例如,问题为“我明天要去上海迪士尼玩,你快点告诉我”,分词处理后的分词结果为“我/明天/要/去/上海/迪士尼/玩/,/你/快点/告诉/我”。

S204,提取分词结果中的关键词。

在本申请实施例中,关键词,即问题中能体现该问题核心内容的一个或多个词语,也可以称为核心词。例如,分词结果为“我/明天/要/去/上海/迪士尼/玩/,/你/快点/告诉/我”,提取的关键词为“上海、迪士尼、快点”。

S205,对关键词进行实体识别,得到实体识别结果。

在本申请实施例中,可以基于知识图谱等,获取关键词对应的实体识别结果。知识图谱中包括多个实体和实体之间的关系,可以根据关键词,在知识图谱中进行检索,获取关键词对应的实体,并根据关键词和对应的实体生成实体识别结果。例如,关键词为“上海、迪士尼、快点”,对应的实体为“地名、景点”,根据关键词和对应的实体生成的实体识别结果为“[上海]地名、[迪士尼]景点”。

S206,根据实体识别结果在问题所属领域的本地知识库和/或网络中进行检索。

在本申请实施例中,步骤S206与上述实施例中的步骤S103中的部分步骤相同,此处不再赘述。

上述实施例中的步骤S103中的“根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果”,具体可包括以下步骤S207-S208。

S207,计算实体识别结果和初始检索结果之间的第一相似度。

在本申请实施例中,可以分别计算实体识别结果和各初始检索结果之间的相似度,记为第一相似度。第一相似度具体可以为余弦相似度等。例如,实体识别结果为“[上海]地名、[迪士尼]景点”,在向量数据库中检索到的初始检索结果为“【鸟巢相关信息】、【上海外滩相关信息】、【上海迪士尼相关信息】”,分别计算实体识别结果和上述三个检索结果之间的余弦相似度为0.1、0.6和0.9。

S208,将第一相似度最高的初始检索结果,确定为目标检索结果。

在本申请实施例中,根据步骤S207计算得到的各初始检索结果的第一相似度,判断哪个初始检索结果的第一相似度最高,并将该第一相似度最高的初始检索结果确定为目标检索结果。

例如,初始检索结果“【鸟巢相关信息】、【上海外滩相关信息】和【上海迪士尼相关信息】”,对应的第一相似度分别为0.1、0.6和0.9,则将第一相似度为0.9的初始检索结果【上海迪士尼相关信息】,确定为目标检索结果。

当上述两种检索方法(知识库检索和网络检索)均采用时,也即当初始检索结果中包括知识库初始检索结果和网络初始检索结果,目标检索结果中包括知识库目标检索结果和网络目标检索结果时,上述实施例中的步骤S104中的“根据问题和目标检索结果生成拼接文本”,具体可包括以下步骤S209-S211。

S209,计算知识库目标检索结果和网络目标检索结果之间的第二相似度。

在本申请实施例中,两种检索方法分别确定出各自对应的目标检索结果,即知识库目标检索结果和网络目标检索结果。为消除不同来源知识的冗余,提升知识的丰富性,可以计算知识库目标检索结果和网络目标检索结果之间的相似度,记为第二相似度,保留相对独立的知识内容,避免信息重复和过度相似。

S210,根据第二相似度,对知识库目标检索结果和网络目标检索结果进行筛选,得到筛选结果。

在本申请实施例中,可以根据用户需求预先设置相似度阈值。如果确定第二相似度小于相似度阈值,则认为两种目标检索结果重复度不高,因此可以保留这两种目标检索结果,即将知识库目标检索结果和网络目标检索结果都确定为筛选结果。如果确定第二相似度等于或者大于相似度阈值,则认为两种目标检索结果重复度过高,因此将知识库目标检索结果和网络目标检索结果中的任意一个,确定为筛选结果,将另一个目标检索结果舍弃。

S211,对问题和筛选结果进行拼接,得到拼接文本。

在本申请实施例中,步骤S211与上述实施例中的步骤S104类似,此处不再赘述。

此处需要说明的是,这里用于进行拼接的问题是步骤S201获取的纠错前的问题,不是步骤S202得到的纠错后的问题。

S212,将拼接文本输入至大语言模型中,得到问题的答案。

在本申请实施例中,步骤S212与上述实施例中的步骤S105相同,此处不再赘述。

综上,本申请实施例的问答方法,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。通过计算第一相似度,可以在检索结果中确定出与实体识别结果最相似的目标检索结果。通过计算第二相似度,可以确定两种目标检索结果的重复程度,进而根据相似度阈值确定采用这两种目标检索结果中的一种或两种,以过滤相似知识,保留相对独立的知识内容,避免信息重复或过度相似。通过对问题进行分词处理,提取分词结果中的关键词,对关键词进行实体识别得到实体识别结果,可以准确的实现对问题的语义解析。对问题进行文本纠错处理,可以保证问题的准确性。

为清楚说明本申请实施例的问答方法,下面结合图3对本申请实施例的问答方法的整体流程进行详细描述。如图3所示,本申请实施例的问答方法具体包括以下步骤:获取用户输入的问题,对问题进行预处理,以获取问题对应的实体识别结果,根据实体识别结果分别在问题所属领域的本地知识库和网络中进行检索,并分别确定出初始检索结果中的目标检索结果,对两种目标检索结果进行知识融合处理,以根据两种目标检索结果之间的相似度在两种目标检索结果中进行筛选,得到筛选结果,对问题和筛选结果进行拼接,得到拼接文本,将拼接文本输入至大语言模型LLM中,得到LLM输出的问题的答案。

图4为本申请一个实施例提供的一种问答装置的结构示意图。如图4所示,本申请实施例的问答装置400,具体可包括:获取模块401、检索模块402、筛选模块403、第一生成模块404和第二生成模块405。其中:

获取模块401,用于获取待应答的问题对应的实体识别结果。

检索模块402,用于根据实体识别结果在问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果。

筛选模块403,用于根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果。

第一生成模块404,用于根据问题和目标检索结果生成拼接文本。

第二生成模块405,用于将拼接文本输入至大语言模型中,得到问题的答案,其中,大语言模型用于将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的答案。

在本申请实施例中,本申请实施例的问答装置中各模块、单元实现其功能的具体过程可参见上述问答方法实施例中的相关描述,此处不再赘述。

综上,本申请实施例的问答装置,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。

图5为本申请另一个实施例提供的一种问答装置的结构示意图。如图5所示,在图4所示实施例的基础上,本申请实施例的问答装置400中,筛选模块403进一步包括:计算单元501和确定单元502。其中:

计算单元501,用于计算实体识别结果和初始检索结果之间的第一相似度。

确定单元502,用于将第一相似度最高的初始检索结果,确定为目标检索结果。

在本申请实施例一种可行的实施方式中,初始检索结果包括知识库初始检索结果和网络初始检索结果,目标检索结果包括知识库目标检索结果和网络目标检索结果;第一生成模块404进一步用于:计算知识库目标检索结果和网络目标检索结果之间的第二相似度;根据第二相似度,对知识库目标检索结果和网络目标检索结果进行筛选,得到筛选结果;对问题和筛选结果进行拼接,得到拼接文本。

在本申请实施例一种可行的实施方式中,第一生成模块404进一步用于:若确定第二相似度小于预设的相似度阈值,则将知识库目标检索结果和网络目标检索结果,确定为筛选结果;若确定第二相似度等于或者大于相似度阈值,则将知识库目标检索结果和网络目标检索结果中的任意一个,确定为筛选结果。

在本申请实施例一种可行的实施方式中,检索模块402还用于:在根据实体识别结果在本地知识库中进行检索之前,将问题所属领域的知识文本,通过词嵌入的方式转换为知识向量,存储至本地知识库中。

在本申请实施例一种可行的实施方式中,获取模块401进一步用于:对问题进行分词处理,得到分词结果;提取分词结果中的关键词;对关键词进行实体识别,得到实体识别结果。

在本申请实施例一种可行的实施方式中,获取模块401进一步用于:在对问题进行分词处理之前,对问题进行文本纠错处理。

在本申请实施例中,本申请实施例的问答装置中各模块、单元实现其功能的具体过程可参见上述问答方法实施例中的相关描述,此处不再赘述。

综上,本申请实施例的问答装置,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。通过计算第一相似度,可以在初始检索结果中确定出与实体识别结果最相似的目标检索结果。通过计算第二相似度,可以确定两种目标检索结果的重复程度,进而根据相似度阈值确定采用这两种目标检索结果中的一种或两种,以过滤相似知识,保留相对独立的知识内容,避免信息重复或过度相似。通过对问题进行分词处理,提取分词结果中的关键词,对关键词进行实体识别得到实体识别结果,可以准确的实现对问题的语义解析。对问题进行文本纠错处理,可以保证问题的准确性。

本申请实施例还提供一种电子设备。如图6所示,该电子设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器601和存储器602,存储器602中可以存储有一个或一个以上存储应用程序或数据。其中,存储器602可以是短暂存储或持久存储。存储在存储器602的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对电子设备600中的一系列计算机可执行指令。更进一步地,处理器601可以设置为与存储器602通信,在电子设备600上执行存储器602中的一系列计算机可执行指令。电子设备600还可以包括一个或一个以上电源603,一个或一个以上有线或无线网络接口604,一个或一个以上输入输出接口605,一个或一个以上键盘606。

具体在本实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:

获取待应答的问题对应的实体识别结果;

根据实体识别结果在问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果;

根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果;

根据问题和目标检索结果生成拼接文本;

将拼接文本输入至大语言模型中,得到问题的答案,其中,大语言模型用于对拼接文本将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的答案。

本申请实施例的电子设备,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。

本申请实施例还提出了一种可读存储介质,该可读存储介质上存储有一个或多个计算机程序,该一个或多个计算机程序包括指令,该程序或指令被包括多个应用程序的电子设备中的处理器执行时,能够使该电子设备中的处理器执行上述问答方法实施例的各个过程,并具体用于执行:

获取待应答的问题对应的实体识别结果;

根据实体识别结果在问题所属领域的本地知识库和/或网络中进行检索,得到初始检索结果;

根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果;

根据问题和目标检索结果生成拼接文本;

将拼接文本输入至大语言模型中,得到问题的答案,其中,大语言模型用于将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的答案。

本申请实施例的可读存储介质,根据问题对应的实体识别结果,在问题所属领域的本地知识库和/或网络中进行检索,并根据根据实体识别结果和初始检索结果之间的第一相似度,从初始检索结果中筛选出目标检索结果,根据目标检索结果和该问题生成拼接文本,将拼接文本输入至大语言模型中,大语言模型将拼接文本映射为第一向量,根据第一向量生成第二向量,将第二向量映射为文本形式的问题的答案。本申请实施例在利用大语言模型生成问题的答案前,根据问题对应的实体识别结果在所属领域的本地知识库和/或网络中进行检索,并根据初始检索结果中的目标检索结果和该问题生成拼接文本,使得输入大语言模型的拼接文本中涵盖了来自所属领域的本地知识库和/或网络中的专业知识,进而使得大语言模型基于专业知识输出的答案更准确。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

技术分类

06120116522508