掌桥专利:专业的专利平台
掌桥专利
首页

一种问句答案生成方法、装置、设备及存储介质

文献发布时间:2024-04-18 19:58:26


一种问句答案生成方法、装置、设备及存储介质

技术领域

本发明涉及计算机技术领域,特别涉及一种问句答案生成方法、装置、设备及存储介质。

背景技术

思维链是一种离散式提示学习,更具体地,是指大模型下的上下文学习。即,不进行训练,将例子添加到当前样本输入的前面,让模型一次输入这些文本进行输出完成任务。目标是赋予语言模型产生一个类似的思维链的能力——一系列连贯的短句子,从而得出一个推理问题的答案。如果在语言模型的范例中提供了思维链推理的演示,那么足够大的语言模型可以生成思维链。

目前思维链在大模型的运用包括由研究者们提出的自洽性方法,通过思维链提示从语言模型中采样一组不同的推理路径,然后返回其中最自洽的答案。其中,自学习推理机的技术依赖于一个简单的循环:生成基本原理以回答许多问题,并提供一些基本原理示例;如果生成的答案是错误的,将再次尝试在给出正确答案的情况下生成理由;对最终得出正确答案进行微调。现有思维链技术都是通过再模型网络结构的构建上适配思维链,以提高模型的效果。但是对于思维链构建上,依旧是采用了传统手工标注的方案,因此需要消耗大量的人力物力。因此,如何降低思维链构建所需消耗的人力物力成本是当前需要解决的。

发明内容

有鉴于此,本发明的目的在于提供一种问句答案生成方法、装置、设备及存储介质,能够降低思维链构建所需消耗的人力物力成本。其具体方案如下:

第一方面,本申请公开了一种问句答案生成方法,包括:

基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;

对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;

基于预设大模型和所述思维链确定所述目标问句的问句答案。

可选的,所述基于预设知识图谱中的三元组确定若干抽象查询图,包括:

将预设知识图谱中的各节点以及与各所述节点相连的关联节点进行组合,以得到若干抽象查询图。

可选的,所述从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图之前,还包括:

通过预设命名实体识别方法对所述目标问句进行识别以得到所述目标问句中的各实体。

可选的,所述从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图,包括:

利用预设规则检索方法和预设相似度计算方法从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图。

可选的,所述对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链,包括:

将所述目标问句中的各所述实体分别对应的若干目标抽象查询图进行拼接,以得到各所述实体分别对应的子思维链;

将所有所述实体分别对应的子思维链进行拼接以得到所述目标问句对应的思维链。

可选的,所述基于预设大模型和所述思维链确定所述目标问句的问句答案,包括:

将所述目标问句和所述思维链输入至预设大模型以得到处理后大模型,并利用所述处理后大模型对所述目标问句和所述思维链之间的关系进行学习,以确定所述目标问句的问句答案。

第二方面,本申请公开了一种问句答案生成装置,包括:

抽象查询图确定模块,用于基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;

思维链生成模块,用于对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;

答案生成模块,用于基于预设大模型和所述思维链确定所述目标问句的问句答案。

可选的,所述思维链生成模块,包括:

子思维链确定单元,用于将所述目标问句中的各所述实体分别对应的若干目标抽象查询图进行拼接,以得到各所述实体分别对应的子思维链;

子思维链拼接单元,用于将所有所述实体分别对应的子思维链进行拼接以得到所述目标问句对应的思维链。

第三方面,本申请公开了一种电子设备,包括:

存储器,用于保存计算机程序;

处理器,用于执行所述计算机程序以实现前述的问句答案生成方法。

第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的问句答案生成方法。

可见,本申请中,首先基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;基于预设大模型和所述思维链确定所述目标问句的问句答案。即,通过对预设知识图谱中的三元组进行提取,以得到所述预设知识图谱中包含的若干抽象查询图,然后针对目标问句中的实体,建立所述实体与所述抽象查询图之间的映射关系,以从所述若干抽象查询图中确定所述实体对应的目标抽象查询图;将所述目标问句中所有实体对应的所有目标抽象查询图进行拼接以得到所述目标问句对应的思维链。最后将所述思维链输入至预设大模型中,使得大模型对所述目标问句和所述思维链进行学习,输出所述目标问句对应的问句答案。这样一来,通过建立目标问句中各实体和若干抽象查询图之间的映射关系,进而得到所述目标问句对应的思维链。进而,解决了传统思维链需要手工标注而消耗大量人力物力的问题。同时,通过建立目标问句中各实体和若干抽象查询图之间的映射关系也在一定程度上减少了由于人员操作疏忽导致思维链标注出现错误情况的出现,进而提供了问句答案生成的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请公开的一种问句答案生成方法流程图;

图2为本申请公开的一种具体的问句答案生成方法流程图;

图3为本申请公开的一种具体的问句答案生成方法流程图;

图4为本申请公开的一种问句答案生成装置结构示意图;

图5为本申请公开的一种电子设备结构图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

现有思维链技术都是通过再模型网络结构的构建上适配思维链,以提高模型的效果。但是对于思维链构建上,依旧是采用了传统手工标注的方案,因此需要消耗大量的人力物力。本实施例将具体介绍一种采用基于知识图谱生成思维链进而得到问句答案的方法。

参见图1所示,本申请实施例公开了一种问句答案生成方法,包括:

步骤S11:基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图。

本实施例中,所述基于预设知识图谱中的三元组确定若干抽象查询图,包括:将预设知识图谱中的各节点以及与各所述节点相连的关联节点进行组合,以得到若干抽象查询图。知识图谱可以看作是头实体-关系-尾实体/属性的三元组的三元组集合。即,针对知识图谱上的每一个节点,将该节点相关联的节点组成一个抽象查询图,其中边代表两个节点之间的关系。查询图是自然语言问题的结构化表示。理论上来说,抽象查询图是有向图,但是在现实数据集中,抽象查询图通常是包括n个节点和n-1条边的树结构。抽象查询图的节点包括实体、实体类型、实体类型、属性等,边包括关系或者一些内置的属性,如下表1,显示了节点和边的详细分类。

表1查询图中节点和边的详细分类

本实施例中,所述从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图之前,还包括:通过预设命名实体识别方法对所述目标问句进行识别以得到所述目标问句中的各实体。即,采用预设命名实体识别方法对所述目标问句中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等进行识别,主要过程包括先基于所述实体的符号进行实体边界识别,然后确定实体类别进而确定所述目标问句中各实体。所述从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图,包括:利用预设规则检索方法和预设相似度计算方法从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图。即,利用计算机通用的预设规则检索方法对若干抽象查询图进行检索,所述预设规则检索方法包括并不限于布尔逻辑检索、短语检索和截词检索等方法。然后,将检索到的若干抽象查询图与所述实体进行相似度的比较,基于比较结果,确定所述目标问句中各实体对应的目标抽象查询图。其中,所述预设相似度计算方法包括并不限于余弦相似度计算方法、杰卡德相似度计算方法。

步骤S12:对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链。

本实施例中,对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链。即,将目标问句中所有抽象查询图,按照相同实体进行拼接。换句话说,就是将所述目标问句中所包含所有实体所在的查询图拼接作为一条思维链。这样一来,通过建立目标问句中各实体和若干抽象查询图之间的映射关系,进而得到所述目标问句对应的思维链。这样一来,解决了传统思维链需要手工标注而消耗大量人力物力的问题。

步骤S13:基于预设大模型和所述思维链确定所述目标问句的问句答案。

本实施例中,所述基于预设大模型和所述思维链确定所述目标问句的问句答案,包括:将所述目标问句和所述思维链输入至预设大模型以得到处理后大模型,并利用所述处理后大模型对所述目标问句和所述思维链之间的关系进行学习,以确定所述目标问句的问句答案。即,将对话问句和抽象查询图所构建出的思维链输入到预设大模型,有由预训练好的预设大模型学习其问句和思维链之间的关系。最终可获得问句答案。因为抽象查询图所包含的三元组和问句具有密切关系,所输出的答案也包含在抽象查询查询图中,因此采用预设大模型重在学习对话问句通过思维链到答案的关系。其中所述预设大模型为语言模型。

可见,本实施例中,如图2所示,首先基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;基于预设大模型和所述思维链确定所述目标问句的问句答案。即,通过对预设知识图谱中的三元组进行提取,以得到所述预设知识图谱中包含的若干抽象查询图,然后针对目标问句中的实体,建立所述实体与所述抽象查询图之间的映射关系,以从所述若干抽象查询图中确定所述实体对应的目标抽象查询图;将所述目标问句中所有实体对应的所有目标抽象查询图进行拼接以得到所述目标问句对应的思维链。最后将所述思维链(promote)输入至预设大模型中,使得大模型对所述目标问句和所述思维链进行学习,输出所述目标问句对应的问句答案。这样一来,通过建立目标问句中各实体和若干抽象查询图之间的映射关系,进而得到所述目标问句对应的思维链。进而,解决了传统思维链需要手工标注而消耗大量人力物力的问题。同时,通过建立目标问句中各实体和若干抽象查询图之间的映射关系也在一定程度上减少了由于人员操作疏忽导致思维链标注出现错误情况的出现,进而提供了问句答案生成的准确度。

上述实施例具体介绍了一种采用基于知识图谱生成思维链进而得到问句答案的方法,本实施例将对生成思维链的过程进行具体介绍。

参见图3所示,本申请实施例公开了一种具体的问句答案生成方法,包括:

步骤S21:基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图。

步骤S22:将所述目标问句中的各所述实体分别对应的若干目标抽象查询图进行拼接,以得到各所述实体分别对应的子思维链。

本实施例中,由于知识图谱中存在多种不同的关系,单个实体可能会对应多个抽象查询图。因此对于句子每一个实体,采用预设规则检索方法和预设相似度计算方法,确定该实体与之对应的抽象查询图。

步骤S23:将所有所述实体分别对应的子思维链进行拼接以得到所述目标问句对应的思维链。

本实施例中,将所有所述实体分别对应的子思维链进行拼接以得到所述目标问句对应的思维链。假设知识图谱中可以构建m个抽象关系图。其中问句Q包含k个实体,即:Q={S

步骤S24:基于预设大模型和所述思维链确定所述目标问句的问句答案。

其中,关于上述步骤S21和S24的具体过程可以参考前述实施例公开的相应内容,在此不再进行赘述。

可见,本实施例中,通过建立目标问句中各实体和若干抽象查询图之间的映射关系,进而得到所述目标问句对应的思维链。进而,解决了传统思维链需要手工标注而消耗大量人力物力的问题。同时,通过建立目标问句中各实体和若干抽象查询图之间的映射关系也在一定程度上减少了由于人员操作疏忽导致思维链标注出现错误情况的出现,进而提供了问句答案生成的准确度。

参考图4所述,本申请实施例还相应公开了一种问句答案生成装置,包括:

抽象查询图确定模块11,用于基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;

思维链生成模块12,用于对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;

答案生成模块13,用于基于预设大模型和所述思维链确定所述目标问句的问句答案。

可见,本实施例中,首先基于预设知识图谱中的三元组确定若干抽象查询图,并从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图;对所述目标问句中所有所述实体对应的目标抽象查询图进行拼接以得到所述目标问句对应的思维链;基于预设大模型和所述思维链确定所述目标问句的问句答案。即,通过对预设知识图谱中的三元组进行提取,以得到所述预设知识图谱中包含的若干抽象查询图,然后针对目标问句中的实体,建立所述实体与所述抽象查询图之间的映射关系,以从所述若干抽象查询图中确定所述实体对应的目标抽象查询图;将所述目标问句中所有实体对应的所有目标抽象查询图进行拼接以得到所述目标问句对应的思维链。最后将所述思维链输入至预设大模型中,使得大模型对所述目标问句和所述思维链进行学习,输出所述目标问句对应的问句答案。这样一来,通过建立目标问句中各实体和若干抽象查询图之间的映射关系,进而得到所述目标问句对应的思维链。进而,解决了传统思维链需要手工标注而消耗大量人力物力的问题。同时,通过建立目标问句中各实体和若干抽象查询图之间的映射关系也在一定程度上减少了由于人员操作疏忽导致思维链标注出现错误情况的出现,进而提供了问句答案生成的准确度。

在一些具体的实施例中,所述思维链生成模块12,具体可以包括:

子思维链确定单元,用于将所述目标问句中的各所述实体分别对应的若干目标抽象查询图进行拼接,以得到各所述实体分别对应的子思维链;

子思维链拼接单元,用于将所有所述实体分别对应的子思维链进行拼接以得到所述目标问句对应的思维链。

在一些具体的实施例中,所述抽象查询图确定模块11,具体可以包括:

节点提取单元,用于将预设知识图谱中的各节点以及与各所述节点相连的关联节点进行组合,以得到若干抽象查询图。

在一些具体的实施例中,所述问句答案生成装置,还可以包括:

实体提取模块,用于通过预设命名实体识别方法对所述目标问句进行识别以得到所述目标问句中的各实体。

在一些具体的实施例中,所述抽象查询图确定模块11,具体可以包括:

目标抽象查询图确定单元,用于利用预设规则检索方法和预设相似度计算方法从所述若干抽象查询图中确定目标问句中各实体对应的目标抽象查询图。

在一些具体的实施例中,所述答案生成模块13,具体可以包括:

模型学习单元,用于将所述目标问句和所述思维链输入至预设大模型以得到处理后大模型,并利用所述处理后大模型对所述目标问句和所述思维链之间的关系进行学习,以确定所述目标问句的问句答案。

进一步的,本申请实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本申请的使用范围的任何限制。

图5为本申请实施例提供的一种电子设备20的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的问句答案生成方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。

本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。

另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222等,存储方式可以是短暂存储或者永久存储。

其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,其可以是Windows Server、Netware、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的问句答案生成方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。

进一步的,本申请还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的问句答案生成方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的技术方案进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

相关技术
  • 一种APP的自动生成方法、装置、终端设备及可读存储介质
  • 一种三维水电预埋图的生成方法、装置、设备及存储介质
  • 一种图像生成方法、装置、设备和存储介质
  • 一种区块链ID生成及使用方法、装置、电子设备以及存储介质
  • 一种会话生成方法、装置、终端设备及存储介质
  • 用于获取问句答案的方法、装置、电子设备及可读存储介质
  • 一种知识图谱的问句生成方法、装置、设备和存储介质
技术分类

06120116491346