导航：首页> 测量；测试>由电子设备执行的方法及相关设备

由电子设备执行的方法及相关设备

文献发布时间：2024-04-18 19:58:21

技术领域

本申请涉及人工智能技术领域，具体而言，本申请涉及一种由电子设备执行的方法及相关设备。

背景技术

随着人工智能技术的发展，基于知识图谱的自然语言问答(Knowledge graphbased question answering，KBQA)系统已广泛应用于各种智能设备中。

然而，由于知识库的资源不足，KBQA系统的应答准确率和召回率低。

发明内容

本申请实施例提供了由电子设备执行的方法及相关设备，可以解决KBQA系统的应答准确率和召回率低的问题。所述技术方案如下：

第一方面，本申请实施例提供了一种由电子设备执行的方法，该方法包括：

获取目标问题中的第一实体；

基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体；

基于所述第二实体确定所述目标问题的答案。

第二方面，本申请实施例提供了一种由电子设备执行的装置，包括：

第一实体获取模块，用于获取目标问题中的第一实体；

第二实体获取模块，用于基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体；

确定模块，用于基于所述第二实体确定所述目标问题的答案。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括存储器、处理器及存储在存储器上的计算机程序，所述处理器执行所述计算机程序以实现上述由电子设备执行的方法的步骤。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述由电子设备执行的方法步骤。

第五方面，本申请实施例提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述由电子设备执行的方法的步骤。

本申请实施例提供的技术方案带来的有益效果是：

本申请提供一种由电子设备执行的方法，具体地，在获取到目标问题的第一实体后，通过与第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体，继而采用第二实体确定目标问题的答案；也即可以采用资源充足的其他语言知识库回答本地语言知识库无法支持的问题，解决由于知识库资源不足所导致的应答准确率和召回率低的问题；其中，还利用知识库中实体共现的方式来确定最终用于确定答案的第二实体，有利于提高应答准确率。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1为KBQA系统的结构示意图；

图2为本申请实施例提供的一种由电子设备执行的方法的执行步骤流程示意图；

图3为本申请实施例提供的一种由电子设备执行的方法的整体流程示意图；

图4为本申请实施例提供的一种基于实体共现确定第二实体的流程示意图；

图5为本申请实施例提供的一种基于实体共现确定第二实体的示例；

图6为本申请实施例提供的一种采用问题解析器进行问题解析的流程示意图；

图7为本申请实施例提供的一种采用基于描述的实体编码器进行编码的流程示意图；

图8为本申请实施例提供的一种采用基于图的实体编码器进行编码的流程示意图；

图9为本申请实施例提供的一种由电子设备执行的装置的结构示意图；

图10为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合本申请中的附图描述本申请的实施例。应理解，下面结合附图所阐述的实施方式，是用于解释本申请实施例的技术方案的示例性描述，对本申请实施例的技术方案不构成限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请实施例所使用的术语“包括”以及“包含”是指相应特征可以实现为所呈现的特征、信息、数据、步骤、操作、元件和/或组件，但不排除实现为本技术领域所支持其他特征、信息、数据、步骤、操作、元件、组件和/或它们的组合等。应该理解，当我们称一个元件被“连接”或“耦接”到另一元件时，该一个元件可以直接连接或耦接到另一元件，也可以指该一个元件和另一元件通过中间元件建立连接关系。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的术语“和/或”指示该术语所限定的项目中的至少一个，例如“A和/或B”可以实现为“A”，或者实现为“B”，或者实现为“A和B”。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请涉及人工智能技术领域，人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。

具体地，本申请可以涉及自然语言处理(Nature Language processing,NLP)，自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

具体地，本申请实施例针对基于知识图谱的自然语言问答(Knowledge graphbased question answering，KBQA)系统中存在的技术问题进行改进。其中，如图1所示，KBQA系统在针对使用对象提出的问题进行处理时，KBQA引擎(问答引擎)首先解析问题，而后答案引擎查询知识库查找到与问题对应的答案。

在相关技术中，为解决KBQA系统中知识库资源不足，导致应答准确率和召回率低的问题，采用机器翻译的方法实现跨语言的问答，如针对韩语问题，采用机器翻译为英语后，采用英语知识库检索答案。然而，相关技术所采用的机器翻译方法依赖于机器翻译的性能，机器翻译容易导致实体翻译错误，并且很难链接到正确的实体，继而导致应答的准确率低。另外，采用机器翻译的方法实现跨语言问答时，所采用的跨语言知识是通过知识对齐和手动验证的方式构建的，也即需要人工将两种或多种语言的知识库中的每个同义词条对应起来，在针对百万词条级别的大规模知识库进行处理时，需要耗费大量的时间和人力成本，且该方法不容易快速地将本地语言转换为其他语言。

针对相关技术中所存在的上述至少一个技术问题或需要改善的地方，本申请提出一种由电子设备执行的方法、装置、电子设备、计算机可读存储介质以及计算机程序产品，具体地，本申请可以利用知识库中跨语言实体的实体共现关系确定第二实体，在解决知识库资源不足问题的同时，避免了机器翻译造成的错误，有利于提供应答的准确率。

下面通过对几个示例性实施方式的描述，对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是，下述实施方式之间可以相互参考、借鉴或结合，对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等，不再重复描述。

图2示出了本申请实施例提供的一种由电子设备执行的方法的流程示意图，该方法可以由任一电子设备执行，如可以是终端，也可以是服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载设备等。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器，但并不局限于此。

具体地，本申请实施例中提供了一种由电子设备执行的方法，该方法可以应用于知识问答场景；具体地，可以使用第二知识库来补充第一知识库来回答使用对象的问题，例如，使用英语知识库来补充韩语知识库，继而回答韩语问题。其中，跨语言链接是NLP的核心技术。如图2所示，该方法包括以下步骤S101-步骤S103：

步骤S101：获取目标问题中的第一实体。

具体地，目标问题可以是使用对象输入的问题，如用户使用智能终端的语音助手时，通过语音输入的问题(如：老虎是属于猫科动物吗？)；又如用户使用智能音箱时，通过语音输入的问题(如：拉布拉多属于大型犬还是中型犬？)等；目标问题还可以是智能平台内部分析得出的待解决问题，如在直播场景中，通过图像识别技术识别出直播内容画面所出现的问题；适应于不同的应用场景，目标问题可以是不同的内容。

其中，第一实体可以是采用文本实体提取的方式针对目标问题提取得到的实体。具体地，可以针对给定的一个问题语句，通过如图3所示的信息丰富的问题解析器获得查询元组<实体e，实体类型t>；例如：针对一个韩语问题语句，获得查询元组<

步骤S102：基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体。

其中，共现关系(co-occurrence)可以理解为共同出现的关系，如针对文本的分词结果为：a-b-c、b-a-f、a-d-c，则其中a和b共现2次，a和c共现2次。

其中，如图3所示，在针对韩语问题时，预设的知识库可以包括韩语知识库和英语知识库，也即，此时预设的知识库中包括韩语和英语。可选地，预设的知识库中还可以包括其他语言的知识库，本申请实施例对此不做限制，可以根据实际需求作调整。可选地，知识库中可以存储有多种资源，如百科页面、论文等。

其中，第二实体可以是在预设的知识库中，基于与第一实体的共现关系获取的实体。关于第二实体的具体获取步骤将在后续实施例中说明。

步骤S103：基于所述第二实体确定所述目标问题的答案。

具体地，可以基于跨语言链接处理所得的第二实体确定目标问题的答案。

本申请实施例可以采用资源充足的其他语言知识库回答本地语言知识库无法支持的问题，解决由于知识库资源不足所导致的应答准确率和召回率低的问题；其中，还可以利用知识库中实体共现的方式来确定最终用于确定答案的第二实体，可以避免机器翻译带来的错误，有利于提高应答准确率。

下面针对本申请实施例中获取第二实体的具体过程进行说明。

如图3所示，本申请实施例中可以通过所提供的基于实体共现的实体候选生成(Entity Co-occurrence based Entity Candidate Generation)模块获取第二实体。

在一可行的实施例中，所述预设的知识库包括与所述目标问题的语言相同的第一知识库(可以是本地语言知识库)，以及与所述目标问题的语言不同的第二知识库(可以是跨语言知识库)。

以图3所示为例，当目标问题为韩语问题时，第一知识库可以是韩语知识库，相对而言，英语知识库的资源较韩语知识库多，因此，可以考虑采用英语知识库为第二知识库，以通过英语知识库补充回答韩语知识库无法支持的问题。图3所示内容仅为一种示例，当目标问题为德语问题时，第一知识库即为德语知识库，而第二知识库可以是中文知识库、英语知识库等的其他至少一个知识库。

具体地，在步骤S102中基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体，包括以下步骤A1-步骤A3：

步骤A1：在所述第一知识库中基于所述第一实体获取第一共现实体。

步骤A2：在所述第二知识库中基于所述第一共现实体获取第二共现实体。

步骤A3：在所述第一共现实体和所述第二共现实体中获取第二实体。

具体地，在基于第一实体在预设的知识库中获取第二实体时，首先在第一知识库中基于与第一实体的共现关系获取第一共现实体，也即第一共现实体是从第一知识库中获取的实体，如目标问题为韩语时，第一实体为语言属于韩语的实体，相应地，第一知识库为韩语知识库，而第一共现实体为语言属于韩语的实体；继而，在第二知识库中基于第一共现实体获取第二共现实体，如第二知识库为英语知识库时，第二共现实体为语言属于英语的实体；在执行步骤A1和步骤A2后，获取到第一共现实体和第二共现实体，此时可以以第一共现实体与第二共现实体所包括的所有实体为候选实体集，继而在该集合中选择至少一个第二实体。

其中，第一共现实体为基于第一实体直接确定的实体；第二共现实体为在第一实体确定第一共现实体后，基于第一共现实体确定的实体；因此，第一共现实体可以视为一阶共现实体，第二共现实体可以视为二阶共现实体。

在一可行的实施例中，在步骤A1中在所述第一知识库中基于所述第一实体获取第一共现实体，包括以下步骤A11-步骤A12：

步骤A11：在所述第一知识库中获取包括所述第一实体的第一页面。

具体地，如图4所示，可以通过现代信息检索(IR)技术(如：BM25算法)，高效地查询第一知识库(如：目标问题为韩语问题时，第一知识库可以是与韩语相关的百科)中提到实体e的第一页面(可以通过检索技术对第一知识库的所有页面内容进行查询，包含实体e的页面即可确定为第一页面)。

步骤A12：基于所述第一页面中包括的实体确定第一共现实体，如将所述第一页面中包括的实体确定为第一共现实体。

具体地，可以将第一页面中包括的所有实体确定为第一共现实体，也即第一共现实体属于与第一实体共现在同一页面的实体。

可选地，预设的知识库可以是已对页面中的各项实体进行标记后的知识库，也即可以标记出各实体的类型等，在此基础上，当通过步骤A11获取到第一页面后，可以将第一页面中与第一实体的标记相同的实体确定为第一共现实体；可选地，第一共现实体可以包括第一实体。

在一可行的实施例中，在步骤A2中在所述第二知识库中基于所述第一共现实体获取第二共现实体，包括以下步骤A21-步骤A22：

步骤A21：在所述第二知识库中获取与所述第一共现实体存在跨语言链接的连接关系的第二页面。

具体地，可以通过检索技术(如：BM25算法)在第二知识库中检索跨语言页面，也即第二页面(第二知识库中对应的目标语言可以是预先设定的，如可以是应用较为广泛的语种，如图3所示，第二知识库可以包括与英语相关的页面)；第二页面由第一共现实体通过跨语言链接连接而得，如图4所示，通过第一页面中的第一共现实体与第二页面中的实体之间的跨语言链接，得到第二页面。其中，一个第一共现实体可以通过跨语言链接连接至少一个第二页面，不同的第一共现实体也可以通过跨语言连接连接至同一个第二页面。

步骤A22：基于所述第二页面中包括的实体确定第二共现实体，如将所述第二页面中包括的实体确定为第二共现实体。

具体地，可以确定第二页面中包括的所有实体为第二共现实体。其中，第二共现实体为基于第一实体间接或直接获得的实体，如第一共现实体为第一实体时，所获得的第二共现实体属于基于第一实体跨语言链接链接得到的第二页面中的实体，也即基于第一实体直接获得的实体；而当第一共现实体为非第一实体，而是属于基于第一实体所在第一页面的实体时，第二共现实体属于基于第一实体间接获得的实体。

可选地，预设的知识库可以是已对页面中的各项实体进行标记后的知识库，也即可以标记出各实体的类型等，在此基础上，当通过步骤A21获取到第二页面后，可以将第二页面中与第一共现实体的标记相同的实体确定为第二共现实体。

在一可行的实施例中，考虑到计算量的问题，本申请实施例还设置过滤模块，以通过减少实体的数量减少计算量。具体地，可以将第一共现实体和第二共现实体一并输入类型过滤模块，过滤掉明显不准确的实体来减少系统的计算量。例如，将输入的实体过滤为剩余预设的数量个第二实体，可以减少一定的不必要计算。下面针对共现实体的过滤处理进行说明。

具体地，在步骤A3中在所述第一共现实体和所述第二共现实体中获取第二实体，包括以下步骤A31-步骤A33中的至少一项：

步骤A31：将所述第一共现实体和所述第二共现实体确定为第二实体。

具体地，可以将所有第一共现实体和第二共现实体构成的集合作为最终的第二实体的集合。

步骤A32：基于所述第一共现实体在所处页面中与所述第一实体的距离，与所述第二共现实体在所处页面中与所述第一共现实体的距离，确定各所述第一共现实体与各所述第二共现实体的优先级；获取优先级最高的第一预设数量个第一共现实体和/或第二共现实体作为第二实体；其中，距离越近，优先级越高。

具体地，提供了一种基于距离的过滤策略，按照与查询实体(如第一实体、第一共现实体)在页面中出现的位置的距离确定共现实体(如第一共现实体、第二共现实体)的优先级，保留最高优先级的若干共现实体，作为最终的第二实体的集合。

其中，在第一页面中，以第一实体为基准计算其他第一共现实体与第一实体的距离；在第二页面中，以第一共现实体为基准计算第二共现实体与第一共现实体的距离；继而，以计算所得的距离确定各第一共现实体与各第二共现实体的优先级，在此基础上，可以选择优先级最高的第一预设数量个(如30个)实体(可能是第一共现实体、也可能是第二共现实体)作为第二实体。其中，计算所得的距离越近，优先级越高。

可选地，在确定优先级时，可以将第一共现实体与第二共现实体各自对应的距离确定后，将以第一共现实体与第二共现实体视为一个整体(如候选共现实体集合)，确定该集合里面各共现实体的优先级。可选地，考虑到第二共现实体是通过跨语言链接得到的，可以在确定优先级时，设置第一共现实体与第二共现实体所分别对应的距离系数；如第一共现实体的距离系数设置为A，第二共现实体的距离系数为B(A+B＝1)，在此基础上，确定优先级时，可以基于第一共现实体与第一实体之间的距离与距离系数A的乘积，以及第二共现实体与第一共现实体之间的距离与距离系数B的乘积确定。

步骤A33：统计所述第一共现实体与所述第二共现实体的总的共现实体数量；若所述共现实体数量小于或等于基于时延要求预设的目标数量，则将所述第一共现实体和所述第二共现实体确定为第二实体；若所述共现实体数量大于所述目标数量，则基于实体类型的置信度在所述第一共现实体和所述第二共现实体中获取第二实体。

具体地，可以基于共现实体的数量设置自适应策略；该自适应策略可以根据对系统时延的要求设定目标数量，例如设定为30，当共现实体数量(如第一共现实体包括6个，第二共现实体包括17个时)不超过目标数量时，不做过滤处理，也即将所有的第一共现实体与所有的第二共现实体均作为第二实体；当共现实体数量超过目标数量时，执行过滤处理，以减少最终确定的第二实体的数量，降低时延。

其中，在执行过滤处理时，类型过滤模块可以自适应地降序选择高置信度分类类型，直至总的置信度分值(各所选类型的置信度得分相加而得)超过预设分值；如果某个实体的标签类型不在所选类型中，则可以将其删除，剩下的实体构成最终的第二实体。如图4所示，“小说家”、“演员”、“艺术家”类别的总置信度得分为92％，超过预设分值90％，则只保留共现实体中有此3类类型中至少一个的共现实体，作为最终的第二实体。其中，各实体类型的置信度可以由图3所示的信息丰富的问题解析器输出，也即在通过步骤S101获取第一实体时，可以同步获取各实体的类型及该类型对应的置信度得分；其中，置信度得分也即执行分类输出的类别概率值。其中，如图4所示，所有的第二实体构成最终实体候选集合。

下面结合图5对确定第二实体的过程进行举例说明：用户提问“卡瓦科·席尔瓦何时成为葡萄牙总理？”，由问题解析器解析得到实体为“卡瓦科·席尔瓦”，类型为“人名”，首先查询本地语言(韩语)的知识库，发现不存在对应实体的信息，而且缺失第二知识库的对齐关系。因此，可以通过基于实体共现的方式进行查询。首先通过检索算法(如：BM25算法)获得“卡瓦科·席尔瓦”在第一知识库中被提及的第一页面，如图5中获取的韩语的“古特里安”实体页面，此页面中的所有实体均构成第一共现实体，“古特里安”即为其中的一个第一共现实体，通过这个第一共现实体，利用知识库中存在的链接，连接到“古特里安”在跨语言(英语)知识库中的对应页面(第二页面)，此页面中的所有实体构成第二共现实体，其中就包含了“卡瓦科·席尔瓦”对应的跨语言实体“Anibal Cavaco Silva”。将所有第一共现实体和第二共现实体通过过滤模块进行过滤以减少明显错误的第二实体，过滤时可以保留属于人名的实体。过滤后留下的实体构成最终的第二实体，其中包含了正确的跨语言实体“Anibal Cavaco Silva”。

本申请实施例提出的基于实体共现的实体候选生成模块中确定第二实体的方法利用实体共现和预设的知识库中的跨语言链接，找到其他语言中的对应实体(第二共现实体)，该方法的处理无需通过知识对齐和人工验证来构建额外的第二知识库，也避免了机器翻译和翻译错误。

在本申请实施例中，考虑到在相关技术中，为解决语义理解只依赖于简短的问题文本容易造成错误的语义理解的问题，所采用的检索方法完全依赖于检索到的词，其无法支持语义相同但实体名称不同的实体(例如“U盘”、“优盘”和“随身碟”指同一实体，但字面表示不同，可能造成模型无法分辨句子中提到的这些词是否为同一实体)的问题，本申请实施例提供的跨语言知识问答模型还包括信息丰富的问题解析器(Information-richQuestion Parser,IRQA)和信息丰富的跨语言实体链接(Information-rich Cross-lingual Entity Linking)模块。

下面将针对信息丰富的问题解析器的具体实施过程进行说明。

在一可行的实施例中，步骤S101中获取目标问题中的第一实体，包括以下步骤B1-步骤B4：

步骤B1：获取目标问题中的第一实体。

步骤B2：获取第二预设数量个与所述第一实体相关的第一实体句子。

步骤B3：编码所述第一实体句子得到第一句子表征。

步骤B4：基于所述第一句子表征确定所述第一实体的实体类型。

具体地，如图6所示，可以首先通过实体检测模块获取输入的目标问题中包括的第一实体，假设获取到词语M(例如：

在一可行的实施例中，在步骤B3中编码所述第一实体句子得到第一句子表征，包括以下步骤B31：

针对每一第一实体句子进行编码操作：提取该第一实体句子的词元表征，以该第一实体句子中的第一实体为中心划分该第一实体句子为包括位于第一实体之前的前部分、第一实体、以及位于第一实体之后的后部分的三个部分，基于划分后的三个部分与相应的词元表征确定第一句子表征。

具体地，如图6所示，可以采用卷积神经网络的实体提及编码器对各第一实体句子进行卷积操作；图6中，包括三个第一实体句子，则可以采用卷积神经网络分别针对三个第一实体句子进行卷积处理。其中，通过卷积操作后，可以提取出与第一实体句子相应的词元表征。

继而，在针对第一实体句子进行卷积操作后，针对卷积后的第一实体句子可以进行池化操作得到该第一实体句子的实体感知的句子表征。具体地，以第一实体为中心分别对位于第一实体之前的前部分、第一实体、和位于第一实体之后的后部分进行池化操作(如图6所示，将一个第一实体句子的词元表征分为三个部分，虚线框所示的三个部分)，并将三部分的池化结果向量拼接，得到该第一实体句子相应的表示{r1，r2，…，rk}，可以称为实体感知的句子表征(第一句子表征)；例如：

在一可行的实施例中，在步骤B4中基于所述第一句子表征确定所述第一实体的实体类型，包括以下步骤B41-步骤B42：

步骤B41：通过句子选择性注意力机制，基于所述第一实体和所述第一句子表征确定上下文感知的实体表征。

具体地，考虑到检索到的K个第一实体句子可能并不都是相关的，因此可以通过如图6所示的句子选择性注意力机制来选择和融合第一句子表征(如图6所示，将三个第一句子表征采用句子选择性注意力机制融合为统一的上下文感知的实体表征)。

其中，句子选择性注意力机制是一种多头注意力操作，多头注意力机制中的查询向量、键向量、值向量分别替换为实体向量、实体感知的第一句子表征、实体感知的第一句子表征，多头注意力输出的注意力向量为增强的实体表征，称为上下文感知的实体表征。

步骤B42：基于所述上下文感知的实体表征进行分类，确定所述第一实体的实体类型，或确定所述第一实体的实体类型和该实体类型的置信度。

具体地，如图6所示，可以将上下文感知的实体表征输入问题解析器的分类层(分类层可以采用1层全连接网络结构)，生成实体类型。例如：

下面将针对信息丰富的跨语言实体链接模块的具体实施过程进行说明。

具体地，信息丰富的跨语言实体链接模块的输入是一个第二实体，输出的是对该第二实体的语义编码向量。本申请实施例提供的信息丰富的跨语言实体链接模块在于语义编码过程中融合了文本描述和知识描述的信息，提高语义表征的准确性。

在一可行的实施例中，在步骤S103中基于所述第二实体确定所述目标问题的答案，包括步骤C1-步骤C2：

步骤C1：编码所述第二实体，得到文本实体表征和/或基于图的实体表征。

步骤C2：基于所述文本实体表征和/或基于图的实体表征，确定所述目标问题的答案。

如图7和图8所示，信息丰富的跨语言实体链接模块中的实体表征网络由两部分组成：基于描述的实体编码器和基于图的实体编码器。这两个编码器分别对第二实体的文本描述和知识描述进行编码，最终输出的实体表征可以由文本实体表征和基于图的实体表征拼接得到，也可以是由文本实体表征或基于图的实体表征得到。如图3所示，在得到信息丰富的跨语言实体链接模块输出的目标实体(基于第二实体确定的实体表征)后，可以基于该目标实体确定目标问题的答案。

可选地，如图3所示，考虑到基于目标实体所生成的答案的语言可能是非目标问题所属语言的，因此，还可以对步骤C2中基于目标实体生成的答案进行翻译，以得到与目标问题所采用语言相同的答案。

在一可行的实施例中，在步骤C1中编码所述第二实体得到文本实体表征，包括以下步骤C11-步骤C12：

步骤C11：在所述第二实体所在知识库对应的描述信息中，获取包括所述第二实体的第二实体句子。

具体地，可以从第二实体所在知识库(可能是第一知识库，也可能是第二知识库)的描述文档(描述信息)中提取提及实体的第二实体句子。考虑到描述信息的量不大，提取时可以进行简单的关键词匹配处理即可得到第二实体句子。描述信息通常包含第二实体的一些基本和关键的信息，从描述信息中获取的第二实体句子对于第二实体的语义理解有极大帮助。

步骤C12：编码所述第二实体句子得到文本实体表征。

其中，可以编码第二实体句子得到第二句子表征后，基于第二句子表征确定文本实体表征。

其中，编码第二实体句子得到第二句子表征包括：针对每一第二实体句子进行编码操作：提取该第二实体句子的词元表征，以该第二实体句子中的第二实体为中心划分该第二实体句子为包括位于第二实体之前的前部分、第二实体、位于第二实体之后的后部分的三个部分，基于划分后的三个部分与相应的词元表征确定第二句子表征。

可选地，步骤C12中编码第二实体句子得到第二句子表征的具体实施过程，可以参考上述实施例中步骤B3编码第一实体句子得到第一句子表征的相关内容。

具体地，如图7所示，每个第二实体句子可以输入到以第二实体为中心的卷积神经网络(实体提及编码器)中，以获得每个第二实体句子的表征(词元表征)。如图7所示，可以对每个第二实体句子进行卷积操作，并针对卷积后的第二实体句子以第二实体为中心分别对位于第二实体之前的前部分、第二实体、和位于第二实体之后的后部分进行池化操作(可以是最大池化操作)，最终将三个部分(如图7虚线框所示的三个部分)的池化结果向量拼接，得到第二实体句子相应的表示{r1，r2，…，rk}，称为实体感知的第二句子表征。继而，如图7所示，针对得到的第二句子表征可以通过池化操作(如最大池化操作)对所有的第二句子表征进行合并，并将最终得到的向量作为文本实体表征。

在一可行的实施例中，在步骤C1中编码所述第二实体得到基于图的实体表征，包括以下步骤C14-步骤C15：

步骤C14：针对所述第二实体所在知识库对应的知识图谱中的所述第二实体、与所述第二实体连接的邻居实体、所述第二实体与所述邻居实体连接的关系类型信息进行编码，得到各编码对象对应的表征向量。

具体地，如图8所示，可以使用字符级的卷积神经网络(编码模型)，得到知识图谱子图中实体的名称和关系类型的表征向量；即将第二实体所在知识库(可能是第一知识库，也可能是第二知识库，图8所示的为英语知识库)对应的知识图谱中第二实体、第二实体连接的邻居实体、第二实体与邻居实体连接的关系类型的文本输入到字符级的卷积神经网络中，为每一个编码对象确定相应的一个表征向量。

步骤C15：将所述第二实体所在知识库对应的知识图谱的拓扑结构信息编码至所述表征向量，得到基于图的实体表征。

具体地，如图8所示，在得到各编码对象相应的表征向量后，可以将各表征向量输入到图神经网络(GCN网络)中，该图神经网络可以用于对图进行编码。图神经网络可以将知识图谱的拓步结构信息编码到每一个实体及关系的表征向量，因此在步骤C15的处理中，第二实体获得了知识图谱对其的知识描述信息，可以增强第二实体的语义表征准确性。其中，图神经网络的输出为第二实体的基于图的实体表征。

为更好地说明本申请实施例提供的由电子设备执行的方法所能带来的有益效果，下面给出表1和表2所示的实验数据结果。

表1中英文跨语言KBQA的表现

表2在韩语和英语之间的跨语言KBQA表现

具体地，表1和表2显示了跨语言KBQA系统的性能，而本申请实施例提供的改进的KBQA可以带来下述各项效果：

(1)提供的信息丰富的问题解析器提高了实体类型的判别准确性，得到更准确的实体类型，以对于后续模块的实体比较和过滤有增益效果。

(2)提供的基于实体共现的实体候选生成模块的处理可以有效避免了机器翻译错误导致的无法找到跨语言实体的问题，此模块对整体系统增益具有较为明显的效果，跨语言实体的命中率可以提高10％以上。

(3)提供的信息丰富的跨语言实体链接模块提高了跨语言实体链接的准确率，系统的F1指标显著增加15+％，该数据可以说明系统的实体的语义理解更加准确。

其中，A->B，意为采用A语言知识库补充B语言知识库来回答B语言的问题；如韩语->英语，意思是用韩语知识库补充英语知识库来回答英语问题。

表1和表2中的数值越高，所表征的性能越好。正确率表示答案精确匹配的准确性。F1表示预测答案和正确答案之间的重叠程度。Hits@1和Hits@10表示在排名前1和前10的实体列表中，正确预测的比例。

本申请实施例提供了一种由电子设备执行的装置，如图9所示，该由电子设备执行的装置100可以包括：第一实体获取模块101、第二实体获取模块102和确定模块103。

其中，第一实体获取模块101，用于获取目标问题中的第一实体；第二实体获取模块102，用于基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体；确定模块103，用于基于所述第二实体确定所述目标问题的答案。

在一可行的实施例中，所述预设的知识库包括与所述目标问题的语言相同的第一知识库，以及与所述目标问题的语言不同的第二知识库；第二实体获取模块102在用于执行基于与所述第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体时，具体用于：

在所述第一知识库中基于所述第一实体获取第一共现实体；

在所述第二知识库中基于所述第一共现实体获取第二共现实体；

在所述第一共现实体和所述第二共现实体中获取第二实体。

在一可行的实施例中，第二实体获取模块102在用于执行在所述第一知识库中基于所述第一实体获取第一共现实体时，具体用于：

在所述第一知识库中获取包括所述第一实体的第一页面；

基于所述第一页面中包括的实体确定第一共现实体。

在一可行的实施例中，第二实体获取模块102在用于执行在所述第二知识库中基于所述第一共现实体获取第二共现实体时，具体用于：

在所述第二知识库中获取与所述第一共现实体存在跨语言链接的连接关系的第二页面；

基于所述第二页面中包括的实体确定第二共现实体。

在一可行的实施例中，第二实体获取模块102在用于执行在所述第一共现实体和所述第二共现实体中获取第二实体时，具体用于以下至少一项：

将所述第一共现实体和所述第二共现实体确定为第二实体；

基于所述第一共现实体在所处页面中与所述第一实体的距离，与所述第二共现实体在所处页面中与所述第一共现实体的距离，确定各所述第一共现实体与各所述第二共现实体的优先级；获取优先级最高的第一预设数量个第一共现实体和/或第二共现实体作为第二实体；其中，距离越近，优先级越高；

统计所述第一共现实体与所述第二共现实体的总的共现实体数量；若所述共现实体数量小于或等于基于时延要求预设的目标数量，则将所述第一共现实体和所述第二共现实体确定为第二实体；若所述共现实体数量大于所述目标数量，则基于实体类型的置信度在所述第一共现实体和所述第二共现实体中获取第二实体。

在一可行的实施例中，第一实体获取模块101在用于执行获取目标问题中的第一实体时，具体用于：

获取目标问题中的第一实体；

获取第二预设数量个与所述第一实体相关的第一实体句子；

编码所述第一实体句子得到第一句子表征；

基于所述第一句子表征确定所述第一实体的实体类型。

在一可行的实施例中，第一实体获取模块101在用于执行编码所述第一实体句子得到第一句子表征时，具体用于：

在一可行的实施例中，第一实体获取模块101在用于执行基于所述第一句子表征确定所述第一实体的实体类型时，具体用于：

通过句子选择性注意力机制，基于所述第一实体和所述第一句子表征确定上下文感知的实体表征；

基于所述上下文感知的实体表征进行分类，确定所述第一实体的实体类型，或确定所述第一实体的实体类型和该实体类型的置信度。

在一可行的实施例中，确定模块103在用于执行基于所述第二实体确定所述目标问题的答案时，具体用于：

编码所述第二实体，得到文本实体表征和/或基于图的实体表征；

基于所述文本实体表征和/或基于图的实体表征，确定所述目标问题的答案。

在一可行的实施例中，确定模块103在用于执行编码所述第二实体得到文本实体表征时，具体用于：

在所述第二实体所在知识库对应的描述信息中，获取包括所述第二实体的第二实体句子；

编码所述第二实体句子得到文本实体表征。

在一可行的实施例中，确定模块103在用于执行编码所述第二实体句子得到文本实体表征时，具体用于：编码第二实体句子得到第二句子表征后，基于第二句子表征确定文本实体表征。

在一可行的实施例中，确定模块103在用于执行编码第二实体句子得到第二句子表征时，具体用于：针对每一第二实体句子进行编码操作：提取该第二实体句子的词元表征，以该第二实体句子中的第二实体为中心划分该第二实体句子为包括位于第二实体之前的前部分、第二实体、位于第二实体之后的后部分的三个部分，基于划分后的三个部分与相应的词元表征确定第二句子表征。

在一可行的实施例中，确定模块103在用于执行编码所述第二实体得到基于图的实体表征时，具体用于：

针对所述第二实体所在知识库对应的知识图谱中的所述第二实体、与所述第二实体连接的邻居实体、所述第二实体与所述邻居实体连接的关系类型信息进行编码，得到各编码对象对应的表征向量；

将所述第二实体所在知识库对应的知识图谱的拓扑结构信息编码至所述表征向量，得到基于图的实体表征。

本申请实施例的装置可执行本申请实施例所提供的方法，其实现原理相类似，本申请各实施例的装置中的各模块所执行的动作是与本申请各实施例的方法中的步骤相对应的，对于装置的各模块的详细功能描述具体可以参见前文中所示的对应方法中的描述，此处不再赘述。

本申请实施例中提供了一种电子设备，包括存储器、处理器及存储在存储器上的计算机程序，该处理器执行上述计算机程序以实现由电子设备执行的方法的步骤，与相关技术相比可实现：在获取到目标问题的第一实体后，通过与第一实体的共现关系，在包括至少两种语言的预设的知识库中获取第二实体，继而采用第二实体确定目标问题的答案；也即可以采用资源充足的其他语言知识库回答本地语言知识库无法支持的问题，解决由于知识库资源不足所导致的应答准确率和召回率低的问题；其中，还利用知识库中实体共现的方式来确定最终用于确定答案的第二实体，有利于提高应答准确率。

在一个可选实施例中提供了一种电子设备，如图10所示，图10所示的电子设备4000包括：处理器4001和存储器4003。其中，处理器4001和存储器4003相连，如通过总线4002相连。可选地，电子设备4000还可以包括收发器4004，收发器4004可以用于该电子设备与其他电子设备之间的数据交互，如数据的发送和/或数据的接收等。需要说明的是，实际应用中收发器4004不限于一个，该电子设备4000的结构并不构成对本申请实施例的限定。

处理器4001可以是CPU(Central Processing Unit，中央处理器)，通用处理器，DSP(Digital Signal Processor，数据信号处理器)，ASIC(Application SpecificIntegrated Circuit，专用集成电路)，FPGA(Field Programmable Gate Array，现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器4001也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线4002可包括一通路，在上述组件之间传送信息。总线4002可以是PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture，扩展工业标准结构)总线等。总线4002可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器4003可以是ROM(Read Only Memory，只读存储器)或可存储静态信息和指令的其他类型的静态存储设备，RAM(Random Access Memory，随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM(Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器)、CD-ROM(Compact DiscRead Only Memory，只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质、其他磁存储设备、或者能够用于携带或存储计算机程序并能够由计算机读取的任何其他介质，在此不做限定。

存储器4003用于存储执行本申请实施例的计算机程序，并由处理器4001来控制执行。处理器4001用于执行存储器4003中存储的计算机程序，以实现前述方法实施例所示的步骤。

该处理器可以包括一个或多个处理器。此时，该一个或多个处理器可以是通用处理器，(例如中央处理单元(CPU)、应用处理器(AP)等)、或者是纯图形处理单元，(例如，图形处理单元(GPU)、视觉处理单元(VPU)、和/或AI专用处理器，(例如，神经处理单元(NPU))。

该一个或多个处理器根据存储在非易失性存储器和易失性存储器中的预定义的操作规则或人工智能(AI)模型来控制对输入数据的处理。通过训练或学习来提供预定义的操作规则或人工智能模型。

这里，通过学习来提供指的是通过将学习算法应用于多个学习数据来得到预定义的操作规则或具有期望特性的AI模型。该学习可以在其中执行根据实施例的AI的装置本身中执行，和/或可以通过单独的服务器/系统来实现。

该AI模型可以由包含多个神经网络层组成。每一层具有多个权重值，一个层的计算是通过前一层的计算结果和当前层的多个权重来执行的。神经网络的示例包括但不限于卷积神经网络(CNN)、深度神经网络(DNN)、循环神经网络(RNN)、受限玻尔兹曼机(RBM)、深度信念网络(DBN)、双向循环深度神经网络(BRDNN)、生成对抗网络(GAN)、以及深度Q网络。

学习算法是一种使用多个学习数据训练预定目标装置(例如，机器人)以使得、允许或控制目标装置进行确定或预测的方法。该学习算法的示例包括但不限于监督学习、无监督学习、半监督学习、或强化学习。

本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。

本申请实施例还提供了一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时可实现前述方法实施例的步骤及相应内容。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”、“1”、“2”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除图示或文字描述以外的顺序实施。

应该理解的是，虽然本申请实施例的流程图中通过箭头指示各个操作步骤，但是这些步骤的实施顺序并不受限于箭头所指示的顺序。除非本文中有明确的说明，否则在本申请实施例的一些实施场景中，各流程图中的实施步骤可以按照需求以其他的顺序执行。此外，各流程图中的部分或全部步骤基于实际的实施场景，可以包括多个子步骤或者多个阶段。这些子步骤或者阶段中的部分或全部可以在同一时刻被执行，这些子步骤或者阶段中的每个子步骤或者阶段也可以分别在不同的时刻被执行。在执行时刻不同的场景下，这些子步骤或者阶段的执行顺序可以根据需求灵活配置，本申请实施例对此不限制。

以上所述仅是本申请部分实施场景的可选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请的方案技术构思的前提下，采用基于本申请技术思想的其他类似实施手段，同样属于本申请实施例的保护范畴。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京三星通信技术研究有限公司;三星电子株式会社;

上一篇：一种环流过压识别方法、装置、可读存储介质及电动汽车
下一篇：一种人体红外测温距离补偿方法及装置