掌桥专利:专业的专利平台
掌桥专利
首页

应答信息生成方法、装置、设备及存储介质

文献发布时间:2023-06-19 09:36:59


应答信息生成方法、装置、设备及存储介质

技术领域

本发明是涉及数据处理技术领域,尤其涉及一种应答信息生成方法、装置、设备及存储介质。

背景技术

随着终端技术的不断发展,客服机器人被广泛应用在各个交易平台(例如,电商客服机器人)。但是,该技术在二手交易市场的应用还不是很成熟。

主要原因如下:(1)区别于其他交易平台,二手交易市场的卖家不是专业卖家,对商品数据库的构建不是很了解,且对其培训成本较高;(2)维护每个商品的数据库需要大量的时间,对于非专业卖家很难对数据库进行专业维护;(3)二手交易市场的卖家往往是抽空回复买家的问题,无法保证一直能在线和买家互动,买家如果收到回复时间过长,往往就会丧失进一步互动的意愿,降低买家的用户体验感。

发明内容

本发明一个或多个实施例描述了一种应答信息生成的方法、装置、设备及存储介质,用以解决在卖家为非专业卖家时,难以构建和维护回复买家问题的数据库,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

根据第一方面,提供了一种应答信息生成方法,该方法可以包括:

识别第一用户端发送问询信息中的意图属性;

从第二用户端针对问询信息回复的第一应答信息中,抽取与意图属性对应的属性值;

基于属性值和意图属性利用话术模板,生成第二应答信息。

根据第二方面,提供了一种构建数据库方法,该方法可以包括:

获取第一用户端发送的多个问询信息和第二用户端针对多个问询信息回复的多个第一应答信息;

利用如第一方面所示的应答信息生成方法,生成多个第二应答信息,以构建应答信息数据库。

根据第三方面,提供了一种获取应答信息的方法,该方法可以包括:

识别第一用户端发送的问询信息中的目标意图属性;

从如第二方面所示的应答信息数据库中,将与目标意图属性对应的第二应答信息作为问询信息的应答信息;

向第一用户端发送应答信息。

根据第四方面,提供了一种应答信息生成装置,该装置可以包括:

识别模块,用于识别第一用户端发送问询信息中的意图属性;

抽取模块,用于从第二用户端针对问询信息回复的第一应答信息中,抽取与意图属性对应的属性值;

处理模块,用于基于属性值和意图属性利用话术模板,生成第二应答信息。

根据第五方面,提供了一种构建数据库的装置,该装置可以包括:

获取模块,用于获取第一用户端发送的多个问询信息和第二用户端针对多个问询信息回复的多个第一应答信息;

生成装置,用于利用如第四方面所示的应答信息生成装置,生成多个第二应答信息,以构建应答信息数据库。

根据第六方面,提供了一种获取应答信息的装置,该装置可以包括:

识别模块,用于识别第一用户端发送的问询信息中的目标意图属性;

处理模块,用于从如第五方面所示的构建数据库的装置构建的应答信息中,将与目标意图属性对应的第二应答信息作为问询信息的应答信息;

收发模块,用于向第一用户端发送应答信息。

根据第七方面,提供了一种构建数据库的系统,其中,包括:

输入模块,用于将第一用户端发送的问询信息进行拆分,确定至少一个第一文本单词;

词向量模块,用于根据至少一个第一文本单词,生成至少一个第一文本单词中每个第一文本单词对应的词向量;

双向循环神经网络模块,用于基于每个第一文本单词对应的词向量,确定与每个第一文本单词对应的词向量对应的上下文向量;根据上下文向量和预设注意力向量,计算每个第一文本单词对应的概率值;以及,配置每个第一文本单词的权重值;

输出模块,用于根据每个第一文本单词对应的概率值和与每个第一文本单词的权重值,确定问询信息中的意图属性。

根据第八方面,提供了一种获取应答信息的系统,其中,包括:

输入模块,用于将第二用户端发送的第一应答信息进行拆分,确定至少一个第二文本单词;

词向量模块,用于根据至少一个第二文本单词,生成至少一个第二文本单词中每个第二本单词对应的词向量;

双向循环神经网络模块,用于基于每个第二文本单词对应的词向量,确定与每个第二文本单词对应的词向量对应的上下文向量;根据上下文向量和预设注意力向量,计算每个第二文本单词对应的概率值;以及,配置每个第二文本单词的权重值;

标签标注模块,用于根据每个第二文本单词对应的概率值和与每个第二文本单词的权重值,标记第二文本单词中属性值的开始部分和中间部分,以确定第二应答信息中属性值。根据第九方面,提供了一种计算设备,该设备包括至少一个处理器和存储器,存储器用于存储有计算机程序指令,处理器用于执行存储器的程序,以控制计算机设备实现如第一方面、第二方面或者第三方面任意一项所示的方法。

根据第十方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,若计算机程序在计算机中执行,则令计算机执行如第一方面、第二方面或者第三方面任意一项所示的方法。

本发明实施例中,能够将买家的问询信息和卖家针对该问询信息回复的应答信息,按照话术模板进行排布,得到应答信息,该应答信息有助于构建及补充相应的应答信息数据库。和目前由专业人员维护数据库相比,本发明实施例提供的方法能够自动构建应答信息数据库,一方面,对于卖家来说,降低了卖家回复问题的入门门槛,无需进行专业的培训,减少了时间和人工成本;另一方面,对于买家来说,解决在卖家为非专业卖家时,难以构建和维护回复买家问题的数据库,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

附图说明

从下面结合附图对本发明的具体实施方式的描述中可以更好地理解本发明其中,相同或相似的附图标记表示相同或相似的特征。

图1示出根据一个回复问询信息的结构示意图;

图2示出根据一个实施例的基于应答信息构建数据库的结构示意图;

图3示出根据一个实施例的应答信息生成方法的流程图;

图4示出根据一个实施例的确定话术模板的示意图;

图5示出根据一个实施例的构建应答信息数据库方法的流程图;

图6示出根据一个实施例的获取应答信息的方法的流程图;

图7示出了一个实施例的基于应答信息建立应答信息数据库的方法的结构框图;

图8示出了一种实施例的构建数据库的系统中第一模型的结构示意图;

图9示出了一种实施例的获取应答信息的系统中第二模型的结构示意图;

图10示出根据一个实施例的应答信息生成装置的结构框图;

图11示出根据一个实施例的构建应答信息数据库装置的结构框图;

图12示出根据一个实施例的获取应答信息的装置的结构框图;

图13示出根据一个实施例的计算设备的结构示意图。

具体实施方式

下面将详细描述本发明的各个方面的特征和示例性实施例,为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细描述。应理解,此处所描述的具体实施例仅被配置为解释本发明,并不被配置为限定本发明。对于本领域技术人员来说,本发明可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本发明的示例来提供对本发明更好的理解。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种测量的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

目前,如图1所示,在大多互联网交易平台中,可以通过客服机器人识别出买家的问询意图,并将与之对应的答案从商品数据库找到并反馈。在相关技术中,问询意图的识别方法已经很成熟,但是,商品数据库的构建过程却远远落后。一方面,二手市场的卖家大多为非专业卖家,难以构建和维护智能问答所需的数据库;这里,非专业卖家对商品数据库的构建不是很了解,如果进行相关培训,会浪费大量的人力物力,提高运营成本;另一方面,维护每个商品的数据库需要额外的时间,及时回复买家提问对于非专业卖家来说较为困难。

由此,为了解决上述技术问题,本发明实施例提供了一种应答信息生成方法、构建数据库的方法、获取应答信息的方法、装置、设备及存储介质,下面分别进行详细说明。

在说明本发明实施例提供的应答信息生成方法之前,介绍一下基于应答信息构建数据库的流程结构。

图2示出根据一个实施例的基于应答信息构建数据库的结构示意图。

如图2所示,接收第一用户端(例如:买家)发送的问询信息,并识别该问询信息中的意图属性。接收第二用户端(例如:卖家)针对该问询信息的第一应答信息,并在该第一应答信息中抽取与意图属性对应的属性值。将该意图信息和与其对应的属性值按照话术模板进行排布,生成第二应答信息。根据生成的多个第二应答信息构建应答信息数据库,以便在接收到买家发送的目标问询信息时,从应答信息数据库中找到与该目标问询信息对应的第二应答信息,并将与该目标问询信息对应的第二应答信息发送至买家,以实现自动回复买家提出的问题。

这里,除了上述自动回复买家提出的问题之外,本发明实施例还提供另一种可能的实例,即显示多个目标选项,以便卖家选择是利用发明实施例提供的应答信息生成方法,还是由卖家人为回复第一用户端发送的问询信息,具体如下所示:在接收第二用户端(例如:卖家)针对该问询信息的第一应答信息之前,还可以包括:第二用户端显示可选择的多个目标选项,其中,该目标选项可以包括:自动回复第一用户端发送的问询信息的选项(即选择通过本发明实施例提供的应答信息生成方法回复第一用户端发送的问询信息)和/或非自动回复第一用户端发送的问询信息的选项(例如:通过卖家人为回复问询信息)。

由此,通过该实例,一方面,以便于为卖家提供多种方式回复第一用户端发送的问询信息,提高本发明实施例提供的方法在实际应用中灵活度;另一方面,通过买家人为回复,可以提高回复问询信息的准确度,以提高用户体验感。

其中,除了上述涉及到的从卖家回答的第一应答信息中匹配答案,还可以在商品信息(例如:图片、视频、音频或者文字)中匹配答案,生成第二应答信息。

这里,在上述涉及到的第二应答信息中商品信息的部分出现变化时,可以在应答信息数据库中更新对应的第二应答信息。

例如:在第二应答信息包括“亲,A衬衫有黄色的10件”,且在A衬衫对应的属性从黄色的10件,更新为黄色的8件时,更新第二应答信息即将第二应答信息包括10件黄色的衬衫,修改为第二应答信息包括8件黄色的衬衫。

由此,本发明实施例提供的方法,能够将买家的问询信息和卖家针对该问询信息回复的应答信息,按照话术模板进行排布,得到应答信息,该应答信息有助于构建及补充相应的应答信息数据库。和目前由专业人员维护数据库相比,本发明实施例提供的方法能够自动构建应答信息数据库,一方面,对于卖家来说,降低了卖家回复问题的入门门槛,无需进行专业的培训,减少了时间和人工成本;另一方面,对于买家来说,解决在卖家为非专业卖家时,难以构建和维护回复买家问题的数据库,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

基于上述场景,本发明实施例具体结合附图3-附图6对本发明实施例提供的一种应答信息生成方法、构建数据库的方法、获取应答信息的方法分别进行详细描述。

图3示出根据一个实施例的应答信息生成方法的流程图。

如图3所示,该方法流程包括步骤310-步骤330:首先,步骤310,识别第一用户端(例如:买家)发送问询信息中的意图属性;其次,步骤320,从第二用户端(例如:卖家)针对问询信息回复的第一应答信息中,抽取与意图属性对应的属性值;然后,步骤330,基于属性值和意图属性利用话术模板,生成第二应答信息。

下面分别对上述步骤进行详细说明:

首先,涉及步骤310:其中,识别第一用户端发送问询信息中的意图属性,具体可以包括:根据问询信息中的多个第一文本单词,确定与多个第一文本单词中每个第一文本单词对应的上下文向量;基于上下文向量和预设注意力向量,得到每个第一文本单词的概率值;根据每个第一文本单词的概率值和与每个第一文本单词的预设权重值,确定问询信息中的意图属性。

这里,概率值用于表征每个第一文本单词的重要程度;其中,每个第一文本单词的重要程度与每个第一文本单词的预设权重值呈正比关系。

进一步地,本发明实施例可以采用两种方式根据每个第一文本单词的概率值和与每个第一文本单词的预设权重值,确定问询信息中的意图属性,下面分别进行说明:

方式一:根据每个第一文本单词的概率值与预设权重值,计算每个第一文本单词的初始权重值;在得到的多个第一文本单词的概率值中,选取概率值满足预设条件的关键概率值,并对关键概率值分配高于预设权重值的关键权重值;根据关键概率值和关键权重值,重新计算关键概率值对应的关键文本单词的权重值;其中,多个第一文本单词中包括关键文本单词;根据初始权重值和关键文本单词的权重值,确定问询信息中的意图属性。

例如:多个文本单词包括:第一文本单词A、第一文本单词B和第一文本单词C,第一文本单词A的概率值10%、第一文本单词B的概率值30%和第一文本单词C的概率值60%,预设权重值为0.1。此时,计算每个第一文本单词的初始权重值。接着,选取满足预设条件的关键概率值如第一文本单词C的概率值60%,并对该关键概率值分配高于预设权重值0.1的关键权重值(例如:在预设权重值的基础上累加0.1的权重值;或者,直接对该关键概率值分配0.2的关键权重值),这里,根据第一文本单词C的概率值60%和0.2的关键权重值重新计算第一文本单词C的权重值。

方式二:在得到的多个第一文本单词的概率值中,选取概率值满足预设条件的关键概率值和不满足预设条件的普通概率值;根据关键概率值和预设关键权重值,计算与关键概率值对应的权重值;以及,根据普通概率值和预设普通权重值,计算与普通概率值对应的权重值;其中,预设关键权重值大于普通权重值;根据关键概率值对应的权重值和普通概率值对应的权重值,确定问询信息中的意图属性;其中,每个第一文本单词的预设权重值包括预设关键权重值和预设普通权重值。

例如:多个文本单词包括:第一文本单词A、第一文本单词B和第一文本单词C,第一文本单词A的概率值10%、第一文本单词B的概率值30%和第一文本单词C的概率值60%。选取概率值满足预设条件的关键概率值(即第一文本单词C的概率值60%),以及不满足预设条件的普通概率值(即第一文本单词A的概率值10%、第一文本单词B的概率值30%)。这里,预设关键权重值包括0.2,预设普通权重值包括0.1,由此,根据第一文本单词C的概率值60%与预设关键权重值0.2,计算第一文本单词C的权重值;根据第一文本单词A的概率值10%、第一文本单词B的概率值30%与预设普通权重值0.1分别计算第一文本单词A和第一文本单词B的概率值。

需要注意的是,上述涉及到的预设权重值、关键权重值、预设关键权重值和预设普通权重值,除了上述涉及的仅分两类的情况下,还可以根据每个概率值占的百分比,分别分配不同的权重值。以方式二为例,第一文本单词A的概率值10%、第一文本单词B的概率值30%和第一文本单词C的概率值60%,可以对A概率值分配0.05的权重值,B概率值分配0.15的权重值,C概率值分配0.3的权重值。

其次,涉及步骤320:本发明实施例提供了2种可能的方式抽取与意图属性对应的属性值,具体如下所示:

方式一:根据第一应答信息中的多个第二文本单词,确定与多个第二文本单词中每个第二文本单词对应的上下文向量;根据每个第二文本单词对应的上下文向量,通过标签标注算法抽取与意图属性对应的属性值。

进一步地,标签标注算法包括:序列标注算法和/或BIO标签算法;其中,序列标注算法包括原始标注算法和/或联合标注算法。

方式二:从第一应答信息和与问询信息相关的产品描述信息中,抽取与意图属性对应的属性值。

然后,涉及步骤330:基于属性值和意图属性利用话术模板,生成第二应答信息。

其中,本发明实施例可以通过如下方法确定话术模板:

如图4所示,识别多个预设问询信息中每个预设问询信息的意图属性;从与每个预设问询信息对应的每个应答信息中抽取掉与意图属性对应的属性值;将抽取掉属性值之后的每个应答信息作为候选话术信息;根据候选话术信息确定话术模板。

例如:“亲,颜色没有红色,还有红蓝色和白色。”其中,属性值为“没有红色,还有红蓝色和白色”,将属性抽取,剩下的部分作为候选话术信息。

另外,可以按照使用话术模板的频次和/或话术模板的可读性,更新话术模板。

由此,本发明实施例中,能够将买家的问询信息和卖家针对该问询信息回复的应答信息,按照话术模板进行排布,得到应答信息,该应答信息有助于构建及补充相应的应答信息数据库。解决在卖家为非专业卖家时,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

这里,基于上述确定的多个第二应答信息,可以构建应答信息的数据库,以便用于在再次接受到问询信息时,可以通过应答信息数据库自动回复买家提出的问询问题,具体方法如下所示。

图5示出根据一个实施例的构建应答信息数据库方法的流程图。

如图5所示,该方法流程包括步骤510-步骤520:首先,步骤510,获取第一用户端发送的多个问询信息和第二用户端针对多个问询信息回复的多个第一应答信息;然后,步骤520,利用如图3所示的应答信息生成方法,生成多个第二应答信息,以构建应答信息数据库。

其中,该应答信息数据库可以包括:多个问询信息和分别与多个问询信息中每个问询信息对应的属性值,或者,第二应答信息。

进一步地,在应答信息数据库中仅包括多个问询信息和分别与多个问询信息中每个问询信息对应的属性值时,在回复第一用户端的询问信息时,可以将问询信息和每个问询信息对应的属性值按照话术模板排布,生成第二应答信息,再将该第二应答信息发送至第一用户端。

根据图5所示构建应答信息数据库的方式,下面介绍一下,该应答信息数据库如何使用,具体如下所示。

图6示出根据一个实施例的获取应答信息的方法的流程图。

如图6所示,该方法流程包括步骤610-步骤630:首先,步骤610:识别第一用户端发送的问询信息中的目标意图属性;其次,步骤620:从如图5所示的应答信息数据库中,将与目标意图属性对应的第二应答信息作为问询信息的应答信息;然后,步骤130:向第一用户端发送应答信息。

在一种实例中,在第二应答信息中涉及商品信息的部分(例如:产品相关的产品属性值包括:产品数量、产品颜色等)出现变化时可以自动更新第二应答信息,具体方法如下:

确定与问询信息相关的产品;从产品信息数据库中获取与产品相关的产品属性值;根据产品属性值更新第二应答信息。

综上,本发明实施例中,能够将买家的问询信息和卖家针对该问询信息回复的应答信息,按照话术模板进行排布,得到应答信息,该应答信息有助于构建及补充相应的应答信息数据库。和目前由专业人员维护数据库相比,本发明实施例提供的方法能够自动构建应答信息数据库,一方面,对于卖家来说,降低了卖家回复问题的入门门槛,无需进行专业的培训,减少了时间和人工成本;另一方面,对于买家来说,解决在卖家为非专业卖家时,难以构建和维护回复买家问题的数据库,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

为了便于理解,下面根据买家发送的问询问题(例如:这件衣服有什么颜色?)建立应答信息数据库为例,对本发明实施例提供的方法进行详细说明。

图7示出了一个实施例的基于应答信息建立应答信息数据库的方法的结构框图。

如图7所示,首先,步骤701:识别第一用户端(即买家)发送问询信息中的意图属性。

具体地,对于买家的询问问题,识别出相应的询问意图。例如:这件衣服有什么颜色?识别出颜色的意图。进一步地可以利用如图8所示的第一模型进行识别,具体如下所示:

(1)输入层,输入问询信息“这件衣服有什么颜色?”。该输入层用于将问询信息划分为多个第一文本单词即“这”、“件”、“衣服”、“有”、“什么”和“颜色”;并将划分之后的第一文本单词转换为数字形式,并输出多个以数字形式存在的第一文本单词。

(2)词向量层,输入多个以数字形式存在的第一文本单词,并根据多个以数字形式存在的第一文本单词,生成每个第一文本单词对应的词向量,输出多个词向量。

(3)双向循环神经网络层,包含BiLSTM(Bi-directional Long Short-TermMemory)部分和注意力机制部分。

其中,BiLSTM部分对词向量层输出的多个词向量处理,确定每个第一文本单词对应的上下文向量。根据多个上下文向量捕捉其中关键词信息和注意力机制部分中的预设注意力向量,计算每个第一文本单词对应的概率值。

例如“这件衣服有什么颜色?”会捕捉到“衣服”、“有”、“颜色”这些文本单词,并计算这些文本单词对应的概率值。

注意力机制部分,用于对每个关键词信息赋予权重,并对关键词赋予更多的权重值。

(4)输出层,根据双向循环神经网络层输出的每个第一文本单词对应的概率值和权重值,预测出问询信息中的意图属性。

其次,步骤702:从第二用户端针对问询信息回复的第一应答信息中,抽取与意图属性对应的属性值。

具体地,对于买家的询问问题,第二用户端(即卖家)针对问询信息回复的第一应答信息。

例如:买家:“这件衣服有什么颜色?”。卖家:“亲,没有红色,还有红蓝色和白色。”其中,“红蓝色和白色”可以为与意图属性对应的属性值。

进一步地可以利用如图9所示的第二模型进行抽取属性值,具体如下所示:

(1)输入层,输入第一应答信息“亲,没有红色,还有红蓝色和白色”。该输入层用于将第一应答信息划分为多个二文本单词即“没有”、“红色”、“有”、“红蓝色”和“白色”;并将划分之后的第二文本单词转换为数字形式,并输出多个以数字形式存在的第二文本单词。

(2)词向量层,输入多个以数字形式存在的第二文本单词,并根据多个以数字形式存在的第二文本单词,生成每个第二文本单词对应的词向量,输出多个词向量。

(3)双向循环神经网络层,包含BiLSTM(Bi-directional Long Short-TermMemory)部分和注意力机制部分。

其中,BiLSTM部分对词向量层输出的多个词向量处理,确定每个第二文本单词对应的上下文向量。根据多个上下文向量捕捉其中关键词信息和注意力机制部分中的预设注意力向量,并计算每个关键词信息对应的概率值。

例如,“亲,没有红色,还有红蓝色和白色”会捕捉到“红蓝色”和“白色”这些关键词,并计算这些关键词对应的概率值。

注意力机制部分,用于对每个关键词信息赋予权重,并对关键词赋予更多的权重值。

(4)CRF层,根据双向循环神经网络层输出的每个第二文本单词对应的概率值和权重值,通过CRF模型确定与意图属性对应的属性值。这里,可以使用最常见的BIO标签算法。

进一步地,其中B表示开始的部分,I表示中间的部分,O表示不需要的部分。CRF层能够自动学习连续单词间的转移关系,比如从B转移到I的概率和从B转移到O的概率是不一致的,这样对于“红蓝色”就会知道“红”是开始部分,“黄色”是中间部分,合在一起是完整的“红蓝色”部分。通过CRF层的输出可以从第一应答信息中得到与意图属性对应的属性值。

接着,步骤703,基于属性值和意图属性利用话术模板,生成第二应答信息。

具体地,根据预先定义的话术模板将意图属性和属性值填入,生成完整的答案,比如模版是“亲,【意图属性】有【属性值】”得到“亲,颜色有红蓝色和白色。”

这里,利用步骤701和702确定的意图属性和属性值生成回复内容即第二应答信息。采用话术模板以得到连续通顺有意义的答案信息。在这基础上,为了丰富生成文本的多样性,可以从历史数据中筛选出符合需求的文案制作成话术模板,例如:识别多个预设问询信息中每个预设问询信息的意图属性;从与每个预设问询信息对应的每个应答信息中抽取掉与意图属性对应的属性值;将抽取掉属性值之后的每个应答信息作为候选话术信息;根据候选话术信息确定话术模板。

在一种实例中,可以按照使用话术模板的频次和/或话术模板的可读性,更新话术模板。

然后,步骤704,根据多个第二应答信息,构建应答信息数据库,以使根据应答信息数据库回复下一次买家发送的问询信息。

由此,本发明实施例提供的方法,能够将买家的问询信息和卖家针对该问询信息回复的应答信息,按照话术模板进行排布,得到应答信息,该应答信息有助于构建及补充相应的应答信息数据库。和目前由专业人员维护数据库相比,本发明实施例提供的方法能够自动构建应答信息数据库,一方面,对于卖家来说,降低了卖家回复问题的入门门槛,无需进行专业的培训,减少了时间和人工成本;另一方面,对于买家来说,解决在卖家为非专业卖家时,难以构建和维护回复买家问题的数据库,导致无法及时回复买家提问,出现降低买家用户体验感的问题。

图10示出根据一个实施例的应答信息生成装置的结构框图。

如图10所示,该装置100可以包括:

识别模块1001,用于识别第一用户端发送问询信息中的意图属性;

抽取模块1002,用于从第二用户端针对问询信息回复的第一应答信息中,抽取与意图属性对应的属性值;

处理模块1003,用于基于属性值和意图属性利用话术模板,生成第二应答信息。

其中,本发明实施例中识别模块1001具体可以用于,根据问询信息中的多个第一文本单词,确定与多个第一文本单词中每个第一文本单词对应的上下文向量;基于上下文向量和预设注意力向量,得到每个第一文本单词的概率值;根据每个第一文本单词的概率值和与每个第一文本单词的预设权重值,确定问询信息中的意图属性。

这里,概率值用于表征每个第一文本单词的重要程度;其中,每个第一文本单词的重要程度与每个第一文本单词的预设权重值呈正比关系。

进一步地,本发明实施例中识别模块1001具体可以用于,根据每个第一文本单词的概率值与预设权重值,计算每个第一文本单词的初始权重值;

在得到的多个第一文本单词的概率值中,选取概率值满足预设条件的关键概率值,并对关键概率值分配高于预设权重值的关键权重值;根据关键概率值和关键权重值,重新计算关键概率值对应的关键文本单词的权重值;其中,多个第一文本单词中包括关键文本单词;根据初始权重值和关键文本单词的权重值,确定问询信息中的意图属性。

或者,识别模块1001具体可以用于,在得到的多个第一文本单词的概率值中,选取概率值满足预设条件的关键概率值和不满足预设条件的普通概率值;根据关键概率值和预设关键权重值,计算与关键概率值对应的权重值;以及,根据普通概率值和预设普通权重值,计算与普通概率值对应的权重值;其中,预设关键权重值大于普通权重值;根据关键概率值对应的权重值和普通概率值对应的权重值,确定问询信息中的意图属性;其中,每个第一文本单词的预设权重值包括预设关键权重值和预设普通权重值。

其中,本发明实施例中抽取模块1002具体可以用于,根据第一应答信息中的多个第二文本单词,确定与多个第二文本单词中每个第二文本单词对应的上下文向量;根据每个第二文本单词对应的上下文向量,通过标签标注算法抽取与意图属性对应的属性值。

这里,标签标注算法包括:序列标注算法和/或BIO标签算法;其中,序列标注算法包括原始标注算法和/或联合标注算法。

在一个实例中,本发明实施例中抽取模块1002具体可以用于,从第一应答信息和与问询信息相关的产品描述信息中,抽取与意图属性对应的属性值。

此外,该装置100还可以包括模板生成模块1004,用于识别多个预设问询信息中每个预设问询信息的意图属性;从与每个预设问询信息对应的每个应答信息中抽取掉与意图属性对应的属性值;将抽取掉属性值之后的每个应答信息作为候选话术信息;根据候选话术信息确定话术模板。

其中,本发明实施例中模板生成模块1004还可以用于,按照使用话术模板的频次和/或话术模板的可读性,更新话术模板。

图11示出根据一个实施例的构建应答信息数据库装置的结构框图。

如图11所示,该装置110可以包括:

获取模块1101,用于获取第一用户端发送的多个问询信息和第二用户端针对多个问询信息回复的多个第一应答信息;

生成装置1102,用于利用如图10所示的应答信息生成装置,生成多个第二应答信息,以构建应答信息数据库。

图12示出根据一个实施例的获取应答信息的装置的结构框图。

如图12所示,该装置120可以包括:

识别模块1201,用于识别第一用户端发送的问询信息中的目标意图属性;

处理模块1202,用于从如图11所示的构建应答信息数据库装置构建的应答信息数据库中,将与目标意图属性对应的第二应答信息作为问询信息的应答信息;

收发模块1203,用于向第一用户端发送应答信息。

另外,该装置120还可以包括更新模块1204,用于确定与问询信息相关的产品;从产品信息数据库中获取与产品相关的产品属性值;根据产品属性值更新第二应答信息。

图13示出根据一个实施例的计算设备的结构示意图。

如图13所示,能够实现根据本发明实施例异常点检测方法和装置的计算设备的示例性硬件架构的结构图。

该设备可以包括处理器1301以及存储有计算机程序指令的存储器1302。

具体地,上述处理器1301可以包括中央处理器(CPU),或者特定集成电路(application specific integrated circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器1302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器1302可包括硬盘驱动器(hard disk drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(universal serial bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器1302可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器1302可在综合网关设备的内部或外部。在特定实施例中,存储器1302是非易失性固态存储器。在特定实施例中,存储器1302包括只读存储器(ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(PROM)、可擦除PROM(EPROM)、电可擦除PROM(EEPROM)、电可改写ROM(EAROM)或闪存,或者两个或及其以上这些的组合。

处理器1301通过读取并执行存储器1302中存储的计算机程序指令,以实现上述实施例中的任意一种应答信息生成方法、构建数据库的方法和获取应答信息的方法。

收发器1303,主要用于实现本发明实施例中各装置或者与其他设备中的通信。

在一个示例中,该设备还可包括总线1304。其中,如图13所示,处理器1301、存储器1302和收发器1303通过总线1304连接并完成相互间的通信。

总线1304包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(FSB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线1303可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行本发明实施例的一种应答信息生成方法、构建数据库的方法以及获取应答信息的方法的步骤。

需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本领域的技术人员可以清楚地了解到,本发明的方法过程并不限于所描述和示出的具体步骤,任何熟悉本技术领域的技术人员在领会本发明的精神后,在本发明揭露的技术范围内作出各种改变、修改和添加,或者等效替换以及改变步骤之间的顺序,这些修改或替换都应涵盖在本发明的保护范围之内。

相关技术
  • 应答信息生成方法、装置、设备及计算机可读存储介质
  • 音乐应答数据的生成方法、装置、设备及存储介质
技术分类

06120112229094