掌桥专利:专业的专利平台
掌桥专利
首页

句子相似度确定方法、答案搜索方法、装置、设备、系统及介质

文献发布时间:2023-06-19 11:52:33


句子相似度确定方法、答案搜索方法、装置、设备、系统及介质

技术领域

本申请实施例涉及人工智能技术领域,尤其涉及一种句子相似度的确定方法、答案的搜索方法、数据处理方法、商品信息的搜索方法、句子相似度模型的建立方法、装置、系统、电子设备及计算机存储介质。

背景技术

计算句子对中句子之间的相似度在自然语言处理领域具有非常广泛的应用前景,如在问答系统中通过计算句子对中句子之间的相似度找到与问题相匹配的答案等。因此,准确地计算句子之间的相似度具有重要意义,同时如何准确地计算句子之间的相似度也一直是研究人员的研究热点。

在相关技术中,句子相似度的计算是在计算机被赋予丰富涵义词汇的基础上,通过句子间的特征构建句子相似度模型,使计算机能够快速匹配系统中最为相似的句子。具体地,一般是直接根据句子对中两个句子中词语的词向量计算句子之间的相似度,这种方法考虑的信息较片面,从而降低了句子相似度模型的性能。例如,句子对“老师叫小明去教室”和“小明叫老师去教室”,如果只按照句子中词语的语义计算相似度,那么这两个句子的意思相同,但显然它们的意思是有区别的。因此,如何有效提升句子相似度模型的性能成为当前亟待解决的技术问题。

发明内容

有鉴于此,本发明实施例提供一种句子相似度的确定方法、答案的搜索方法、数据处理方法、商品信息的搜索方法、句子相似度模型的建立方法、装置、系统、电子设备及计算机存储介质,以解决现有技术中存在的如何有效提升句子相似度模型的性能的技术问题。

根据本发明实施例的第一方面,提供了一种句子相似度的确定方法。所述方法包括:对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。

根据本发明实施例的第二方面,提供了一种句子相似度的确定装置。所述装置包括:分析模块,用于对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;确定模块,用于基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;预测模块,用于基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。

根据本发明实施例的第三方面,提供了一种答案的搜索方法。所述方法包括:确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。

根据本发明实施例的第四方面,提供了一种答案的搜索装置。所述装置包括:第一确定模块,用于确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;第二确定模块,用于基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;第三确定模块,用于基于所述相似度,确定所述问题的答案。

根据本发明实施例的第五方面,提供了一种数据处理方法。所述方法包括:对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树;基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种;基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。

根据本发明实施例的第六方面,提供了一种数据处理装置。所述装置包括:分析模块,用于对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树;第一确定模块,用于基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种;第二确定模块,用于基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。

根据本发明实施例的第七方面,提供了一种答案的搜索方法。所述方法包括:向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;接收所述服务器返回的所述问题的答案。

根据本发明实施例的第八方面,提供了一种答案的搜索装置。所述装置包括:发送模块,用于向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;接收模块,用于接收所述服务器返回的所述问题的答案。

根据本发明实施例的第九方面,提供了一种答案的搜索方法。所述方法包括:确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。

根据本发明实施例的第十方面,提供了一种答案的搜索装置。所述装置包括:第一确定模块,用于确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;第二确定模块,用于基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;第三确定模块,用于基于所述相似度,确定所述问题的答案。

根据本发明实施例的第十一方面,提供了一种商品信息的搜索方法。所述方法包括:确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度;基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。

根据本发明实施例的第十二方面,提供了一种商品信息的搜索装置。所述装置包括:第一确定模块,用于确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;第二确定模块,用于基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度;第三确定模块,用于基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。

根据本发明实施例的第十三方面,提供了一种句子相似度模型的建立方法。所述句子相似度模型包括第一依存句法特征表征层、第二依存句法特征表征层,及与所述第一依存句法特征表征层和所述第二依存句法特征表征层的输出端连接的相似度预测层,所述方法包括:通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

根据本发明实施例的第十四方面,提供了一种句子相似度模型的建立装置。所述句子相似度模型包括第一依存句法特征表征层、第二依存句法特征表征层,及与所述第一依存句法特征表征层和所述第二依存句法特征表征层的输出端连接的相似度预测层,所述装置包括:第一提取模块,用于通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;第二提取模块,用于通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;计算模块,用于通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

根据本发明实施例的第十五方面,提供了一种答案的搜索系统。所述系统包括:终端设备,以及与所述终端设备通信连接的服务器,所述终端设备,用于向服务器发送携带有问题的答案搜索请求;所述服务器,用于确定接收到的答案搜索请求中携带的问题的依存句法信息,并基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;所述终端设备,还用于接收所述服务器返回的所述问题的答案。

根据本发明实施例的第十六方面,提供了一种商品信息的搜索系统。所述系统包括:终端设备,以及与所述终端设备通信连接的服务器,所述终端设备,用于向服务器发送携带有商品搜索关键词的商品搜索请求;所述服务器,用于确定接收到的商品搜索请求中携带的商品搜索关键词的依存句法信息,并基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度,再基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;所述终端设备,还用于接收所述服务器返回的所述商品信息。

根据本申请实施例的第十七方面,提供了一种电子设备,包括:一个或多个处理器;计算机可读介质,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例的第一方面所述的句子相似度的确定方法,实现如上述实施例的第三方面所述的答案的搜索方法,实现如上述实施例的第五方面所述的数据处理方法,实现如上述实施例的第七方面所述的答案的搜索方法,实现如上述实施例的第九方面所述的答案的搜索方法,实现如上述实施例的第十一方面所述的商品信息的搜索方法,或者实现如上述实施例的第十三方面所述的句子相似度模型的建立方法。

根据本申请实施例的第十八方面,提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例的第一方面所述的句子相似度的确定方法,实现如上述实施例的第三方面所述的答案的搜索方法,实现如上述实施例的第五方面所述的数据处理方法,实现如上述实施例的第七方面所述的答案的搜索方法,实现如上述实施例的第九方面所述的答案的搜索方法,实现如上述实施例的第十一方面所述的商品信息的搜索方法,或者实现如上述实施例的第十三方面所述的句子相似度模型的建立方法。

根据本申请实施例提供的句子相似度的确定方案,对第一句子和第二句子分别进行依存句法分析,以获得第一句子对应的第一依存句法树和第二句子对应的第二依存句法树,并基于第一依存句法树和第二依存句法树,分别确定第一句子的第一依存句法信息和第二句子的第二依存句法信息,其中,第一依存句法信息包括第一句子中的词语的依存关系标签信息和第一依存句法树表示的第一依存关系结构信息,并且第二依存句法信息包括第二句子中的词语的依存关系标签信息和第二依存句法树表示的第二依存关系结构信息,再基于第一依存句法信息和第二依存句法信息,预测第一句子与第二句子的相似度,与现有技术相比,通过利用句子对应的依存句法树,获得句子的依存句法信息,也即句子中的词语的依存关系标签信息和句子对应的依存句法树表示的依存关系结构信息,能够充分体现句子中词语与词语之间的依存关系和句子中词语与词语之间的依存关系结构,因此,能够准确地表征句子,从而有效提升句子相似度模型确定句子之间的相似度的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。

图1A为本申请实施例提供的一种自动问答系统的结构示意图;

图1B为本申请实施例一中句子相似度的确定方法的步骤流程图;

图1C为根据本申请实施例一提供的依存句法分析的一示例的示意图;

图1D为根据本申请实施例一提供的句子相似度模型的结构示意图;

图1E为根据本申请实施例一提供的句子相似度模型的结构示意图;

图2A为本申请实施例二中句子相似度的确定方法的步骤流程图;

图2B为根据本申请实施例二提供的句子相似度模型的结构示意图;

图2C为根据本申请实施例二提供的句子相似度模型的结构示意图;

图2D为根据本申请实施例二提供的句子相似度的确定过程的示意图;

图3为本申请实施例三中答案的搜索方法的步骤流程图;

图4为本申请实施例四中数据处理方法的步骤流程图;

图5为本申请实施例五中答案的搜索方法的步骤流程图;

图6为本申请实施例六中答案的搜索方法的步骤流程图;

图7A为本申请实施例七中商品信息的搜索方法的步骤流程图;

图7B为根据本申请实施例七提供的商品信息的搜索过程的示意图;

图8为本申请实施例八中句子相似度模型的建立方法的步骤流程图;

图9为本申请实施例十一中句子相似度的确定装置的结构示意图;

图10为本申请实施例十二中句子相似度的确定装置的结构示意图;

图11为本申请实施例十三中答案的搜索装置的结构示意图;

图12为本申请实施例十四中数据处理装置的结构示意图;

图13为本申请实施例十五中答案的搜索装置的结构示意图;

图14为本申请实施例十六中答案的搜索装置的结构示意图;

图15为本申请实施例十七中商品信息的搜索装置的步骤流程图;

图16为本申请实施例十八中句子相似度模型的建立装置的结构示意图;

图17为本申请实施例十九中电子设备的结构示意图;

图18为本申请实施例二十中电子设备的硬件结构。

具体实施方式

为了使本领域的人员更好地理解本发明实施例中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明实施例一部分实施例,而不是全部的实施例。基于本发明实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明实施例保护的范围。

下面结合本发明实施例附图进一步说明本发明实施例具体实现。

参照图1A,为实现本申请实施例提供的句子相似度的确定方法的一种自动问答系统的结构示意图,该系统可以包括服务器以及终端设备A,应该理解,图1A所呈现的服务器与终端设备A仅是示例性说明,并不会对两者的实现形式做限定。

在实际应用中,服务器与终端设备A之间可以是有线或无线网络连接,具体可以通过GSM(Global System For Mobile Communications,全球移动通信系统)、GPRS(GeneralPacket Radio Service,通用分组无线业务)、LTE(Long Term Evolution,长期演进技术)等移动网络实现通信连接,或者是通过蓝牙、WIFI、红外线等方式进行通信连接,本申请实施例对服务器与终端设备A之间的具体通信连接方式不做限定。

服务器可以是为用户提供服务的服务设备,具体可以是独立的应用服务设备,也可以是由多个服务器构成的服务集群,实际应用中,其可以是云服务器、云主机、虚拟中心等,本申请实施例对该服务器的结构及其实现形式不作限定。

终端设备A可以是面向用户,并能够与用户进行交互的终端,如手机、笔记本、电脑、iPad、智能音响等,还可以各种自助终端,如医院、银行、车站等场所中的自助服务机,此外,终端设备A还可以是支持交互的智能机器,如聊天机器人、扫地机器人、点餐服务机器人等。本申请实施例对终端设备的产品类型及其物理形态不做限定,本申请实施例需要其具有交互功能,可以通过安装如知识问答等交互类应用程序实现。

在进行搜索式问答时,终端设备A可通过网络向服务器发送携带问题的答案搜索请求。服务器接收终端设备A发送的携带有问题的答案搜索请求,并确定所述答案搜索请求中携带的所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述答案搜索请求中携带的所述问题的答案,并向所述终端设备A返回携带有所述答案的答案搜索响应。例如,当问题为“李三的爸爸是谁”时,所述答案搜索请求携带问题“李三的爸爸是李四”,并且针对所述答案搜索请求的答案搜索响应携带的答案为“李四”。由此可见,本申请实施例提供的句子相似度的确定方法可以由服务器执行,具体实现过程可以参照下文方法实施例的描述。

结合上图1A所示的自动问答系统的结构示意图,参照图1B,为本申请实施例一的句子相似度的确定方法的流程示意图,可以应用于各种应用场景下的句子相似度的确定过程,具体可以由服务器执行,如图1B所示,该方法可以包括但并不局限于以下步骤:

在步骤S101中,对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树。

在本申请实施例中,所述第一句子和所述第二句子可为目标句子对中的两个句子。所述目标句子对可理解为两个句子组成的一对句子。目标句子对中的句子可为询问语句,例如,“张柏芝的儿子是谁?”、“李亚鹏的女儿是谁?”等。目标句子对中的句子可为陈述语句,例如,“放学后,小明的奶奶去学校接小明”、“小明去学校打羽毛球了”等。所述目标句子对可为配置的问答对、对话中的两个句子组成的句子对。具体地,可以通过语言技术平台(language technology platform,LTP)对目标句子对中的第一句子和第二句子分别进行依存句法分析。依存句法分析可理解为将句子分析成一棵依存句法树,描述出各个词语之间的依存关系,也即指出了词语之间在句法上的搭配关系,这种搭配关系是和语义相关联的。依存句法分析主要是通过分析语言单位内成分之间的依存关系揭示其句法结构,直观来讲,依存句法分析可以识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。

为了便于理解本申请中的部分技术内容,在此对依存句法分析进行简要描述。但是应当明白,本申请实施例的技术方案可以利用依存句法分析,但是本申请实施例的创新点不在于依存句法分析的具体实现方式。这里对依存句法分析的细节描述不构成对本申请实施例的限制。依存句法分析就是计算语言学(Computational Linguistics)的一项研究内容,它通过建立形式化的数学模型,设计有效的算法,利用计算机分析和处理句子,将其从词序列形式转换为句法树形式从而捕捉句子内部结构和词语之间的搭配关系。在自然语言处理(NLP,Natural Language Processing)领域,主要分析两种主流的句法体系,分别是短语结构句法体系(Phrase-structure Grammar)和依存结构句法体系(DependencyGrammar)。

依存句法是由法国语言学家L.Tesniere于1959年提出,用于分析语言单位内成分之间的依存关系,以揭示其句法结构,其主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。计算机进行依存句法分析,即是对给定输入句子的词序列,分析各个词之间的搭配关系和整个句子的结构,并得到一棵依存句法分析树。依存句法分析树就是依存句法分析的结果的表示形式。在依存句法分析树中,句子的每个词看做一个节点,并在句首插入一个起辅助作用的虚拟节点(记为根节点ROOT),所有节点通过有向弧连接形成一棵树,且满足以下三个条件:第一,除了根节点外,任意节点都有且仅有一条入边;第二,除了叶子节点外,任意节点有至少一条出边,根节点仅有一条出边,对应的弧指向支配整个句子的核心词;第三,所有的弧不能交叉,如果a和b两个节点存在有向弧,则处于他们中间的任意两个节点间的弧在水平方向的投影一定落在a和b的弧的投影上。

在依存句法树中,一条弧代表一则依存关系,弧的方向代表支配顺序。有向弧总是从某个父节点出发,指向其子节点,这称作父节点支配子节点,而子节点依存于父节点。常见的依存关系有:定中关系(ATT),表示定语依存于中心语;状中关系(ADV),表示状语依存于中心语;并列关系(COO),表示名词支配(与之并列)名词;主谓关系(SBV),表示主语依存于谓语;介宾关系(POB),表示介词支配宾语;动宾关系(VOB),表示谓语支配宾语;核心关系(HED),表示ROOT支配句子核心词;依存分句(DC),表示主句核心词支配分句核心词。依存句法分析树中的一条有向弧就叫依存弧。这里,详细描述了依存句法分析的一种实现方式。应当理解,在本申请实施例的技术方案中,当应用依存句法分析时,完全可以不限于上面的细节,可以采用其它方式来实现依存句法分析。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图1C所示,对询问语句“谢霆锋的儿子是谁”进行依存句法分析,以得到如图1C所示的依存句法树。核心谓语HED为“是”,主谓关系SBV为“儿子是”,动宾关系VOB为“是谁”,本申请实施例中,可以HED、SBV、VOB为例进行分析。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S102中,基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息。

在本申请实施例中,所述依存句法信息可理解为基于依存句法树确定得到的信息。具体地,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息。其中,句子中的词语的依存关系标签信息可包括主谓关系(SBV)、动宾关系(VOB)、间宾关系(IOB)、前置宾语(FOB)、兼语(DBL)、定中关系(ATT)、状中结构(ADV)、动补结构(CMP)、并列关系(COO)、介宾关系(POB)、左附加关系(LAD)、右附加关系(RAD)、独立结构(IS)、核心关系(HED)等,依存句法树表示的依存关系结构信息包括依存句法树对应的句子的核心词和依存句法树对应的句子中的词语在依存句法树中所对应的节点的结构特征表征信息,例如,询问语句“谢霆锋的儿子是谁”的核心词为“是”,陈述语句“她提出绿色环保理念”的核心词为“提出”。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一些可选实施例中,在基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息时,通过第一依存句法树编码模型,对所述第一依存句法树执行编码操作,以获得所述第一依存关系结构信息包括的所述第一句子中的词语在所述第一依存句法树中所对应的节点的结构特征表征信息;通过第二依存句法树编码模型,对所述第二依存句法树执行编码操作,以获得所述第二依存关系结构信息包括的所述第二句子中的词语在所述第二依存句法树中所对应的节点的结构特征表征信息。其中,所述第一句子中的词语在所述第一依存句法树中所对应的节点的结构特征表征信息可为所述第一句子中的词语在所述第一依存句法树中所对应的节点的结构特征表征向量,所述第二句子中的词语在所述第二依存句法树中所对应的节点的结构特征表征信息可为所述第二句子中的词语在所述第二依存句法树中所对应的节点的结构特征表征向量。籍此,通过依存句法树编码模型,对依存句法树执行编码操作,能够准确地获得句子中的词语在依存句法树中所对应的节点的结构特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第一依存句法树编码模型和所述第二依存句法树编码模型分别包括图卷积神经网络模型,或者所述第一依存句法树编码模型和所述第二依存句法树编码模型分别包括树状长短时记忆网络模型。籍此,当用于对依存句法树执行编码操作的依存句法树编码模型包括图卷积神经网络模型,或者树状长短时记忆网络模型时,能够进一步准确地获得句子中的词语在依存句法树中所对应的节点的结构特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,图卷积神经网络模型(Graph Convolutional Network,GCN),可以指在广义的图结构上,利用一种递归聚合的方式,将图中节点的信息进行传播,最终学习每个图节点的结构特征表征向量。更为具体的,深度学习理论中的图卷积神经网络模型可以是在拓扑空间(topological space)内按图(graph)结构组织以进行关系推理(relational reasoning)的函数集合。树状长短时记忆网络模型(Tree-structure LongShort-Term Memory,TreeLSTM)可理解为将序列的长短时记忆网络模型扩展到树结构上所获得的模型。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一些可选实施例中,在基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息时,通过所述第一依存句法树,直接确定所述第一依存关系结构信息包括的所述第一句子中的核心词和所述第一句子中的词语的依存关系标签信息;通过所述第二依存句法树,直接确定所述第二依存关系结构信息包括的所述第二句子中的核心词和所述第二句子中的词语的依存关系标签信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S103中,基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。

在本申请实施例中,所述句子相似度模型可理解为用于确定句子之间的相似度的模型。此外,可使用相似度分数表征第一句子与第二句子之间的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一些可选实施例中,在基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度时,通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;通过所述句子相似度模型的相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。其中,所述第一句子的依存句法特征表征信息可为所述第一句子的依存句法特征表征向量,所述第二句子的依存句法特征表征信息可为所述第二句子的依存句法特征表征向量。籍此,基于所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,能够准确地预测第一句子与第二句子的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一个具体的例子中,在通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作时,通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息,确定所述词语的综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第一句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第一依存句法树中所对应的节点的结构特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第一句子中的词语的依存关系标签信息引入句子相似度模型的输入层,以及将第一句子的第一依存关系结构信息包括的词语在第一依存句法树中所对应的节点的结构特征表征信息引入句子相似度模型的编码层,能够准确地获得第一句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第一依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量,以及所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,在通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作时,通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息,确定所述词语的综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第二句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第二依存句法树中所对应的节点的结构特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第二句子中的词语的依存关系标签信息引入句子相似度模型的输入层,以及将第二句子的第二依存关系结构信息包括的词语在第二依存句法树中所对应的节点的结构特征表征信息引入句子相似度模型的编码层,能够准确地获得第二句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第二依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量,以及所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图1D所示,将句子A的词语与句子A的词语的依存关系标签信息输入至句子相似度模型的输入层,句子相似度模型的输入层对句子A的词语与句子A的词语的依存关系标签信息分别执行特征提取操作,以获得句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息。与此同时,可通过TreeLSTM或者GCN,对句子A的依存句法树执行编码操作,以获得句子A的词语在依存句法树中所对应的节点的结构特征表征信息。然后,可对句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息,以及句子A的词语在依存句法树中所对应的节点的结构特征表征信息进行相加或者拼接,以获得句子A的词语的综合特征表征信息。再然后,将句子A的词语的综合特征表征信息输入至句子相似度模型的编码层,句子相似度模型的编码层对句子A的词语的综合特征表征信息执行编码操作,以获得句子A的依存句法特征表征信息。类似地,使用句子A的依存句法特征表征信息的获得方法,可获得句子B的依存句法特征表征信息。在获得句子A和句子B的依存句法特征表征信息之后,将句子A和句子B的依存句法特征表征信息输入至句子相似度模型的相似度预测层,通过句子相似度模型的相似度预测层,对句子A的依存句法特征表征信息和句子B的依存句法特征表征信息执行相似度的计算操作,以预测句子A与句子B的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一个具体的例子中,在通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作时,通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的第一综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的第一综合特征表征信息执行编码操作,以获得所述词语的第二综合特征表征信息;基于所述词语的第二综合特征表征信息和所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息,确定所述词语的第三综合特征表征信息;对所述词语的第三综合特征表征信息执行相加操作或者拼接操作,以确定所述第一句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第一依存句法树中所对应的节点的结构特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第一句子中的词语的依存关系标签信息引入句子相似度模型的输入层,以及将第一句子的第一依存关系结构信息包括的词语在第一依存句法树中所对应的节点的结构特征表征信息引入句子相似度模型的相似度预测层,能够准确地获得第一句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第一依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的第一综合特征表征信息时,对所述词语的语义特征表征向量和依存关系标签特征表征向量进行拼接或相加,以获得所述词语的第一综合特征表征向量。在确定所述词语的第三综合特征表征信息时,对所述词语的第二综合特征表征向量和所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征向量进行相加或拼接,以获得所述词语的第三综合特征表征向量。在确定所述第一句子的依存句法特征表征信息时,可对所述词语的第三综合特征表征向量执行拼接操作,以获得所述第一句子的依存句法特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,在通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作时,通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的第一综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的第一综合特征表征信息执行编码操作,以获得所述词语的第二综合特征表征信息;基于所述词语的第二综合特征表征信息和所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息,确定所述词语的第三综合特征表征信息;基于所述词语的第三综合特征表征信息,确定所述第二句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第二依存句法树中所对应的节点的结构特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第二句子中的词语的依存关系标签信息引入句子相似度模型的输入层,以及将第二句子的第二依存关系结构信息包括的词语在第二依存句法树中所对应的节点的结构特征表征信息引入句子相似度模型的相似度预测层,能够准确地获得第二句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第二依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的第一综合特征表征信息时,对所述词语的语义特征表征向量和依存关系标签特征表征向量进行拼接或相加,以获得所述词语的第一综合特征表征向量。在确定所述词语的第三综合特征表征信息时,对所述词语的第二综合特征表征向量和所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征向量进行相加或拼接,以获得所述词语的第三综合特征表征向量。在确定所述第二句子的依存句法特征表征信息时,可对所述词语的第三综合特征表征向量执行拼接操作,以获得所述第二句子的依存句法特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图1E所示,将句子A的词语与句子A的词语的依存关系标签信息输入至句子相似度模型的输入层,句子相似度模型的输入层对句子A的词语与句子A的词语的依存关系标签信息分别执行特征提取操作,以获得句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息。然后,可对句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息进行相加或者拼接,以获得句子A的词语的第一综合特征表征信息。再然后,将句子A的词语的第一综合特征表征信息输入至句子相似度模型的编码层,句子相似度模型的编码层对句子A的词语的第一综合特征表征信息执行编码操作,以获得句子A的词语的第二综合特征表征信息。与此同时,可通过TreeLSTM或者GCN,对句子A的依存句法树执行编码操作,以获得句子A的词语在依存句法树中所对应的节点的结构特征表征信息。然后,可对句子A的词语的第二综合特征表征信息,以及句子A的词语在依存句法树中所对应的节点的结构特征表征信息进行相加或者拼接,以获得句子A的词语的第三综合特征表征信息。再然后,对句子A的词语的第三综合特征表征信息进行拼接操作,以获得句子A的依存句法特征表征信息。类似地,使用句子A的依存句法特征表征信息的获得方法,可获得句子B的依存句法特征表征信息。在获得句子A和句子B的依存句法特征表征信息之后,将句子A和句子B的依存句法特征表征信息输入至句子相似度模型的相似度预测层,通过句子相似度模型的相似度预测层,对句子A和句子B的依存句法特征表征信息执行相似度的计算操作,以预测句子A与句子B的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

通过本申请实施例提供的句子相似度的确定方法,对第一句子和第二句子分别进行依存句法分析,以获得第一句子对应的第一依存句法树和第二句子对应的第二依存句法树,并基于第一依存句法树和第二依存句法树,分别确定第一句子的第一依存句法信息和第二句子的第二依存句法信息,其中,第一依存句法信息包括第一句子中的词语的依存关系标签信息和第一依存句法树表示的第一依存关系结构信息,并且第二依存句法信息包括第二句子中的词语的依存关系标签信息和第二依存句法树表示的第二依存关系结构信息,再基于第一依存句法信息和第二依存句法信息,预测第一句子与第二句子的相似度,与现有技术相比,通过利用句子对应的依存句法树,获得句子的依存句法信息,也即句子中的词语的依存关系标签信息和句子对应的依存句法树表示的依存关系结构信息,能够充分体现句子中词语与词语之间的依存关系和句子中词语与词语之间的依存关系结构,因此,能够准确地表征句子,从而有效提升句子相似度模型确定句子之间的相似度的准确度。

本实施例的句子相似度的确定方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图2A,示出了本申请实施例二的句子相似度的确定方法的步骤流程图。

具体地,本实施例提供的句子相似度的确定方法包括以下步骤:

在步骤S201中,对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树。

由于该步骤S201的具体实施方式与上述步骤S101的具体实施方式类似,在此不再赘述。

在步骤S202中,基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息。

由于该步骤S202的具体实施方式与上述步骤S102的具体实施方式类似,在此不再赘述。

在步骤S203中,通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息。

在一些可选实施例中,在通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作时,通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语、所述词语的依存关系标签信息,以及所述第一依存关系结构信息包括的所述第一句子的核心词分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息,确定所述词语的综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第一句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述第一句子的核心词的语义特征表征信息可为所述第一句子的核心词的语义特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第一句子中的词语的依存关系标签信息和第一依存关系结构信息包括的第一句子的核心词引入句子相似度模型的输入层,能够准确地获得第一句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第一依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量,以及所述核心词的语义特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一些可选实施例中,在通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作时,通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的综合特征表征信息,并将所述词语的综合特征表征信息作为所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息;通过所述第一依存句法特征表征层中的编码层,对节点具有结构特征表征信息的所述第一依存句法树执行编码操作,以获得所述第一句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量,所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第一依存句法树中所对应的节点的结构特征表征向量。籍此,通过将第一句子中的词语的依存关系标签信息引入句子相似度模型的输入层,并通过第一依存句法特征表征层中的编码层,对节点具有结构特征表征信息的第一依存句法树执行编码操作,能够准确地获得第一句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第一依存句法特征表征层中的编码层可为TreeLSTM或者GCN。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S204中,通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息。

在一些可选实施例中,在通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作时,通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语、所述词语的依存关系标签信息,以及所述第二依存关系结构信息包括的所述第二句子的核心词分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息,确定所述词语的综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第二句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述第二句子的核心词的语义特征表征信息可为所述第二句子的核心词的语义特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量。籍此,通过将第二句子中的词语的依存关系标签信息和第二依存关系结构信息包括的第二句子的核心词引入句子相似度模型的输入层,能够准确地获得第二句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第二依存句法特征表征层中的编码层可为经典的多层双向长短时记忆网络模型。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量,以及所述核心词的语义特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图2B所示,将句子A的词语与句子A的词语的依存关系标签信息以及句子A的核心词输入至句子相似度模型的输入层,句子相似度模型的输入层对句子A的词语与句子A的词语的依存关系标签信息以及句子A的核心词分别执行特征提取操作,以获得句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息以及句子A的核心词的语义特征表征信息。然后,可对句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息,以及句子A的核心词的语义特征表征信息进行相加或者拼接,以获得句子A的词语的综合特征表征信息。再然后,将句子A的词语的综合特征表征信息输入至句子相似度模型的编码层,句子相似度模型的编码层对句子A的词语的综合特征表征信息执行编码操作,以获得句子A的依存句法特征表征信息。类似地,使用句子A的依存句法特征表征信息的获得方法,可获得句子B的依存句法特征表征信息。在获得句子A和句子B的依存句法特征表征信息之后,将句子A和句子B的依存句法特征表征信息输入至句子相似度模型的相似度预测层,通过句子相似度模型的相似度预测层,基于句子A和句子B的依存句法特征表征信息,预测句子A与句子B的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一些可选实施例中,在通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作时,通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的综合特征表征信息,并将所述词语的综合特征表征信息作为所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息;通过所述第二依存句法特征表征层中的编码层,对节点具有结构特征表征信息的所述第二依存句法树执行编码操作,以获得所述第二句子的依存句法特征表征信息。其中,所述词语的语义特征表征信息可为所述词语的语义特征表征向量,所述词语的依存关系标签特征表征信息可为所述词语的依存关系标签特征表征向量,所述词语的综合特征表征信息可为所述词语的综合特征表征向量,所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息可为所述词语在所述第二依存句法树中所对应的节点的结构特征表征向量。籍此,通过将第二句子中的词语的依存关系标签信息引入句子相似度模型的输入层,并通过第二依存句法特征表征层中的编码层,对节点具有结构特征表征信息的第二依存句法树执行编码操作,能够准确地获得第二句子的依存句法特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,所述第二依存句法特征表征层中的编码层可为TreeLSTM或者GCN。在确定所述词语的综合特征表征信息时,可对所述词语的语义特征表征向量和依存关系标签特征表征向量进行相加或者拼接,以获得所述词语的综合特征表征向量。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图2C所示,将句子A的词语与句子A的词语的依存关系标签信息输入至句子相似度模型的输入层,句子相似度模型的输入层对句子A的词语与句子A的词语的依存关系标签信息分别执行特征提取操作,以获得句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息。然后,可对句子A的词语的语义特征表征信息与句子A的词语的依存关系标签特征表征信息进行相加或者拼接,以获得句子A的词语的综合特征表征信息。再然后,将句子A的词语的综合特征表征信息作为所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息。再然后,通过所述第一依存句法特征表征层中的编码层,对节点具有结构特征表征信息的所述第一依存句法树执行编码操作,以获得所述第一句子的依存句法特征表征信息。类似地,使用句子A的依存句法特征表征信息的获得方法,可获得句子B的依存句法特征表征信息。在获得句子A和句子B的依存句法特征表征信息之后,将句子A和句子B的依存句法特征表征信息输入至句子相似度模型的相似度预测层,通过句子相似度模型的相似度预测层,对句子A和句子B的依存句法特征表征信息执行相似度的计算,以预测句子A与句子B的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在步骤S205中,通过所述句子相似度模型的相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

在一些可选实施例中,在通过所述句子相似度模型的相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度时,通过所述相似度预测层中的线性计算层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行线性计算,以获得所述第一句子与所述第二句子的相似度所属相似类别的分数;通过所述相似度预测层中的归一化层,对所述第一句子与所述第二句子的相似度所属相似类别的分数执行归一化操作,以获得所述第一句子与所述第二句子的相似度所属相似类别的概率;基于所述第一句子与所述第二句子的相似度所属相似类别的概率,以及所述第一句子与所述第二句子的相似度所属相似类别的语义特征表征信息,确定所述第一句子与所述第二句子的相似度。其中,所述第一句子与所述第二句子的相似度所属相似类别的语义特征表征信息可为所述第一句子与所述第二句子的相似度所属相似类别的语义特征表征向量。籍此,通过对第一句子的依存句法特征表征信息和第二句子的依存句法特征表征信息执行线性计算,以获得第一句子与第二句子的相似度所属相似类别的分数,并对第一句子与第二句子的相似度所属相似类别的分数执行归一化操作,以获得第一句子与第二句子的相似度所属相似类别的概率,再基于第一句子与第二句子的相似度所属相似类别的概率,以及第一句子与第二句子的相似度所属相似类别的语义特征表征信息,确定第一句子与第二句子的相似度,能够准确地确定第一句子与第二句子的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图2D所示,在图示应用场景中,包括终端设备B和自动问答服务器。其中,终端设备B用于将问题搜索请求发送至自动问答服务器,自动问答服务器用于执行本申请实施例提供的句子相似度的确定方法,以向终端设备B返回携带答案的问题搜索响应。

当用户需要通过自动问答系统来搜索答案时,用户可以在终端设备B上提供的问题输入栏中输入问题,进而,在终端设备B获取到用户输入的问题之后,将问题搜索请求发送至自动问答服务器。

自动问答服务器接收到终端设备B发送的问题搜索请求后,自动问答服务器将问题搜索请求中携带的问题作为句子A,并将预先配置的问答对中的问题作为句子B。然后,采用如图2C所示的句子相似度的确定方法确定句子A与句子B之间的相似度,并确定与句子A的相似度最大的句子B为与句子A匹配的句子B。在确定得到与句子A匹配的句子B之后,可将句子B对应的问题的答案作为句子A对应的问题的答案,从而获得问题搜索请求中携带的问题的答案。由此,自动问答服务器可以向终端设备B返回携带答案的答案搜索响应。

需要说明的是,通过将句子中的词语的依存关系标签信息引入句子相似度模型的输入层,并通过编码层,对节点具有结构特征表征信息的依存句法树执行编码操作,能够准确地获得句子的依存句法特征表征信息,进而能够准确地确定句子之间的相似度。

需要说明的是,上述图2D所示场景仅为一种示例,在实际应用中,本申请实施例提供的句子相似度的确定方法还可以应用于终端设备B,在此不对该句子相似度的确定方法的应用场景做任何具体限定。

通过本申请实施例提供的句子相似度的确定方法,对第一句子和第二句子分别进行依存句法分析,以获得第一句子对应的第一依存句法树和第二句子对应的第二依存句法树,并基于第一依存句法树和第二依存句法树,分别确定第一句子的第一依存句法信息和第二句子的第二依存句法信息,其中,第一依存句法信息包括第一句子中的词语的依存关系标签信息和第一依存句法树表示的第一依存关系结构信息,并且第二依存句法信息包括第二句子中的词语的依存关系标签信息和第二依存句法树表示的第二依存关系结构信息,再通过句子相似度模型的第一依存句法特征表征层,对第一依存句法信息执行特征提取操作,以获得第一句子的依存句法特征表征信息,再通过句子相似度模型的第二依存句法特征表征层,对第二依存句法信息执行特征提取操作,以获得第二句子的依存句法特征表征信息,再通过句子相似度模型的相似度预测层,对第一句子的依存句法特征表征信息和第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度,与现有技术相比,通过利用句子对应的依存句法树,获得句子的依存句法信息,也即句子中的词语的依存关系标签信息和句子对应的依存句法树表示的依存关系结构信息,能够充分体现句子中词语与词语之间的依存关系和句子中词语与词语之间的依存关系结构,因此,能够准确地表征句子,从而有效提升句子相似度模型确定句子之间的相似度的准确度。

本实施例的句子相似度的确定方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图3,示出了本申请实施例三的答案的搜索方法的步骤流程图。

具体地,本实施例提供的答案的搜索方法包括以下步骤:

在步骤S301中,确定接收到的答案搜索请求中携带的问题的依存句法信息。

在本申请实施例中,在服务器确定接收到的答案搜索请求中携带的问题的依存句法信息时,可将答案搜索请求中携带的问题作为句子。具体地,在确定接收到的答案搜索请求中携带的问题的依存句法信息时,对所述问题进行依存句法分析,以获得所述问题对应的依存句法树;基于所述依存句法树,确定所述问题的依存句法信息。其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息。所述问题对应的依存句法树表示的依存关系结构信息包括依存句法树对应的问题的核心词和依存句法树对应的问题中的词语在依存句法树中所对应的节点的结构特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在步骤S302中,基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度。

在一些可选实施例中,在基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度时,通过句子相似度模型的第一依存句法特征表征层,对所述问题的依存句法信息执行特征提取操作,以获得所述问题的依存句法特征表征信息;通过所述句子相似度模型的第二依存句法特征表征层,对所述预先配置的问答对中的问题的依存句法信息执行特征提取操作,以获得所述预先配置的问答对中的问题的依存句法特征表征信息;通过所述句子相似度模型的相似度预测层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行相似度的计算操作,以预测所述问题与所述预先配置的问答对中的问题的相似度。籍此,基于所述问题的依存句法信息和所述预先配置的问答对中的问题的依存句法信息,能够准确地预测请求中携带的问题与预先配置的问答对中的问题的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一些可选实施例中,在通过所述句子相似度模型的相似度预测层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行相似度的计算操作,以预测所述问题与所述预先配置的问答对中的问题的相似度时,通过所述相似度预测层中的线性计算层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行线性计算,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数;通过所述预测层中的归一化层,对所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数执行归一化操作,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率;基于所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率,以及所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的语义特征表征信息,确定所述问题与所述预先配置的问答对中的问题的相似度。籍此,通过对请求中携带的问题的依存句法特征表征信息和预先配置的问答对中的问题的依存句法特征表征信息执行线性计算,以获得请求中携带的问题与预先配置的问答对中的问题的相似度所属相似类别的分数,并对请求中携带的问题与预先配置的问答对中的问题的相似度所属相似类别的分数执行归一化操作,以获得请求中携带的问题与预先配置的问答对中的问题的相似度所属相似类别的概率,再基于请求中携带的问题与预先配置的问答对中的问题的相似度所属相似类别的概率,以及请求中携带的问题与预先配置的问答对中的问题的相似度所属相似类别的语义特征表征信息,确定请求中携带的问题与预先配置的问答对中的问题的相似度,能够准确地确定请求中携带的问题与预先配置的问答对中的问题的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S303中,基于所述相似度,确定所述问题的答案。

在一些可选实施例中,在基于所述相似度,确定所述问题的答案时,确定与请求中携带的问题的相似度最大的预先配置的问答对中的问题为与请求中携带的问题匹配的问题;将与请求中携带的问题匹配的问题的答案作为请求中携带的问题的答案。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

通过本申请实施例提供的答案的搜索方法,确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息,并基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,与现有技术相比,基于答案搜索请求中携带的问题的依存句法信息,确定问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定答案搜索请求中携带的问题的答案,能够准确地确定答案搜索请求中携带的问题的答案。

本实施例的答案的搜索方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图4,示出了本申请实施例四的数据处理方法的步骤流程图。

具体地,本实施例提供的数据处理方法包括以下步骤:

在步骤S401中,对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树。

由于该步骤S401的具体实施方式与上述步骤S101的具体实施方式类似,在此不再赘述。

在步骤S402中,基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息。

其中,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种。

由于该步骤S402的具体实施方式与上述步骤S102的具体实施方式类似,在此不再赘述。

在步骤S403中,基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。

在一些可选实施例中,在基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据时,通过句子相似度模型的至少两个依存句法特征表征层,对所述至少两个句子对应的依存句法信息分别执行特征提取操作,以获得所述至少两个句子的依存句法特征表征信息;通过所述句子相似度模型的相似度预测层,对所述至少两个句子的依存句法特征表征信息执行相似度的计算操作,以确定所述至少两个句子之间的相似数据。籍此,基于所述述至少两个句子对应的依存句法信息,能够准确地确定至少两个句子的相似数据。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一个具体的例子中,所述通过句子相似度模型的至少两个依存句法特征表征层,对所述至少两个句子对应的依存句法信息分别执行特征提取操作的具体实施方式与上述通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作的具体实施方式类似,在此不再赘述。所述通过所述句子相似度模型的相似度预测层,对所述至少两个句子的依存句法特征表征信息执行相似度的计算操作的具体实施方式与上述通过所述句子相似度模型的相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作的具体实施方式类似,在此不再赘述。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

通过本申请实施例提供的数据处理方法,对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树,并基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种,再基于至少两个句子对应的依存句法信息,确定至少两个句子之间的相似数据,与现有技术相比,通过利用至少两个句子对应的依存句法树,获得至少两个句子的依存句法信息,也即句子中的词语的依存关系标签信息和句子对应的依存句法树表示的依存关系结构信息,能够充分体现句子中词语与词语之间的依存关系和句子中词语与词语之间的依存关系结构,因此,能够准确地表征句子,从而有效提升确定至少两个句子之间的相似度的准确度。

本实施例的数据处理方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图5,示出了本申请实施例五的答案的搜索方法的步骤流程图。

具体地,本实施例提供的答案的搜索方法包括以下步骤:

在步骤S501中,向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息。

在本申请实施例中,终端设备向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在步骤S502中,接收所述服务器返回的所述问题的答案。

在本申请实施例中,终端设备接收所述服务器返回的所述问题的答案。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

通过本申请实施例提供的答案的搜索方法,终端设备向服务器发送携带有问题的答案搜索请求,服务器确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息,并基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,终端设备接收所述服务器返回的所述问题的答案,与现有技术相比,基于答案搜索请求中携带的问题的依存句法信息,确定问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定答案搜索请求中携带的问题的答案,能够准确地确定答案搜索请求中携带的问题的答案。

本实施例的答案的搜索方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图6,示出了本申请实施例六的答案的搜索方法的步骤流程图。

具体地,本实施例提供的答案的搜索方法包括以下步骤:

在步骤S601中,确定输入的问题的依存句法信息。

在本申请实施例中,在终端设备确定用户输入的问题的依存句法信息时,可将用户输入的问题作为句子。具体地,在确定输入的问题的依存句法信息时,对所述问题进行依存句法分析,以获得所述问题对应的依存句法树;基于所述依存句法树,确定所述问题的依存句法信息。其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息。所述问题对应的依存句法树表示的依存关系结构信息包括依存句法树对应的问题的核心词和依存句法树对应的问题中的词语在依存句法树中所对应的节点的结构特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在步骤S602中,基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度。

在一些可选实施例中,在基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度时,通过句子相似度模型的第一依存句法特征表征层,对所述问题的依存句法信息执行特征提取操作,以获得所述问题的依存句法特征表征信息;通过所述句子相似度模型的第二依存句法特征表征层,对所述预先配置的问答对中的问题的依存句法信息执行特征提取操作,以获得所述预先配置的问答对中的问题的依存句法特征表征信息;通过所述句子相似度模型的相似度预测层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行相似度的计算操作,以预测所述问题与所述预先配置的问答对中的问题的相似度。籍此,基于所述用户输入的问题的依存句法信息和所述预先配置的问答对中的问题的依存句法信息,能够准确地预测用户输入的问题与预先配置的问答对中的问题的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一些可选实施例中,在通过所述句子相似度模型的相似度预测层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行相似度的计算操作,以预测所述问题与所述预先配置的问答对中的问题的相似度时,通过所述相似度预测层中的线性计算层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行线性计算,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数;通过所述相似度预测层中的归一化层,对所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数执行归一化操作,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率;基于所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率,以及所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的语义特征表征信息,确定所述问题与所述预先配置的问答对中的问题的相似度。籍此,通过对用户输入的问题的依存句法特征表征信息和预先配置的问答对中的问题的依存句法特征表征信息执行线性计算,以获得用户输入的问题与预先配置的问答对中的问题的相似度所属相似类别的分数,并对用户输入的问题与预先配置的问答对中的问题的相似度所属相似类别的分数执行归一化操作,以获得用户输入的问题与预先配置的问答对中的问题的相似度所属相似类别的概率,再基于用户输入的问题与预先配置的问答对中的问题的相似度所属相似类别的概率,以及用户输入的问题与预先配置的问答对中的问题的相似度所属相似类别的语义特征表征信息,确定用户输入的问题与预先配置的问答对中的问题的相似度,能够准确地确定用户输入的问题与预先配置的问答对中的问题的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S603中,基于所述相似度,确定所述问题的答案。

在一些可选实施例中,在基于所述相似度,确定所述问题的答案时,确定与用户输入的问题的相似度最大的预先配置的问答对中的问题为与用户输入的问题匹配的问题;将与用户输入的问题匹配的问题的答案作为用户输入的问题的答案。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

通过本申请实施例提供的答案的搜索方法,确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息,并基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,与现有技术相比,基于用户输入的问题的依存句法信息,确定用户输入的问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定用户输入的问题的答案,能够准确地确定用户输入的问题的答案。

本实施例的答案的搜索方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图7A,示出了本申请实施例七的商品信息的搜索方法的步骤流程图。

具体地,本实施例提供的商品信息的搜索方法包括以下步骤:

在步骤S701中,确定接收到的商品搜索关键词的依存句法信息。

在本申请实施例中,在服务器确定接收到的商品搜索关键词的依存句法信息时,可将商品搜索关键词作为句子。具体地,在确定接收到的商品搜索关键词的依存句法信息时,对所述商品搜索关键词进行依存句法分析,以获得所述商品搜索关键词对应的依存句法树;基于所述依存句法树,确定所述商品搜索关键词的依存句法信息。其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息。所述商品搜索关键词对应的依存句法树表示的依存关系结构信息包括依存句法树对应的商品搜索关键词的核心词和依存句法树对应的商品搜索关键词中的词语在依存句法树中所对应的节点的结构特征表征信息。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在步骤S702中,基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度。

在一些可选实施例中,在基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度时,通过句子相似度模型的第一依存句法特征表征层,对所述商品搜索关键词的依存句法信息执行特征提取操作,以获得所述商品搜索关键词的依存句法特征表征信息;通过所述句子相似度模型的第二依存句法特征表征层,对所述商品描述内容的依存句法信息执行特征提取操作,以获得所述商品描述内容的依存句法特征表征信息;通过所述句子相似度模型的相似度预测层,对所述商品搜索关键词的依存句法特征表征信息和所述商品描述内容的依存句法特征表征信息执行相似度的计算操作,以预测所述商品搜索关键词与所述商品描述内容的相似度。籍此,基于所述商品搜索关键词的依存句法信息和所述商品描述内容的依存句法信息,能够准确地预测商品搜索关键词与商品描述内容的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不做任何限定。

在一些可选实施例中,在通过所述句子相似度模型的相似度预测层,对所述商品搜索关键词的依存句法特征表征信息和所述商品描述内容的依存句法特征表征信息执行相似度的计算操作,以预测所述商品搜索关键词与所述商品描述内容的相似度时,通过所述相似度预测层中的线性计算层,对所述商品搜索关键词的依存句法特征表征信息和所述商品描述内容的依存句法特征表征信息执行线性计算,以获得所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的分数;通过所述预测层中的归一化层,对所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的分数执行归一化操作,以获得所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的概率;基于所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的概率,以及所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的语义特征表征信息,确定所述商品搜索关键词与所述商品描述内容的相似度。籍此,通过对商品搜索关键词的依存句法特征表征信息和商品描述内容的依存句法特征表征信息执行线性计算,以获得商品搜索关键词与商品描述内容的相似度所属相似类别的分数,并对商品搜索关键词与商品描述内容的相似度所属相似类别的分数执行归一化操作,以获得商品搜索关键词与商品描述内容的相似度所属相似类别的概率,再基于商品搜索关键词与商品描述内容的相似度所属相似类别的概率,以及商品搜索关键词与商品描述内容的相似度所属相似类别的语义特征表征信息,确定商品搜索关键词与商品描述内容的相似度,能够准确地确定商品搜索关键词与商品描述内容的相似度。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在步骤S703中,基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。

在一些可选实施例中,在基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息时,确定与商品搜索关键词的相似度最大的商品描述内容为与商品搜索关键词匹配的商品描述内容;将与商品搜索关键词匹配的商品描述内容作为基于所述商品搜索关键词搜索得到的商品信息。其中,所述商品信息可包括商品文本信息等。可以理解的是,以上描述仅为示例性的,本申请实施例对此不作任何限定。

在一个具体的例子中,如图7B所示,在图示应用场景中,包括终端设备B和服务器。其中,终端设备B用于将商品搜索请求发送至服务器,服务器用于执行本申请实施例提供的句子相似度的确定方法,以向终端设备B返回携带商品信息的商品搜索响应。

当用户需要通过商品搜索系统来搜索商品信息时,用户可以在终端设备B上提供的商品搜索关键词的输入栏中输入商品搜索关键词,进而,在终端设备B获取到用户输入的商品搜索关键词之后,将商品搜索请求发送至服务器。

服务器接收到终端设备B发送的商品搜索请求后,服务器将商品搜索请求中携带的商品搜索关键词作为句子A,并将预先配置的商品描述内容作为句子B。然后,采用如图2C所示的句子相似度的确定方法确定句子A与句子B之间的相似度,并确定与句子A的相似度最大的句子B为与句子A匹配的句子B。在确定得到与句子A匹配的句子B之后,可将句子B对应的商品描述内容作为句子A对应的商品信息,从而获得基于所述商品搜索关键词搜索得到的商品信息。由此,服务器可以向终端设备B返回携带商品信息的商品搜索响应。

需要说明的是,通过将句子中的词语的依存关系标签信息引入句子相似度模型的输入层,并通过编码层,对节点具有结构特征表征信息的依存句法树执行编码操作,能够准确地获得句子的依存句法特征表征信息,进而能够准确地确定句子之间的相似度。

需要说明的是,上述图7B所示场景仅为一种示例,在实际应用中,本申请实施例提供的句子相似度的确定方法还可以应用于终端设备B,在此不对该句子相似度的确定方法的应用场景做任何具体限定。

通过本申请实施例提供的商品信息的搜索方法,确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息,并基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度,再基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息,与现有技术相比,基于商品搜索关键词的依存句法信息,确定商品搜索关键词与商品描述内容的相似度,再基于所述相似度,确定基于商品搜索关键词搜索得到的商品信息,能够准确地确定基于商品搜索关键词搜索得到的商品信息。

本实施例的商品信息的搜索方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

参照图8,示出了本申请实施例八的句子相似度模型的建立方法的步骤流程图。

具体地,本实施例提供的句子相似度模型包括第一依存句法特征表征层、第二依存句法特征表征层,及与所述第一依存句法特征表征层和所述第二依存句法特征表征层的输出端连接的相似度预测层。所述句子相似度模型的建立方法包括以下步骤:

在步骤S801中,通过所述第一依存句法特征表征层,对第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息。

由于该步骤S801的具体实施方式与上述步骤S203的具体实施方式类似,在此不再赘述。

在步骤S802中,通过所述第二依存句法特征表征层,对第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息。

由于该步骤S802的具体实施方式与上述步骤S204的具体实施方式类似,在此不再赘述。

在步骤S803中,通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

由于该步骤S803的具体实施方式与上述步骤S205的具体实施方式类似,在此不再赘述。

根据本申请实施例提供的句子相似度模型的建立方法,通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息,并通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息,再通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度,与现有技术相比,基于所述第一句子的依存句法信息和所述第二句子的依存句法信息,能够准确地预测第一句子与第二句子的相似度。

本实施例的句子相似度模型的建立方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:摄像头、终端、移动终端、PC机、服务器、车载设备、娱乐设备、广告设备、个人数码助理(PDA)、平板电脑、笔记本电脑、掌上游戏机、智能眼镜、智能手表、可穿戴设备、虚拟显示设备或显示增强设备等。

本申请实施例九提供一种答案的搜索系统。所述系统包括:终端设备,以及与所述终端设备通信连接的服务器,所述终端设备,用于向服务器发送携带有问题的答案搜索请求;所述服务器,用于确定接收到的答案搜索请求中携带的问题的依存句法信息,并基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;所述终端设备,还用于接收所述服务器返回的所述问题的答案。

本实施例的答案的搜索系统用于实现前述多个方法实施例中相应的答案的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

本申请实施例十提供一种商品信息的搜索系统。所述系统包括:终端设备,以及与所述终端设备通信连接的服务器,所述终端设备,用于向服务器发送携带有商品搜索关键词的商品搜索请求;所述服务器,用于确定接收到的商品搜索请求中携带的商品搜索关键词的依存句法信息,并基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度,再基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;所述终端设备,还用于接收所述服务器返回的所述商品信息。

本实施例的商品信息的搜索系统用于实现前述多个方法实施例中相应的商品信息的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图9,示出了本申请实施例十一中句子相似度的确定装置的结构示意图。

本实施例提供的句子相似度的确定装置包括:分析模块901,用于对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;确定模块902,用于基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;预测模块903,用于基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。

本实施例的句子相似度的确定装置用于实现前述多个方法实施例中相应的句子相似度的确定方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图10,示出了本申请实施例十二中句子相似度的确定装置的结构示意图。

本实施例提供的句子相似度的确定装置包括:分析模块1001,用于对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;确定模块1002,用于基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;预测模块1003,用于基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。

可选地,所述确定模块1002,具体用于:通过第一依存句法树编码模型,对所述第一依存句法树执行编码操作,以获得所述第一依存关系结构信息包括的所述第一句子中的词语在所述第一依存句法树中所对应的节点的结构特征表征信息;通过第二依存句法树编码模型,对所述第二依存句法树执行编码操作,以获得所述第二依存关系结构信息包括的所述第二句子中的词语在所述第二依存句法树中所对应的节点的结构特征表征信息。

可选地,所述第一依存句法树编码模型和所述第二依存句法树编码模型分别包括图卷积神经网络模型,或者所述第一依存句法树编码模型和所述第二依存句法树编码模型分别包括树状长短时记忆网络模型。

可选地,所述预测模块1003,包括:第一获得子模块10031,用于通过句子相似度模型的第一依存句法特征表征层,对所述第一依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;第二获得子模块10032,用于通过所述句子相似度模型的第二依存句法特征表征层,对所述第二依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;预测子模块10033,用于通过所述句子相似度模型的相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

可选地,所述第一获得子模块10031,具体用于:通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息,确定所述词语的综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第一句子的依存句法特征表征信息。

可选地,所述第一获得子模块10031,具体用于:通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的第一综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的第一综合特征表征信息执行编码操作,以获得所述词语的第二综合特征表征信息;基于所述词语的第二综合特征表征信息和所述第一依存关系结构信息包括的所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息,确定所述词语的第三综合特征表征信息;对所述词语的第三综合特征表征信息执行相加操作或者拼接操作,以确定所述第一句子的依存句法特征表征信息。

可选地,所述第一获得子模块10031,具体用于:通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语、所述词语的依存关系标签信息,以及所述第一依存关系结构信息包括的所述第一句子的核心词分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息,确定所述词语的综合特征表征信息;通过所述第一依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第一句子的依存句法特征表征信息。

可选地,所述第一获得子模块10031,具体用于:通过所述第一依存句法特征表征层中的输入层,对输入的所述第一句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的综合特征表征信息,并将所述词语的综合特征表征信息作为所述词语在所述第一依存句法树中所对应的节点的结构特征表征信息;通过所述第一依存句法特征表征层中的编码层,对节点具有结构特征表征信息的所述第一依存句法树执行编码操作,以获得所述第一句子的依存句法特征表征信息。

可选地,所述第二获得子模块10032,具体用于:通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的综合特征表征信息,并将所述词语的综合特征表征信息作为所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息;通过所述第二依存句法特征表征层中的编码层,对节点具有结构特征表征信息的所述第二依存句法树执行编码操作,以获得所述第二句子的依存句法特征表征信息。

可选地,所述编码层包括图卷积神经网络模型,或者树状长短时记忆网络模型。

可选地,所述第二获得子模块10032,具体用于:通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息,确定所述词语的综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第二句子的依存句法特征表征信息。

可选地,所述第二获得子模块10032,具体用于:通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语和所述词语的依存关系标签信息分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,确定所述词语的第一综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的第一综合特征表征信息执行编码操作,以获得所述词语的第二综合特征表征信息;基于所述词语的第二综合特征表征信息和所述第二依存关系结构信息包括的所述词语在所述第二依存句法树中所对应的节点的结构特征表征信息,确定所述词语的第三综合特征表征信息;基于所述词语的第三综合特征表征信息,确定所述第二句子的依存句法特征表征信息。

可选地,所述第二获得子模块10032,具体用于:通过所述第二依存句法特征表征层中的输入层,对输入的所述第二句子中的词语、所述词语的依存关系标签信息,以及所述第二依存关系结构信息包括的所述第二句子的核心词分别执行特征提取操作,以获得所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息;基于所述词语的语义特征表征信息和依存关系标签特征表征信息,以及所述核心词的语义特征表征信息,确定所述词语的综合特征表征信息;通过所述第二依存句法特征表征层中的编码层,对所述词语的综合特征表征信息执行编码操作,以获得所述第二句子的依存句法特征表征信息。

可选地,所述预测子模块10033,具体用于:通过所述相似度预测层中的线性计算层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行线性计算,以获得所述第一句子与所述第二句子的相似度所属相似类别的分数;通过所述相似度预测层中的归一化层,对所述第一句子与所述第二句子的相似度所属相似类别的分数执行归一化操作,以获得所述第一句子与所述第二句子的相似度所属相似类别的概率;基于所述第一句子与所述第二句子的相似度所属相似类别的概率,以及所述第一句子与所述第二句子的相似度所属相似类别的语义特征表征信息,确定所述第一句子与所述第二句子的相似度。

本实施例的句子相似度的确定装置用于实现前述多个方法实施例中相应的句子相似度的确定方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图11,示出了本申请实施例十三中答案的搜索装置的结构示意图。

本实施例提供的答案的搜索装置包括:第一确定模块1101,用于确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;第二确定模块1102,用于基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;第三确定模块1103,用于基于所述相似度,确定所述问题的答案。

本实施例的答案的搜索装置用于实现前述多个方法实施例中相应的答案的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图12,示出了本申请实施例十四中数据处理装置的结构示意图。

本实施例提供的数据处理装置包括:分析模块1201,用于对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树;第一确定模块1202,用于基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种;第二确定模块1203,用于基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。

本实施例的数据处理装置用于实现前述多个方法实施例中相应的数据处理方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图13,示出了本申请实施例十五中答案的搜索装置的结构示意图。

本实施例提供的答案的搜索装置包括:发送模块1301,用于向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;接收模块1302,用于接收所述服务器返回的所述问题的答案。

本实施例的答案的搜索装置用于实现前述多个方法实施例中相应的答案的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图14,示出了本申请实施例十六中答案的搜索装置的结构示意图。

本实施例提供的答案的搜索装置包括:第一确定模块1401,用于确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;第二确定模块1402,用于基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;第三确定模块1406,用于基于所述相似度,确定所述问题的答案。

可选地,所述第一确定模块1401,具体用于:对所述问题进行依存句法分析,以获得所述问题对应的依存句法树;基于所述依存句法树,确定所述问题的依存句法信息。

可选地,所述第二确定模块1402,包括:第一提取子模块1403,用于通过句子相似度模型的第一依存句法特征表征层,对所述问题的依存句法信息执行特征提取操作,以获得所述问题的依存句法特征表征信息;第二提取子模块1404,用于通过所述句子相似度模型的第二依存句法特征表征层,对所述预先配置的问答对中的问题的依存句法信息执行特征提取操作,以获得所述预先配置的问答对中的问题的依存句法特征表征信息;计算子模块1405,用于通过所述句子相似度模型的相似度预测层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行相似度的计算操作,以预测所述问题与所述预先配置的问答对中的问题的相似度。

可选地,所述计算子模块1405,具体用于:通过所述相似度预测层中的线性计算层,对所述问题的依存句法特征表征信息和所述预先配置的问答对中的问题的依存句法特征表征信息执行线性计算,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数;通过所述预测层中的归一化层,对所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的分数执行归一化操作,以获得所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率;基于所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的概率,以及所述问题与所述预先配置的问答对中的问题的相似度所属相似类别的语义特征表征信息,确定所述问题与所述预先配置的问答对中的问题的相似度。

本实施例的答案的搜索装置用于实现前述多个方法实施例中相应的答案的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图15,示出了本申请实施例十七中商品信息的搜索装置的结构示意图。

本实施例提供的商品信息的搜索装置包括:第一确定模块1501,用于确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;第二确定模块1502,用于基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度;第三确定模块1506,用于基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。

可选地,所述第一确定模块1501,具体用于:对所述商品搜索关键词进行依存句法分析,以获得所述商品搜索关键词对应的依存句法树;基于所述依存句法树,确定所述商品搜索关键词的依存句法信息。

可选地,所述第二确定模块1502,包括:第一提取子模块1503,用于通过句子相似度模型的第一依存句法特征表征层,对所述商品搜索关键词的依存句法信息执行特征提取操作,以获得所述商品搜索关键词的依存句法特征表征信息;第二提取子模块1504,用于通过所述句子相似度模型的第二依存句法特征表征层,对所述商品描述内容的依存句法信息执行特征提取操作,以获得所述商品描述内容的依存句法特征表征信息;计算子模块1505,用于通过所述句子相似度模型的相似度预测层,对所述商品搜索关键词的依存句法特征表征信息和所述商品描述内容的依存句法特征表征信息执行相似度的计算操作,以预测所述商品搜索关键词与所述商品描述内容的相似度。

可选地,所述计算子模块1505,具体用于:通过所述相似度预测层中的线性计算层,对所述商品搜索关键词的依存句法特征表征信息和所述商品描述内容的依存句法特征表征信息执行线性计算,以获得所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的分数;通过所述预测层中的归一化层,对所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的分数执行归一化操作,以获得所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的概率;基于所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的概率,以及所述商品搜索关键词与所述商品描述内容的相似度所属相似类别的语义特征表征信息,确定所述商品搜索关键词与所述商品描述内容的相似度。

本实施例的商品信息的搜索装置用于实现前述多个方法实施例中相应的商品信息的搜索方法,并具有相应的方法实施例的有益效果,在此不再赘述。

参照图16,示出了本申请实施例十八中句子相似度模型的建立装置的结构示意图。

本实施例提供的句子相似度模型包括第一依存句法特征表征层、第二依存句法特征表征层,及与所述第一依存句法特征表征层和所述第二依存句法特征表征层的输出端连接的相似度预测层。所述句子相似度模型的建立装置包括:第一提取模块1601,用于通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;第二提取模块1602,用于通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;计算模块1603,用于通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

本实施例的句子相似度模型的建立装置用于实现前述多个方法实施例中相应的句子相似度模型的建立方法,并具有相应的方法实施例的有益效果,在此不再赘述。

图17为本申请实施例十九中电子设备的结构示意图;该电子设备可以包括:

一个或多个处理器1701;

计算机可读介质1702,可以配置为存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述实施例一或实施例二所述的句子相似度的确定方法,实现如上述实施例三所述的答案的搜索方法,实现如上述实施例四所述的数据处理方法,实现如上述实施例五所述的答案的搜索方法,实现如上述实施例六所述的答案的搜索方法,实现如上述实施例七所述的商品信息的搜索方法,或者实现如上述实施例八所述的句子相似度模型的建立方法。

图18为本申请实施例二十中电子设备的硬件结构;如图18所示,该电子设备的硬件结构可以包括:处理器1801,通信接口1802,计算机可读介质1803和通信总线1804;

其中处理器1801、通信接口1802、计算机可读介质1803通过通信总线1804完成相互间的通信;

可选地,通信接口1802可以为通信模块的接口,如GSM模块的接口;

其中,处理器1801具体可以配置为:对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。此外,处理器1801还可以配置为:确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。此外,处理器1801还可以配置为:对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树;基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种;基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。此外,处理器1801还可以配置为:向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;接收所述服务器返回的所述问题的答案。此外,处理器1801还可以配置为:确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。此外,处理器1801还可以配置为:确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度;基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。此外,处理器1801还可以配置为:通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

处理器1801可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

计算机可读介质1803可以是,但不限于,随机存取存储介质(Random AccessMemory,RAM),只读存储介质(Read Only Memory,ROM),可编程只读存储介质(Programmable Read-Only Memory,PROM),可擦除只读存储介质(Erasable ProgrammableRead-Only Memory,EPROM),电可擦除只读存储介质(Electric Erasable ProgrammableRead-Only Memory,EEPROM)等。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含配置为执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读介质例如可以但不限于是电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储介质(RAM)、只读存储介质(ROM)、可擦式可编程只读存储介质(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储介质(CD-ROM)、光存储介质件、磁存储介质件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输配置为由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写配置为执行本申请的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络:包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个配置为实现规定的逻辑功能的可执行指令。上述具体实施例中有特定先后关系,但这些先后关系只是示例性的,在具体实现的时候,这些步骤可能会更少、更多或执行顺序有调整。即在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括分析模块、确定模块和预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,分析模块还可以被描述为“对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树的模块”。

作为另一方面,本申请还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例一或实施例二所描述的句子相似度的确定方法,实现如上述实施例三所述的答案的搜索方法,实现如上述实施例四所述的数据处理方法,实现如上述实施例五所述的答案的搜索方法,实现如上述实施例六所述的答案的搜索方法,实现如上述实施例七所述的商品信息的搜索方法,或者实现如上述实施例八所述的句子相似度模型的建立方法。

作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的装置中所包含的;也可以是单独存在,而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该装置:对第一句子和第二句子分别进行依存句法分析,以获得所述第一句子对应的第一依存句法树和所述第二句子对应的第二依存句法树;基于所述第一依存句法树和所述第二依存句法树,分别确定所述第一句子的第一依存句法信息和所述第二句子的第二依存句法信息,其中,所述第一依存句法信息包括所述第一句子中的词语的依存关系标签信息和所述第一依存句法树表示的第一依存关系结构信息,并且所述第二依存句法信息包括所述第二句子中的词语的依存关系标签信息和所述第二依存句法树表示的第二依存关系结构信息;基于所述第一依存句法信息和所述第二依存句法信息,预测所述第一句子与所述第二句子的相似度。此外,还使得该装置:确定接收到的答案搜索请求中携带的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。此外,还使得该装置:对待分析的至少两个句子进行依存句法分析,分别获得对应的依存句法树;基于依存句法分析得到的依存句法树,确定句子对应的依存句法信息,所述依存句法信息包括句子中词语之间的依存关系标签数据和句子的依存关系结构数据中至少一种;基于所述至少两个句子对应的依存句法信息,确定所述至少两个句子之间的相似数据。此外,还使得该装置:向服务器发送携带有问题的答案搜索请求,使得所述服务器确定所述问题的依存句法信息,并基于所述依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度,再基于所述相似度,确定所述问题的答案,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;接收所述服务器返回的所述问题的答案。此外,还使得该装置:确定输入的问题的依存句法信息,其中,所述依存句法信息包括所述问题中的词语的依存关系标签信息和所述问题对应的依存句法树表示的依存关系结构信息;基于所述问题的依存句法信息,确定所述问题与预先配置的问答对中的问题的相似度;基于所述相似度,确定所述问题的答案。此外,还使得该装置:确定接收到的商品搜索关键词的依存句法信息,其中,所述依存句法信息包括所述商品搜索关键词中的词语的依存关系标签信息和所述商品搜索关键词对应的依存句法树表示的依存关系结构信息;基于所述商品搜索关键词的依存句法信息,确定所述商品搜索关键词与商品描述内容的相似度;基于所述相似度,确定基于所述商品搜索关键词搜索得到的商品信息。此外,还使得该装置:通过所述第一依存句法特征表征层,对所述第一句子的依存句法信息执行特征提取操作,以获得所述第一句子的依存句法特征表征信息;通过所述第二依存句法特征表征层,对所述第二句子的依存句法信息执行特征提取操作,以获得所述第二句子的依存句法特征表征信息;通过所述相似度预测层,对所述第一句子的依存句法特征表征信息和所述第二句子的依存句法特征表征信息执行相似度的计算操作,以预测所述第一句子与所述第二句子的相似度。

在本公开的各种实施方式中所使用的表述“第一”、“第二”、“所述第一”或“所述第二”可修饰各种部件而与顺序和/或重要性无关,但是这些表述不限制相应部件。以上表述仅配置为将元件与其它元件区分开的目的。例如,第一用户设备和第二用户设备表示不同的用户设备,虽然两者均是用户设备。例如,在不背离本公开的范围的前提下,第一元件可称作第二元件,类似地,第二元件可称作第一元件。

当一个元件(例如,第一元件)称为与另一元件(例如,第二元件)“(可操作地或可通信地)联接”或“(可操作地或可通信地)联接至”另一元件(例如,第二元件)或“连接至”另一元件(例如,第二元件)时,应理解为该一个元件直接连接至该另一元件或者该一个元件经由又一个元件(例如,第三元件)间接连接至该另一个元件。相反,可理解,当元件(例如,第一元件)称为“直接连接”或“直接联接”至另一元件(第二元件)时,则没有元件(例如,第三元件)插入在这两者之间。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

相关技术
  • 句子相似度确定方法、答案搜索方法、装置、设备、系统及介质
  • 相似度评估方法、答案搜索方法、装置、设备及介质
技术分类

06120113083300