掌桥专利:专业的专利平台
掌桥专利
首页

资源检索方法、训练方法、装置、电子设备、存储介质及程序产品

文献发布时间:2024-04-18 20:02:18


资源检索方法、训练方法、装置、电子设备、存储介质及程序产品

技术领域

本公开涉及人工智能技术领域,尤其涉及智能检索技术领域、大数据技术领域和深度学习技术领域。

背景技术

随着互联网技术的快速发展,用户可以通过智能手机等终端设备快速地浏览新闻等信息资源,也可以基于需求在终端设备中输入搜索词、搜索语句等搜索文本,终端设备可以基于搜索文本来进行资源检索,以提供与用户的检索需求相匹配的资源,提升用户的信息获取效率。

发明内容

本公开提供了一种资源检索方法、训练方法、装置、电子设备、存储介质及程序产品。

根据本公开的一方面,提供了一种资源检索方法,包括:响应于接收到搜索文本,根据搜索文本确定目标对象的对象属性,目标对象与搜索文本相关;对搜索文本和对象属性进行特征融合,得到搜索特征;根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征,预设资源融合特征库中的预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本;根据目标资源融合特征进行资源检索,得到目标资源;以及向与目标对象相关的终端推送目标资源。

根据本公开的另一方面,提供了一种深度学习模型的训练方法,其中,深度学习模型包括:资源特征提取网络、搜索特征提取网络和搜索融合特征提取网络;该方法包括:获取样本数据集和标签,样本数据集包括样本搜索文本、与样本搜索文本相关联的样本对象属性,以及与样本关联资源相对应的样本关联资源相关文本,样本关联资源与样本搜索文本相关联;利用搜索特征提取网络对样本搜索文本和样本对象属性进行特征融合,得到样本搜索特征;利用资源特征提取网络对样本关联资源相关文本进行特征融合,得到样本关联资源特征;利用搜索融合特征提取网络融合样本关联资源特征和样本搜索特征,得到样本搜索融合特征;以及根据样本搜索融合特征和标签,训练深度学习模型,得到训练后的深度学习模型。

根据本公开的另一方面,提供了资源检索装置,包括:第一确定模块,用于响应于接收到搜索文本,根据搜索文本确定目标对象的对象属性,目标对象与搜索文本相关;搜索特征获得模块,用于对搜索文本和对象属性进行特征融合,得到搜索特征;目标资源融合特征获得模块,用于根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征,预设资源融合特征库中的预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本;目标资源获得模块,用于根据目标资源融合特征进行资源检索,得到目标资源;以及目标资源推送模块,用于向与目标对象相关的终端推送目标资源。

根据本公开的另一方面,提供了深度学习模型的训练装置,其中,深度学习模型包括:资源特征提取网络、搜索特征提取网络和搜索融合特征提取网络;该装置包括:第一获取模块,用于获取样本数据集和标签,样本数据集包括样本搜索文本、与样本搜索文本相关联的样本对象属性,以及与样本关联资源相对应的样本关联资源相关文本,样本关联资源与样本搜索文本相关联;样本搜索特征获得模块,用于利用搜索特征提取网络对样本搜索文本和样本对象属性进行特征融合,得到样本搜索特征;样本关联资源特征获得模块,用于利用资源特征提取网络对样本关联资源相关文本进行特征融合,得到样本关联资源特征;样本搜索融合特征获得模块,用于利用搜索融合特征提取网络融合样本关联资源特征和样本搜索特征,得到样本搜索融合特征;以及训练模块,用于根据样本搜索融合特征和标签,训练深度学习模型,得到训练后的深度学习模型。

根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开实施例提供的方法。

根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开实施例提供的方法。

根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开实施例提供的方法。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1示意性示出了根据本公开实施例的可以应用资源检索方法及装置的示例性系统架构;

图2示意性示出了根据本公开实施例的资源检索方法的流程图;

图3示意性示出了根据本公开实施例的对搜索文本和对象属性进行特征融合的原理示意图;

图4示意性示出了根据本公开实施例的确定与预设资源节点相关联的关联预设搜索节点的原理示意图;

图5示意性示出了根据本公开实施例的对预设资源相关文本和预设资源属性进行特征融合的原理示意图;

图6示意性示出了根据本公开实施例的确定与搜索文本相关联的关联资源节点的原理示意图;

图7示意性示出了根据本公开实施例的将关联资源相关文本进行文本语义融合的原理示意图;

图8示意性示出了根据本公开实施例的深度学习模型的原理示意图;

图9示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图;

图10示意性示出了根据本公开实施例的深度学习模型的训练方法的原理示意图;

图11示意性示出了根据本公开另一实施例的深度学习模型的训练方法的原理示意图;

图12示意性示出了根据本公开实施例的正标签资源节点和负标签资源节点的示意图;

图13示意性示出了根据本公开另一实施例的正标签资源节点和负标签资源节点的示意图;

图14示意性示出了根据本公开实施例的资源检索装置的框图;

图15示意性示出了根据本公开实施例的深度学习模型的训练装置的框图;以及

图16示意性示出了根据本公开实施例的适于实现资源检索方法、深度学习模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

在本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,采取了必要保密措施,且不违背公序良俗。

用户可以通过在智能手机等终端设备中输入文本等搜索信息进行资源检索,终端设备可以基于搜索信息的语义属性来进行资源检索,以提供与用户的检索需求相匹配的资源。而发明人发现资源检索过程中基于搜索文本难以准确地理解用户的检索需求,导致检索到的资源可能会与用户的检索意图的匹配程度较低,难以准确地满足用户的检索需求。

本公开的实施例提供了一种资源检索方法、训练方法、装置、电子设备、存储介质及程序产品。该资源检索方法包括:响应于接收到搜索文本,根据搜索文本确定目标对象的对象属性,目标对象与搜索文本相关;对搜索文本和对象属性进行特征融合,得到搜索特征;根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征,预设资源融合特征库中的预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本;根据目标资源融合特征进行资源检索,得到目标资源;以及向与目标对象相关的终端推送目标资源。

根据本公开的实施例,通过将搜索文本和离散化的对象属性进行特征融合,可以使得到的搜索特征在融合搜索文本的语义属性和目标对象的对象属性的条件下进行资源检索,从而可以使搜索特征较为准确地表征目标对象的检索意图,在预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本的情况下,通过搜索特征在预设资源融合特征库中进行检索,可以使得到的目标资源融合特征表征的预设资源相关文本和关联预设搜索文本,能够较为准确地匹配搜索文本的语义属性和目标对象的对象属性,这样根据目标资源融合特征进行资源检索,能够在减少语义信息丢失,并充分学习对象属性的条件下来进行资源检索,使检索到的目标资源较为准确地匹配目标对象的检索需求,提升资源检索的准确性与检索效率。

图1示意性示出了根据本公开实施例的可以应用资源检索方法及装置的示例性系统架构。

需要注意的是,图1所示仅为可以应用本公开实施例的系统架构的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。例如,在另一实施例中,可以应用资源检索方法及装置的示例性系统架构可以包括终端设备,但终端设备可以无需与服务器进行交互,即可实现本公开实施例提供的资源检索方法及装置。

如图1所示,根据该实施例的系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线和/或无线通信链路等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如知识阅读类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端和/或社交平台软件等(仅为示例)。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的内容提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。

需要说明的是,本公开实施例所提供的资源检索方法一般可以由终端设备101、102、或103执行。相应地,本公开实施例所提供的资源检索装置也可以设置于终端设备101、102、或103中。

或者,本公开实施例所提供的资源检索方法一般也可以由服务器105执行。相应地,本公开实施例所提供的资源检索装置一般可以设置于服务器105中。本公开实施例所提供的资源检索方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的资源检索装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群中。

例如,在用户在线阅读电子书时,终端设备101、102、103可以获取用户视线指向的电子书中的目标内容,然后将获取的目标内容发送给服务器105,由服务器105对目标内容进行分析,确定目标内容的特征信息;根据目标内容的特征信息预测用户感兴趣的内容;以及摘抄用户感兴趣的内容。或者由能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群对目标内容进行分析,并最终实现摘抄用户感兴趣的内容。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示意性示出了根据本公开实施例的资源检索方法的流程图。

如图2所示,该资源检索方法包括操作S210~S250。

在操作S210,响应于接收到搜索文本,根据搜索文本确定目标对象的对象属性,目标对象与搜索文本相关。

在操作S220,对搜索文本和对象属性进行特征融合,得到搜索特征。

在操作S230,根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征,预设资源融合特征库中的预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本。

在操作S240,根据目标资源融合特征进行资源检索,得到目标资源。

在操作S250,向与目标对象相关的终端推送目标资源。

根据本公开的实施例,搜索文本可以包括目标对象基于输入操作生成的文本字、文本词、字符等任意类型的信息,本公开的实施例对搜索文本的具体类型不做限定。

需要说明的是,搜索文本可以使基于任意地方式获取的,例如可以基于目标对象的文本输入操作接收到搜索文本,但不仅限于此,还可以基于语音输入操作、图像输入操作等其他类型的输入操作来得到搜索文本,本公开的实施例对获得到搜索文本的具体方式不做限定。

根据本公开的实施例,对象属性可以包括目标对象的产品偏好属性、地理位置属性等离散化的属性,对象属性可以基于目标对象的属性设置操作确定,或者还可以在目标对象授权的情况下,基于目标对象的检索操作、浏览操作等任意类型的交互操作来确定,本公开的实施例对确定对象属性的具体方式不做限定,只要满足相关法律法规的规定即可。

根据本公开的实施例,对搜索文本和对象属性进行特征融合,可以包括基于神经网络算法来处理搜索文本和对象属性,以便于提取到搜索文本的语义属性特征和对象属性表征的离散化属性特征,并将语义属性特征和对象属性表征的离散化属性特征进行融合,使得到的搜索特征能够较为准确地表征目标对象的资源检索意图。

根据本公开的实施例,预设资源可以包括已经构建得到的资源,预设搜索文本可以包括历史时间段中获得到的搜索文本。与预设资源相关联的关联预设搜索文本,可以包括与预设资源具有检索交互操作关系的预设搜索文本,检索交互操作关系例如可以是历史时间段中基于关联预设搜索文本进行检索,并对该预设资源进行执行点击操作。

根据本公开的实施例,预设资源可以包括能够基于智能手机等终端设备浏览的任意类型的资源,包括新闻资源、广告资源、视频资源等,本公开的实施例对资源的具体类型不做限定,本领域技术人员可以根据实际需求进行选择。预设资源相关文本可以包括该预设资源表征的文本,例如广告资源的产品介绍文本,新闻资源的新闻内容文本等。或者还可以包括其他类型的与该预设资源相关的文本,例如预设资源相关文本还可以包括用于对该预设资源的文字、图像等资源内容进行描述的文本,例如对广告资源的产品形状进行描述的文本等。或者还可以包括对资源的投放区域范围等资源投放属性进行描述的文本。本公开的实施例对资源描述文本的具体描述内容不做限定,只要能够表征预设资源即可。

根据本公开的实施例,预设资源融合特征可以是对预设资源的预设资源相关文本和关联预设搜索文本进行特征融合后得到的,例如可以基于注意力网络算法来融合预设资源相关文本和关联预设搜索文本,得到预设资源融合特征。基于搜索特征检索到的目标资源融合特征,可以实现预设资源相关文本、关联预设搜索文本和搜索文本这三项文本之间的文本语义属性相匹配,能够实现预设资源相关文本、关联预设搜索文本和目标对象的对象属性之间的检索操作关系相适配,从而根据目标资源融合特征检索到的目标资源,能够较为准确地满足目标对象的检索需求,从而提升资源的检索精确程度,提升检索效率。

图3示意性示出了根据本公开实施例的对搜索文本和对象属性进行特征融合的原理示意图。

如图3所示,搜索特征提取网络300可以包括搜索文本特征提取层310、对象属性特征提取层320和搜索特征输出层330。搜索文本特征提取层310可以基于注意力网络算法构建得到,例如可以基于Ernie网络算法构建得到。对象属性特征提取层320和搜索特征输出层330可以基于神经网络算法构建得到,例如对象属性特征提取层320可以基于深度神经网络(Deep Neural Networks,DNN)模型构建得到,搜索特征输出层330可以基于多层感知器(MLP,Multilayer Perceptron)算法来构建得到。

如图3所示,对搜索文本和对象属性进行特征融合,可以包括:将搜索文本301输入搜索文本特征提取层310,以便于对搜索文本301提取文本特征,得到搜索文本特征。将对象属性302输入对象属性特征提取层320,以便于对对象属性302提取属性特征,得到对象属性特征。将搜索文本特征和对象属性特征输入搜索特征输出层330,输出搜索特征303。

需要说明的是,图3所示的搜索特征提取网络300并不是用于限定对搜索文本和对象属性进行特征融合的具体方式,本领域技术人员可以根据实际需求对特征融合的具体方式进行设计,本公开的实施例对此不做限定。

根据本公开的实施例,预设资源融合特征是基于如下操作确定的:确定与预设资源相关联的关联预设搜索节点,关联预设搜索节点与关联预设搜索文本相关联;对关联预设搜索文本,以及与关联预设搜索文本相关联的关联预设对象属性进行特征融合,得到关联预设搜索特征;对与预设资源相关联的预设资源相关文本和预设资源属性进行特征融合,得到预设资源特征;基于注意力机制融合关联预设搜索特征和预设资源特征,得到与预设资源相关的预设资源融合特征。

根据本公开的实施例,可以根据索引来查询到与预设资源相关联的关联预设搜索节点。或者还可以基于其他方式来确定关联预设搜索节点,例如可以在预先构建的资源搜索关系拓扑图中,确定表征预设资源的预设资源节点,并根据预设资源节点在资源搜索关系拓扑图中进行检索,将与预设资源节点具有边关系的预设搜索节点确定为关联预设搜索节点。边关系可以表征预设搜索文本与预设资源之间的检索交互操作关系。

根据本公开的实施例,确定与预设资源相关联的关联预设搜索节点可以包括:根据与预设资源相对应的预设资源节点,在预构建的资源搜索关系拓扑图中确定与预设资源节点相关联的关联预设搜索节点。

根据本公开的实施例,资源搜索关系拓扑图包括多个节点和节点之间的边关系,多个节点包括预设资源节点和预设搜索节点,预设搜索节点与预设搜索文本相关联。

根据本公开的实施例,预设资源节点和预设搜索节点可以各自与预设资源和预设搜索文本相关联,可以基于与预设资源相对应的预设资源文本特征来确定预设资源节点,可以基于与预设搜索文本相对应的预设搜索文本特征来确定预设搜索节点,从而可以使资源搜索关系拓扑图中不同的节点之间的位置关系,可以表征不同的节点之间的语义相关性,这样可以基于近邻检索的方式来确定与预设资源节点相关联的关联预设搜索节点,提升关联预设搜索文本与预设资源相关文本之间的语义相关程度。

图4示意性示出了根据本公开实施例的确定与预设资源节点相关联的关联预设搜索节点的原理示意图。

如图4所示,资源搜索关系拓扑图T400中可以包括多个节点,以及多个节点之间的边关系。例如可以包括预设搜索节点411,以及与预设搜索节点411具有边关系的预设资源节点421和422等。还可以包括预设资源节点425,以及与预设资源节点425相对应的关联预设搜索节点。在确定与预设资源相对应的预设资源节点425的情况下,可以将与预设资源节点425具有边关系的预设搜索节点,确定为关联预设搜索节点。这样可以从资源搜索关系拓扑图T400中确定拓扑子图T410。拓扑子图T410中的预设搜索节点可以为关联预设搜索节点,进而可以根据拓扑子图T410中的关联预设搜索节点来从预设搜索文本库中确定与预设资源相关联的关联预设搜索文本。

根据本公开的实施例,对关联预设搜索文本,以及与关联预设搜索文本相关联的关联预设对象属性进行特征融合,得到关联预设搜索特征可以包括基于预训练的搜索特征提取网络来融合关联预设搜索文和关联预设对象属性,得到关联预设搜索特征。搜索特征提取网络可以包括注意力网络层和深度神经网络层。

图5示意性示出了根据本公开实施例的对预设资源相关文本和预设资源属性进行特征融合的原理示意图。

如图5所示,资源特征融合网络500可以包括资源文本特征提取层510、资源属性特征提取层520和资源特征输出层530。资源文本特征提取层510可以基于注意力网络算法构建得到,例如可以基于Ernie网络算法构建得到。资源属性特征提取层520和资源特征输出层530可以基于神经网络算法构建得到,例如资源属性特征提取层520可以基于深度神经网络(Deep Neural Networks,DNN)模型构建得到,资源特征输出层530可以基于多层感知器(MLP,Multilayer Perceptron)算法来构建得到。

如图5所示,对预设资源相关文本和预设资源属性进行特征融合,可以包括:将预设资源相关文本501输入资源文本特征提取层510,以便于对预设资源相关文本501提取文本特征,得到预设资源文本特征。将预设资源属性502输入资源属性特征提取层520,以便于对预设资源属性502提取属性特征,得到预设资源属性特征。将预设资源文本特征和预设资源属性特征输入资源特征输出层530,以便于融合预设资源文本特征和预设资源属性特征,输出预设资源特征503。

根据本公开的实施例,基于注意力机制融合关联预设搜索特征和预设资源特征,可以包括基于注意力网络算法来处理关联预设搜索特征和预设资源特征。例如可以基于Transformer模型来处理关联预设搜索特征和预设资源特征,得到能够表征预设资源与关联搜索文本之间的语义属性关系和检索交互操作关系的预设资源融合特征,以便于目标对象基于当前的搜索信息来进行资源查询,得到较为精确地目标资源。

根据本公开的实施例,预设资源属性可以包括与该预设资源相关的资源投放属性,资源投放属性例如可以为资源投放区域、资源投放时间段等等。或者,预设资源属性还可以包括其他类型的属性,例如还可以包括资源内容属性、资源质量属性等等,本公开的实施例对预设资源属性的具体属性类型不做限定。

根据本公开的实施例,通过将预设资源属性和预设资源相关文本进行特征融合,可以使得到的预设资源特征能够表征预设资源相关文本的语义属性,以及离散化的预设资源属性,从而可以对预设资源进行多个维度的表征,以便于提升后续预设资源融合特征针对预设资源的表征精度,进而可以通过查询到与搜索特征相匹配的目标资源融合特征,来提升召回的目标资源与搜索文本和对象属性之间的匹配程度,提升检索精确性。

根据本公开的实施例,资源检索方法还可以包括:从预设资源库中确定与搜索文本相关联的关联资源;将与关联资源相对应的关联资源相关文本进行文本语义融合,得到关联资源文本特征;以及根据关联资源文本特征,确定与关联资源相对应的关联资源特征;

根据本公开的实施例,可以在资源搜索关系拓扑图中确定与搜索文本相对应的预设搜索节点,例如,在搜索文本与预设搜索文本的文本内容相同的情况下,可以直接在资源搜索关系拓扑图中确定与搜索文本相对应的预设搜索节点。或者,还可以基于搜索文本特征在资源搜索关系拓扑图中生成与搜索文本相对应的搜索节点,并根据搜索节点与预设搜索节点之间的距离来确定与搜索节点相匹配的预设搜索节点,进而可以将与该相匹配的预设搜索节点具有边关系的预设资源节点确定为关联资源节点,从而可以根据关联资源节点在预设资源库中确定关联资源。

图6示意性示出了根据本公开实施例的确定与搜索文本相关联的关联资源节点的原理示意图。

如图6所示,资源搜索关系拓扑图T600中可以包括多个节点,以及多个节点之间的边关系。例如可以包括预设搜索节点611,以及与预设搜索节点611具有边关系的预设资源节点621和622等。在确定与搜索文本相对应的搜索节点为预设搜索节点611的情况下,可以将与预设搜索节点611具有边关系的预设资源节点,确定为关联资源节点。这样可以从资源搜索关系拓扑图T600中确定拓扑子图T610。拓扑子图T610中的资源节点可以为关联资源节点,进而可以根据拓扑子图T610中的关联资源节点来从预设资源库中确定与搜索文本相关联的关联资源。

根据本公开的实施例,根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征可以包括:根据搜索特征和关联资源特征,在预设资源融合特征库中进行检索,得到目标资源融合特征。

根据本公开的实施例,根据搜索特征和关联资源特征,在预设资源融合特征库中进行检索,可以包括融合搜索特征和关联资源特征,得到搜索融合特征。将搜索融合特征与预设资源融合特征库中的预设资源融合特征进行相似度计算,根据得到的相似度结果从预设资源融合特征库中确定与搜索融合特征相似度较高的目标资源融合特征。

根据本公开的实施例,根据搜索特征和关联资源特征,在预设资源融合特征库中进行检索,得到目标资源融合特征可以包括:基于注意力机制融合搜索融合特征和关联资源融合特征,得到中间搜索融合特征;根据中间搜索融合特征,确定搜索融合特征;以及根据搜索融合特征,在预设资源融合特征库中进行检索,得到目标资源融合特征。

根据本公开的实施例,预设资源可以包括多个资源类型,例如可以包括产品推荐资源类型、知识分享资源类型中的任意一项或多项。在资源类型包括多项的情况下,可以将与同一个资源类型的预设资源相对应的关联资源融合特征分别与搜索融合特征进行特征融合,得到与该资源类型对应的中间搜索融合特征。基于注意力机制将多个资源类型各自对应的中间搜索融合特征进行融合,得到搜索融合特征。这样可以使搜索融合特征充分学习到各个资源类型的关联资源特征的属性信息,提升目标资源融合特征对于关联资源的资源相关文本和资源属性的表征准确性,进而提升目标资源与目标对象的检索需求的匹配精度。

根据本公开的实施例,通过基于注意力机制来融合搜索特征和关联资源特征,可以使融合后得到的搜索融合特征较为充分地表征搜索文本的文本语义属性、目标对象的对象属性、以及与搜索文本之间可以存在检索交互操作关系的预设资源的资源相关文本语义属性和资源属性,从而可以使搜索融合特征从多个维度来表征目标对象的检索需求。通过搜索融合特征来与表征预设资源的多维度特征的预设资源融合特征进行相似度计算,进而确定目标资源融合特征,可以使根据目标资源融合特征检索到的目标资源能够与目标对象的检索需求相匹配,从而提升资源检索的准确性,减少目标对象的检索操作步骤,提升检索效率。

根据本公开的实施例,关联资源相关文本包括:关联资源主题文本和关联资源描述文本。

根据本公开的实施例,关联资源主题文本可以是表征关联资源的资源内容主题的文本信息,资源内容主题可以包括任意的类型,例如产品推荐资源的资源内容主题可以包括产品的业务分类主题、产品的行业分类主题、产品的营销目标主题等等。知识分享资源的资源内容主题可以包括知识类型主题、分享对象主体等等。本公开的实施例对关联资源主题文本表征的资源内容主题的类型不做限定,本领域技术人员可以根据实际需求进行选择,只要能够表征该关联资源的内容类型即可。

根据本公开的实施例,关联资源描述文本可以包括关联资源中记载的文本,或者,关联资源描述文本可以包括用于对关联资源的资源文本、资源图像、资源投放属性、资源风格等任意类型的资源内容属性进行描述的文本。

根据本公开的实施例,将与关联资源相对应的关联资源相关文本进行文本语义融合,得到关联资源文本特征包括:对关联资源主题文本进行文本特征提取,得到关联资源主题特征;对关联资源描述文本进行文本特征提取,得到关联资源描述特征;以及将关联资源主题特征和关联资源描述特征进行特征融合,得到关联资源文本特征。

根据本公开的实施例,通过分别提取得到关联资源主题特征和关联资源描述特征,并通过融合关联资源主题特征和关联资源描述特征来得到关联资源文本特征,可以使关联资源文本特征在充分学习到与关联资源相关的文本的语义属性的情况下,将关联资源的资源主题与资源描述文本的语义相融合,使得到的关联资源文本特征能够准确地包含关联资源的主题类型,进而根据关联资源文本特征和搜索特征来得到的搜索融合特征,能够更加准确地检索到与资源主题类型相关的目标资源,提升目标资源的资源主题与检索需求的适配性。

根据本公开的实施例,关联资源描述文本包括与产品推荐类资源相对应的产品推荐资源描述文本,产品推荐资源描述文本包括以下至少一项:产品推荐资源展示页文本、产品推荐属性描述文本。

根据本公开的实施例,产品推荐资源展示页文本包括产品推荐资源展示页的页面文本。产品推荐资源展示页可以包括展示产品推荐类资源的落地页,落地页可以包括一个或多个产品推荐类资源,产品推荐资源展示页文本可以包括产品推荐资源展示页的全部或部分页面文本。

根据本公开的实施例,产品推荐属性描述文本用于描述产品推荐类资源的推荐属性,推荐属性可以包括产品推荐类资源的资源投放区域、资源投放时间段,资源推荐条件等。产品推荐属性描述文本可以包括从产品推荐类资源中提取得到的关键词、关键语句等。但不仅限于此,还可以包括其他方式来生成产品推荐属性描述文本,例如可以基于人工编辑的方式来确定产品推荐属性描述文本。本公开的实施例对方式生成产品推荐属性描述文本的具体方式不做限定。

根据本公开的实施例,产品推荐属性描述文本还可以是基于如下操作确定的:利用预训练的大语言模型处理产品推荐资源展示页文本,得到产品推荐属性描述文本。

根据本公开的实施例,利用预训练的大语言模型来处理产品推荐资源展示页文本,可以基于大语言模型较为强大地语义理解能力来对产品推荐资源展示页文本进行分析,并较为高效地生成产品推荐属性描述文本,从而提升资源检索整体的检索效率。

根据本公开的实施例,将关联资源主题特征和关联资源描述特征进行特征融合,得到关联资源文本特征可以包括:基于注意力机制融合关联资源主题特征和关联资源描述特征,得到中间关联资源文本特征;将中间关联资源文本特征和关联资源主题特征进行特征融合,得到关联资源文本特征。

图7示意性示出了根据本公开实施例的将关联资源相关文本进行文本语义融合的原理示意图。

如图7所示,关联资源相关文本可以包括产品推荐资源展示页文本701、关联资源主题文本702和产品推荐属性描述文本703。资源文本特征提取层700可以包括编码器710、第一文本特征融合子层720、第二文本特征融合子层730和资源特征自注意力子层740。编码710可以是基于Ernie算法构建得到的,第一文本特征融合子层720和第二文本特征融合子层730各自可以是基于交互注意力(Cross-attention)网络算法构建得到的。资源特征自注意力子层740可以是基于自注意力(Self-attention)网络算法构建得到的。

如图7所示,将产品推荐资源展示页文本701、关联资源主题文本702和产品推荐属性描述文本703分别输入至编码器710,以便于分别对产品推荐资源展示页文本701、关联资源主题文本702和产品推荐属性描述文本703进行特征提取,得到展示页文本特征704、关联资源主题特征705和推荐属性描述特征706。将展示页文本特征704和关联资源主题特征705输入至第一文本特征融合子层720,输出第一中间关联资源文本特征。将关联资源主题特征705和推荐属性描述特征706输入第二文本特征融合子层730,输出第二中间关联资源文本特征。将第一中间关联资源文本特征和第二中间关联资源文本特征输入资源特征自注意力子层740,输出关联资源文本特征707。

根据本公开的实施例,通过基于注意力机制将关联资源主题特征与多个关联资源描述特征分别进行特征融合,可以实现利用资源主题文本来对多个资源描述文本进行主题牵引,避免得到的关联资源文本特征与关联资源的差异过大,提升关联资源文本特征的语义表征准确性和主题分类准确性,进而提升关联资源融合特征对关联资源表征的准确性,提升根据搜索融合特征进行资源检索的检索精度。

根据本公开的实施例,可以基于上述实施例提供的资源检索方法,来对预设资源相关文本进行特征提取,得到预设资源文本特征,本公开的实施例在此不再赘述。

根据本公开的实施例,根据关联资源文本特征,确定与关联资源相对应的关联资源特征可以包括:融合关联资源文本特征和与关联资源相对应的关联资源属性特征,得到关联资源特征,其中,关联资源属性特征是对与关联资源相关的关联资源属性进行特征提取得到的。

根据本公开的实施例,可以基于上述任意实施例中提供的资源特征提取网络来融合关联资源文本特征和关联资源属性特征,得到关联资源融合特征,本公开的实施例对此不再赘述。

根据本公开的实施例,可以基于不同的资源特征提取网络来分别处理不同类型的关联资源各自对应的关联资源相关文本,并可以基于注意力机制将不同的资源特征提取网络各自输出的中间搜索融合特征进行融合,得到搜索融合特征。

图8示意性示出了根据本公开实施例的深度学习模型的原理示意图。

如图8所示,深度学习模型800可以包括搜索特征提取网络810、第一资源特征提取网络820、第二资源特征提取网络830、搜索融合特征提取网络840和搜索融合特征输出层850。第一资源特征提取网络820和第二资源特征提取网络830可以是不同的资源特征提取网络。搜索特征提取网络810、第一资源特征提取网络820和第二资源特征提取网络830可以基于Ernie网络模型、DNN模型与MLP模型构建得到。搜索融合特征提取网络840可以包括第一中间特征融合层841和第二中间特征融合层842,第一中间特征融合层841和第二中间特征融合层842可以基于Transformer算法构建得到。搜索融合特征输出层850可以基于全连接网络层构建得到。

如图8所示,可以基于搜索文本确定从预构建的资源搜索关系拓扑图中确定搜索节点N811,并根据搜索节点N811确定与搜索文本相关联的关联资源节点N821和N822。搜索节点N811、关联资源节点N821和N822可以构成拓扑子图T810。关联资源节点N821可以与具有参考资源类型的参考类型资源相关联,关联资源节点N822可以与具有产品推荐类型的产品推荐资源相关联。根据搜索节点N811、关联资源节点N821和N822,可以确定搜索文本节点数据801、产品推荐资源节点数据802和参考类型资源节点数据803。搜索文本节点数据801可以包括搜索文本和对象属性。产品推荐资源节点数据802可以包括与搜索文本相关联的产品推荐资源的产品推荐资源展示页文本、关联资源主题文本和产品推荐属性描述文本,还可以包括产品推荐资源的资源属性。参考类型资源节点数据803可以包括具有参考类型的关联资源各自的关联资源相关文本和关联资源属性。

如图8所示,将搜索文本节点数据801输入搜索特征提取网络810,输出搜索特征。将产品推荐资源节点数据802输入第一资源特征提取网络820,输出产品推荐资源特征。将参考类型资源节点数据803输入第二资源特征提取网络830,输出参考类型资源特征。将搜索特征和产品推荐资源特征输入第一中间特征融合层841,输出第一中间搜索融合特征。将搜索特征和参考类型资源特征输入第二中间特征融合层842,输出第二中间搜索融合特征。将第一中间搜索融合特征和第二中间搜索融合特征输入搜索融合特征输出层850,可以输出搜索融合特征804。可以基于搜索融合特征804在预设资源融合特征中进行检索,得到与搜索文本相对应的目标资源融合特征。

本公开的实施例还提供了一种深度学习模型的训练方法。深度学习模型可以包括:资源特征提取网络、搜索特征提取网络和搜索融合特征提取网络。

图9示意性示出了根据本公开实施例的深度学习模型的训练方法的流程图。

如图9所示,该深度学习模型的训练方法包括操作S910~S950。

在操作S910,获取样本数据集和标签,样本数据集包括样本搜索文本、与样本搜索文本相关联的样本对象属性,以及与样本关联资源相对应的样本关联资源相关文本,样本关联资源与样本搜索文本相关联。

在操作S920,利用搜索特征提取网络对样本搜索文本和样本对象属性进行特征融合,得到样本搜索特征。

在操作S930,利用资源特征提取网络对样本关联资源相关文本进行特征融合,得到样本关联资源特征。

在操作S940,利用搜索融合特征提取网络融合样本关联资源特征和样本搜索特征,得到样本搜索融合特征。

在操作S950,根据样本搜索融合特征和标签,训练深度学习模型,得到训练后的深度学习模型。

根据本公开的实施例,样本关联资源与样本搜索文本之间可以具有检索交互操作关系。可以基于预构建的资源搜索关系拓扑图来确定样本搜索节点和样本关联资源节点,并根据样本搜索节点和样本关联资源节点确定样本搜索文本与样本关联资源。

根据本公开的实施例,样本关联资源相关文本可以包括样本关联资源主题文本和样本关联资源描述文本。

图10示意性示出了根据本公开实施例的深度学习模型的训练方法的原理示意图。

如图10所示,深度学习模型10000可以包括第一特征融合子模型10100,第一特征融合子模型10100可以包括搜索特征提取网络10110、第一资源特征提取网络10120、第二资源特征提取网络10130、搜索融合特征提取网络10140和搜索融合特征输出层10150。第一资源特征提取网络10120和第二资源特征提取网络10130可以是不同的资源特征提取网络。搜索特征提取网络10110、第一资源特征提取网络10120和第二资源特征提取网络10130可以基于Ernie网络模型、DNN模型与MLP模型构建得到。搜索融合特征提取网络10140可以包括第一中间特征融合层10141和第二中间特征融合层10142,第一中间特征融合层10141和第二中间特征融合层10142可以基于Transformer算法构建得到。搜索融合特征输出层10150可以基于全连接网络层构建得到。

如图10所示,可以基于样本搜索文本确定从预构建的资源搜索关系拓扑图中确定样本搜索节点N1011,并根据样本搜索节点N1011确定与样本搜索文本相关联的样本关联资源节点N1021和N1022。样本搜索节点N1011、样本关联资源节点N1021和N1022可以构成拓扑子图T1010。关样本联资源节点N1021可以与具有参考资源类型的样本参考类型资源相关联,样本关联资源节点N1022可以与具有产品推荐类型的样本产品推荐资源相关联。根据样本搜索节点N1011、样本关联资源节点N1021和样本N1022,可以确定样本搜索文本节点数据1001、样本产品推荐资源节点数据1002和样本参考类型资源节点数据1003。样本搜索文本节点数据1001可以包括样本搜索文本和样本对象属性。样本产品推荐资源节点数据1002可以包括与样本搜索文本相关联的样本产品推荐资源的样本产品推荐资源展示页文本、样本关联资源主题文本和样本产品推荐属性描述文本,还可以包括样本产品推荐资源的样本资源属性。样本参考类型资源节点数据1003可以包括具有参考类型的样本关联资源各自的样本关联资源相关文本和样本关联资源属性。

如图10所示,将样本搜索文本节点数据1001输入搜索特征提取网络10110,输出搜索特征。将样本产品推荐资源节点数据1002输入第一资源特征提取网络10120,输出样本产品推荐资源特征。将样本参考类型资源节点数据1003输入第二资源特征提取网络10130,输出样本参考类型资源特征。将样本搜索特征和样本产品推荐资源特征输入第一中间特征融合层10141,输出样本第一中间搜索融合特征。将样本搜索特征和样本参考类型资源特征输入第二中间特征融合层10142,输出样本第二中间搜索融合特征。将样本第一中间搜索融合特征和样本第二中间搜索融合特征输入搜索融合特征输出层10150,可以输出样本搜索融合特征1004。可以基于损失函数处理样本搜索融合特征1004和标签,得到损失值。根据损失值来调整深度学习模型10000的模型参数,直至损失值收敛,得到训练后的深度学习模型。

根据本公开的实施例,标签可以是基于任意的方式来得到的,例如可以根据预训练的资源特征融合网络来处理样本预设资源相关文本和样本资源属性,将得到的样本资源融合特征作为标签,从而可以基于知识蒸馏方式来对深度学习模型进行训练,提升训练效率。但不仅限于此,还可以基于其他方式来得到标签,本公开的实施例对此不做限定。

根据本公开的实施例,深度学习模型还可以包括资源融合特征提取网络。

根据本公开的实施例,深度学习模型的训练方法还可以包括:获取初始标签集,初始标签集包括标签资源相关文本、标签关联搜索文本和与标签关联搜索文本相对应的标签关联对象属性,标签资源相关文本与标签关联搜索文本相关联;利用资源特征提取网络对标签资源相关文本进行特征提取,得到标签资源特征;利用搜索特征提取网络对标签关联搜索文本和标签关联对象属性进行特征融合,得到标签关联搜索特征;以及利用资源融合特征提取网络融合标签资源特征和标签关联搜索特征,得到标签资源融合特征。

根据本公开的实施例,根据样本搜索融合特征和标签,训练深度学习模型包括:将标签资源融合特征作为标签,根据样本搜索融合特征和标签资源融合特征训练深度学习模型。

图11示意性示出了根据本公开另一实施例的深度学习模型的训练方法的原理示意图。

如图11所示,深度学习模型还可以包括第二特征融合子模型11200,第二特征融合子模型11200可以包括资源特征提取网络11210、搜索特征提取网络11220、资源融合特征提取网络10140和资源融合特征输出层10150。

如图11所示,根据标签资源在预构建的资源搜索关系拓扑图中确定标签资源节点N1111,并将与标签资源节点N1111具有边关系的预设搜索节点确定为关联搜索节点,得到子拓扑图T1110。根据子拓扑图T1110可以确定从预设资源库中确定标签资源,并从样本搜索文本库中确定标签关联搜索文本。根据标签资源可以是产品推荐资源可以确定与该产品推荐资源相关的标签产品推荐资源节点数据1101,以及与该关联搜索文本相对应的标签关联搜索文本节点数据1102。标签产品推荐资源节点数据1101可以包括标签产品资源相关文本、标签产品资源属性。标签关联搜索文本节点数据1102可以包括标签关联搜索文本和标签关联对象属性。

如图11所示,将标签产品推荐资源节点数据1101输入资源特征提取网络11210,输出标签资源特征;将标签关联搜索文本节点数据1102输入搜索特征提取网络11220,输出标签关联搜索特征。将标签资源特征和标签关联搜索特征输入资源融合特征提取网络10140,输出中间标签资源融合特征,并将中间标签资源融合特征输入资源融合特征输出层10150,输出标签资源融合特征1103。

如图11所示,深度学习模型包含的第一特征融合子模型可以输出样本搜索融合特征1103’,可以基于对抗损失函数来处理样本搜索融合特征1103’与标签资源融合特征1103,并根据对抗损失值来调整深度学习模型的模型参数,得到训练后的深度学习模型。

根据本公开的实施例,初始标签集包括多个,多个初始标签集包括以下至少一项:初始基准类标签集、初始参考类标签集。

根据本公开的实施例,初始基准类标签集包括基准类标签资源相关文本,基准类标签资源相关文本与基准类资源相对应,初始参考类标签集包括参考类标签资源相关文本,参考类标签资源相关文本与参考类资源相对应,基准类资源与参考类资源具有不同的资源类型。

根据本公开的实施例,初始基准类标签集还可以包括与基准类标签资源相关的基准类资源属性。初始参考类标签集还可以包括参考类标签资源相关联的参考类资源属性。

根据本公开的实施例,可以基于深度学习模型的学习目标来设置多个初始标签集各自对应的标签标识。例如,可以对与样本搜索文本具有检索交互操作关系的标签资源设置正标签标识,得到正标签资源,从而可以得到包含样本搜索文本与正标签资源的正样本对。将与样本搜索文本没有检索交互操作关系的标签资源设置负标签标识,得到负标签资源,从而可以得到包含样本搜索文本与负标签资源的正样本对。

在本公开的一个实施例中,正标签资源和负标签资源可以具有个的资源类型,例如可以具有产品推荐类型。

图12示意性示出了根据本公开实施例的正标签资源节点和负标签资源节点的示意图。

如图12所示,节点1211可以表示样本搜索节点,节点1221和节点1222可以表示标签资源节点。样本搜索节点1211可以与标签资源节点1221具有边关系,表征与样本搜索节点1211相对应的样本搜索文本,和与标签资源节点1221相对应的样本标签资源具有检索交互操作关系。样本搜索节点1211可以与标签资源节点1222没有边关系,表征与样本搜索节点1211相对应的样本搜索文本,和与标签资源节点1222相对应的样本标签资源并没有检索交互操作关系。从而可以确定标签资源节点1221为正标签资源,标签资源节点1222为负标签资源。正标签资源与负标签资源具有相同的资源类型。由此可以对同一个搜索文本设置的正标签资源的数量小于负标签资源的数量,并对深度学习模型设置对抗学习任务,以便于深度学习模型更好地学习到针对该资源类型的目标资源的召回能力。

图13示意性示出了根据本公开另一实施例的正标签资源节点和负标签资源节点的示意图。

如图13所示,节点1311可以表示样本搜索节点,节点1321、节点1322和节点1323可以表示标签资源节点。样本搜索节点1311可以与标签资源节点1321具有边关系,表征与样本搜索节点1311相对应的样本搜索文本,和与标签资源节点1321相对应的样本标签资源具有检索交互操作关系。样本搜索节点1311可以与标签资源节点1322和节点1323没有边关系,表征与样本搜索节点1311相对应的样本搜索文本,和与标签资源节点1322和节点1323各自相对应的样本标签资源并没有检索交互操作关系。从而可以确定标签资源节点1321为正标签资源,标签资源节点1322和节点1323为负标签资源。此外,标签资源节点1321和标签资源节点1322各自对应的标签资源可以具有相同的基准资源类型,标签资源节点1323对应的标签资源可以具有参考资源类型。由此可以对同一个搜索文本设置的正标签资源的数量小于负标签资源的数量,且将具有参考资源类型的标签资源作为负标签资源,可以使深度学习模型在训练过程中充分学习到不同的资源类型的标签资源各自的标签数据属性,提升针对不同资源类型的资源的表征能力,进而提升目标资源的召回精度。

在本公开的一个实施例中,还可以根据样本搜索文本具有边关系的样本关联资源的资源类型来确定正标签和负标签,例如可以在样本关联资源的资源类型均为基准类型的情况下,将样本搜索文本确定为正标签。在在样本关联资源的资源类型均为参考类型的情况下,将样本搜索文本确定为负标签。由此来针对第一融合子模型设计特征融合任务,进而提升深度学习模型针对基准参考类型的资源的召回能力。

图14示意性示出了根据本公开实施例的资源检索装置的框图。

如图14所示,资源检索装置1400包括:第一确定模块1410、搜索特征获得模块1420、目标资源融合特征获得模块1430、目标资源获得模块1440和目标资源推送模块1450。

第一确定模块1410,用于响应于接收到搜索文本,根据搜索文本确定目标对象的对象属性,目标对象与搜索文本相关。

搜索特征获得模块1420,用于对搜索文本和对象属性进行特征融合,得到搜索特征。

目标资源融合特征获得模块1430,用于根据搜索特征在预设资源融合特征库中进行检索,得到目标资源融合特征,预设资源融合特征库中的预设资源融合特征表征与预设资源相关联的预设资源相关文本和关联预设搜索文本。

目标资源获得模块1440,用于根据目标资源融合特征进行资源检索,得到目标资源。

目标资源推送模块1450,用于向与目标对象相关的终端推送目标资源。

根据本公开的实施例,资源检索装置还包括:关联资源确定模块、关联资源文本特征获得模块和关联资源特征获得模块。

关联资源确定模块,用于从预设资源库中确定与搜索文本相关联的关联资源;

关联资源文本特征获得模块,用于将与关联资源相对应的关联资源相关文本进行文本语义融合,得到关联资源文本特征;以及

关联资源特征获得模块,用于根据关联资源文本特征,确定与关联资源相对应的关联资源特征;

根据本公开的实施例,目标资源融合特征获得模块包括目标资源融合特征获得子模块。

目标资源融合特征获得子模块,用于根据搜索特征和关联资源特征,在预设资源融合特征库中进行检索,得到目标资源融合特征。

根据本公开的实施例,关联资源相关文本包括:关联资源主题文本和关联资源描述文本。

根据本公开的实施例,关联资源文本特征获得模块包括:关联资源主题特征获得子模块、关联资源描述特征获得子模块和关联资源文本特征获得子模块。

关联资源主题特征获得子模块,用于对关联资源主题文本进行文本特征提取,得到关联资源主题特征。

关联资源描述特征获得子模块,用于对关联资源描述文本进行文本特征提取,得到关联资源描述特征。

关联资源文本特征获得子模块,用于将关联资源主题特征和关联资源描述特征进行特征融合,得到关联资源文本特征。

根据本公开的实施例,关联资源文本特征获得子模块包括中间关联资源文本特征获得单元和关联资源文本特征获得单元。

中间关联资源文本特征获得单元,用于基于注意力机制融合关联资源主题特征和关联资源描述特征,得到中间关联资源文本特征;

关联资源文本特征获得单元,用于将中间关联资源文本特征和关联资源主题特征进行特征融合,得到关联资源文本特征。

根据本公开的实施例,目标资源融合特征获得子模块包括:中间搜索融合特征获得单元、搜索融合特征确定单元和目标资源融合特征获得单元。

中间搜索融合特征获得单元,用于基于注意力机制融合搜索融合特征和关联资源融合特征,得到中间搜索融合特征。

搜索融合特征确定单元,用于根据中间搜索融合特征,确定搜索融合特征。

目标资源融合特征获得单元,用于根据搜索融合特征,在预设资源融合特征库中进行检索,得到目标资源融合特征。

根据本公开的实施例,关联资源特征获得模块包括融合子模块。

融合子模块,用于融合关联资源文本特征和与关联资源相对应的关联资源属性特征,得到关联资源特征,其中,关联资源属性特征是对与关联资源相关的关联资源属性进行特征提取得到的。

根据本公开的实施例,关联资源描述文本包括与产品推荐类资源相对应的产品推荐资源描述文本,产品推荐资源描述文本包括以下至少一项:产品推荐资源展示页文本、产品推荐属性描述文本;产品推荐资源展示页文本包括产品推荐资源展示页的页面文本。

根据本公开的实施例,产品推荐属性描述文本是基于如下操作确定的:利用预训练的大语言模型处理产品推荐资源展示页文本,得到产品推荐属性描述文本。

根据本公开的实施例,预设资源融合特征是基于如下操作确定的:确定与预设资源相关联的关联预设搜索节点,关联预设搜索节点与关联预设搜索文本相关联;对关联预设搜索文本,以及与关联预设搜索文本相关联的关联预设对象属性进行特征融合,得到关联预设搜索特征;对与预设资源相关联的预设资源相关文本和预设资源属性进行特征融合,得到预设资源特征;基于注意力机制融合关联预设搜索特征和预设资源特征,得到与预设资源相关的预设资源融合特征。

根据本公开的实施例,确定与预设资源相关联的关联预设搜索节点包括:根据与预设资源相对应的预设资源节点,在预构建的资源搜索关系拓扑图中确定与预设资源节点相关联的关联预设搜索节点;其中,资源搜索关系拓扑图包括多个节点和节点之间的边关系,多个节点包括预设资源节点和预设搜索节点,预设搜索节点与预设搜索文本相关联。

图15示意性示出了根据本公开实施例的深度学习模型的训练装置的框图。

如图15所示,深度学习模型的训练装置1500包括:第一获取模块1510、样本搜索特征获得模块1520、样本关联资源特征获得模块1530、样本搜索融合特征获得模块1540和训练模块1550。

第一获取模块1510,用于获取样本数据集和标签,样本数据集包括样本搜索文本、与样本搜索文本相关联的样本对象属性,以及与样本关联资源相对应的样本关联资源相关文本,样本关联资源与样本搜索文本相关联。

样本搜索特征获得模块1520,用于利用搜索特征提取网络对样本搜索文本和样本对象属性进行特征融合,得到样本搜索特征。

样本关联资源特征获得模块1530,用于利用资源特征提取网络对样本关联资源相关文本进行特征融合,得到样本关联资源特征。

样本搜索融合特征获得模块1540,用于利用搜索融合特征提取网络融合样本关联资源特征和样本搜索特征,得到样本搜索融合特征。

训练模块1550,用于根据样本搜索融合特征和标签,训练深度学习模型,得到训练后的深度学习模型。

根据本公开的实施例,深度学习模型还包括资源融合特征提取网络。

训练装置还包括:第二获取模块、标签资源特征获得模块、标签关联搜索特征获得模块和标签资源融合特征获得模块。

第二获取模块,用于获取初始标签集,初始标签集包括标签资源相关文本、标签关联搜索文本和与标签关联搜索文本相对应的标签关联对象属性,标签资源相关文本与标签关联搜索文本相关联。

标签资源特征获得模块,用于利用资源特征提取网络对标签资源相关文本进行特征提取,得到标签资源特征。

标签关联搜索特征获得模块,用于利用搜索特征提取网络对标签关联搜索文本和标签关联对象属性进行特征融合,得到标签关联搜索特征。

标签资源融合特征获得模块,用于利用资源融合特征提取网络融合标签资源特征和标签关联搜索特征,得到标签资源融合特征。

根据本公开的实施例,训练模块包括训练子模块。

训练子模块,用于将标签资源融合特征作为标签,根据样本搜索融合特征和标签资源融合特征训练深度学习模型。

根据本公开的实施例,初始标签集包括多个,多个初始标签集包括以下至少一项:初始基准类标签集、初始参考类标签集;初始基准类标签集包括基准类标签资源相关文本,基准类标签资源相关文本与基准类资源相对应,初始参考类标签集包括参考类标签资源相关文本,参考类标签资源相关文本与参考类资源相对应,基准类资源与参考类资源具有不同的资源类型。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开的实施例,一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上所述的方法。

根据本公开的实施例,一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行如上所述的方法。

根据本公开的实施例,一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如上所述的方法。

图16示意性示出了根据本公开实施例的适于实现资源检索方法、深度学习模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图16所示,设备1600包括计算单元1601,其可以根据存储在只读存储器(ROM)1602中的计算机程序或者从存储单元1608加载到随机访问存储器(RAM)1603中的计算机程序,来执行各种适当的动作和处理。在RAM 1603中,还可存储设备1600操作所需的各种程序和数据。计算单元1601、ROM 1602以及RAM 1603通过总线1604彼此相连。输入/输出(I/O)接口1605也连接至总线1604。

设备1600中的多个部件连接至I/O接口1605,包括:输入单元1606,例如键盘、鼠标等;输出单元1607,例如各种类型的显示器、扬声器等;存储单元1608,例如磁盘、光盘等;以及通信单元1609,例如网卡、调制解调器、无线通信收发机等。通信单元1609允许设备1600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1601执行上文所描述的各个方法和处理,例如资源检索方法、深度学习模型的训练方法。例如,在一些实施例中,资源检索方法、深度学习模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1602和/或通信单元1609而被载入和/或安装到设备1600上。当计算机程序加载到RAM 1603并由计算单元1601执行时,可以执行上文描述的资源检索方法、深度学习模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行资源检索方法、深度学习模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以是分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术分类

06120116581862