掌桥专利:专业的专利平台
掌桥专利
首页

一种物品推荐方法、装置、电子设备及存储介质

文献发布时间:2024-04-18 19:58:30


一种物品推荐方法、装置、电子设备及存储介质

技术领域

本申请涉及人工智能技术领域,尤其涉及一种物品推荐方法、装置、电子设备及存储介质。

背景技术

目前,随着互联网技术的发展,利用网络平台获取物品信息越来越普遍,对象与物品交互方式也十分丰富,例如,对象可以对喜欢的物品进行点击,并可以浏览、赞赏、分享、收藏。对象获取物品信息时,网络平台可以根据对象的喜好向对象推荐可能感兴趣的物品。通过物品推荐,可以缩短对象寻找所需要物品的路径,提升用户体验。

现有技术中,通常根据物品的属性信息,将与待推荐对象曾经感兴趣的物品相似的物品推荐给待推荐对象。

例如,待推荐对象在过去一段时间内浏览或点击过多个汽车类物品,则向待推荐对象推荐相似的汽车物品。进一步,可以将物品属性信息抽象为数值特征,进而对每个物品形成一个物品特征向量,再利用机器学习算法进行分类。

然而,由于基于物品的属性信息,将与待推荐对象曾经感兴趣的物品相似的物品作为一个类团,向待推荐对象推荐其已接触类型的相关物品,因此,只向待推荐对象推荐一类相似的物品,会出现重复推荐和封闭式推荐的情况,不利于推荐物品类型的扩展,导致物品推荐的新颖性和多样性不足。

有鉴于此,相关技术下,物品推荐的准确度,有待进一步提高。

发明内容

本申请实施例提供一种物品推荐方法、装置、电子设备及存储介质,以提高物品推荐的准确度。

本申请实施例提供的具体技术方案如下:

第一方面,本申请实施例提供了一种物品推荐方法,该方法包括:

响应于待推荐对象触发的物品推荐请求,获取待推荐对象关联的历史行为数据,其中,历史行为数据至少包括:待推荐对象及其关联对象,在各历史时间段内与各个历史物品的交互信息,关联对象为与待推荐对象之间的属性特征满足相似条件的对象;

基于历史行为数据,提取待推荐对象的交互特征和时序特征,其中,时序特征表征交互特征包含的各交互元素的时间位置;

确定交互特征包含的各交互元素各自的第一重要度,并基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度;

基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,并将预估点击率符合推荐条件的候选物品,推荐给待推荐对象。

第二方面,本申请实施例还提供了一种物品推荐装置,所述装置包括:

获取模块,用于响应于待推荐对象触发的物品推荐请求,获取待推荐对象关联的历史行为数据,其中,历史行为数据至少包括:待推荐对象及其关联对象,在各历史时间段内与各个历史物品的交互信息述关联对象为与待推荐对象之间的属性特征满足相似条件的对象;

提取模块,用于基于历史行为数据,提取待推荐对象的交互特征和时序特征,其中,时序特征表征交互特征包含的各交互元素的时间位置;

确定模块,用于确定交互特征包含的各交互元素各自的第一重要度,并基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度;

推荐模块,用于基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,并将预估点击率符合推荐条件的候选物品,推荐给待推荐对象。

在一种可能的实现方式,确定交互特征包含的各交互元素的第一重要度时,确定模块用于:

基于交互特征包含的各交互元素各自的取值及相应的预设元素权重,获得各交互元素各自的第一重要度;

将分别对应交互特征包含的各交互元素预设的默认值,作为相应交互元素的第一重要度。

在一种可能的实现方式,基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度时,确定模块用于:

将各交互元素分别与匹配程度达到匹配阈值的时序元素进行拼接融合,获得初始融合特征;

基于初始融合特征对应的注意力权重,分别获得初始融合特征包含的各初始融合元素各自的内部影响度,并基于获得的各内部影响度,分别对各初始融合元素的取值进行更新,获得目标融合特征;其中,每个内部影响度表征:相应的初始融合元素在与待推荐对象交互时,受其他各初始融合元素的影响程度;

对目标融合特征进行归一化处理,并将归一化处理之后的目标融合特征包含的各目标融合元素的取值,分别作为各交互元素各自在所属时序元素上的第二重要度。

在一种可能的实现方式,注意力权重至少包括查询权重和键权重;则基于初始融合特征对应的注意力权重,分别获得初始融合特征包含的各初始融合元素各自的内部影响度时,确定模块还用于:

基于预设的查询权重矩阵和键权重矩阵,分别对初始融合特征进行线性变换,获得相应的查询矩阵和键矩阵,其中,查询权重矩阵中的每个元素表征:对应的初始融合元素的重要程度,键权重矩阵中的每个元素表征:与对应的初始融合元素相关的至少一个其他初始融合元素的重要程度;

基于查询矩阵和键矩阵,获得影响度矩阵;其中,影响度矩阵中的每个元素表征:相应的初始融合元素的内部影响度。

在一种可能的实现方式,注意力权重还包括值权重;则基于获得的各内部影响度,分别对各初始融合元素的取值进行更新,获得目标融合特征时,确定模块还用于:

基于预设的值权重矩阵,对初始融合特征进行线性变换,获得相应的值矩阵,其中,值权重矩阵中的每个元素表征:对应的初始融合元素,和相关的至少一个其他初始融合元素之间的相关性的重要程度;

基于影响度矩阵和值矩阵,获得目标融合特征。

在一种可能的实现方式,基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率时,推荐模块用于:

基于各交互元素各自的第一重要度,结合预设的第一点击权重,分别获得各候选物品各自的第一点击率;

基于各交互元素各自的第二重要度,结合预设的第二点击权重,分别获得各候选物品各自的第二点击率;

基于各候选物品各自的第一点击率和第二点击率,结合其各自的占比权重,分别确定各候选物品的预估点击率。

在一种可能的实现方式,预估点击率是通过将交互特征和时序特征,输入目标点击率预估模型获得的,所述装置还包括训练模块,训练模块用于:

获取初始训练样本集,其中,初始训练样本集中每一初始训练样本至少包括:样本对象关联的样本历史行为数据;

提取初始训练样本集的样本交互特征集,其中,对应每个样本交互特征设置有基于时间顺序的特征编号;

基于样本交互特征集,对待训练的点击率预估模型进行迭代训练,获得目标点击率预估模型。

在一种可能的实现方式,基于样本交互特征集,对待训练的点击率预估模型进行迭代训练,获得目标点击率预估模型,其中,在一次迭代训练过程时,训练模块还用于:

基于选取的目标训练样本关联的特征编号,获得相应的目标样本交互特征;

基于目标样本交互特征包含的各样本交互元素的时间信息,获得目标训练样本的目标样本时序特征;

确定目标样本交互特征包含的各样本交互元素各自的第三重要度,并基于各样本交互元素和目标样本时序特征包含的各样本时序元素之间的匹配程度,分别确定各样本交互元素各自在所属样本时序元素上的第四重要度;

基于第三重要程度和第四重要程度,分别获得各样本物品的点击率结果,并基于点击率结果对应的损失值进行调参。

第三方面,本申请实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一种物品推荐方法的步骤。

第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一种物品推荐方法的步骤。

第五方面,本申请实施例还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行上述任意一种物品推荐方法的步骤。

本申请有益效果如下:

本申请实施例提供了一种物品推荐方法、装置、设备及存储介质,该方法包括:在待推荐对象触发物品推荐请求时,根据待推荐对象关联的历史行为数据,提取待推荐对象的交互特征和时序特征,来获得交互特征包含的各交互元素各自的第一重要度和第二重要程度,进而基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率。其中,待推荐对象关联的历史行为数据不仅包括待推荐对象自身在各历史时间段内与各个历史物品的交互信息,还包括待推荐对象的关联对象在各历史时间段内与各个历史物品的交互信息,这样,避免了封闭式推荐的情况,有利于推荐物品类型的扩展,能够增加物品推荐的新颖性和多样性。其中,时序特征表征交互特征包含的各交互元素的时间位置,时序特征亦能反映到待推荐对象交互时刻距离当前时刻的远近程度,能够有效挖掘理历史行为数据的信息,基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,不仅考虑了各交互元素之间的重要程度,还考虑了各交互元素在相应时序元素上的重要程度,使得预估点击率更准确,提高了物品推荐的准确度,向待推荐对象推荐更准确的物品。

本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

图1为本申请实施例中的应用场景示意图;

图2为本申请实施例中目标点击率预估模型训练的流程示意图;

图3为本申请实施例中获得样本交互特征集的流程示意图;

图4为本申请实施例中数据预处理的示意图;

图5为本申请实施例中特征编号的示意图;

图6为本申请实施例中一次迭代训练的流程示意图;

图7为本申请实施例中目标点击率预估模型训练的示意图;

图8为本申请实施例中物品推荐方法的流程示意图;

图9为本申请实施例中触发客户端向服务器发送物品推荐请求的示意图;

图10为本申请实施例中关联对象的示意图;

图11为本申请实施例中确定第二重要度的流程示意图;

图12为本申请实施例中获得内部影响度的流程示意图;

图13为本申请实施例中获得目标融合特征的示意图;

图14为本申请实施例中获得目标融合特征的流程示意图;

图15为本申请实施例中推荐目标物品给待推荐对象的示意图;

图16为本申请实施例中获得各候选物品的预估点击率的流程示意图;

图17为本申请实施例提供的一种物品推荐装置的结构示意图;

图18为本申请实施例中一种计算机设备的一个硬件组成结构示意图;

图19为本申请实施例中另一种计算机设备的一个硬件组成结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为便于理解本申请实施例提供的技术方案,这里先对本申请实施例使用的一些关键名词进行解释:

物品:广告、产品、文章、音频或者视频等均可以作为物品,来向待推荐对象进行推荐。

交互信息:待推荐对象点击物品的次数、浏览物品的时间或者待推荐对象对物品的操作行为,其中,操作行为可以包括平台内可以对物品进行的任意操作行为,例如点赞行为、评论行为、转发行为等。

独热编码:又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。

自注意力机制:其主要思路是计算输入数据之间的相关性,用这个相关性再对输入数据进行重新编码,其输入数据的基本形式就是一组元素。

目标函数:机器学习中用于度量和优化模型预估值和真实样本标注值之间距离的函数。

下面对本申请实施例的设计思想进行简要介绍:

目前,随着互联网技术的发展,利用网络平台获取物品信息越来越普遍,对象与物品交互方式也十分丰富,例如,对象可以对喜欢的物品进行点击,并可以浏览、赞赏、分享、收藏。对象获取物品信息时,网络平台可以根据对象的喜好向对象推荐可能感兴趣的物品。

为了缩短对象寻找所需要物品的路径,现有技术中,通常采用两种方法向待推荐对象推荐物品。

方法一:根据物品的属性信息,将与待推荐对象曾经感兴趣的物品相似的物品推荐给待推荐对象。例如,待推荐对象在过去一段时间内浏览或点击过多个汽车类物品,则向待推荐对象推荐相似的汽车物品。进一步,可以将物品属性信息抽象为数值特征,进而对每个物品形成一个物品特征向量,再利用机器学习算法进行分类。

采用方法一时,由于基于物品的属性信息,将与待推荐对象曾经感兴趣的物品相似的物品作为一个类团,向待推荐对象推荐其已接触类型的相关物品,因此,只向待推荐对象推荐一类相似的物品,会出现重复推荐和封闭式推荐的情况,不利于推荐物品类型的扩展,导致物品推荐的新颖性和多样性不足。

方法二:采用协同过滤算法,向待推荐对象推荐物品,在基于待推荐对象的协同过滤算法中,将待推荐对象放在由物品组成的向量空间中,用交互过的物品表示该待推荐对象,然后计算与待推荐对象最相似的邻居对象;在基于目标物品的协同过滤算法中,将目标物品放在由对象组成的向量空间中,用交互过的对象表示目标物品,然后计算与目标物品最相似的邻居物品。

采用方法二时,基于协同过滤的推荐算法核心是基于历史数据,推荐的效果依赖于历史偏好的数据的多少和准确性,且在大部分的实现中,历史偏好是用稀疏矩阵进行存储的,而稀疏矩阵上的计算有些明显的问题,包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等。

有鉴于此,本申请实施例中,提供一种物品推荐方法、装置、电子设备及存储介质,在待推荐对象触发物品推荐请求时,可以根据待推荐对象关联的历史行为数据,提取待推荐对象的交互特征和时序特征,来获得交互特征包含的各交互元素各自的第一重要度和第二重要程度,进而基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率。其中,待推荐对象关联的历史行为数据不仅包括待推荐对象自身在各历史时间段内与各个历史物品的交互信息,还包括待推荐对象的关联对象在各历史时间段内与各个历史物品的交互信息,这样,避免了封闭式推荐的情况,有利于推荐物品类型的扩展,能够增加物品推荐的新颖性和多样性。其中,时序特征表征交互特征包含的各交互元素的时间位置,交互元素的时间位置能够反映交互元素对应的交互时刻距离当前时刻的远近程度,进而时序特征亦能反映到待推荐对象交互时刻距离当前时刻的远近程度,能够有效挖掘理历史行为数据的信息,提高了物品推荐的准确度。

在本申请实施例中,目标点击率预估模型的部分,涉及人工智能(ArtificialIntelligence,AI)和机器学习技术,基于人工智能中的语音技术、自然语言处理技术和机器学习(Machine Learning,ML)而设计。

人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术主要包括计算机视觉技术、自然语言处理技术、以及机器学习/深度学习等几大方向。随着人工智能技术研究和进步,人工智能在多个领域展开研究和应用,例如常见的智能家居、智能客服、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、机器人、智能医疗等,相信随着技术的发展,人工智能将在更多的领域获得应用,并发挥越来越重要的价值。

机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够自动地从数据中“学习”规律,并利用规律对未知数据进行预测。

机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。强化学习(Reinforcement Learning,RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。

本申请实施例提供的方案可以适用于大多数物品推荐的场景中,例如适用于广告推荐场景、短视频推荐场景、音频推荐场景、新闻等文本的推荐场景以及产品推荐场景等场景中。

参阅图1所示,为本申请实施例中可能的应用场景示意图,在该场景中,可以包括终端设备101和服务器102。

终端设备101例如可以为手机、平板电脑(PAD)、个人计算机(Personal computer,PC)以及可穿戴设备等。终端设备101可以安装有可以进行物品浏览的软件客户端,例如浏览器、视频客户端、音频客户端、新闻客户端或者购物客户端等,待推荐对象可以通过在客户端上登录自己的账户,进而浏览客户端中包括的物品。其中,需要说明的是,即使待推荐对象未进行账户登录时,一般而言,客户端对应的服务器也会对该待推荐对象进行标识,例如可以通过该待推荐对象使用的终端进行标识,因而该标识也可以理解为待推荐对象的账户。

服务器102可以为终端设备101上安装的客户端所对应的后台服务器,例如可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。

服务器102可以包括一个或多个处理器1021、存储器1022以及与终端交互的I/O接口1023等。此外,服务器102还可以配置数据库1024,数据库1024可以用于存储各个待推荐对象的基础信息以及历史行为数据以及训练得到的模型参数等。其中,服务器102的存储器1022中还可以存储本申请实施例提供的物品推荐方法的程序指令,这些程序指令被处理器1021执行时能够用以实现本申请实施例提供的物品推荐方法的步骤,以获得各候选物品的预估点击率,并将预估点击率符合推荐条件的候选物品,推荐给待推荐对象,在终端设备101上则可以相应的展示推送的物品信息。

具体而言,当待推荐对象通过终端设备101打开客户端时,则在客户端上需要展示本次为待推荐对象推荐的物品,也就是说,此时可以向服务器102发起物品推荐请求,服务器102基于该物品推荐请求,获取待推荐对象关联的历史行为数据,进而根据待推荐对象关联的历史行为数据,提取待推荐对象的交互特征和时序特征,来获得交互特征包含的各交互元素各自的第一重要度和第二重要程度,进而基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,以将预估点击率符合推荐条件的候选物品,推荐给待推荐对象。

终端设备101和服务器102之间可以通过一个或者多个网络103进行直接或间接的通信连接。该网络103可以是有线网络,也可以是无线网络,例如无线网络可以是移动蜂窝网络,或者可以是无线保真(Wireless-Fidelity,WIFI)网络,当然还可以是其他可能的网络,本发明实施例对此不做限制。

当然,本申请实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其他可能的应用场景,本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述。

需要说明的是,在本申请一些可能的应用场景中,目标点击率预估模型可以安装于服务器102上,使得服务器102可以直接采用该目标点击率预估模型对直接或者间接获得的历史行为数据进行处理,其中,目标点击率预估模型可以是服务器102自行训练得到的,或者,可以由其他设备完成训练后,提供给服务器102的。

以下结合说明书附图对本申请的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本申请,并不用于限定本申请,并且在不冲突的情况下,本申请实施例及实施例中的特征可以相互组合。

以下的说明中,将以服务器实现目标点击率预估模型的训练为例,对相关的训练过程进行详细说明。

另外,本申请实施例中,根据实际的处理需要,服务器训练得到目标点击率预估模型可以是一个周期性的过程,可以周期性的重新生成训练样本,训练得到目标点击率预估模型。

下面,对目标点击率预估模型的过程进行简单的介绍。参见图2所示,为目标点击率预估模型训练的流程示意图。

步骤20:获取初始训练样本集。

其中,初始训练样本集中每一初始训练样本至少包括:样本对象关联的样本历史行为数据。历史行为数据至少包括:样本对象及其关联对象,在各历史时间段内与各个历史物品的交互信息,本申请实施例中对此并不进行限制。

本申请实施例中,通过日志收集进行训练样本的采集,从而构成可用于目标点击率预估模型训练的初始训练样本集。

具体的,系统日志中包含了样本对象的基本信息、所交互的物品、与物品的操作行为以及物品信息等数据,因而可以从系统收集到日志中所包含的样本对象的画像数据、物品数据和在各历史时间段内与各个历史物品的交互信息等,从而构成可用于目标点击率预估模型训练的初始训练样本集。

另外,值得说明的历史时间段可以为1天,例如,各历史时间段分别为历史第一天、历史第二天、历史第3天等,本申请实施例中对此并不进行限制。

其中,关联对象为与样本对象之间的属性特征满足相似条件的对象,相似条件可以为:与样本对象具有相同的属相特征,或者与样本对象在同一历史时间段内对同一历史物品有操作行为等,本申请实施例中对此并不进行限制。

步骤21:提取初始训练样本集的样本交互特征集。

其中,对应每个样本交互特征设置有基于时间顺序的特征编号。

具体的,在执行步骤21时,服务器具体执行以下操作。参阅图3所示,其为本申请实施例中获得样本交互特征集的流程示意图,下面结合附图3,对具体执行的操作进行详细说明:

步骤210:对初始训练样本集进行数据预处理。

其中,数据预处理包括以下处理中的任意一种或任意组合:整理、奇异值处理和缺失值处理。

本申请实施例中,获得初始训练样本集之后,对初始训练样本集进行数据预处理。

具体的,奇异值处理为删除初始训练样本集中的异常数值和非规定数据类型的数值,异常数值为大于其所在维度的数据均值与第一参数之和的数值或小于其所在维度的数据均值与第二参数之差的数值,缺失值处理为对初始训练样本集中缺失的数值进行填充。

例如,参阅图4所示,为本申请实施例中数据预处理的示意图,假设交互值维度的数据均值为15,第一参数为20,第二参数为15,交互值的数据类型为数字,历史时间段3的交互值为1023,交互值1023大于其所在维度的数据均值与第一参数之和35,则1023为异常数值,将1023删除,历史时间段4的交互值为Oexc,Oexc的数据类型为字符,则Oexc为非规定数据类型的数值,将Oexc删除,对历史时间段3和历史时间段4的交互值进行填充,可以补0或者-1。

这样,对初始训练样本集进行数据预处理,避免了数值过大和过小的数据、乱码数据、以及空数据对目标点击率预估模型的干扰,从而提高了目标点击率预估模型的准确度。

步骤211:基于预处理后的初始训练样本集,提取各初始训练样本的样本交互特征。

本申请实施例中,对初始训练样本集进行数据预处理之后,基于预处理后的初始训练样本集,提取各初始训练样本的样本交互特征。

例如,提取样本对象1在历史时间段1内的样本交互特征为(1,2,3),1表征样本对象1在历史时间段1内与物品类型A交互的数值为1,2表征样本对象1在历史时间段1内与物品类型B交互的数值为2,3表征样本对象1在历史时间段1内与物品类型C交互的数值为3。

步骤212:基于各初始训练样本的样本编号、各样本历史时间段的时序编号、以及初始训练样本数量,分别确定各初始训练样本的样本交互特征的特征编号,获得初始训练样本集的样本交互特征集。

本申请实施例中,提取各初始训练样本的样本交互特征之后,针对各初始训练样本,分别执行以下操作:基于一个初始训练样本的样本编号、一个样本历史时间段的时序编号、以及初始训练样本数量,确定该初始训练样本在该样本历史时间段内的样本交互特征的特征编号,从而获得设置有特征编号的样本交互特征集。

可选的,本申请实施例中,在获得一个初始训练样本在一个样本历史时间段内的样本交互特征的特征编号时,可以计算该样本历史时间段的时序编号与初始训练样本数量的乘积,再计算乘积与该初始训练样本的样本编号之和,从而获得该初始训练样本在该样本历史时间段内的样本交互特征的特征编号。

其中,第a个初始训练样本在第b个样本历史时间段内的样本交互特征的特征编号可以表示为:N

例如,参阅图5所示,为本申请实施例中特征编号的示意图,假设第1个初始训练样本在第3个样本历史时间段内的样本交互特征为(2,2,1),第1个初始训练样本00001的样本编号为1,样本历史时间段3的时序编号为2,初始训练样本数量为4,则样本交互特征为(2,2,1)的特征编号为1+(2*4)=9。

步骤22:基于样本交互特征集,对待训练的点击率预估模型进行迭代训练,获得目标点击率预估模型。

本申请实施例中,服务器基于读取的训练样本的样本交互特征,对待训练的点击率预估模型进行一轮迭代训练,得到当前训练得到的训练结果。

具体的,在执行步骤22时,服务器具体执行以下操作。参阅图6所示,其为本申请实施例中一次迭代训练的流程示意图,下面结合附图6,对具体执行的操作进行详细说明:

步骤220:基于选取的目标训练样本关联的特征编号,获得相应的目标样本交互特征。

本申请实施例中,服务器根据实际的处理需要,确定一批(batch)训练过程中所需要的目标训练样本,或者,服务器随机选取一个batch训练过程中的目标训练样本,然后,从样本交互特征集中抽取目标训练样本关联的目标样本交互特征,作为一个batch内训练所使用的目标样本交互特征。

可选的,本申请实施例中,在获得一个目标训练样本相应的目标样本交互特征时,可以计算该目标训练样本关联的特征编号的独热编码矩阵,再计算独热编码矩阵与样本交互特征集的样本特征交互矩阵的乘积,获得该目标训练样本相应的目标样本交互特征。

其中,目标训练样本相应的目标样本交互特征可以表示为:feature=wX,w为目标训练样本关联的特征编号的独热编码矩阵,X为样本交互特征集的样本特征交互矩阵。

例如,假设将图5中的各样本交互特征作为样本交互特征集,按照图5中的顺序生成样本交互特征集的样本特征交互矩阵X,目标训练样本00001关联的特征编号为(1,5,9),将(1,5,9)转化为独热编码矩阵

这样,基于选取的目标训练样本关联的特征编号,获得相应的目标样本交互特征,在进行模型训练时,并不需要将所有样本交互特征输入模型,只需选取目标训练样本的目标样本交互特征,采用矩阵乘法,实现动态特征查询和抽取,能够提高每一次迭代训练的执行效率,节约了时间资源。

步骤221:基于目标样本交互特征包含的各样本交互元素的时间信息,获得目标训练样本的目标样本时序特征。

其中,目标样本时序特征表征目标样本交互特征包含的各样本交互元素的时间位置。

本申请实施例中,获得目标样本交互特征之后,基于目标样本交互特征包含的各样本交互元素的时间信息,获得目标训练样本的目标样本时序特征。

可选的,本申请实施例中,在获得一个目标训练样本的目标样本时序特征时,可以针对该目标训练样本的目标样本交互特征包含的各样本交互元素,分别执行以下操作:基于一个样本交互元素在目标样本交互特征中的位置信息和目标样本交互特征的维度,确定该样本交互元素对应的样本时序元素。

其中,一个样本交互元素对应的样本时序元素可以表示为:T

例如,假设目标训练样本00001相应的目标样本交互特征为

步骤222:确定目标样本交互特征包含的各样本交互元素各自的第三重要度,并基于各样本交互元素和目标样本时序特征包含的各样本时序元素之间的匹配程度,分别确定各样本交互元素各自在所属样本时序元素上的第四重要度。

本申请实施例中,通过并行模型确定目标样本交互特征包含的各样本交互元素各自的第三重要度,通过序列推理模型基于各样本交互元素和目标样本时序特征包含的各样本时序元素之间的匹配程度,分别确定各样本交互元素各自在所属样本时序元素上的第四重要度。

可选的,本申请实施例中,将目标样本交互特征作为输入至并行模型中,获得并行模型输出的并行结果,将目标样本交互特征和目标样本时序特征进行拼接融合,输入至序列推理模型中,获得序列推理模型输出的推理结果。

其中,并行模型使用两层神经网络,基于目标样本交互特征、权重参数、偏置参数,采用激活函数进行处理,获得并行结果,具体计算公式如下:

序列推理模型包括:多头自注意力网络、前向神经网络和归一化网络,单头自注意力计算公式为

另外,值得说明的是一个序列推理模型完成后,可以接入下一个序列推理模型,总共可以堆叠N个序列推理模型完成整个序列推理过程,N可以根据需要设置,例如,采用N=3,即有3个序列推理模型完成时序推理任务,时序推理任务得到的输出结果可以作为其他场景模型的特征输入,具有较强的可扩展性。

例如,参阅图7所示,为本申请实施例中目标点击率预估模型训练的示意图,将目标样本交互特征作为输入至并行模型中,获得并行模型输出的并行结果,将目标样本交互特征和目标样本时序特征进行拼接融合,得到样本融合特征输入至多头自注意力网络中,获得多头自注意力网络输出的注意力结果,将注意力结果和样本融合特征输入至第一归一化网络中,获得第一归一化网络输出的第一归一化结果,将第一归一化结果输入至前向神经网络中,获得前向神经网络输出的前向结果,将前向结果和第一归一化结果输入至第二归一化网络中,获得第二归一化网络输出的第二归一化结果,将第二归一化结果作为序列推理模型输出的推理结果。

这样,通过序列推理模型,可以有效处理物品推送前后的各类特征,包括时序特征,时序特征能反映到样本对象交互时刻距离当前时刻的远近程度,能够有效挖掘理历史行为数据的信息,提升点击率预估的准确度。

步骤223:基于第三重要程度和第四重要程度,分别获得各样本物品的点击率结果,并基于点击率结果对应的损失值进行调参。

本申请实施例中,通过柔性特征融合将并行模型输出的并行结果和序列推理模型输出的推理结果进行融合,基于融合后的结果进行识别,获得各样本物品的点击率结果,并基于点击率结果对应的损失值对各模型参数进行调参。

其中,基于并行模型输出的并行结果、权重参数和偏置参数,采用激活函数进行处理,获得第一激活结果,基于序列推理模型输出的推理结果、权重参数和偏置参数,采用激活函数进行处理,获得第一激活结果,再将第一激活结果和第一激活结果相加后,采用激活函数进行处理,获得融合后的结果,具体的融合计算公式为

例如,如图7所示,将并行结果和推理结果进行融合,采用分类模型或是回归模型对融合后的结果进行识别,获得各样本物品的点击率结果。

这样,将并行结果和推理结果进行融合,保留了两侧结果的有效信息,使得模型学习到的表达更为全面。

另外,值得说明的是,目标点击率预估模型可以是由并行模型、时序推理模型以及分类(回归)模型进行联合训练获得的,也可以是并行模型、时序推理模型以及分类(回归)模型三个部分单独训练后拼接的,或者拼接后为了保证准确性再次进行参数调整后获得的。

下面结合附图,对基于已训练的目标点击率预估模型进行应用的过程进行说明:

参阅图8所示,其为本申请实施例中物品推荐方法的流程示意图,下面结合附图8,对具体操作进行详细说明:

步骤80:响应于待推荐对象触发的物品推荐请求,获取待推荐对象关联的历史行为数据。

其中,历史行为数据至少包括:待推荐对象及其关联对象,在各历史时间段内与各个历史物品的交互信息,关联对象为与所述待推荐对象之间的属性特征满足相似条件的对象。

本申请实施例中,在待推荐对象在终端设备上的客户端上进行一定的操作之后,则可以触发客户端向服务器发送物品推荐请求,服务器响应于待推荐对象触发的物品推荐请求,获取待推荐对象关联的历史行为数据。

例如,参阅图9所示,为本申请实施例中触发客户端向服务器发送物品推荐请求的示意图,待推荐对象A进入客户端上某个包含一个或者多个物品的操作,待推荐对象B上拉、下拉页面的操作,待推荐对象C刷新页面的操作,待推荐对象A、待推荐对象B和待推荐对象C在相应终端设备上的客户端上进行的操作,都可以触发相应客户端向服务器发送物品推荐请求,当然,也可以包括其他可能的操作,本申请实施例对此不做限制。

具体的,通过日志收集进行待推荐对象的数据的采集,从而获取待推荐对象关联的历史行为数据,系统日志中包含了待推荐对象的基本信息、所交互的物品、与物品的操作行为以及物品信息等数据,因而可以从系统收集到日志中所包含的待推荐对象的画像数据、物品数据和在各历史时间段内与各个历史物品的交互信息等,从而待推荐对象关联的历史行为数据。

另外,值得说明的历史时间段可以为1天,例如,各历史时间段分别为历史第一天、历史第二天、历史第3天等,本申请实施例中对此并不进行限制。

其中,关联对象为与待推荐对象之间的属性特征满足相似条件的对象,相似条件可以为:与待推荐对象具有相同的属性特征,或者与待推荐对象在同一历史时间段内对同一历史物品有操作行为等,本申请实施例中对此并不进行限制。

例如,参阅图10所示,为本申请实施例中关联对象的示意图,假设待推荐对象A的年龄为63,性别为女,待推荐对象A在最近的历史时间段2024.10.21对历史物品C有操作行为,对象E的年龄为63,性别为女,对象F在历史时间段2024.10.21对历史物品C有操作行为,对象E与待推荐对象A具有相同的属性特征,对象F与待推荐对象A在同一历史时间段内对同一历史物品有操作行为,则对象E和对象F为待推荐对象A的关联对象。

步骤81:基于历史行为数据,提取待推荐对象的交互特征和时序特征。

其中,时序特征表征交互特征包含的各交互元素的时间位置。

本申请实施例中,对待推荐对象关联的历史行为数据进行预处理,基于处理后的历史行为数据,提取待推荐对象的交互特征,并基于交互特征包含的各交互元素的时间信息,获得目标训练样本的目标样本时序特征。

可选的,本申请实施例中,在获得待推荐对象的时序特征时,可以针对待推荐对象的交互特征包含的各交互元素,分别执行以下操作:基于一个交互元素在交互特征中的位置信息和交互特征的维度,确定该交互元素对应的时序元素。

其中,一个交互元素对应的时序元素可以表示为:T

例如,假设待推荐对象A的交互特征为

步骤82:确定交互特征包含的各交互元素各自的第一重要度,并基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度。

具体的,在确定交互特征包含的各交互元素各自的第一重要度时,可以采用以下任意一种方式:

方式一:基于交互特征包含的各交互元素各自的取值及相应的预设元素权重,获得各交互元素各自的第一重要度。

本申请实施例中,根据交互特征包含的各交互元素各自的取值,以及各交互元素各自相应的预设元素权重,采用激活函数sigmoid进行映射,获得各交互元素各自的第一重要度。

其中,第一重要度表征相应交互元素的在向待推荐对象推荐物品方面的重要程度,预设元素权重为目标点击率预估模型训练后,获得的最终的元素权重。

方式二:将分别对应交互特征包含的各交互元素预设的默认值,作为相应交互元素的第一重要度。

本申请实施例中,对交互特征包含的各交互元素分别预设一个默认值,将默认值作为相应交互元素的第一重要度。

例如,假设对应交互元素A的预设的默认值为0.5,则将0.5作为交互元素A的第一重要度。

具体的,在基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度时,服务器具体执行以下操作。参阅图11所示,其为本申请实施例中确定第二重要度的流程示意图,下面结合附图11,对具体执行的操作进行详细说明:

步骤820:将各交互元素分别与匹配程度达到匹配阈值的时序元素进行拼接融合,获得初始融合特征。

本申请实施例中,与交互元素匹配程度达到匹配阈值的时序元素为交互元素对应的时序元素,将各交互元素分别与对应的时序元素进行拼接融合,获得初始融合特征。

例如,假设交互元素(1,3,3)对应的时序元素为0.5,将交互元素(1,3,3)与时序元素0.5进行拼接融合,获得初始融合特征(1,3,3,0.5)。

步骤821:基于初始融合特征对应的注意力权重,分别获得初始融合特征包含的各初始融合元素各自的内部影响度,并基于获得的各内部影响度,分别对各初始融合元素的取值进行更新,获得目标融合特征。

其中,每个内部影响度表征:相应的初始融合元素在与待推荐对象交互时,受其他各初始融合元素的影响程度。

本申请实施例中,通过模型训练过程,可以学习到初始融合特征中各个初始融合元素的权重参数值,权重参数值用于表征各个初始融合元素对应的物品在向待推荐对象推荐物品方面的重要程度,进而可以根据各个初始融合元素以及各自对应的权重参数值,获得目标融合特征。例如,可以采用加权求和的方式来得到目标融合特征。

其中,权重参数值例如可以为初始融合特征对应的注意力权重,其可以包括查询(query)权重、键(key)权重和值(value)权重。

具体的,在获得初始融合特征包含的各初始融合元素各自的内部影响度时,服务器具体执行以下操作。参阅图12所示,其为本申请实施例中获得内部影响度的流程示意图,下面结合附图12,对具体执行的操作进行详细说明:

步骤8210:基于预设的查询权重矩阵和键权重矩阵,分别对初始融合特征进行线性变换,获得相应的查询矩阵和键矩阵。

其中,查询权重矩阵中的每个元素表征:对应的初始融合元素的重要程度,键权重矩阵中的每个元素表征:与对应的初始融合元素相关的至少一个其他初始融合元素的重要程度。

本申请实施例中,将初始融合特征分别与预设的各查询权重矩阵和各键权重矩阵做矩阵乘法,生成相应的查询矩阵和键矩阵,相当于实现对初始融合特征的线性变换。

例如,参阅图13所示,为本申请实施例中获得目标融合特征的示意图,假设预设的各查询权重矩阵为W

步骤8211:基于查询矩阵和键矩阵,获得影响度矩阵。

其中,影响度矩阵中的每个元素表征:相应的初始融合元素的内部影响度。

本申请实施例中,将各查询矩阵与相应键矩阵的转置做矩阵乘法,获得各影响度矩阵。

例如,如图13所示,将查询矩阵Q

具体的,在对各初始融合元素的取值进行更新,获得目标融合特征时,服务器具体执行以下操作。参阅图14所示,其为本申请实施例中获得目标融合特征的流程示意图,下面结合附图14,对具体执行的操作进行详细说明:

步骤8212:基于预设的值权重矩阵,对初始融合特征进行线性变换,获得相应的值矩阵。

其中,值权重矩阵中的每个元素表征:对应的初始融合元素,和相关的至少一个其他初始融合元素之间的相关性的重要程度。

本申请实施例中,将初始融合特征分别与预设的各值权重矩阵做矩阵乘法,生成相应的值矩阵,相当于实现对初始融合特征的线性变换。

例如,如图13所示,假设预设的各值权重矩阵为W

步骤8213:基于影响度矩阵和值矩阵,获得目标融合特征。

本申请实施例中,分别利用softmax函数获得归一化的各影响度矩阵,然后将归一化后的各影响度矩阵与相应的值矩阵相乘,获得各中间融合特征,最后将各中间融合特征进行拼接后与输出矩阵相乘,获得目标融合特征。

例如,如图13所示,将各影响度矩阵归一化,即

步骤822:对目标融合特征进行归一化处理,并将归一化处理之后的目标融合特征包含的各目标融合元素的取值,分别作为各交互元素各自在所属时序元素上的第二重要度。

其中,第二重要度表征相应交互元素在所属时序元素上的在向待推荐对象推荐物品方面的重要程度。

本申请实施例中,将目标融合特征和初始融合特征进行合并后,进行第一归一化处理,获得第一归一化特征,采用前向神经网络机制,对第一归一化特征进行处理,获得前向特征,将前向特征和第一归一化特征进行合并后,进行第二归一化处理,获得第二归一化特征,将第二归一化特征包含的各目标融合元素的取值,分别作为各交互元素各自在所属时序元素上的第二重要度。

步骤83:基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,并将预估点击率符合推荐条件的候选物品,推荐给待推荐对象。

其中,推荐条件可以为预估点击率排名前五,或者预估点击率达到推荐阈值。

本申请实施例中,基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率。根据预估点击率的高低对各个候选物品进行排序,将预估点击率排名前五的候选物品作为目标物品,推荐给待推荐对象,或者判断预估点击率是否达到推荐阈值,将预估点击率达到推荐阈值的候选物品作为目标物品,推荐给待推荐对象,向待推荐对象推送确定的各个目标物品的内容信息,以使得待推荐对象对应的客户端中可以查看到各个目标物品的内容信息。

例如,参阅图15所示,为本申请实施例中推荐目标物品给待推荐对象的示意图,假设各个候选物品的预估点击率分别为:候选物品A:0.88、候选物品B:0.76、候选物品C:0.56、候选物品D:0.43、候选物品E:0.33、候选物品F:0.27、候选物品G:0.90、候选物品H:0.84、候选物品I:0.51、候选物品J:0.49,则情况一:根据预估点击率的高低对各个候选物品进行排序,排序结果为候选物品G、候选物品A、候选物品H、候选物品B、候选物品C、候选物品I、候选物品J、候选物品D、候选物品E、候选物品F,将预估点击率排名前五的候选物品G、候选物品A、候选物品H、候选物品B、候选物品C作为目标物品,推荐给待推荐对象A;情况二:假设推荐阈值为0.8,判断预估点击率是否达到推荐阈值0.8,将预估点击率达到推荐阈值0.8的候选物品G、候选物品A和候选物品H作为目标物品,推荐给待推荐对象A,待推荐对象A对应的客户端中可以查看到各个目标物品的内容信息。

另外,值得说明的是,在客户端中展示目标物品的内容信息,也可以按照预估点击率的高低进行展示,例如预估点击率高的目标物品可以优先显示。

具体的,在获得各候选物品的预估点击率时,服务器具体执行以下操作。参阅图16所示,其为本申请实施例中获得各候选物品的预估点击率的流程示意图,下面结合附图16,对具体执行的操作进行详细说明:

步骤830:基于各交互元素各自的第一重要度,结合预设的第一点击权重,分别获得各候选物品各自的第一点击率。

本申请实施例中,采用激活函数sigmoid或者relu,基于各交互元素各自的第一重要度,结合预设的第一点击权重,分别获得各候选物品各自的第一点击率。

步骤831:基于各交互元素各自的第二重要度,结合预设的第二点击权重,分别获得各候选物品各自的第二点击率。

本申请实施例中,采用激活函数sigmoid或者relu,基于各交互元素各自的第二重要度,结合预设的第二点击权重,分别获得各候选物品各自的第二点击率。

步骤832:基于各候选物品各自的第一点击率和第二点击率,结合其各自的占比权重,分别确定各候选物品的预估点击率。

本申请实施例中,采用激活函数sigmoid或者relu,基于各候选物品各自的第一点击率和第二点击率,结合其各自的占比权重,分别确定各候选物品的预估点击率。

可选的,在获得各候选物品的预估点击率时,服务器还可以执行以下操作:

基于各交互元素各自的第一重要度和第一重要度,结合预设的占比权重,获得各交互元素各自的目标重要度,再基于目标重要度,分别确定各候选物品各自的预估点击率。

这样,基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,不仅考虑了各交互元素之间的重要程度,还考虑了各交互元素在相应时序元素上的重要程度,使得预估点击率更准确,从而能够向待推荐对象推荐更准确的物品。

与上述方法实施例基于同一发明构思,本申请实施例还提供了一种物品推荐装置,参阅图17所示,为本申请实施例提供的一种物品推荐装置的结构示意图,该装置包括:

获取模块1701,用于响应于待推荐对象触发的物品推荐请求,获取待推荐对象关联的历史行为数据,其中,历史行为数据至少包括:待推荐对象及其关联对象,在各历史时间段内与各个历史物品的交互信息述关联对象为与待推荐对象之间的属性特征满足相似条件的对象;

提取模块1702,用于基于历史行为数据,提取待推荐对象的交互特征和时序特征,其中,时序特征表征交互特征包含的各交互元素的时间位置;

确定模块1703,用于确定交互特征包含的各交互元素各自的第一重要度,并基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度;

推荐模块1704,用于基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率,并将预估点击率符合推荐条件的候选物品,推荐给待推荐对象。

在一种可能的实现方式,确定交互特征包含的各交互元素的第一重要度时,确定模块1703用于:

基于交互特征包含的各交互元素各自的取值及相应的预设元素权重,获得各交互元素各自的第一重要度;

将分别对应交互特征包含的各交互元素预设的默认值,作为相应交互元素的第一重要度。

在一种可能的实现方式,基于交互特征包含的各交互元素和时序特征包含的各时序元素之间的匹配程度,分别确定各交互元素各自在所属时序元素上的第二重要度时,确定模块1703用于:

将各交互元素分别与匹配程度达到匹配阈值的时序元素进行拼接融合,获得初始融合特征;

基于初始融合特征对应的注意力权重,分别获得初始融合特征包含的各初始融合元素各自的内部影响度,并基于获得的各内部影响度,分别对各初始融合元素的取值进行更新,获得目标融合特征;其中,每个内部影响度表征:相应的初始融合元素在与待推荐对象交互时,受其他各初始融合元素的影响程度;

对目标融合特征进行归一化处理,并将归一化处理之后的目标融合特征包含的各目标融合元素的取值,分别作为各交互元素各自在所属时序元素上的第二重要度。

在一种可能的实现方式,注意力权重至少包括查询权重和键权重;则基于初始融合特征对应的注意力权重,分别获得初始融合特征包含的各初始融合元素各自的内部影响度时,确定模块1703还用于:

基于预设的查询权重矩阵和键权重矩阵,分别对初始融合特征进行线性变换,获得相应的查询矩阵和键矩阵,其中,查询权重矩阵中的每个元素表征:对应的初始融合元素的重要程度,键权重矩阵中的每个元素表征:与对应的初始融合元素相关的至少一个其他初始融合元素的重要程度;

基于查询矩阵和键矩阵,获得影响度矩阵;其中,影响度矩阵中的每个元素表征:相应的初始融合元素的内部影响度。

在一种可能的实现方式,注意力权重还包括值权重;则基于获得的各内部影响度,分别对各初始融合元素的取值进行更新,获得目标融合特征时,确定模块1703还用于:

基于预设的值权重矩阵,对初始融合特征进行线性变换,获得相应的值矩阵,其中,值权重矩阵中的每个元素表征:对应的初始融合元素,和相关的至少一个其他初始融合元素之间的相关性的重要程度;

基于影响度矩阵和值矩阵,获得目标融合特征。

在一种可能的实现方式,基于获得的各第一重要度和各第二重要度,分别获得各候选物品的预估点击率时,推荐模块1704用于:

基于各交互元素各自的第一重要度,结合预设的第一点击权重,分别获得各候选物品各自的第一点击率;

基于各交互元素各自的第二重要度,结合预设的第二点击权重,分别获得各候选物品各自的第二点击率;

基于各候选物品各自的第一点击率和第二点击率,结合其各自的占比权重,分别确定各候选物品的预估点击率。

在一种可能的实现方式,预估点击率是通过将交互特征和时序特征,输入目标点击率预估模型获得的,装置还包括训练模块1705,训练模块1705用于:

获取初始训练样本集,其中,初始训练样本集中每一初始训练样本至少包括:样本对象关联的样本历史行为数据;

提取初始训练样本集的样本交互特征集,其中,对应每个样本交互特征设置有基于时间顺序的特征编号;

基于样本交互特征集,对待训练的点击率预估模型进行迭代训练,获得目标点击率预估模型。

在一种可能的实现方式,基于样本交互特征集,对待训练的点击率预估模型进行迭代训练,获得目标点击率预估模型,其中,在一次迭代训练过程时,训练模块1705还用于:

基于选取的目标训练样本关联的特征编号,获得相应的目标样本交互特征;

基于目标样本交互特征包含的各样本交互元素的时间信息,获得目标训练样本的目标样本时序特征;

确定目标样本交互特征包含的各样本交互元素各自的第三重要度,并基于各样本交互元素和目标样本时序特征包含的各样本时序元素之间的匹配程度,分别确定各样本交互元素各自在所属样本时序元素上的第四重要度;

基于第三重要程度和第四重要程度,分别获得各样本物品的点击率结果,并基于点击率结果对应的损失值进行调参。

为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本申请时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

在介绍了本申请示例性实施方式的物品推荐方法和装置之后,接下来,介绍根据本申请的另一示例性实施方式的电子设备。

所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。

与上述方法实施例基于同一发明构思,本申请实施例中还提供了一种计算设备。在一种实施例中,该计算设备可以是服务器,如图1所示的服务器102。在该实施例中,计算设备的结构如图18所示,可以至少包括存储器1801、通讯模块1803,以及至少一个处理器1802。

存储器1801,用于存储处理器1802执行的计算机程序。存储器1801可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。

存储器1801可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1801也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD);或者存储器1801是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1801可以是上述存储器的组合。

处理器1802,可以包括一个或多个中央处理单元(central processing unit,CPU)或者为数字处理单元等等。处理器1802,用于调用存储器1801中存储的计算机程序时实现上述物品推荐方法。

通讯模块1803用于与终端设备和其他服务器进行通信。

本申请实施例中不限定上述存储器1801、通讯模块1803和处理器1802之间的具体连接介质。本申请实施例在图18中以存储器1801和处理器1802之间通过总线1804连接,总线1804在图18中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线1804可以分为地址总线、数据总线、控制总线等。为便于描述,图18中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。

存储器1801中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本申请实施例的物品推荐方法。处理器1802用于执行上述的物品推荐方法。

在另一种实施例中,计算设备也可以是其他计算设备,如图1所示的终端设备101。在该实施例中,计算设备的结构可以如图19所示,包括:通信组件1910、存储器1920、显示单元1930、摄像头1940、传感器1950、音频电路1960、蓝牙模块1920、处理器1980等部件。

通信组件1910用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(Wireless Fidelity,WiFi)模块,WiFi模块属于短距离无线传输技术,电子设备通过WiFi模块可以帮助对象收发信息。

存储器71920可用于存储软件程序及数据。处理器1980通过运行存储在存储器1920的软件程序或数据,从而执行终端设备101的各种功能以及数据处理。存储器1920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器1920存储有使得终端设备1910能运行的操作系统。本申请中存储器1920可以存储操作系统及各种应用程序,还可以存储执行本申请实施例物品推荐方法的计算机程序。

显示单元1930还可用于显示由对象输入的信息或提供给对象的信息以及终端设备101的各种菜单的图形用户界面(graphical user interface,GUI)。具体地,显示单元1930可以包括设置在终端设备1910正面的显示屏732。其中,显示屏1932可以采用液晶显示器、发光二极管等形式来配置。显示单元1930可以用于显示本申请实施例中的缺陷检测界面、模型训练界面等。

显示单元1930还可用于接收输入的数字或字符信息,产生与终端设备101的对象设置以及功能控制有关的信号输入,具体地,显示单元1930可以包括设置在终端设备101正面的触控屏1931,可收集对象在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。

其中,触控屏1931可以覆盖在显示屏1932之上,也可以将触控屏1931与显示屏1932集成而实现物理终端设备101的输入和输出功能,集成后可以简称触摸显示屏。本申请中显示单元1930可以显示应用程序以及对应的操作步骤。

摄像头1940可用于捕获静态图像,对象可以将摄像头1940拍摄的图像通过应用发布。摄像头1940可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,CCD)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,CMOS)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器1980转换成数字图像信号。

物理终端设备还可以包括至少一种传感器1950,比如加速度传感器1951、距离传感器1952、指纹传感器1953、温度传感器1954。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。

音频电路1960、扬声器1961、传声器1962可提供对象与终端设备101之间的音频接口。音频电路1960可将接收到的音频数据转换后的电信号,传输到扬声器1961,由扬声器1961转换为声音信号输出。物理终端设备1910还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器1962将收集的声音信号转换为电信号,由音频电路1960接收后转换为音频数据,再将音频数据输出至通信组件1910以发送给比如另一物理终端设备101,或者将音频数据输出至存储器1920以便进一步处理。

蓝牙模块1920用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,物理终端设备可以通过蓝牙模块1920与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。

处理器1980是物理终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器1920内的软件程序,以及调用存储在存储器1920内的数据,执行终端设备的各种功能和处理数据。在一些实施例中,处理器1980可包括一个或多个处理单元;处理器1980还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器1980中。本申请中处理器1980可以运行操作系统、应用程序、用户界面显示及触控响应,以及本申请实施例的物品推荐方法。另外,处理器1980与显示单元1930耦接。

此外需要注意的是,在本申请的具体实施方式中,涉及到与目标点击率预估模型等相关的对象数据,当本申请以上实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

在一些可能的实施方式中,本申请提供的物品推荐方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在计算设备上运行时,计算机程序用于使计算设备执行本说明书上述描述的根据本申请各种示例性实施方式的物品推荐方法中的步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体地例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请的实施方式的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机程序,并可以在电子设备上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在用户计算设备上执行、部分地在用户计算设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外,尽管在附图中以特定顺序描述了本申请方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品,该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序命令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的命令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

相关技术
  • 一种房源推荐方法、装置、存储介质及电子设备
  • 一种信息推荐方法、装置、电子设备及存储介质
  • 一种信息推荐方法、装置、电子设备及存储介质
  • 一种物品推荐方法、装置、存储介质及程序产品
  • 生成推荐词的方法、装置、电子设备及存储介质
  • 物品推荐方法、物品推荐装置、存储介质及电子设备
  • 物品推荐模型训练方法、物品推荐方法、装置及存储介质
技术分类

06120116500560