掌桥专利:专业的专利平台
掌桥专利
首页

一种物料推荐方法、装置、设备和存储介质

文献发布时间:2023-06-19 12:05:39


一种物料推荐方法、装置、设备和存储介质

技术领域

本申请实施例涉及推荐技术领域,尤其涉及一种物料推荐方法、装置、设备和存储介质。

背景技术

随着信息技术和互联网的发展,人们逐渐从信息匮乏时代走入了信息过载时代,在这个时代中,从大量信息中找到自己感兴趣的信息是一件非常困难的事情。因而推荐系统应运而生,一方面能帮助用户发现有价值的信息,另一方面也能帮助信息生产者提升信息的曝光度。

然而,现有技术中进行物料推荐时,推荐结果与用户匹配度较低,难以实现精确推荐,给用户带来的较差的使用体验。

发明内容

本申请提供了一种物料推荐方法、装置、设备和存储介质,以提高推荐结果与用户之间的匹配度,同时提高推荐效率。

第一方面,本申请实施例提供了一种物料推荐方法,包括:

根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;

根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料;

确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料;

向所述目标用户推荐所述目标物料。

第二方面,本申请实施例还提供了一种物料推荐装置,包括:

初始物料获取模块,用于根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;

候选物料选取模块,用于根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料;

目标物料选取模块,用于确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料;

目标物料推荐模块,用于向所述目标用户推荐所述目标物料。

第三方面,本申请实施例还提供了一种电子设备,包括:

一个或多个处理器;

存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请第一方面实施例提供的任意一种物料推荐方法。

第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请第一方面实施例所提供的任意一种物料推荐方法。

本申请实施例通过根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;根据关联物料对之间的物料相似度数据,从物料库中选取与各初始物料相关联的至少一个候选物料;确定各候选物料的物料得分,并根据物料得分,从候选物料中选取目标物料;向目标用户推荐目标物料。上述技术方案通过进入目标用户的历史交互数据和关联物料对之间的物料相似度数据,进行候选物料的确定,并将所确定候选物料作为目标物料的确定基础,从而保证了最终确定的目标物料能够与用户的交互习惯相匹配,从而提高了目标物料与目标用户的匹配度,同时,避免了目标用户已交互物料的重复推荐,进而提高了目标用户的使用体验。

附图说明

图1是本申请实施例一提供的一种物料推荐方法的流程图;

图2是本申请实施例二提供的另一种物料推荐方法的流程图;

图3A是本申请实施例三提供的一种物料推荐方法的过程图;

图3B是本申请实施例三提供的一种相似度预测模型的结构示意图;

图4是本申请实施例四提供的一种物料推荐装置的结构图;

图5是本申请实施例五提供的一种电子设备的结构图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。

实施例一

图1是本申请实施例提供的一种物料推荐方法的流程图。该实施例适用于向目标用户进行物料库中的物料推荐的推荐情况。其中,物料可以是新闻、商品或其他消息等,本申请对物料的具体内容不做任何限定。本申请所提供的各物料推荐方法,可以由物料推荐装置执行,该装置可以采用软件和/或硬件实现,并具体配置于电子设备中。在一个可选实施例中,该电子设备可以是具备一定数据处理能力的智能终端或服务器等。

参见图1所示的一种物料推荐方法,包括:

S110、根据目标用户的历史交互数据,从物料库中选取至少一个初始物料。

其中,物料库中存储有至少一条待推荐物料,各待推荐物料可以是新闻物料、商品物料或其他消息等,可根据推荐场景不同,进行不同物料库的构建或使用。

其中,历史交互数据可以是基于目标用户对物料库中各物料的历史交互行为所生成的数据。其中,交互行为可以包括浏览、点击、收藏、分享和评论等行为中的至少一种。

其中,物料库可以由构建用户根据需求进行物料的增加、删除和修改等。

示例性地,物料库可以预先存储在电子设备本地、与电子设备关联的其他存储设备或云端中。相应的,在需要进行物料推荐时从电子设备本地、与电子设备关联的其他存储设备或云端中,进行物料库的查找和使用。

需要说明的是,本申请实施例对物料库的构建时机不做限定,仅需保证在本次进行物料推荐之前,能够正常使用物料库即可。

示例性地,可以收集目标用户产生历史交互行为的物料,并将所收集物料作为初始物料。

可以理解的是,根据目标用户的历史交互行为,从物料库中进行初始物料的选取,使得所选取的各初始物料能够与目标用户的行为相关联,从而保证后续所确定的目标物料能够与目标用户相匹配。另外,通过用户的历史交互行为对物料库进行初筛,减少了进行物料推荐时的推荐范围,从而减少了后续进行目标物料选取时的数据运算量。

S120、根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料。

示例性地,关联物料对可以是物料库中具备关联关系的两个物料所构成的物料对。其中,物料相似度数据用于表征关联物料对之间的相似度属性。相似度越大,表征关联物料对之间的关联性越强;相似度越小,表征关联物料对之间的关联性越弱。因此,通过物料相似度数据能够确定出与某一物料对应的相似物料,从而将相似物料作为目标物料的推荐基础,从而在避免最终确定目标物料与目标用户产生历史交互行为的物料相同的同时,保证了目标物料与目标交互行为的一致性,进而保证了后续目标物料与目标用户的匹配度。

其中,物料相似度数据可以是余弦相似度。当然,本领域技术人员还可以根据需要或实际情况,采用其他表征相似度属性的数据作为物料相似度数据,本申请对此不做任何限定。

在一个可选实施例中,可以根据关联物料对之间的物料相似度数据,选取相似度数值大于设定相似度阈值的初始物料作为候选物料。其中,设定相似度阈值可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复确定。

S130、确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料。

在一个可选实施例中,确定各候选物料的物料得分,可以是:根据目标用户在设定历史时段内的历史交互数据,从物料库中选取与候选物料对应的各参考物料;根据候选物料相对于各参考物料之间的物料相似度数据,确定候选物料的物料得分。

示例性地,针对每个候选物料,从物料库中选取目标用户在设定历史时间段内产生过交互行为的各物料,作为参考物料;统计候选物料相对于各参考物料之间的物料相似度数据的和值,并将和值作为该候选物料的物料得分。

具体的,可以采用以下公式确定候选物料的物料得分:

score(user,item1)=∑w

其中,score(user,item1)表示目标用户user的候选物料item1的物料得分;w

需要说明的是,设定历史时间段可以由技术人员根据需要或经验值进行设定或调整,还可以通过大量试验进行确定。

示例性地,根据物料得分,从候选物料中选取目标物料,可以是:按照设定选取规则,选取至少一个候选物料作为目标物料。其中,设定选取规则可以包括下述至少一种:选取物料得分大于设定得分阈值、选取数量小于设定数量阈值和选取类别属于设定类别范围等。其中,设定得分阈值、设定数量阈值和设定类别范围可以由技术人员或目标用户根据需要或经验值进行设定或调整,或通过大量试验反复确定。

S140、向所述目标用户推荐所述目标物料。

将各目标物料发送至目标用户所所用的用户终端,以通过用户终端进行物料显示。

本申请实施例通过根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;根据关联物料对之间的物料相似度数据,从物料库中选取与各初始物料相关联的至少一个候选物料;确定各候选物料的物料得分,并根据物料得分,从候选物料中选取目标物料;向目标用户推荐目标物料。上述技术方案通过进入目标用户的历史交互数据和关联物料对之间的物料相似度数据,进行候选物料的确定,并将所确定候选物料作为目标物料的确定基础,从而保证了最终确定的目标物料能够与用户的交互习惯相匹配,从而提高了目标物料与目标用户的匹配度,同时,避免了目标用户已交互物料的重复推荐,进而提高了目标用户的使用体验。

实施例二

图2是本申请实施例提供的一种物料推荐方法的流程图,该实施例在上述各技术方案的基础上,进行了优化改进。

进一步的,在操作“根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料”之前,追加“将所述物料库中的各物料两两构建关联物料对;其中,所述关联物料对包括第一物料和第二物料;根据所述第一物料和所述第二物料的文本数据,生成关联物料词向量;根据所述关联物料词向量,确定所述第一物料相对于所述第二物料的相似度;根据各关联物料对的相似度,构建物料相似度数据”操作,以完善关联物料对之间的物料相似度数据的确定机制。

参见图2所示的一种物料推荐方法,包括:

S210、将所述物料库中的各物料两两构建关联物料对;其中,所述关联物料对包括第一物料和第二物料。

示例性的,关联物料对可以是有向物料对,也即,第一物料指向第二物料所对应的关联物料对,与第二物料指向第一物料所对应的关联物料对不同。

示例性的,关联物料对还可以是无向物料对或双向物料对,也即,第一物料指向第二物料所对应的关联物料对,与第二物料指向第一物料所对应的关联物料对相同。

S220、根据所述第一物料和所述第二物料的文本数据,生成关联物料词向量。

其中,物料的文本数据可以包括物料的标题数据、摘要数据、介绍数据和详情数据等中的至少一种。

需要说明的是,由于物料的标题数据中通常属于物料的概括信息,能够表征物料的整体内容,且数据量小。为了减少后续的数据运算量,通常采用标题数据作为物料的文本数据。

示例性地,根据第一物料的文本数据,生成第一物料词向量;根据第二物料的文本数据,生成第二物料词向量;将第一物料词向量和第二物料词向量先后拼接,构建关联物料词向量。

可选的,根据物料的文本数据,生成物料词向量,可以是:对物料的文本数据进行分词;分别对各分词结果进行编码处理,得到分词向量;将各分词向量按照各分词结果在文本数据中的顺序进行拼接,得到物料词向量。

其中,编码处理可以基于Word2vec模型或现有技术的其他模型中的至少一种加以实现,本申请对此不做任何限定。

S230、根据所述关联物料词向量,确定所述第一物料相对于所述第二物料的相似度。

在一个可选实施例中,根据关联物料词向量,确定第一物料相对于第二物料的相似度,可以是:直接确定关联物料词向量中第一物料词向量与第二物料词向量之间的余弦相似度,并将余弦相似度结果作为第一物料相对于第二物料的相似度。

在另一可选实施例中,为了提高相似度确定结果的准确度,根据关联物料词向量,确定第一物料相对于第二物料的相似度,还可以是:采用相似度预测模型,根据关联物料词向量,确定第一物料相对于第二物料的相似度。其中,相似度预测模型采用以下方式训练得到:根据样本用户的历史交互数据,构建样本物料对;其中,样本物料对包括第一样本物料和第二样本物料;根据第一样本物料和第二样本物料的文本数据,生成样本物料对的样本物料词向量;根据样本物料对的标签数据和样本物料词向量,对预先构建的机器学习模型进行训练,得到相似度预测模型。

可选的,样本物料对可以是有向物料对,如由第一样本物料指向第二样本物料的样本物料对,或第二样本物料指向第一样本物料的样本物料对。示例性地,可以通过交互行为发生时间的先后顺序,确定第一样本物料和第二样本物料的先后顺序,进而确定有向物料对的指向关系。例如,将先存在交互行为的物料作为第一样本物料,将后存在交互行为的物料作为第二样本物料。

可选的,样本物料对还可以是无向物料对或双向物料对。

在一个具体实现方式中,为了保证所构建样本物料对之间的逻辑性,通常会将根据交互习惯,将相邻的原发交互行为和继发交互行为所约束的两个物料构建样本物料对。例如,当用户先浏览物料A,再点击物料B时,浏览即为原发交互行为,点击即为继发交互行为,此时构建(物料A,物料B)作为物料A指向物料B的样本物料对。又如,当用户先点击物料B,再收藏物料C时,点击即为原发交互行为,收藏即为继发交互行为,此时构建(物料B,物料C)作为物料B指向物料C的样本物料对。

可以理解的是,为了保证样本物料对的数据量,同时避免样本物料对构建方式不同对后续结果产生的影响,通常会选取原发交互行为为浏览,继发交互行为为点击时,所限定的两个物料,进行样本物料对的构建。

示例性的,预先构建的机器学习模型可以是双向长短期记忆网络(Long Short-Term Memory,LSTM),或门控循环单元(Gated Recurrent Unit,GRU)网络。

可以理解的是,通过采用训练好的相似度预测模型进行第一物料相对于第二物料的相似度的确定,能够提取出第一物料对应的第一物料词向量和第二物料对应的第二物料词向量中的关联信息,和/或屏蔽掉第一物料词向量与第二物料词向量对应的无关信息,从而提高了相似度判定结果的准确度。

在一个可选实施方式中,为了保证所训练的相似度预测模型的泛化能力,通常在模型训练时,将样本物料对设置为包括正样本物料对和负样本物料对。可以理解的是,为了便于样本收集,同时保证训练得到的模型性能,通常可以预先设置正样本物料对和负样本物料对的比例数值,该比例数值一般由技术人员根据需要或经验值进行设定,或通过大量试验反复确定。例如,正样本物料对和负样本物料对的比例为1:4。

可选的,根据样本用户的历史交互数据,构建正样本物料对,可以是:根据样本用户的历史交互数据,将顺序交互的第一样本物料和第二样本物料顺序组合,构建正样本物料对。

可选的,根据样本用户的历史交互数据,构建负样本物料对,可以是:直接将与第一样本物料无顺序交互的其他样本物料作为第三样本物料;将第一样本物料和第三样本物料顺序组合,构建负样本物料对。

然而,直接机械的将与第一样本物料无顺序交互的其他样本物料作为第三样本物料,进行负样本物料对的构建,使得所构建负样本不够均匀,无法真实反映推荐场景下的数据分部情况,进而影响最终得到的相似度预测模型的准确度。为了避免上述情况的发生,可选的,还可以采用以下负样本物料对构建方式,对负样本物料对构建过程进行优化:从与第一样本物料无顺序交互的其他样本物料中,采样得到第三样本物料;将第一样本物料与第三样本物料顺序组合,构建负样本物料对。

可以理解的是,通过采样的方式进行第三样本物料的确定,能够一定程度上避免将未被看到的物料进行负样本构建的情况,从而使得所构建的负样本物料对更加合理。

需要说明的是,若关联物料对为无向物料对或双向物料对,则可以将第一物料相对于第二物料的相似度和第二物料相对于第一物料的相似度进行平均,将确定的均值,作为第一物料与第二物料之间的相似度,用于物料相似度数据的构建。由于用户的原发交互行为和继发交互行为具备先后顺序,因此,通常采用有向物料对进行第一物料相对于第二物料的相似度的确定,并根据第一物料相对于第二物料的相似度,进行物料相似度数据的确定。

S240、根据各关联物料对的相似度,构建物料相似度数据。

示例性的,将关联物料对的关联物料词向量输入至训练好的相似度预测模型,得到关联物料对中第一物料相对于第二物料的相似度;根据相似度所涉及物料主体之间的对应关系,生成相似度矩阵,并将该相似度矩阵作为物料相似度数据。

具体的,将各第一物料作为行向量,将第一物料对应的各第二物料作为列向量,将第一物料相对于第二物料的相似度作为元素,生成相似度矩阵,从而得到物料相似度数据。

为了减少数据运算量,在针对物料库中的各关联物料对生成物料相似度数据之后,基于该物料相似度数据进行物料推荐。为了减少物料推荐过程中数据的重复计算,可以将生成的物料相似度数据预先存储在电子设备本地、与电子设备关联的其他存储设备或云端中,并在后续进行物料推荐时,进行物料相似度数据的查找获取,从而实现物料相似度数据的复用。

随着时间的推移,物料库中的物料可能存在新增和/或删除带来的物料库更新情况。以下将在物料库存在更新的情况下,对物料相似度数据的更新进行详细说明。

在一个可选实施例中,若存在对物料库中的设定物料进行删除带来的更新,则遍历物料相似度数据,并查找出与所删除物料相关的相似度数据,并删除查找到的相似度数据,从而实现对物料相似度数据的更新。

在另一个可选实施例中,若存在向物料库中添加新物料带来的更新,则可以采用以下方式进行物料相似度数据的更新:将新增物料与物料库中各物料分别构建新增物料对,其中,新增物料对包括第一新增物料和第二新增物料;根据第一新增物料和第二新增物料的文本数据,生成新增物料词向量;根据新增物料词向量,确定第一新增物料相对于第二新增物料的相似度;根据各新增物料对的相似度,更新物料相似度数据。其中,第一新增物料和第二新增物料中的其中一个为新增物料,另一个为物料库中的已有物料。

示例性的,根据第一新增物料的文本数据,生成第一新增物料词向量;根据第二新增物料的文本数据,生成第二新增物料词向量;将第一新增物料词向量和第二新增物料词向量先后拼接,构建新增物料词向量。

其中,新增物料的文本数据可以包括新增物料的标题数据、摘要数据、介绍数据和详情数据等中的至少一种。需要说明的是,新增物料的文本数据,与物料库中其他物料的物料相似度数据确定时所采用的文本数据保持一致即可。

S250、根据目标用户的历史交互数据,从物料库中选取至少一个初始物料。

S260、根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料。

S270、确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料。

S280、向所述目标用户推荐所述目标物料。

本申请实施例通过将物料相似度数据确定过程,细化为根据已推荐用户的历史交互数据,确定存在关联交互关系的关联物料对;其中关联物料对包括第一物料和第二物料;根据第一物料和第二物料的文本数据,生成关联物料词向量;根据关联物料词向量,确定第一物料相对于第二物料的相似度;根据各关联物料对的相似度,构建物料相似度数据。上述技术方案通过引入已推荐用户的历史交互数据进行关联物料对的构建,从而使得所构建物料对中的第一物料和第二物料能够隐含表征用户行为,为物料推荐结果与用户匹配度的提升奠定了基础。通过关联物料对中第一物料和第二物料的文本数据的引入,进行相似度确定的基础,为相似度确定过程提供了丰富且全面的数据支撑,提高了相似度确定结果的准确度。进一步的,通过新增物料对物料相似度数据进行更新,进而根据更新后的物料相似度数据进行物料推荐,实现了物料的快速冷启动。

实施例三

本申请实施例在上述各技术方案的基础上,提供了一种优选实施方式。参见图3A所示的一种物料推荐方法,包括离线阶段、更新阶段和在线阶段。

在一个可选实施例中,离线阶段,包括:物料标题获取、正负样本标记、标题向量生成和相似度数据构建几个子阶段。

示例性的,物料标题获取,包括:获取样本用户的历史浏览和点击的新闻物料的样本物料标题。

示例性的,正负样本标记,包括:针对同一样本用户,若该样本用户存在浏览第一样本物料后点击第二样本物料的交互行为,则将第一样本物料和第二样本物料顺序拼接,生成第一样本物料指向第二样本物料的正样本;从未被点击的各物料中采样获取第三样本物料,并将第一样本物料和第三样本物料顺序拼接,生成第一样本物料指向第三样本物料的负样本。

示例性的,标题向量生成,包括:对正负样本中的各物料标题进行分词,并对各分词结果进行编码处理,生成嵌入向量;针对各样本,根据物料拼接顺序和各分词结果在物料标题的先后顺序,将各嵌入向量进行拼接,生成各样本对应的样本标题向量。

示例性的,相似度数据构建,包括:将样本标题向量输入至预设的机器学习模型中,并根据各样本标题向量对应的正负样本标签,对机器学习模型中的网络参数进行优化;将训练好的机器学习模型作为相似度预测模型。将物料库中的各物料两两构建关联物料对;其中,该关联物料对包括第一物料和第二物料;对第一物料的物料标题和第二物料的物料标题分别依次进行分词和编码处理,得到嵌入向量;将各嵌入向量按照第一物料和第二物料的顺序以及在所属物料标题中的先后顺序进行拼接,得到关联物料词向量;将关联物料词向量输入至训练好的相似度预测模型,得到第一物料相对于第二物料的相似度;将各第一物料作为行向量,将各第二物料作为列向量,将第一物料相对于第二物料的相似度作为矩阵元素,构建相似度矩阵,并将该相似度矩阵作为物料相似度数据。

在一个可选实施例中,机器学习模型可以基于长短期记忆网络加以实现。参见图3B所示的一种相似度预测模型的结构示意图,该模型包括嵌入层、双向LSTM层和输出层。其中,嵌入层用于对所输入分词进行编码处理,得到词向量;双向LSTM层用于对所输入词向量进行特征提取,得到隐向量;输出层用于对隐向量进行激活处理,得到一个0-1之间的值作为概率,并将该概率值作为两个物料之间的相似度。

在进行模型训练时,确定输出层的输出结果与正负样本标签的损失函数(例如交叉熵),并根据损失函数指导对预设机器学习模型的网络参数调整过程,直至满足训练截止条件。例如,总训练样本的数量满足设定数量阈值、损失函数的数值结果趋于稳定,或者损失函数的函数值小于设定数值阈值等中的至少一种。其中,设定数量阈值、设定数值阈值的大小可以由技术人员根据需要或经验值进行确定或调整。

需要说明的是,离线阶段考虑到新闻推荐的实时性,通常最迟以天为单位进行物料库更新;若新闻数量较多,还可以以小时为单位进行物料库更新。

在一个可选实施例中,当物料库中有新增物料时,物料推荐过程还包括更新阶段。

示例性的,更新阶段,可以包括:新增物料对构建:获取新增物料的标题数据,并对新增物料和物料库中的其他物料两两构建新增物料对;新增词向量生成:对新增物料对中的各物料进行分词、编码和拼接,得到新增物料对对应的新增词向量;相似度数据更新:基于训练好的相似度预测模型,确定新增词向量对应新增物料对中各物料间的新增相似度,并根据新增相似度更新物料相似度数据。

在一个可选实施例中,在线阶段,包括:物料筛选、物料扩充、得分计算和物料推荐几个子阶段。

示例性的,物料筛选,包括:获取待推荐用户在物料库中历史交互过的初始物料。

示例性的,物料扩充,包括:根据物料相似度数据,从物料库中筛选与各初始物料相似度满足设定相似度阈值的第一设定数量的其他物料,作为候选物料。其中,相似度阈值数值、和第一设定数量的数值大小可以由技术人员根据需要或经验值进行确定或调整。可选的,第一设定数量可以与初始物料的数量或种类相关。例如,初始物料有3个,则设定数量为3K,其中,K为单个初始物料对应的设定子数量。

举例说明,若用户甲的历史交互过的物料包括A、B和C,则根据物料相似度数据,从物料库中筛选出与A相似度超过设定相似度阈值的K个物料A’,筛选出与B相似度超过设定相似度阈值的K个物料B’,以及筛选出与C相似度超过设定相似度阈值的K个物料C’;将A’、B’和C’作为候选物料。

示例性的,得分计算,可以是:采用以下公式,计算各候选物料对应的物料得分:

score(user,item1)=∑w

其中,score(user,item1)表示目标用户user的候选物料item1的物料得分;w

示例性的,物料推荐,包括:从各候选物料中,选取物料得分最高的第二设定数量个候选物料作为目标物料,并将目标物料发送至待推荐用户的用户终端进行显示。其中,第二设定数量可以由技术人员根据需要或经验值进行设定,或通过大量试验反复确定或调整。其中,第二设定数量小于前述第一设定数量。

实施例四

图4是本申请实施例提供的一种物料推荐装置的结构图,该装置适用于向目标用户进行物料库中的物料推荐的推荐情况。其中,物料可以是新闻、商品或其他消息等,本申请对物料的具体内容不做任何限定。该装置可以采用软件和/或硬件实现,并具体配置于电子设备中。在一个可选实施例中,该电子设备可以是具备一定数据处理能力的智能终端或服务器等。

参见图4所示的物料推荐装置,包括:初始物料获取模块410、候选物料选取模块420、目标物料选取模块430和目标物料推荐模块440。其中,

初始物料获取模块410,用于根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;

候选物料选取模块420,用于根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一种候选物料;

目标物料选取模块430,用于确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料;

目标物料推荐模块440,用于向所述目标用户推荐所述目标物料。

本申请实施例通过根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;根据关联物料对之间的物料相似度数据,从物料库中选取与各初始物料相关联的至少一个候选物料;确定各候选物料的物料得分,并根据物料得分,从候选物料中选取目标物料;向目标用户推荐目标物料。上述技术方案通过进入目标用户的历史交互数据和关联物料对之间的物料相似度数据,进行候选物料的确定,并将所确定候选物料作为目标物料的确定基础,从而保证了最终确定的目标物料能够与用户的交互习惯相匹配,从而提高了目标物料与目标用户的匹配度,同时,避免了目标用户已交互物料的重复推荐,进而提高了目标用户的使用体验。

在一个可选实施例中,所述装置还包括:物料相似度数据确定模块,用于确定关联物料对之间的物料相似度数据;

其中,所述物料相似度数据确定模块,具体包括:

关联物料对确定单元,用于将所述物料库中的各物料两两构建关联物料对;其中,所述关联物料对包括第一物料和第二物料;

关联物料词向量生成单元,用于根据所述第一物料和所述第二物料的文本数据,生成关联物料词向量;

相似度确定单元,用于根据所述关联物料词向量,确定所述第一物料相对于所述第二物料的相似度;

相似度数据构建单元,用于根据各关联物料对的相似度,构建物料相似度数据。

在一个可选实施例中,所述相似度确定单元,包括:

相似度确定子单元,用于采用相似度预测模型,根据所述关联物料词向量,确定所述第一物料相对于所述第二物料的相似度;

其中,所述相似度确定单元还包括:相似度模型训练子单元,用于对相似度预测模型进行训练;

其中,所述相似度模型训练子单元,具体用于:

根据样本用户的历史交互数据,构建样本物料对;其中,所述样本物料对包括第一样本物料和第二样本物料;

根据所述第一样本物料和所述第二样本物料的文本数据,生成所述样本物料对的样本物料词向量;

根据所述样本物料对的标签数据和所述样本物料词向量,对预先构建的机器学习模型进行训练,得到所述相似度预测模型。

在一个可选实施例中,所述样本物料对包括正样本物料对和负样本物料对;

相应的,所述根据样本用户的历史交互数据,构建样本物料对,包括:

根据所述样本用户的历史交互数据,将顺序交互的第一样本物料和第二样本物料顺序组合,构建正样本物料对;

从与所述第一样本物料无顺序交互的其他样本物料中,采样得到第三样本物料;

将所述第一样本物料与所述第三样本物料顺序组合,构建负样本物料对。

在一个可选实施例中,所述装置还包括物料相似度数据更新模块,具体包括:

新增物料对构建单元,用于将新增物料与所述物料库中的各物料分别构建新增物料对;其中,新增物料对包括第一新增物料和第二新增物料;

新增物料词向量生成单元,用于根据所述第一新增物料和所述第二新增物料的文本数据,生成新增物料词向量;

相似度确定单元,用于根据所述新增物料词向量,确定所述第一新增物料相对于所述第二新增物料的相似度;

物料相似度数据更新单元,用于根据各新增物料对的相似度,更新所述物料相似度数据。

在一个可选实施例中,所述目标物料选取模块430,包括:

参考物料选取单元,用于根据所述目标用户在设定历史时段内的历史交互数据,从所述物料库中选取与所述候选物料对应的各参考物料;

物料得分确定单元,用于根据所述候选物料相对于各所述参考物料之间的物料相似度数据,确定所述候选物料的物料得分。

在一个可选实施例中,所述物料库中的各物料为新闻。

上述物料推荐装置可执行本申请任意实施例所提供的物料推荐方法,具备执行物料推荐方法相应的功能模块和有益效果。

实施例五

图5是本发明实施例五提供的一种电子设备的结构图。图5示出了适于用来实现本发明实施方式的示例性电子设备512的框图。图5显示的电子设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图5所示,电子设备512以通用计算设备的形式表现。电子设备512的组件可以包括但不限于:一个或者多个处理器或者处理单元516,系统存储器528,连接不同系统组件(包括系统存储器528和处理单元516)的总线518。

总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。

电子设备512典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

系统存储器528可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。电子设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。

电子设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该电子设备512交互的设备通信,和/或与使得该电子设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,电子设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与电子设备512的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元516通过运行存储在系统存储器528中的多个程序中其他程序的至少一个,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的物料推荐方法。

实施例六

本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任一实施例所提供的一种物料推荐方法,包括:根据目标用户的历史交互数据,从物料库中选取至少一个初始物料;根据关联物料对之间的物料相似度数据,从所述物料库中选取与各所述初始物料相关联的至少一个候选物料;确定各所述候选物料的物料得分,并根据所述物料得分,从所述候选物料中选取目标物料;向所述目标用户推荐所述目标物料。

注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

相关技术
  • 一种物料推荐方法、装置、设备和存储介质
  • 推荐物料确定方法、装置、存储介质和计算机设备
技术分类

06120113162102