一种推荐作品确定模型训练、推荐作品确定方法及装置

文献发布时间：2024-04-18 19:58:30

技术领域

本发明实施例涉及数据处理技术领域，特别是涉及一种推荐作品确定模型训练、推荐作品确定方法及装置。

背景技术

当前，随着互联网科技的发展，视听娱乐变得越来越重要，用户在网络上的各个作品平台中都希望找到自己喜欢的文娱作品。在这种情况下，各个作品平台都在努力提高作品的推荐质量，以更好地满足用户需求，吸引、留住用户。因此，对用户进行作品推荐是各个作品平台均重点关注的方面。

发明内容

本发明实施例的目的在于提供一种推荐作品确定模型训练、推荐作品确定方法及装置，以训练能够向用户推荐作品的模型。具体技术方案如下：

第一方面，本发明实施例提供了一种推荐作品确定模型训练方法，所述方法包括：

获取样本用户的历史行为数据；

提取所述历史行为数据中至少一个样本作品的样本内容特征信息、所述样本作品的样本封面图的样本封面图特征信息，并获取所述样本用户的样本用户特征信息；

基于所述样本内容特征信息、样本封面图特征信息与样本用户特征信息，生成样本特征信息；

将所述样本特征信息输入推荐作品确定模型，得到对所述样本作品的评估得分；

根据所述评估得分以及所述样本用户的历史行为数据，计算所述推荐作品确定模型的样本损失；

基于所述样本损失对所述推荐作品确定模型进行参数调整，返回执行所述将所述样本特征信息输入推荐作品确定模型的步骤，直至达到预设的训练收敛条件，得到训练好的推荐作品确定模型。

本发明一个实施例中，在所述样本作品存在多个封面图的情况下，采用如下方式获得所述样本作品的样本封面图：

基于各个封面图的权重因子，选择出目标数量个样本封面图，其中，权重因子越大的封面图的历史点击率越大，被选择的概率越大。

本发明一个实施例中，在所述选择出目标数量个样本封面图之后，还包括：

在选择出的目标数量个样本封面图中不包含向所述样本用户展示的封面图的情况下，使用所展示的封面图替换选择出的样本封面图。

本发明一个实施例中，在所述选择出目标数量个样本封面图之后，还包括：

在选择出的目标数量个样本封面图中不包含向所述样本用户展示的封面图的情况下，将所展示的封面图添加至样本封面图。

本发明一个实施例中，所述推荐作品确定模型中包含多个子网络，采用如下方式处理所述样本封面图特征信息：

通过多个子网络分别处理所述样本封面图特征信息，获取各子网络输出的处理结果；

基于各个子网络的权重对各处理结果进行合并计算。

第二方面，本发明实施例提供了一种推荐作品确定方法，所述方法包括：

获取待推荐作品的内容特征信息以及所述待推荐作品的封面图的封面图特征信息；

获取目标用户的目标用户特征信息；

基于所述内容特征信息、封面图特征信息与目标用户特征信息，生成目标特征信息；

将所述目标特征信息输入预先训练的推荐作品确定模型，所述推荐作品确定模型是根据第一方面中任一项所述的方法步骤训练得到的；

获得所述推荐作品确定模型的输出结果，确定所述待推荐作品是否是推荐作品。

本发明一个实施例中，在所述待推荐作品存在至少两张封面图的情况下，所述基于所述内容特征信息、封面图特征信息与目标用户特征信息，生成目标特征信息，包括：

针对至少两张封面图中的每一封面图，基于所述内容特征信息、该封面图的封面图特征信息与目标用户特征信息，生成该封面图对应的目标特征信息。

第三方面，本发明实施例提供了一种推荐作品确定模型训练装置，所述装置包括：

第一获取模块，用于获取样本用户的历史行为数据；

提取模块，用于提取所述历史行为数据中至少一个样本作品的样本内容特征信息、所述样本作品的样本封面图的样本封面图特征信息，并获取所述样本用户的样本用户特征信息；

第一生成模块，用于基于所述样本内容特征信息、样本封面图特征信息与样本用户特征信息，生成样本特征信息；

输入与输出模块，用于将所述样本特征信息输入推荐作品确定模型，得到对所述样本作品的评估得分；

损失计算模块，用于根据所述评估得分以及所述样本用户的历史行为数据，计算所述推荐作品确定模型的样本损失；

调整模块，用于基于所述样本损失对所述推荐作品确定模型进行参数调整，返回执行所述将所述样本特征信息输入推荐作品确定模型的步骤，直至达到预设的训练收敛条件，得到训练好的推荐作品确定模型。

第四方面，本发明实施例提供了一种推荐作品确定装置，所述装置包括：

第二获取模块，用于获取待推荐作品的内容特征信息以及所述待推荐作品的封面图的封面图特征信息；

第三获取模块，用于获取目标用户的目标用户特征信息；

第二生成模块，用于基于所述内容特征信息、封面图特征信息与目标用户特征信息，生成目标特征信息；

输入模块，用于将所述目标特征信息输入预先训练的推荐作品确定模型，所述推荐作品确定模型是根据第一方面中任一项所述的方法步骤训练得到的；

确定模块，用于获得所述推荐作品确定模型的输出结果，确定所述待推荐作品是否是推荐作品。

第五方面，本发明实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现第一方面或第二方面中任一项所述的方法步骤。

第六方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现第一方面或第二方面中任一项所述的方法步骤。

本发明实施例有益效果：

本发明实施例提供一种推荐作品确定模型训练方法，获取样本用户的历史行为数据；提取上述历史行为数据中至少一个样本作品的样本内容特征信息、上述样本作品的样本封面图的样本封面图特征信息，并获取上述样本用户的样本用户特征信息；基于上述样本内容特征信息、样本封面图特征信息与样本用户特征信息，生成样本特征信息；将上述样本特征信息输入推荐作品确定模型，得到对上述样本作品的评估得分；根据上述评估得分以及上述样本用户的历史行为数据，计算上述推荐作品确定模型的样本损失；基于上述样本损失对上述推荐作品确定模型进行参数调整，返回执行上述将上述样本特征信息输入推荐作品确定模型的步骤，直至达到预设的训练收敛条件，得到训练好的推荐作品确定模型。

由以上可见，在本发明实施例提供的方案中，通过每一次训练不断调整推荐作品确定模型的参数，最终得到训练好的推荐作品确定模型。在推荐作品确定模型中，通过处理样本特征信息，一次性得到样本作品的内容得分与封面图得分，进而基于内容得分与封面图得分得到样本作品的评估得分，之后可将评估得分满足预设条件的样本作品确定为推荐作品。样本特征信息中包含了样本作品的内容特征信息、封面图特征信息，在计算样本作品的评估得分过程中，同时考虑到样本作品的内容与封面图，与只考虑样本作品的内容或封面图相比，更全面地评估了样本作品的价值，提高了之后确定出的推荐作品的推荐质量。

并且，通过综合考虑样本用户、样本作品的内容、封面图这三者的特征信息，使得根据评估得分确定出的推荐作品更适用于实际场景，能更准确、真实地确定出样本用户喜欢的作品。通过分析样本用户的喜好，能够为作品平台提供辅助决策分析，提供有关产品及服务的改进依据。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的实施例。

图1为本发明实施例提供的一种推荐作品确定模型训练方法的流程示意图；

图2为本发明实施例提供的一种推荐作品确定方法的流程示意图；

图3为本发明实施例提供的一种推荐作品确定模型训练装置的结构示意图；

图4为本发明实施例提供的一种推荐作品确定装置的结构示意图；

图5为本发明实施例提供的一种电子设备的结构示意图；

图6为本发明实施例提供的另一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员基于本发明所获得的所有其他实施例，都属于本发明保护的范围。

相关技术中，网络上的平台对用户进行作品推荐主要通过两个阶段实现。第一阶段是关于作品内容的推荐，可以通过召回排序等个性化推荐方式对待推荐的作品进行排序，选出推荐给用户的作品；第二阶段是给每个推荐给用户的作品选择合适的封面图，即作品封面图。用户对同一作品的不同封面图的喜好不同，相关技术在第二阶段根据用户对封面图的点击反馈进行封面图的推荐。

一个受用户喜爱的封面图更容易吸引用户点击该封面图对应的作品，而相关技术通过上述两个阶段对用户进行作品推荐，未能同时考虑到作品内容与封面图对推荐效果的影响，会导致推荐效果受限，相关技术通过上述两个阶段进行作品推荐的方式存在一定的局限性。

为了解决上述问题，本发明实施例提供了一种推荐作品确定模型训练、推荐作品确定方法及装置。

首先，对本发明实施例提供的一种推荐作品确定模型训练方法进行说明。

参见图1，为本发明实施例提供的一种推荐作品确定模型训练方法的流程示意图，该方法可应用于具有计算能力的电子设备上，示例性的，该方法应用于服务器。上述方法包括以下步骤S101至步骤S106。

步骤S101：获取样本用户的历史行为数据。

具体的，获取样本用户的历史行为数据是指，获取向样本用户推荐过的作品，并获取与样本用户对上述推荐过的作品的观看行为相关的数据，如样本用户是否点击作品。上述作品包含内容以及封面信息，上述作品可以为音视频、读物(杂志、小说)等。

步骤S102：提取上述历史行为数据中至少一个样本作品的样本内容特征信息、上述样本作品的样本封面图的样本封面图特征信息，并获取上述样本用户的样本用户特征信息。

具体的，上述样本作品可能是上述样本用户观看过的，也可能是上述样本用户未观看过的。将上述样本用户观看过的样本作品作为正样本作品，将上述样本用户未观看过的样本作品作为负样本作品。

对于上述负样本作品，其样本内容特征信息是对该负样本作品的作品内容的一种简要描述，例如，上述样本内容特征信息可以包括上述负样本作品的时长、类型、标签等。其中，上述类型指喜剧类、古装类、悬疑类等不同的作品分类或组合，例如，上述负样本作品的类型为喜剧类，或者，上述负样本作品的类型为古装喜剧类；上述标签指上述负样本作品的关键词，例如，上述负样本作品的标签为：二次元、热血、青春。

本发明实施例不仅获取上述负样本作品的样本内容特征信息，还获取上述负样本作品的样本封面图的样本封面图特征信息，上述样本封面图特征信息可以包括上述样本封面图的颜色分布、图像主题、人数等。其中，上述颜色分布可以指上述样本封面图中各种颜色占画面的比例，各种颜色在样本封面图中的位置等；上述图像主题指上述样本封面图的图片风格；上述人数指上述样本封面图中展现的人物形象的个数。

与上述负样本作品的样本内容特征信息相比，上述正样本作品的样本内容特征信息还包括上述样本用户对该正样本作品内容的评分；与上述负样本作品的样本封面图特征信息相比，上述正样本作品的样本封面图特征信息还包括上述样本用户对该正样本作品的样本封面图的质量评分。

上述样本用户特征信息可以包括上述样本用户的年龄、性别、兴趣爱好等。

步骤S103：基于上述样本内容特征信息、样本封面图特征信息与样本用户特征信息，生成样本特征信息。

在获取上述样本内容特征信息、样本封面图特征信息与样本用户特征信息后，将这三类特征信息进行融合，生成上述样本特征信息，上述样本特征信息包含了上述样本内容特征信息、样本封面图特征信息与样本用户特征信息。

具体的，获取的上述样本内容特征信息、样本封面图特征信息与样本用户特征信息可分别以一个向量的形式表示，将各个向量合成为一个样本向量，该样本向量即为上述样本特征信息。

步骤S104：将上述样本特征信息输入推荐作品确定模型，得到对上述样本作品的评估得分。

具体的，在上述推荐作品确定模型对上述样本特征信息的处理过程中，会根据上述样本特征信息中包含的样本内容特征信息计算样本作品的样本内容得分，根据上述样本特征信息中包含的样本封面图特征信息计算样本封面图得分，其中，上述样本内容得分表征样本用户对样本作品内容的喜爱程度，上述样本封面图得分表征样本用户对样本封面图的喜爱程度。例如，得分越高，表示喜爱程度越高。

在上述推荐作品确定模型中，综合考虑样本内容得分与样本封面图得分，得到对样本作品的评估得分。具体的，可以按照设置的样本内容得分与样本封面图得分各自的权重，对样本内容得分与样本封面图得分按权重进行加权，计算得到对样本作品的评估得分。

本发明一个实施例中，上述推荐作品确定模型中包含DNN(Deep Neural Network，深度神经网络)、ESMM(Entire Space Multi-Task Model，全空间多任务模型)、MMOE(Multi-gate Mixture-of-Experts，多门控混合专家模型)、得分评估单元，上述DNN用于对所输入的信息进行压缩，上述ESSM用于基于压缩后的信息预测用户对作品内容喜爱程度，得到作品的内容得分，上述MMOE用于基于压缩后的信息预测用户对封面图喜爱程度，得到封面图的封面图得分，上述得分评估单元用于基于内容得分与封面图得分计算作品的评估得分。

由于样本特征信息的数据量可能较大，在样本特征信息由样本向量表示的情况下，样本向量的维度可能较高，在这种情况下，可先对样本向量进行压缩，得到压缩样本向量，以降低向量维度，便于后续处理。具体的，可以将样本向量输入DNN，经DNN的隐藏层对样本向量进行处理后，得到压缩样本向量。

另外，对于计算样本作品的样本内容得分，具体的，可以将表示样本特征信息的压缩样本向量输入ESMM，ESMM设置有两个任务目标：CTR(Click-through rate，点击率)与CVR(Conversion Rate，转化率)。经ESMM处理输入的压缩样本向量，得到CTR与CVR后，基于得到的CTR与CVR得到样本作品的样本内容得分。具体的，可以将CTR与CVR的乘积作为样本作品的样本内容得分。

示例性的，若样本作品为视频，则将该样本作品称为样本视频。CTR可以指样本视频的点击次数与该样本视频的曝光次数的比值，若样本视频为免费视频，CVR可以指在点击样本视频后，成功进行用户注册的次数与样本视频的点击次数的比值；若样本视频为付费视频，CVR可以指在点击样本视频后，成功进行付费的次数与样本视频的点击次数的比值。

对于计算样本作品的样本封面图得分，具体的，可以将表示样本特征信息的压缩样本向量输入MMOE，经MMOE处理得到样本作品的样本封面图得分。

步骤S105：根据上述评估得分以及上述样本用户的历史行为数据，计算上述推荐作品确定模型的样本损失。

在得到对样本作品的评估得分后，结合样本用户的历史行为数据，具体的，即样本作品的实际CTR、CVR，计算推荐作品确定模型的样本损失。理论上，样本作品的实际CTR、CVR越大，样本作品的评估得分应越高。

步骤S106：基于上述样本损失对上述推荐作品确定模型进行参数调整，返回执行上述将上述样本特征信息输入推荐作品确定模型的步骤，直至达到预设的训练收敛条件，得到训练好的推荐作品确定模型。

通过进行参数调整优化损失函数，在每次进行参数调整后，继续执行步骤S104及其之后的步骤，直至达到预设的训练收敛条件。

具体的，将输入上述推荐作品确定模型的样本作品分为训练集和验证集，可使用早停法监控上述推荐作品确定模型在验证集上的输出结果以防止过拟合；同时，还可以采用学习率衰减、正则化、丢弃法等技巧来优化上述推荐作品确定模型。

另外，通过持续收集给样本用户推荐过的作品的数据，得到新的样本特征信息，定期更新训练上述推荐作品确定模型，根据需要动态调整模型中的一些权重系数、改进模型网络结构，不断优化模型；还可以考虑引入给样本用户推荐过的作品的声音、弹幕等其他模态的信息，使得模型更全面地评估作品的价值。上述推荐作品确定模型可以使用Python进行开发，并采用相关机器学习库，如TensorFlow实现。

若样本作品的封面图个数过多，对样本作品的所有封面图均进行处理，生成对应的样本特征信息，可能会影响推荐作品确定模型运行的效率。本发明一个实施例中，上述样本作品存在多个封面图，通过以下步骤A来获得样本作品的样本封面图。

步骤A：基于各个封面图的权重因子，选择出目标数量个样本封面图。

其中，权重因子越大的封面图的历史点击率越大，被选择的概率越大。

对于样本作品的各个封面图，每个封面图都有可能被选择成为上述目标数量个样本封面图中的一个样本封面图，只不过权重因子越大的封面图被选择的概率越大。另外，上述目标数量可以根据需求进行设置。

在选择出上述目标数量个样本封面图后，将上述目标数量个样本封面图的封面图特征信息确定为样本作品的样本封面图特征信息。

具体的，可使用MAB(Multi-Armed Bandit，多臂机)算法选出目标数量个样本封面图。将获取的样本作品的每个封面图的封面图特征信息、历史点击率等信息输入MAB算法中，MAB算法会基于历史点击率为每一个封面图分配权重因子，并基于权重因子选择出目标数量个样本封面图。其中，权重因子越大的封面图被选择的概率越大，这样可以发现新的潜在优质样本封面图，避免过度利用历史表现优秀的样本封面图。

由以上可见，在本发明实施例提供的方案中，对于样本作品的封面图个数过多的情形，选择出目标数量个样本封面图，减少需要处理的封面图的数量，从而保证推荐作品确定模型的运行效率。并且，基于各个封面图的权重因子，选择目标数量个样本封面图，权重因子越大的封面图被选择的概率越大，权重因子较小的封面图也存在被选择的概率，这一概率虽小，但并不为0。因此，在选择目标数量个样本封面图的过程中，各个封面图都有被选择的可能，保证了选择结果的多样性。

本发明一个实施例中，在通过上述步骤A选择出目标数量个样本封面图后，还包括以下步骤B。

步骤B：在选择出的目标数量个样本封面图中不包含向上述样本用户展示的封面图的情况下，使用所展示的封面图替换选择出的样本封面图。

在使用所展示的封面图替换选择出的样本封面图后，得到包含所展示的封面图的新的目标数量个样本封面图，之后对新的目标数量个样本封面图进行处理，得到样本封面图特征信息。

具体的，若发现使用MAB算法选择出的目标数量个样本封面图中不包含向上述样本用户展示的封面图，则使用所展示的封面图替换选择出的样本封面图，根据得到的新的目标数量个样本封面图的封面图特征信息，对MAB算法的参数进行调整。

本发明另一个实施例中，在通过上述步骤A选择出目标数量个样本封面图后，还包括以下步骤C。

步骤C：在选择出的目标数量个样本封面图中不包含向上述样本用户展示的封面图的情况下，将所展示的封面图添加至样本封面图。

具体的，将所展示的封面图添加至样本封面图，也就是在之后会对经步骤A选择出的目标数量个样本封面图及上述所展示的封面图均进行处理，得到样本封面图特征信息。

由以上可见，在本发明实施例提供的方案中，推荐作品确定模型处理的封面图特征信息中包含向样本用户展示的封面图的封面图特征信息。对于向样本用户展示的封面图，若样本用户观看了该封面图对应的作品，表明该封面图比较受样本用户的喜爱；若样本用户未观看该封面图对应的作品，表明该封面图受样本用户喜爱的程度较低，对于这两种情况，都表明该封面图是具有代表性的，可以反映样本用户对同类型封面图的喜爱程度。因此，推荐作品确定模型考虑到向样本用户展示的封面图这一因素，能够使得得到的样本作品的评估得分与样本用户对该样本作品的喜爱程度更为一致。

本发明一个实施例中，上述推荐作品确定模型中包含多个子网络，通过以下步骤D与步骤E处理上述样本封面图特征信息。

步骤D：通过多个子网络分别处理上述样本封面图特征信息，获取各子网络输出的处理结果。

上述多个子网络中不同的子网络的参数不同，不同的子网络对样本封面图特征信息处理的侧重点不同，如一个子网络的处理重点为样本封面图特征信息中的样本封面图颜色信息，另一个子网络的处理重点为样本封面图特征信息中的样本封面图类型信息。

各子网络处理上述样本封面图特征信息后，输出的处理结果可以是一个分值。

步骤E：基于各个子网络的权重对各处理结果进行合并计算。

各个子网络输出的处理结果有其对应的权重，基于权重合并计算各子网络输出的处理结果。如各子网络输出各自的分值，则可以对各个分值按权重进行加权平均计算，将该计算结果作为对上述样本封面图特征信息的处理结果。

具体的，上述子网络可为MMOE中的专家网络，MMOE在处理样本封面图特征信息的过程中，通过Gating Network(门网络)学习MMOE中每个专家网络的权重，多个专家网络分别预测样本封面图的样本封面图得分，对多个专家网络分别预测的样本封面图得分按权重进行加和，得到最终确定的样本作品的样本封面图得分。

由以上可见，在本发明实施例提供的方案中，通过多个子网络分别处理样本封面图特征信息，并按权重对各子网络的处理结果进行合并计算，从而能够得到对样本封面图特征信息的处理结果。

参见图2，为本发明实施例提供的一种推荐作品确定方法的流程示意图，该方法应用于具有计算能力的电子设备上，上述方法包括以下步骤S201至步骤S205。

步骤S201：获取待推荐作品的内容特征信息以及上述待推荐作品的封面图的封面图特征信息。

对于预先准备好的上述待推荐作品，获取该待推荐作品的内容特征信息以及上述封面图特征信息。具体的，上述待推荐作品的内容特征信息、封面图特征信息与步骤S102中描述的负样本的样本内容特征信息、样本封面图特征信息相同。

步骤S202：获取目标用户的目标用户特征信息。

为了给目标用户推荐作品，需要获取该目标用户的用户特征信息，即上述目标用户特征信息。具体的，上述目标用户特征信息与步骤S102中描述的样本用户特征信息相同，即可以包括上述目标用户的年龄、性别、兴趣爱好等。

步骤S203：基于上述内容特征信息、封面图特征信息与目标用户特征信息，生成目标特征信息。

具体的，生成上述目标特征信息的方式可参照步骤S103中的描述。

步骤S204：将上述目标特征信息输入预先训练的推荐作品确定模型。

其中，上述推荐作品确定模型是根据上述任一推荐作品确定模型训练方法中的方法步骤训练得到的。对推荐作品确定模型的描述可参照上述推荐作品确定模型训练方法中的相关内容。

步骤S205：获得上述推荐作品确定模型的输出结果，确定上述待推荐作品是否是推荐作品。

具体的，上述推荐作品确定模型对上述目标特征信息的处理，可参考上述推荐作品确定模型训练方法中描述的对样本特征信息的处理内容。

在上述推荐作品确定模型处理上述目标特征信息，输出对上述待推荐作品的评估得分后，需要考虑该评估得分是否满足预设条件，以确定是否将上述待推荐作品确定为推荐作品。具体的，上述预设条件可以是一个预设的分数，在上述评估得分不小于预设的分数的情况下，才将上述待推荐作品确定为推荐作品。或者，在得到多个待推荐作品各自的评估得分的情况下，可将评估得分排名在前预设百分比的待推荐作品确定为推荐作品。

另外，还可以根据用户对确定出的推荐作品的反馈和行为，例如：点击、观看、评分等，调整推荐结果。

在一种示例中，若用户对确定出的目标推荐作品进行了点击、观看，在之后的推荐作品确定过程中，将与目标推荐作品同类型的待推荐作品确定为推荐作品。

在另一种示例中，若用户对确定出的目标推荐作品的评分达到了预设分数，则在之后的推荐作品确定过程中，将与目标推荐作品同类型的待推荐作品确定为推荐作品。

由以上可见，在本发明实施例提供的方案中，将上述目标特征信息输入预先训练的推荐作品确定模型，得到待推荐作品的评估得分，进而根据该评估得分便可确定出是否将待推荐作品作为推荐给目标用户的推荐作品。

而且，由于上述目标特征信息中包含了待推荐作品的内容特征信息、封面图特征信息，在使用上述推荐作品确定模型得到待推荐作品的评估得分的过程中，同时考虑到待推荐作品的内容与封面图，与只考虑待推荐作品的内容或封面图相比，更全面地评估了待推荐作品的价值，提高了最终确定出的推荐作品的推荐质量。通过综合考虑目标用户、待推荐作品的内容、封面图这三者的特征信息，使得最终确定出的推荐作品更适用于实际场景，能更准确、真实地确定出目标用户喜欢的作品，从而提升目标用户观看作品的体验，提高目标用户在作品平台上停留的时间与留存率，进而提高作品平台中广告的点击率。针对不同的目标用户，确定出的推荐作品不同，能够丰富个性化推荐策略，还能够为广告商划分目标客户群体。通过对待推荐作品的内容与封面图的综合考虑，能够合理利用作品、封面图资源，调整资源投放优先级，提高资源利用效率。

另外，利用上述推荐作品确定模型同时考虑作品的内容与封面图，可以节省计算作品的评估得分并进而确定推荐作品所耗费的资源；模型可应用于同时考虑作品的内容与封面图的不同领域，具有可拓展性。

通常情况下，一个作品可能有多张封面图。在上述待推荐作品存在至少两张封面图的情况下，本发明一个实施例中，上述步骤S203可由以下步骤F实现。

步骤F：针对至少两张封面图中的每一封面图，基于上述内容特征信息、该封面图的封面图特征信息与目标用户特征信息，生成该封面图对应的目标特征信息。

对于上述待推荐作品的每一封面图，在得到该封面图的封面图特征信息后，可参照上述步骤S103中的描述生成该封面图对应的目标特征信息。之后，便可继续按照上述步骤S204处理生成的目标特征信息，并按照上述步骤S205获得与封面图对应的待推荐作品的评估得分，最后根据评估得分确定出推荐作品。

另外，若一个待推荐作品存在至少两张封面图，针对每一封面图均能计算得到一个待推荐作品的评估得分，也就是对于一个待推荐作品，会得到多个评估得分，评估得分的个数与该待推荐作品的封面图个数相同。在这种情况下，可以在确定推荐作品的过程中，对于内容相同、封面图不同的多个待推荐作品，保留一个评估得分最高的待推荐作品，在此基础上进行推荐作品的确定。

由以上可见，应用本发明实施例提供的方案，能够对待推荐作品存在至少两张封面图的情形进行处理，对每一封面图，基于待推荐作品的内容特征信息、该封面图的封面图特征信息与目标用户特征信息，生成该封面图对应的目标特征信息，进而对该目标特征信息进行处理，得到评估得分并确定推荐作品。

若待推荐作品的封面图个数过多，对待推荐作品的所有封面图均进行处理，可能会影响确定出推荐作品的效率。因此，可以从待推荐作品的全部封面图中选出预设的目标数量个封面图，选出预设的目标数量个封面图的方式可参照前文在推荐作品确定模型训练方法中对选择目标数量个样本封面图的描述。

具体的，可以使用上述推荐作品确定模型训练方法中的MAB算法或其他相关技术中的算法处理上述待推荐作品的所有封面图。MAB算法会为每一个封面图分配权重因子，基于权重因子选择出目标数量个封面图，其中，权重因子越大的封面图被选择的概率越大。

与前述的一种推荐作品确定模型训练方法相对应，本发明实施例还提供了一种推荐作品确定模型训练装置。

参见图3，为本发明实施例提供的一种推荐作品确定模型训练装置的结构示意图，上述装置包括：

第一获取模块301，用于获取样本用户的历史行为数据。

提取模块302，用于提取上述历史行为数据中至少一个样本作品的样本内容特征信息、上述样本作品的样本封面图的样本封面图特征信息，并获取上述样本用户的样本用户特征信息。

第一生成模块303，用于基于上述样本内容特征信息、样本封面图特征信息与样本用户特征信息，生成样本特征信息。

输入与输出模块304，用于将上述样本特征信息输入推荐作品确定模型，得到对上述样本作品的评估得分。

损失计算模块305，用于根据上述评估得分以及上述样本用户的历史行为数据，计算上述推荐作品确定模型的样本损失。

调整模块306，用于基于上述样本损失对上述推荐作品确定模型进行参数调整，返回执行上述将上述样本特征信息输入推荐作品确定模型的步骤，直至达到预设的训练收敛条件，得到训练好的推荐作品确定模型。

本发明一个实施例中，上述样本作品存在多个封面图，上述装置还包括：

选择模块307，用于基于各个封面图的权重因子，选择出目标数量个样本封面图，其中，权重因子越大的封面图的历史点击率越大，被选择的概率越大。

本发明一个实施例中，上述装置还包括：

替换模块308，用于在选择出的目标数量个样本封面图中不包含向上述样本用户展示的封面图的情况下，使用所展示的封面图替换选择出的样本封面图。

本发明另一个实施例中，上述装置还包括：

添加模块309，用于在选择出的目标数量个样本封面图中不包含向上述样本用户展示的封面图的情况下，将所展示的封面图添加至样本封面图。

本发明一个实施例中，上述推荐作品确定模型中包含多个子网络，上述输入与输出模块304，包括：

网络处理子模块3041，用于通过多个子网络分别处理上述样本封面图特征信息，获取各子网络输出的处理结果。

合并计算子模块3042，用于基于各个子网络的权重对各处理结果进行合并计算。

与前述的一种推荐作品确定方法相对应，本发明实施例还提供了一种推荐作品确定装置。

参见图4，为本发明实施例提供的一种推荐作品确定装置的结构示意图，该装置包括：

第二获取模块401，用于获取待推荐作品的内容特征信息以及上述待推荐作品的封面图的封面图特征信息。

第三获取模块402，用于获取目标用户的目标用户特征信息。

第二生成模块403，用于基于上述内容特征信息、封面图特征信息与目标用户特征信息，生成目标特征信息。

输入模块404，用于将上述目标特征信息输入预先训练的推荐作品确定模型，所述推荐作品确定模型是根据上述任一推荐作品确定模型训练方法中的方法步骤训练得到的。

确定模块405，用于获得上述推荐作品确定模型的输出结果，确定上述待推荐作品是否是推荐作品。

本发明一个实施例中，上述待推荐作品存在至少两张封面图，上述第二生成模块403，具体用于：

针对至少两张封面图中的每一封面图，基于上述内容特征信息、该封面图的封面图特征信息与目标用户特征信息，生成该封面图对应的目标特征信息。

参见图5，为本发明实施例提供的一种电子设备的结构示意图，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信；

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现前述推荐作品确定模型训练方法中任一项的步骤。

参见图6，为本发明实施例提供的另一种电子设备的结构示意图，包括处理器601、通信接口602、存储器603和通信总线604，其中，处理器601，通信接口602，存储器603通过通信总线604完成相互间的通信；

存储器603，用于存放计算机程序；

处理器601，用于执行存储器603上所存放的程序时，实现前述推荐作品确定方法中任一项的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一推荐作品确定模型训练方法的步骤。

应用本发明实施例提供的计算机可读存储介质中存储的计算机程序进行推荐作品确定模型训练时，通过每一次训练不断调整推荐作品确定模型的参数，最终得到训练好的推荐作品确定模型。在推荐作品确定模型中，通过处理样本特征信息，一次性得到样本作品的内容得分与封面图得分，进而基于内容得分与封面图得分得到样本作品的评估得分，之后可将评估得分满足预设条件的样本作品确定为推荐作品。样本特征信息中包含了样本作品的内容特征信息、封面图特征信息，在计算样本作品的评估得分过程中，同时考虑到样本作品的内容与封面图，与只考虑样本作品的内容或封面图相比，更全面地评估了样本作品的价值，提高了之后确定出的推荐作品的推荐质量。

在本发明提供的又一实施例中，还提供了另一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述任一推荐作品确定方法的步骤。

应用本发明实施例提供的计算机可读存储介质中存储的计算机程序进行推荐作品确定时，将上述目标特征信息输入预先训练的推荐作品确定模型，得到待推荐作品的评估得分，进而根据该评估得分便可确定出是否将待推荐作品作为推荐给目标用户的推荐作品。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一推荐作品确定模型训练方法。

应用本发明实施例提供的计算机程序产品进行推荐作品确定模型训练时，通过每一次训练不断调整推荐作品确定模型的参数，最终得到训练好的推荐作品确定模型。在推荐作品确定模型中，通过处理样本特征信息，一次性得到样本作品的内容得分与封面图得分，进而基于内容得分与封面图得分得到样本作品的评估得分，之后可将评估得分满足预设条件的样本作品确定为推荐作品。样本特征信息中包含了样本作品的内容特征信息、封面图特征信息，在计算样本作品的评估得分过程中，同时考虑到样本作品的内容与封面图，与只考虑样本作品的内容或封面图相比，更全面地评估了样本作品的价值，提高了之后确定出的推荐作品的推荐质量。

在本发明提供的又一实施例中，还提供了另一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一推荐作品确定方法。

应用本发明实施例提供的计算机程序产品进行推荐作品确定时，将上述目标特征信息输入预先训练的推荐作品确定模型，得到待推荐作品的评估得分，进而根据该评估得分便可确定出是否将待推荐作品作为推荐给目标用户的推荐作品。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备、计算机可读存储介质及计算机程序产品实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京奇艺世纪科技有限公司;

上一篇：资源确定方法、终端和存储介质
下一篇：基于活动驱动的项目数据管理方法、装置、设备和介质