推荐方法、样本分析方法、装置、电子设备和存储介质

文献发布时间：2023-06-19 10:48:02

技术领域

本申请涉及计算机技术领域，尤其涉及一种推荐方法、样本分析方法、装置、电子设备和存储介质。

背景技术

随着互联网的发展，终端的应用逐渐普遍，人们休闲娱乐时，使用终端观看视频、阅读电子书、播放音乐等也越来越多。

终端在人们已浏览的视频、音乐、电子书后，会进行记录，并为用户推荐相关的内容，以便于用户选择。

相关技术中，终端推荐的内容往往仅依赖于用户的基本信息，如用户画像等，根据协同过滤法(即“物以类聚、人以群分”的方式)进行内容的推荐。而这种方式，只能为用户推荐与其相似的用户点击率高的内容，推荐内容可能并不是用户感兴趣的，使得推荐结果不准确。

发明内容

本申请提供了一种推荐方法、样本分析方法、装置、电子设备和存储介质，用以解决现有技术中，在进行数据推荐时，仅根据用户基本信息，导致推荐结果不准确的问题。

第一方面，本申请实施例提供了一种推荐方法，包括：

获取待推荐数据；

将所述待推荐数据输入预先训练的推荐模型，以通过所述推荐模型确定所述待推荐数据的推荐指数，所述推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及所述用户行为信息的属性标识确定训练样本权重值，并根据所述训练样本权重值和所述训练样本中所述多媒体数据的数据特征训练得到的，其中，所述属性标识用于指示所述用户行为信息的属性是否为正向，所述样本权重值越大对所述多媒体数据的推荐影响程度越高；

根据所述推荐指数，确定所述推荐数据中的目标推荐数据；

推荐所述目标推荐数据。

可选的，对所述推荐模型的训练过程，包括：

获取第一训练样本集，所述第一训练样本集中包括：至少一个第一训练样本，各所述第一训练样本包括：第一多媒体样本数据的推荐标识、所述第一多媒体样本数据对应的第一样本数据特征、浏览所述第一多媒体样本数据时的第一用户行为信息、第一用户特征及所述第一多媒体样本数据的第一属性标识，所述第一属性标识包括正向标识和负向标识，所述推荐标识用于指示所述第一多媒体样本数据的推荐度；

分别对所述第一训练样本集中的每个所述第一训练样本执行以下第一训练过程：

将所述训练样本输入至第一网络模型中，在所述第一网络模型的第一数据处理层根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值，在所述第一网络模型的第二数据处理层根据所述样本权重值和所述第一样本数据特征计算得到初始推荐指数；

根据所述初始推荐指数和所述推荐标识计算第一损失函数值；

根据所述第一损失函数值更新所述第一网络模型的模型参数，重复执行所述第一训练过程，直至所述第一损失函数值不大于第一预设值，将所述第一网络模型作为所述推荐模型。

可选的，所述在所述第一网络模型的第一数据处理层根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值，包括：

在所述第一网络模型的第一数据处理层，采用梯度下降算法根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值。

可选的，获取所述第一多媒体样本数据的第一属性标识，包括：

判断所述第一用户行为信息是否为文本信息；

若是，对所述文本信息进行分析，确定所述第一属性标识；

若否，判断所述用户行为信息是否为预设的用户行为信息中的一个，若是，根据所述预设的用户行为信息的属性标识确定所述第一属性标识。

可选的，所述对所述文本信息进行分析，确定所述第一属性标识，包括：

将所述文本信息输入预先训练的文本判别模型；

根据所述预先训练的文本判别模型的输出结果，确定所述第一属性标识；

其中，所述文本判别模型的训练过程包括：

获取文本样本集，所述文本样本集包括至少一个文本样本，所述文本样本的文本标识，所述文本标识指示所述文本样本的属性是否为正向；

分别对所述文本样本集中的每个所述文本样本执行以下第二训练过程：

将所述文本样本输入第二网络模型中，得到输出结果，根据所述数据结果和所述文本标识计算第二损失函数值；

根据所述第二损失函数值更新所述第二网络模型的模型参数，重复执行所述第二训练过程，直至所述第二损失函数值不大于第二预设值，将所述第二网络模型作为所述文本判别模型。

第二方面，本申请实施例提供了一种样本分析方法，包括：

获取样本，所述样本包括多媒体数据、用户的用户特征、所述用户浏览所述多媒体数据时的用户行为信息、所述用户行为信息的第一属性标识和所述多媒体数据的数据特征，其中，所述属性标识用于指示所述用户行为信息的属性是否为正向；

根据多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识，确定所述样本的权重值；

根据所述样本权重值和所述多媒体数据的数据特征确定所述样本的推荐值。

可选的，所述根据多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识，确定所述样本的权重值；根据所述样本权重值和所述多媒体数据的数据特征确定所述样本的推荐值，包括：

将所述多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识输入预先训练的推荐模型；

通过所述预先训练的推荐模型的第一数据处理层，根据所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识，计算得到所述多媒体数据的样本权重值，并所述预先训练的推荐模型的第二数据处理层根据所述样本权重值和所述多媒体数据的数据特征计算得到所述样本的推荐值。

可选的，对所述推荐模型的训练过程，包括：

获取第二训练样本集，所述第二训练样本集中包括：至少一个第二训练样本，各所述第二训练样本包括：第二多媒体样本数据的推荐标识、所述第二多媒体样本数据对应的第二样本数据特征、浏览所述第二多媒体样本数据时的第二用户行为信息、第二用户特征及所述第二用户行为信息的第二属性标识，所述第二属性标识包括正向标识和负向标识；

分别对所述第二训练样本集中的每个所述第二训练样本执行以下第三训练过程：

将所述训练样本输入至第三网络模型中，在所述第三网络模型的第一数据处理层根据所述第二用户行为信息、所述第二用户特征和所述第二属性标识计算得到样本权重值，在所述第二网络模型的第二数据处理层根据所述样本权重值和所述第二样本数据特征计算得到初始推荐指数；

根据所述初始推荐指数和所述推荐标识计算第三损失函数值；

根据所述第三损失函数值更新所述第三网络模型的模型参数，重复执行所述第三训练过程，直至所述第三损失函数值不大于第三预设值，将所述第三网络模型作为所述推荐模型。

第三方面，本申请实施例提供了一种推荐装置，包括：

第一获取模块，用于获取待推荐数据；

第一确定模块，用于将所述待推荐数据输入预先训练的推荐模型，以通过所述推荐模型确定所述待推荐数据的推荐指数，所述推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及所述用户行为信息的属性标识确定训练样本权重值，并根据所述训练样本权重值和所述训练样本中所述多媒体数据的数据特征训练得到的，其中，所述属性标识用于指示所述用户行为信息的属性是否为正向，所述样本权重值越大对所述多媒体数据的推荐影响程度越高；

第二确定模块，用于根据所述推荐指数，确定所述推荐数据中的目标推荐数据；

推荐模块，用于推荐所述目标推荐数据。

可选的，第一确定模块，用于对所述推荐模型进行训练，包括：

分别对所述第一训练样本集中的每个所述第一训练样本执行以下第一训练过程：

根据所述初始推荐指数和所述推荐标识计算第一损失函数值；

可选的，所述在所述第一网络模型的第一数据处理层根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值，包括：

在所述第一网络模型的第一数据处理层，采用梯度下降算法根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值。

可选的，所述第一确定模块，具体用于：

判断所述第一用户行为信息是否为文本信息；

若是，对所述文本信息进行分析，确定所述第一属性标识；

若否，判断所述用户行为信息是否为预设的用户行为信息中的一个，若是，根据所述预设的用户行为信息的属性标识确定所述第一属性标识。

可选的，所述第一确定模块，具体用于：

将所述文本信息输入预先训练的文本判别模型；

根据所述预先训练的文本判别模型的输出结果，确定所述第一属性标识；

其中，所述文本判别模型的训练过程包括：

获取文本样本集，所述文本样本集包括至少一个文本样本，所述文本样本的文本标识，所述文本标识指示所述文本样本的属性是否为正向；

分别对所述文本样本集中的每个所述文本样本执行以下第二训练过程：

将所述文本样本输入第二网络模型中，得到输出结果，根据所述数据结果和所述文本标识计算第二损失函数值；

第四方面，本申请实施例提供了一种样本分析装置，包括：

第二获取模块，用于获取样本，所述样本包括多媒体数据、用户的用户特征、所述用户浏览所述多媒体数据时的用户行为信息、所述用户行为信息的第一属性标识和所述多媒体数据的数据特征，其中，所述属性标识用于指示所述用户行为信息的属性是否为正向；

第三确定模块，用于根据多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识，确定所述样本的权重值；

第四确定模块，用于根据所述样本权重值和所述多媒体数据的数据特征确定所述样本的推荐值。

可选的，所述第三确定模块和第四确定模块，具体用于：

将所述多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识输入预先训练的推荐模型；

可选的，所述第三确定模块和第四确定模块，用于对所述推荐模型进行训练过程，包括：

分别对所述第二训练样本集中的每个所述第二训练样本执行以下第三训练过程：

根据所述初始推荐指数和所述推荐标识计算第三损失函数值；

第五方面，本申请实施例提供了一种电子设备，包括：处理器、通信接口、存储器和通信总线，其中，处理器、通信接口和存储器通过通信总线完成相互间的通信；

所述存储器，用于存储计算机程序；

所述处理器，用于执行所述存储器中所存储的程序，实现第一方面所述的推荐方法或第二方面所述的样本分析方法。

第六方面，本申请实施例提供了一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现第一方面所述的推荐方法或第二方面所述的样本分析方法。

本申请实施例提供的上述技术方案与现有技术相比具有如下优点：本申请实施例提供的该方法，通过获取待推荐数据；将待推荐数据输入预先训练的推荐模型，以通过推荐模型确定待推荐数据的推荐指数，推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到的，其中，属性标识用于指示用户行为信息的属性是否为正向，样本权重值越大对多媒体数据的推荐影响程度越高；根据推荐指数，确定推荐数据中的目标推荐数据；推荐目标推荐数据。如此，通过推荐模型从待推荐数据中确定出目标推荐数据，由于推荐模型是基于训练样本的权重训练的，并且训练样本的权重是根据用户的行为信息和用户特征确定的，考虑到了用户不同行为的差异性，因此，使得推荐模型在推荐时，更加的准确。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的推荐方法的流程图；

图2为本申请另一实施例提供的推荐方法的流程图；

图3为本申请另一实施例提供的推荐方法的流程图；

图4为本申请一实施例提供的推荐装置的结构图；

图5为本申请一实施例提供的样本分析方法的流程图；

图6为本申请一实施例提供的样本分析装置的结构图；

图7为本申请一实施例提供的电子设备的结构图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请一实施例中提供了一种推荐方法，该方法可以应用于任意一种形式的电子设备中，如终端和服务器中。如图1所示，该推荐方法，包括：

步骤101、获取待推荐数据。

一些实施例中，待推荐数据可以为视频、小说、音乐或课程。用户在登录到对应的应用程序，或者在应用程序中进行搜索时，应用程序便会为用户进行推荐。

步骤102、将待推荐数据输入预先训练的推荐模型，以通过推荐模型确定待推荐数据的推荐指数，推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到的，其中，属性标识用于指示用户行为信息的属性是否为正向，样本权重值越大对多媒体数据的推荐影响程度越高。

一些实施例中，待推荐数据输入推荐模型后，推荐模型便可以基于推荐数据的数据特征，确定出该推荐数据的推荐指数。

其中，推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到的，其中，属性标识用于指示用户行为信息的属性是否为正向，样本权重值越大对多媒体数据的推荐影响程度越高。

进一步的，推荐模型的训练方式有多种，例如，第一种，可以先根据训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识训练得到权重预测模型，然后将预测得到的训练样本权重值和训练样本中多媒体数据的数据特征训练得到推荐模型；第二种，可以基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到推荐模型。

本实施例中，以上述第二种方式得到推荐模型的训练过程进行具体说明。

具体的，对推荐模型的训练过程，包括：

步骤201、获取第一训练样本集，第一训练样本集中包括：至少一个第一训练样本，各第一训练样本包括：第一多媒体样本数据的推荐标识、第一多媒体样本数据对应的第一样本数据特征、浏览第一多媒体样本数据时的第一用户行为信息、第一用户特征及第一多媒体样本数据的第一属性标识，第一属性标识包括正向标识和负向标识，推荐标识用于指示第一多媒体样本数据的推荐度。

一些实施例中，正向标识表示用户喜欢该第一训练样本，负向标识表示用户不喜欢该第一训练样本。

其中，第一样本数据特征包括第一多媒体样本数据的ID、第一多媒体样本数据的标签和第一多媒体样本数据的作者；第一用户特征包括用户画像、用户使用特征。其中，用户画像包括用户的年龄、性别、学历、地域等，用户使用特征包括用户使用的网络环境、使用时间等。多媒体样本数据可以但不限于为图片、视频、小说、音乐或课程。推荐度可以为推荐百分比，推荐度越高百分比越大，例如，第一多媒体样本极力不推荐，将其推荐度标记为1％，第一多媒体数据非常推荐，将其推荐度标记为99％，第一多媒体数据一般推荐，将其推荐度标记为50％。

进一步的，获取第一多媒体样本数据的第一属性标识，包括：

判断第一用户行为信息是否为文本信息；若是文本信息，对文本信息进行分析，确定第一属性标识；若不是文本信息，判断用户行为信息是否为预设的用户行为信息中的一个，若是预设的用户行为信息中的一个，根据预设的用户行为信息的属性标识确定第一属性标识。

一些实施例中，在用户行为信息为文本信息时，可以对文本信息进行文本分析，将文本信息发送至文本判别模型中，确定该第一用户行为信息是正向行为还是负向行为，从而确定第一属性标识，以进一步确定该文本信息中表达的用户的喜好。也可以通过提取文本信息中的关键字，根据该关键字对文本信息的正负向进行判断，从而确定第一属性标识。例如，关键字中包括“不喜欢”、“别推了”等字样时，确定第一属性标识为负向标识；关键字中包括“喜欢”、“还想看”等字样时，确定第一属性标识为正向标识。

一些实施例中，在第一用户行为信息不为文本信息时，可以将其与预设的用户行为信息进行比较，以确定第一用户行为信息为预设用户行为信息中的哪一个，进而确定该第一用户行为信息是正向行为还是负向行为，进而确定第一属性标识。其中，预设用户行为信息包括：点赞、点踩、点击喜欢、点击不喜欢、点击、收藏、转发。其中，文本信息包括但不限于用户的评论中的文本信息，弹幕中的文本信息，及转发中的文本信息。

具体的，第一属性标识可以是在第一训练样本获取到后，人为的根据第一用户行为信息确定的。例如，用户的第一行为信息包括正向行为和负向行为，其中正向行为包括点赞、点击喜欢、点击、收藏、转发、正向评论、正向弹幕，负向行为包括点踩、点击不喜欢、负向评论、负向弹幕，第一属性标识可以根据上述行为的数量进行标记，例如，包括上述正向行为中的一个，第一属性标识为1，包括两个第一属性标识为2，以此类推；在包括的上述行为既有正向行为又有负向行为时，将一者进行抵消，例如，包括两个正向行为，一个负向行为，将第一属性标识计为1。可以理解的是，第一属性标识也可以根据用户行为的属性确定，例如，第一用户行为信息中点赞、点击喜欢、点击、收藏、转发、正向评论、正向弹幕、点踩、点击不喜欢、负向评论、负向弹幕对应的第一属性标识分别为1、1、1、1、2、3、3、-1、-1、-3、-3。

分别对第一训练样本集中的每个第一训练样本执行以下第一训练过程：

步骤202、将训练样本输入至第一网络模型中，在第一网络模型的第一数据处理层根据第一用户行为信息、第一用户特征和第一属性标识计算得到样本权重值，在第一网络模型的第二数据处理层根据样本权重值和第一样本数据特征计算得到初始推荐指数。

一些实施例中，在第一网络模型的第一数据处理层，采用梯度下降算法根据第一用户行为信息、第一用户特征和第一属性标识计算得到样本权重值。

步骤203、根据初始推荐指数和推荐标识计算第一损失函数值。

一些实施例中，第一损失函数值的计算方式可以通过调用损失函数，将初始推荐指数和推荐标识输入损失函数计算得到。

步骤204、判断第一损失函数值是否大于第一预设值，若是，执行步骤206，若否，执行步骤205。

步骤205、根据第一损失函数值更新第一网络模型的模型参数，并返回执行步骤202。

步骤206、将第一网络模型作为推荐模型。

其中，第一预设值的取值可以根据实际情况进行设置，此处不做限定，例如，可以将第一预设值设置为0.8。

进一步的，文本判别模型的训练过程包括：

获取文本样本集，文本样本集包括至少一个文本样本，文本样本的文本标识，文本标识指示文本样本的的属性是否为正向；

分别对文本样本集中的每个文本样本执行以下第二训练过程：

将文本样本输入第二网络模型中，得到输出结果，根据数据结果和文本标识计算第二损失函数值；

根据第二损失函数值更新第二网络模型的模型参数，重复执行第二训练过程，直至第二损失函数值不大于第二预设值，将第二网络模型作为文本判别模型。

本实施例中，可以在获取到文本信息后，直接输入文本判别模型，得到判别结果，通过训练得到文本判别模型对第一属性标识进行确定，判别过程更加方便，结果更加准确。

步骤103、根据推荐指数，确定推荐数据中的目标推荐数据。

一些实施例中，在确定推荐指数后，便可以根据推荐指数确定推荐数据中的目标推荐数据。具体的，可以设置推荐指数阈值，将得到的推荐指数与推荐指数阈值进行比较，将推荐指数大于推荐阈值的推荐数据作为目标推荐数据。也可以在多个推荐数据中，将推荐指数为前预设数量的推荐数据作为目标推荐数据，例如，将推荐指数按照数值大小进行排序，将排序前10位的推荐数据作为目标推荐数据。

步骤104、推荐目标推荐数据。

一些实施例中，确定目标推荐数据后，对其进行推荐的方式有多种，例如，可以将目标推荐数据显示在用户端，供用户选择，或者将目标推荐数据直接打开(如，目标推荐数据为视频时，可以直接播放)，简化用户操作。

可以理解的是，上述实施例中的第一网络模型和第二网络模型可以但不限于采用逻辑回归模型或GBDT(梯度升压决策树，Gradient Boost Decision Tree)模型。

本申请另一实施例中提供了一种推荐方法，参照图3，该推荐方法，包括：

步骤301、获取样本中的用户行为信息。

步骤302、判断用户行为信息是否为文本信息，若是，执行步骤303，若否，执行步骤304。

步骤303、对文本信息进行正负向分析，得到该文本信息的正负向标识。

步骤304、对用户行为信息中的正负反馈行为进行判定，得到正负向标识。

步骤305、获取样本中的用户特征、正负向标识以及多媒体数据的数据特征。

步骤306、将用户行为信息、用户特征、正负向标识以及多媒体数据的数据特征输入推荐模型，通过推荐模型，得到该样本的推荐指数。

步骤307、根据推荐指数，确定推荐数据中的目标推荐数据。

步骤308、推荐目标推荐数据。

本申请的推荐方法，考虑到了用户不同的行为在模型中起到的作用不同，不同用户的相同行为，因为用户个体的差异，在训练统一模型的时候，也应该体现差异，而不能一概而论。因此，本申请在训练推荐模型时，加入了训练样本的权重，引入了用户行为信息的感情色彩分析，根据评论的正负向来给定训练样本的正负向，通过内容分析区分对待用户的评论的行为，而不是一股脑地把所有的评论行为都作为正样本。通过在推荐模型中设置权重预测的计算，根据用户的行为特点，个性化的得到每个用户的每条样本的权重。不同的用户相同的行为，因为用户的行为习惯不同，不应该统一给相同的权重，而是应该有区别的对待，比如有的用户很喜欢点赞，每几个行为里都会有一个点赞，那和不怎么点赞，几百个行为里才有一个点赞的用户，点赞行为样本的权重应该是不同的。通过引入个性化的样本权重，能很好地消除个性化行为习惯的偏差。

基于同一构思，本申请实施例中提供了一种推荐装置，该装置的具体实施可参见方法实施例部分的描述，重复之处不再赘述，如图4所示，该装置主要包括：

第一获取模块401，用于获取待推荐数据。

第一确定模块402，用于将待推荐数据输入预先训练的推荐模型，以通过推荐模型确定待推荐数据的推荐指数，推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到的，其中，属性标识用于指示用户行为信息的属性是否为正向，样本权重值越大对多媒体数据的推荐影响程度越高。

第二确定模块403，用于根据推荐指数，确定推荐数据中的目标推荐数据。

推荐模块404，用于推荐目标推荐数据。

可选的，第一确定模块，用于对所述推荐模型进行训练，包括：

分别对所述第一训练样本集中的每个所述第一训练样本执行以下第一训练过程：

根据所述初始推荐指数和所述推荐标识计算第一损失函数值；

可选的，所述在所述第一网络模型的第一数据处理层根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值，包括：

在所述第一网络模型的第一数据处理层，采用梯度下降算法根据所述第一用户行为信息、所述第一用户特征和所述第一属性标识计算得到样本权重值。

可选的，所述第一确定模块，具体用于：

判断所述第一用户行为信息是否为文本信息；

若是，对所述文本信息进行分析，确定所述第一属性标识；

若否，判断所述用户行为信息是否为预设的用户行为信息中的一个，若是，根据所述预设的用户行为信息的属性标识确定所述第一属性标识。

可选的，所述第一确定模块，具体用于：

将所述文本信息输入预先训练的文本判别模型；

根据所述预先训练的文本判别模型的输出结果，确定所述第一属性标识；

其中，所述文本判别模型的训练过程包括：

获取文本样本集，所述文本样本集包括至少一个文本样本，所述文本样本的文本标识，所述文本标识指示所述文本样本的属性是否为正向；

分别对所述文本样本集中的每个所述文本样本执行以下第二训练过程：

将所述文本样本输入第二网络模型中，得到输出结果，根据所述数据结果和所述文本标识计算第二损失函数值；

本申请一实施例中提供了一种样本分析方法，该方法的具体实施可参见推荐方法实施例部分的描述，重复之处不再赘述，该样本分析方法可以应用于任意一种形式的电子设备中，如终端和服务器中。如图5所示，该样本分析方法，包括：

步骤501、获取样本，样本包括多媒体数据、用户的用户特征、用户浏览多媒体数据时的用户行为信息、用户行为信息的第一属性标识和多媒体数据的数据特征，其中，属性标识用于指示用户行为信息的属性是否为正向。

一些实施例中，样本可以是从用户的历史浏览记录中获取的，用户在浏览多媒体数据时，会进行一些互动操作，如点赞、转发、评论、发弹幕、点踩、分享等，将这些互动操作作为用户多媒体数据时的用户行为信息。其中，用户特征包括：用户画像信息、用户在浏览多媒体数据时所处的位置、时间等。

步骤502、根据多媒体数据、用户特征、用户浏览多媒体数据时的用户行为信息和属性标识，确定样本的权重值。

进一步的，根据多媒体数据、用户特征、用户浏览多媒体数据时的用户行为信息和属性标识，确定样本的权重值；根据样本权重值和多媒体数据的数据特征确定样本的推荐值，包括：

将多媒体数据、用户特征、用户浏览多媒体数据时的用户行为信息和属性标识输入预先训练的推荐模型；

通过预先训练的推荐模型的第一数据处理层，根据用户特征、用户浏览多媒体数据时的用户行为信息和属性标识，计算得到多媒体数据的样本权重值，并预先训练的推荐模型的第二数据处理层根据样本权重值和多媒体数据的数据特征计算得到样本的推荐值。

具体的，对推荐模型的训练过程，包括：

获取第二训练样本集，第二训练样本集中包括：至少一个第二训练样本，各第二训练样本包括：第二多媒体样本数据的推荐标识、第二多媒体样本数据对应的第二样本数据特征、浏览第二多媒体样本数据时的第二用户行为信息、第二用户特征及第二用户行为信息的第二属性标识，第二属性标识包括正向标识和负向标识；

分别对第二训练样本集中的每个第二训练样本执行以下第三训练过程：

将训练样本输入至第三网络模型中，在第三网络模型的第一数据处理层根据第二用户行为信息、第二用户特征和第二属性标识计算得到样本权重值，在第二网络模型的第二数据处理层根据样本权重值和第二样本数据特征计算得到初始推荐指数；

根据初始推荐指数和推荐标识计算第三损失函数值；

根据第三损失函数值更新第三网络模型的模型参数，重复执行第三训练过程，直至第三损失函数值不大于第三预设值，将第三网络模型作为推荐模型。

步骤503、根据样本权重值和多媒体数据的数据特征确定样本的推荐值。

本实施例提供的样本分析方法，在进行个性化推荐场景中起到至关重要的作用，推荐模型基于用户的行为信息及用户特征，分析得到样本的权重值，并基于该权重值和多媒体数据的数据特征确定出样本的推荐值。通过该推荐模型基于用户行为信息、用户特征对不同用户进行了区分，对不同的用户配置不同的权重值，对用户的不同行为差异化进行区别，调控了不同用户行为在推荐模型中发挥的权重和作用，更好的拟合了不同用户之间的差异性，使得推荐结果更加准确。

基于同一构思，本申请实施例中提供了一种样本分析装置，该装置的具体实施可参见样本分析方法实施例部分的描述，重复之处不再赘述，如图6所示，该装置主要包括：

第二获取模块601，用于获取样本，样本包括多媒体数据、用户的用户特征、用户浏览多媒体数据时的用户行为信息、用户行为信息的第一属性标识和多媒体数据的数据特征，其中，属性标识用于指示用户行为信息的属性是否为正向；

第三确定模块602，用于根据多媒体数据、用户特征、用户浏览多媒体数据时的用户行为信息和属性标识，确定样本的权重值；

第四确定模块603，用于根据样本权重值和多媒体数据的数据特征确定样本的推荐值。

可选的，所述第三确定模块和第四确定模块，具体用于：

将所述多媒体数据、所述用户特征、所述用户浏览多媒体数据时的用户行为信息和所述属性标识输入预先训练的推荐模型；

可选的，所述第三确定模块和第四确定模块，用于对所述推荐模型进行训练过程，包括：

分别对所述第二训练样本集中的每个所述第二训练样本执行以下第三训练过程：

根据所述初始推荐指数和所述推荐标识计算第三损失函数值；

基于同一构思，本申请实施例中提供了一种电子设备，如图7所示，该电子设备主要包括：处理器701、通信接口702、存储器703和通信总线704，其中，处理器701、通信接口702和存储器703通过通信总线704完成相互间的通信。其中，存储器703中存储有可被至处理器701执行的程序，处理器701执行存储器703中存储的程序，实现如下步骤：

获取待推荐数据；

将待推荐数据输入预先训练的推荐模型，以通过推荐模型确定待推荐数据的推荐指数，推荐模型是基于训练样本中的用户特征、用户浏览多媒体数据时的用户行为信息以及用户行为信息的属性标识确定训练样本权重值，并根据训练样本权重值和训练样本中多媒体数据的数据特征训练得到的，其中，属性标识用于指示用户行为信息的属性是否为正向，样本权重值越大对多媒体数据的推荐影响程度越高；

根据推荐指数，确定推荐数据中的目标推荐数据；

推荐目标推荐数据。或，

获取样本，样本包括多媒体数据、用户的用户特征、用户浏览多媒体数据时的用户行为信息、用户行为信息的第一属性标识和多媒体数据的数据特征，其中，属性标识用于指示用户行为信息的属性是否为正向；

根据多媒体数据、用户特征、用户浏览多媒体数据时的用户行为信息和属性标识，确定样本的权重值；

根据样本权重值和多媒体数据的数据特征确定样本的推荐值。

上述电子设备中提到的通信总线704可以是外设部件互连标准(PeripheralComponent Interconnect，简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture，简称EISA)总线等。该通信总线704可以分为地址总线、数据总线、控制总线等。为便于表示，图7中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口702用于上述电子设备与其他设备之间的通信。

存储器703可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器701的存储装置。

上述的处理器701可以是通用处理器，包括中央处理器(Central ProcessingUnit，简称CPU)、网络处理器(Network Processor，简称NP)等，还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当该计算机程序在计算机上运行时，使得计算机执行上述实施例中所描述的推荐方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以时通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的具体实施方式，使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：李玥亭;刘宇涛;崔光范;王海梁;
专利申请人：上海众源网络有限公司;