一种目标推荐模型的训练、内容推荐方法及装置

文献发布时间：2023-06-19 19:33:46

技术领域

本说明书涉及深度学习技术领域，尤其涉及一种目标推荐模型的训练、内容推荐方法及装置。

背景技术

随着很多网络平台的涌现，用户可以在平台中搜索相关的信息、分享自己的看法、进行观点的交流和讨论，平台可以预测用户感兴趣的内容并推荐相应的内容供用户浏览。

然而，当平台中存储的用户历史行为数据(用户注册、浏览、点击、收藏等互动数据)较少时，这个平台中应用的内容推荐模型中的网络参数并不能基于这些较少的用户历史行为数据得到较好的训练。也就是说，这个平台中的内容推荐模型为用户推荐的内容未必是用户感兴趣的内容。

发明内容

为克服相关技术中存在的问题，本说明书提供了一种目标推荐模型的训练、内容推荐方法及装置。

根据本申请实施例的第一方面，提供一种目标推荐模型的训练方法，包括：

获取第一互动平台内的用户行为数据、以及应用于所述第一互动平台的预先训练好的第一推荐模型；

将所述用户行为数据分别作为所述第一推荐模型和待训练的第一神经网络的输入数据，得到所述第一推荐模型提取的第一特征向量、以及所述第一神经网络提取的第二特征向量；

基于所述第一特征向量对所述第二特征向量的影响权重、以及所述第二特征向量，确定所述第一神经网络输出的第一推荐内容；其中，所述第一推荐内容是为所述用户行为数据对应的用户推荐的；

基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述第一神经网络中的网络参数，得到训练好的第一神经网络，并将所述训练好的第一神经网络确定为目标推荐模型；其中，所述目标推荐模型应用于第二互动平台。

根据本申请实施例的第二方面，提供一种内容推荐方法，所述方法包括：

响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息；

确定所述第二互动平台为所述用户生成的若干候选推荐内容；

将所述身份信息和所述若干候选推荐内容输入至目标推荐模型，并接收所述目标推荐模型针对所述身份信息返回的所述用户对每个所述候选推荐内容的感兴趣数值；其中，所述目标推荐模型是通过第一方面提供的任一训练方法得到的，所述第一互动平台的互动内容与所述第二互动平台的互动内容携带有至少部分相同的推荐标签，所述第一互动平台内的用户行为数据多于所述第二互动平台内的用户行为数据；

按照所述感兴趣数值，从所述若干候选推荐内容中选择至少部分推荐内容进行推荐。

根据本申请实施例的第三方面，提供一种目标推荐模型的训练装置，所述训练装置包括：

获取模块，用于获取第一互动平台内的用户行为数据、以及应用于所述第一互动平台的预先训练好的第一推荐模型；

提取模块，用于将所述用户行为数据分别作为所述第一推荐模型和待训练的第一神经网络的输入数据，得到所述第一推荐模型提取的第一特征向量、以及所述第一神经网络提取的第二特征向量；

第一确定模块，用于基于所述第一特征向量对所述第二特征向量的影响权重、以及所述第二特征向量，确定所述第一神经网络输出的第一推荐内容；其中，所述第一推荐内容是为所述用户行为数据对应的用户推荐的；

调整模块，用于基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述第一神经网络中的网络参数，得到训练好的第一神经网络，并将所述训练好的第一神经网络确定为目标推荐模型；其中，所述目标推荐模型应用于第二互动平台。

根据本申请实施例的第四方面，提供一种内容推荐装置，所述内容推荐装置包括：

响应模块，用于响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息；

第二确定模块，用于确定所述第二互动平台为所述用户生成的若干候选推荐内容；

接收模块，用于将所述身份信息和所述若干候选推荐内容输入至目标推荐模型，并接收所述目标推荐模型针对所述身份信息返回的所述用户对每个所述候选推荐内容的感兴趣数值；其中，所述目标推荐模型是通过第三方面的目标推荐模型的训练装置得到的，所述第一互动平台的互动内容与所述第二互动平台的互动内容携带有至少部分相同的推荐标签，所述第一互动平台内的用户行为数据多于所述第二互动平台内的用户行为数据；

推荐模块，用于按照所述感兴趣数值，从所述若干候选推荐内容中选择至少部分推荐内容进行推荐。

根据本申请实施例的第五方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如第一方面或第二方面提供的实施例中任一所述方法的步骤。

根据本申请实施例的第六方面，提供一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序；其中，所述处理器被配置为执行如第一方面或第二方面提供的实施例中任一所述方法的步骤。

本说明书的实施例提供的技术方案可以包括以下有益效果：

本申请实施例中，当第二互动平台内的用户行为数据比较少(或者是没有用户行为数据)时，获取应用于第一互动平台内预先训练好的第一推荐模型，来根据第一推荐模型以及用户行为数据对待训练的第一神经网络进行训练，在训练过程中，通过考虑第一推荐模型基于用户行为数据提取的第一特征向量对第一神经网络基于用户行为数据提取的第二特征向量的影响权重，来影响第一神经网络输出的第一推荐内容，从而使得第一推荐内容接近第一推荐模型基于第一特征向量生成的推荐内容。

进一步的，通过第一推荐内容与用户行为数据中用户的实际互动内容之间的的损失，来调整第一神经网络的网络参数，直到得到训练好的第一神经网络，并作为用于对第二互动平台内的用户进行内容推荐的目标推荐模型。

通过上述方法，有助于解决第二互动平台的推荐模型无法对用户进行精准内容推荐的问题。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本说明书的实施例，并与说明书一起用于解释本说明书的原理。

图1示出了本申请实施例提供的一种目标推荐模型的训练方法的流程图。

图2a示出了本申请实施例提供的另一种目标推荐模型的训练方法的流程图。

图2b示出了本申请实施例提供的一种目标推荐模型的训练方法的应用示意图。

图3a示出了本申请实施例提供的另一种目标推荐模型的训练方法的流程图。

图3b示出了本申请实施例提供的另一种目标推荐模型的训练方法的应用示意图。

图4示出了本申请实施例提供的一种内容推荐方法的流程图。

图5示出了本申请实施例提供的一种目标推荐模型的训练装置的结构示意图。

图6示出了本申请实施例提供的一种目标推荐模型的训练装置或一种内容推荐装置所在计算机设备的一种硬件结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本说明书范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

当用户在平台中进行互动时，平台通常会为用户推荐用户感兴趣的内容，从而增加用户在平台中的互动时间、互动量。然而在以下两种情况中，平台为用户推荐的内容未必是用户喜欢的：

情况一：用户在新平台中互动：

在一个新平台刚刚投入使用的时候，由于新平台中的用户历史数据比较少，因此无论是这个新平台中刚刚注册的新用户，还是拥有少量用户行为数据的旧用户，这些用户在这个新平台进行互动时(例如浏览、点击、收藏、发布信息等)，由于无法获取到新平台中的用户历史数据，因此新平台自身搭载的内容推荐模型为用户推荐的内容未必符合用户的喜好。

或者情况二：新用户在旧平台中互动：

平台投入使用了很久时，这个平台中具有大量的用户历史数据，但是当一个新用户在这个平台中进行互动时，由于这个平台中并不具有关于这个用户的历史行为数据、喜好、特征标签等，因此这个平台中的内容推荐模型无法针对性的为用户推荐其喜好的互动内容。

例如，存在两个关于新能源汽车的互动平台(例如新能源汽车论坛)，用户可以在互动平台中浏览新能源汽车车型、厂商、汽车性能，发布车辆性价比分析图文视频信息等，这这两个互动平台(第一互动平台和第二互动平台)中存在至少部分相关的话题、相同的话题标签等。

假设第一互动平台中的用户历史行为数据比较多，第二互动平台中的用户历史行为数据比较少，此时第一互动平台内的用户历史行为数据远远多于第二互动平台中的用户历史行为数据，当第一互动平台中应用有为用户进行内容推荐的内容推荐模型时，由于第一互动平台中具有大量的用户历史行为数据，此时第一互动平台中的内容推荐模型中的网络参数能够基于自身的用户历史行为数据进行优化，进而向用户推荐用户感兴趣的互动内容。

然而，由于第二互动平台内的用户历史行为数据较少，此时第二互动平台中的内容推荐模型并未得到有效的训练，因此第二互动平台向用户推荐的互动内容未必是用户感兴趣的内容，这就导致用户在第二互动平台内的使用体验差。并且，当第一互动平台与第二互动平台属于不同域(两个平台的协议、域名、端口至少一个不相同)时，也无法基于第一互动平台内的内容推荐模型对第二互动平台内的用户进行推荐。

此时，第二互动平台无法对用户进行精准的内容推荐。

为了解决上述问题，本申请实施例提供一种目标推荐模型的训练方法，接下来对本申请实施例进行详细说明。

图1示出了本申请实施例提供的一种目标推荐模型的训练方法的流程图，如图1所示，所述方法包括以下步骤：

步骤101，获取第一互动平台内的用户行为数据、以及应用于所述第一互动平台的预先训练好的第一推荐模型。

其中，第一互动平台内具有大量的用户行为数据，每个用户行为数据都是根据用户在第一互动平台内的互动操作生成的。

第一推荐模型的网络参数已经基于第一互动平台中的大量用户行为数据进行优化，因此预先训练好的第一推荐模型在第一互动平台中为用户推荐的内容与用户的偏好内容接近。

步骤102，将所述用户行为数据分别作为所述第一推荐模型和待训练的第一神经网络的输入数据，得到所述第一推荐模型提取的第一特征向量、以及所述第一神经网络提取的第二特征向量。

其中，第一神经网络是为第二互动平台训练的，将每个所述用户行为数据分别转换成训练样本，得到多个训练样本；其中，所述训练样本中包括用于表征所述用户行为数据对应的用户的用户特征，以及包括用于表征所述用户行为数据对应的实际互动内容的内容特征；将所述多个训练样本分别输入到所述第一推荐模型和所述第一神经网络中。

例如，用户的互动行为是：用户甲在第一互动平台中收藏了文章一，那么针对这个用户行为生成的用户行为数据中包括用于表示用户甲的信息的用户特征，例如用户甲登录平台时，用户特征可以是用户甲的身份标识信息、账号信息、用户画像信息(例如用户年龄、性别、所在城市)等；当用户甲未登录时，用户特征可以是为这个用户甲生成的随机编码、用于区别于其他用户。

另外，这个用户行为数据中还包括用于表示用户甲收藏文章一这个实际互动内容的内容特征，例如内容特征可以是描述文章一中的关键词的特征、还可以是表征用户“收藏文章一”这个“收藏”行为的特征，还可以是文章一对应的唯一标识，还可以是文章一对应的发布者的信息、其他用户对文章一的互动特征(例如评论、点赞、收藏信息)。

将每个用户行为数据中的内容特征和用户特征拼接为一个二元组，并将这个二元组作为一个训练样本，从而得到对应于多个用户行为数据的多个训练样本，在得到这些训练样本之后，还可以对这些训练样本进行预处理(例如对缺失值进行填充、假设并不知道用户甲的性别信息，可以填充：无、0值等用于表示不知道这个用户的性别信息的数据)。

通过将多个训练样本分别输入到第一推荐模型和第一神经网络中，由于第一推荐模型中的网络参数已经基于这些训练样本预先优化过，因此，当将训练样本重新作为第一推荐模型的输入数据输入到第一推荐模型后，第一推荐模型对这些训练样本进行特征提取，由于第一推荐模型中具有多个隐藏层、每个隐藏层中具有若干神经元，因此在第一推荐模型中的每个隐藏层均能够提取得到特征向量，将这些特征向量确定为第一推荐模型提取得到的第一特征向量，并输出基于第一特征向量得到的第一推荐模型的推荐结果。

由于第一神经网络是尚未训练的神经网络，因此，当将多个训练样本输入到第一神经网络后，第一神经网络提取得到的第二特征向量与第一推荐模型提取得到的第一特征向量会存在较大的区别。

步骤103，基于所述第一特征向量对所述第二特征向量的影响权重、以及所述第二特征向量，确定所述第一神经网络输出的第一推荐内容；其中，所述第一推荐内容是为所述用户行为数据对应的用户推荐的。

由于用户行为数据中包括用户的用户特征、用户的实际互动内容的内容特征，因此当将用户特征输入到第一推荐模型后，第一推荐模型能够对用户行为数据提取得到第一特征向量，然后基于第一特征向量为这个用户特征生成推荐内容；同理，当将用户特征输入到第一神经网络之后，第一神经网络能够对用户行为数据提取得到第二特征向量，然后基于第二特征向量为这个用户特征生成第一推荐内容，然而，在本申请中由于第一特征向量与第二特征向量之间存在较大的区别，因此通过设置第一特征向量对第二特征向量的影响权重，这样在根据第二特征向量生成第一神经网络输出的第一推荐内容时，通过考虑第一推荐模型提取的第一特征向量，使得第一神经网络最终得到的第一推荐内容与第一推荐模型根据第一特征向量得到的推荐内容的内容比较接近。

其中，图2a示出了本申请实施例提供的另一种目标推荐模型的训练方法的流程图，如图2a所示，第一特征向量对第二特征向量的影响权重的设置方法包括以下步骤：

步骤201，针对每个所述用户行为数据，确定所述用户行为数据对应的实际互动内容的第一类型；以及，确定所述第二互动平台内的互动内容的第二类型。

由于用户行为数据是用户在第一互动平台内互动产生的数据，因此根据用户行为数据对应的用户的实际互动内容，能够确定出实际互动内容的第一类型。

例如，用户行为数据是：用户乙浏览“新能源汽车款式A”的视频3分钟，那么实际互动内容是：“新能源汽车款式A”的视频，那么第一类型包括但不限于：视频、汽车、新能源汽车款式A、以及视频中的关键词等。

在本申请实施例中，第二互动平台与第一互动平台可以是相同域的平台，也可以是不同域的平台，第一互动平台的互动内容与第二互动平台的互动内容携带有至少部分相同的推荐标签，例如购物标签、汽车标签、新能源标签、电动车标签、直播标签等等，这样能够保证第一互动平台与第二互动平台具有相似的讨论话题、或者至少部分相同的话题类型。

推荐标签与第一类型具有绑定关系，例如第一类型为：视频，那么当互动内容携带有：短视频、直播、剪辑视频这类推荐标签时，可以将这个互动内容确定为第一类型。

因此，根据第二互动平台中的若干互动内容，可以确定每个互动内容的第二类型。

步骤202，通过权重设置网络，基于所述第一类型与所述第二类型的相关程度，确定每个所述用户行为数据对应的权重。

其中，权重设置网络用于设置第一特征向量对第二特征向量的影响权重，通过步骤201确定每个用户行为数据对应的第一类型，以及确定第一类型与第二类型的相关程度，能够确定每个用户行为数据对应的权重，为与第二互动平台内互动内容相关度高的用户行为数据设置较高的权重，为与第二互动平台内互动内容相关度低的用户行为数据设置较低的权重。

步骤203，基于所述用户行为数据对应的权重，确定所述第一特征向量对所述第二特征向量的影响权重。

基于每个用户行为数据对应的权重，为第一推荐模型对用户行为数据提取得到的第一特征向量设置较高的影响权重，进而能够使得第一特征向量对第二特征向量影响较高，进而使得第一神经网络得到的第一推荐内容与第一推荐模型基于第一特征向量得到的推荐内容比较接近。

图2b示出了本申请实施例提供的一种目标推荐模型的训练方法的应用示意图，如图2b所示，将第一互动平台中的用户行为数据分别输入到左侧和右侧的模型中，其中左侧模型为第一推荐模型、右侧模型为待训练的第一神经网络。

特征一、特征二、特征三是第一推荐模型对用户行为数据提取得到的第一特征向量；特征四、特征五、特征六是第一神经网络对用户行为数据提取到的第二特征向量。

进一步的，在执行步骤203之后，所述方法还包括步骤204：

基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述权重设置网络的网络参数，以基于调整网络参数后的权重设置网络、以及所述用户行为数据对应的权重，重新调整所述影响权重。

第一推荐内容是第一神经网络训练过程中基于用户行为数据为用户行为数据中对应的用户推荐的内容，而第一推荐模型生成的推荐内容与第一推荐内容基于相同的用户行为数据生成的，因此通过确定第一推荐内容与第一推荐模型生成的推荐内容之间的差别，调整权重设置网络的网络参数，能够使得权重设置网络优化网络参数之后设置的影响权重更加合适，进而使得第一推荐内容与第一推荐模型生成的推荐内容更加接近。

步骤104，基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述第一神经网络中的网络参数，得到训练好的第一神经网络，并将所述训练好的第一神经网络确定为目标推荐模型；其中，所述目标推荐模型应用于第二互动平台。

其中，第一推荐内容是第一神经网络训练过程中基于用户行为数据为用户行为数据中对应的用户推荐的内容，而实际互动内容是该用户行为数据中用户实际互动的内容，也即正确答案。

通过确定第一推荐内容与实际互动内容之间的损失，能够调整和优化第一神经网络中的网络参数，直到得到训练好的第一神经网络，训练好的第一神经网络得到的第一推荐内容与实际互动内容之间的损失小于或等于预设的损失阈值。

通过将训练好的第一神经网络确定为目标推荐模型，能够使得第二互动平台通过应用该目标推荐模型，向用户推荐用户偏好的互动内容。

通过上述方法，有助于解决第二互动平台的推荐模型无法对用户进行精准内容推荐的问题。

在一个可行的实施方案中，图3a示出了本申请实施例提供的另一种目标推荐模型的训练方法的流程图，在执行步骤104得到训练好的第一神经网络之后，所述方法还包括以下步骤：

步骤301，将所述用户行为数据作为待训练的第二神经网络的输入数据，得到所述第二神经网络的第二推荐内容；其中，所述第二神经网络是对所述第一神经网络的网络结构进行简化之后得到的，所述第二推荐内容是为所述用户行为数据对应的用户推荐的。

其中，假设第一神经网络的网络结构包括：m个隐藏层、每个隐藏层中包括n个神经元；那么，对第一神经网络的网络结构进行简化，可以得到例如：m-x个隐藏层、每个隐藏层中包括n-y个神经元，x、y均大于等于1，并且，第一神经网络和第二神经网络应用的模型框架是相同的，例如均为DNN深度神经网络。

将用户行为数据作为第二神经网络的输入，对第二神经网络进行训练，得到第二神经网络输出的第二推荐内容。

步骤302，基于所述第一推荐内容与所述第二推荐内容之间的差异，调整所述第二神经网络的网络参数，并将网络参数调整后的第二神经网络确定为训练好的第二神经网络。

具体包括步骤3021：确定所述训练好的第一神经网络得到的第一推荐内容与实际互动内容之间的第一损失，以及所述第二推荐内容与实际互动内容之间的第二损失。当所述第一损失与所述第二损失之间的差值大于预设差值时，基于所述差值调整所述第二神经网络的网络参数，以使网络参数调整后的第二神经网络对应的第二损失与所述第一损失之间的差值小于或等于所述预设差值。

其中，第一推荐内容是由训练好的第一神经网络基于用户行为数据生成的，第二推荐内容是由尚未训练好的第二神经网络基于用户行为数据生成的。若第一损失与第二损失之间的差值大于预设差值，说明第二神经网络输出的第二推荐内容与第一神经网络输出的第一推荐内容相差较大，需要调整第二神经网络的网络参数，直到得到训练好的第二神经网络，使得第二神经网络输出的第二推荐内容与第一推荐内容接近程度较高，提高第二神经网络推荐的互动内容的准确度。图3b示出了本申请实施例提供的另一种目标推荐模型的训练方法的应用示意图，如图3b所示，第一神经网络是训练好的神经网络，根据第一损失、第二损失之间的差值来调整第二神经网络的网络参数。

步骤303，将所述目标推荐模型更换为所述训练好的第二神经网络。

将目标推荐模型中已经训练好的第一神经网络更换为训练好的第二神经网络，由于第二神经网络是第一神经网络的网络结构简化后的神经网络，因此在使用第二神经网络对第二互动平台中的用户进行推荐时，第二神经网络运算速度较快，能够较快的得到为用户推荐的互动内容。

图4示出了本申请实施例提供的一种内容推荐方法的流程图，如图4所示，所述方法包括以下步骤：

步骤401，响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息。

其中，用户的身份信息可以是临时身份信息(用户未登录账号)、也可以是非临时身份信息(用户登录账号)，因此响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息，包括：响应于用户在第二互动平台内的互动操作，确定所述用户的用户特征。

其中，当用户未登录第二互动平台(例如以游客等临时身份浏览)时，用户特征可以是：用户的地域信息、临时身份编码信息、基于用户的互动行为生成的话题标签(例如喜欢新能源汽车)等。

当用户登录第二互动平台时，用户特征可以是：用户的身份标识、账号信息、用户画像(例如用户年龄、性别、所在城市)、以及根据用户的历史行为生成的话题标签(喜欢观看短视频、喜欢浏览文章等)。

步骤402，确定所述第二互动平台为所述用户生成的若干候选推荐内容。

候选推荐内容可以是第二互动平台基于互动内容的更新时间、这个互动内容的曝光量、收藏量、评论量等方式综合考虑之后为用户生成的。

步骤403，将所述身份信息和所述若干候选推荐内容输入至目标推荐模型，并接收所述目标推荐模型针对所述身份信息返回的所述用户对每个所述候选推荐内容的感兴趣数值；其中，所述目标推荐模型是通过上述实施例提供的目标推荐模型的训练方法得到的，所述第一互动平台的互动内容与所述第二互动平台的互动内容携带有至少部分相同的推荐标签，所述第一互动平台内的用户行为数据多于所述第二互动平台内的用户行为数据。

其中，将所述身份信息和所述若干候选推荐内容输入至目标推荐模型，包括：将所述用户特征和所述若干候选推荐内容输入至目标推荐模型，以便第二互动平台中的目标推荐模型确定这个用户特征对应的用户对每个候选推荐内容的感兴趣数值。

例如，用户特征是：账号A，若干候选推荐内容是：推荐内容A、推荐内容B；

目标推荐模型输出的是：

推测账号A对推荐内容A的感兴趣数值是60；

推测账号A对推荐内容B的感兴趣数值是80。可以看出，账号A对推荐内容B更感兴趣。

步骤404，按照所述感兴趣数值，从所述若干候选推荐内容中选择至少部分推荐内容进行推荐。

根据步骤403得到的感兴趣数值，对若干候选推荐内容中的至少部分推荐内容进行推荐，例如：优先展示推荐内容B，再展示推荐内容A；或者，仅展示推荐内容B。

通过上述方法，能够为第二互动平台内的用户推荐用户可能偏好的互动内容。

图5示出了本申请实施例提供的一种目标推荐模型的训练装置的结构示意图，所述装置包括：

获取模块501，用于获取第一互动平台内的用户行为数据、以及应用于所述第一互动平台的预先训练好的第一推荐模型。

提取模块502，用于将所述用户行为数据分别作为所述第一推荐模型和待训练的第一神经网络的输入数据，得到所述第一推荐模型提取的第一特征向量、以及所述第一神经网络提取的第二特征向量。

第一确定模块503，用于基于所述第一特征向量对所述第二特征向量的影响权重、以及所述第二特征向量，确定所述第一神经网络输出的第一推荐内容；其中，所述第一推荐内容是为所述用户行为数据对应的用户推荐的。

调整模块504，用于基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述第一神经网络中的网络参数，得到训练好的第一神经网络，并将所述训练好的第一神经网络确定为目标推荐模型；其中，所述目标推荐模型应用于第二互动平台。

在一个可行的实施方案中，所述装置还包括：

第三确定模块，用于在所述基于所述第一特征向量对所述第二特征向量的影响权重、以及所述第二特征向量，确定所述第一神经网络输出的第一推荐内容之前，针对每个所述用户行为数据，确定所述用户行为数据对应的实际互动内容的第一类型；以及，确定所述第二互动平台内的互动内容的第二类型。

第一权重模块，用于通过权重设置网络，基于所述第一类型与所述第二类型的相关程度，确定每个所述用户行为数据对应的权重。

第二权重模块，用于基于所述用户行为数据对应的权重，确定所述第一特征向量对所述第二特征向量的影响权重。

在一个可行的实施方案中，所述装置还包括：

第一调整模块，用于在所述确定所述第一特征向量对所述第二特征向量的影响权重之后，基于所述第一推荐内容和所述用户行为数据中用户的实际互动内容之间的损失，调整所述权重设置网络的网络参数，以基于调整网络参数后的权重设置网络、以及所述用户行为数据对应的权重，重新调整所述影响权重。

在一个可行的实施方案中，所述装置还包括：

第一输入模块，用于在所述得到训练好的第一神经网络之后，将所述用户行为数据作为待训练的第二神经网络的输入数据，得到所述第二神经网络的第二推荐内容；其中，所述第二神经网络是对所述第一神经网络的网络结构进行简化之后得到的，所述第二推荐内容是为所述用户行为数据对应的用户推荐的。

第二调整模块，用于基于所述第一推荐内容与所述第二推荐内容之间的差异，调整所述第二神经网络的网络参数，并将网络参数调整后的第二神经网络确定为训练好的第二神经网络。

更换模块，用于将所述目标推荐模型更换为所述训练好的第二神经网络。

在一个可行的实施方案中，所述第二调整模块在用于基于所述第一推荐内容与所述第二推荐内容之间的差异，调整所述第二神经网络的网络参数时，用于：

确定所述训练好的第一神经网络得到的第一推荐内容与实际互动内容之间的第一损失，以及所述第二推荐内容与实际互动内容之间的第二损失。

当所述第一损失与所述第二损失之间的差值大于预设差值时，基于所述差值调整所述第二神经网络的网络参数，以使网络参数调整后的第二神经网络对应的第二损失与所述第一损失之间的差值小于或等于所述预设差值。

在一个可行的实施方案中，所述提取模块在用于将所述用户行为数据分别作为所述第一推荐模型和待训练的第一神经网络的输入数据时，用于：

将每个所述用户行为数据分别转换成训练样本，得到多个训练样本；其中，所述训练样本中包括用于表征所述用户行为数据对应的用户的用户特征，以及包括用于表征所述用户行为数据对应的实际互动内容的内容特征。

将所述多个训练样本分别输入到所述第一推荐模型和所述第一神经网络中。

本申请实施例提供一种内容推荐装置，所述内容推荐装置包括：

响应模块，用于响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息。

第二确定模块，用于确定所述第二互动平台为所述用户生成的若干候选推荐内容。

接收模块，用于将所述身份信息和所述若干候选推荐内容输入至目标推荐模型，并接收所述目标推荐模型针对所述身份信息返回的所述用户对每个所述候选推荐内容的感兴趣数值；其中，所述目标推荐模型是通过目标推荐模型的训练装置得到的，所述第一互动平台的互动内容与所述第二互动平台的互动内容携带有至少部分相同的推荐标签，所述第一互动平台内的用户行为数据多于所述第二互动平台内的用户行为数据。

推荐模块，用于按照所述感兴趣数值，从所述若干候选推荐内容中选择至少部分推荐内容进行推荐。

在一个可行的实施方案中，所述用户行为数据中包括用户的用户特征，所述第一互动平台内的用户与所述第二互动平台内的用户具有至少部分相同的用户特征。

所述响应模块用于响应于用户在第二互动平台内的互动操作，确定所述用户的身份信息时，用于：响应于用户在第二互动平台内的互动操作，确定所述用户的用户特征。

所述接收模块用于将所述身份信息和所述若干候选推荐内容输入至目标推荐模型时，用于：将所述用户特征和所述若干候选推荐内容输入至目标推荐模型。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程，在此不再赘述。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

图6示出了本申请实施例提供的一种目标推荐模型的训练装置或一种内容推荐装置所在计算机设备的一种硬件结构图，该设备可以包括：处理器601、存储器602、输入/输出接口603、通信接口604和总线605。其中处理器601、存储器602、输入/输出接口603和通信接口604通过总线605实现彼此之间在设备内部的通信连接。

处理器601可以采用通用的CPU(Central Processing Unit，中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的方法的步骤。

存储器602可以采用ROM(Read Only Memory，只读存储器)、RAM(Random AccessMemory，随机存取存储器)、静态存储设备，动态存储设备等形式实现。存储器602可以存储操作系统和其他应用程序，在通过软件或者固件来实现本申请实施例所提供的技术方案时，相关的程序代码保存在存储器602中，并由处理器601来调用执行。

输入/输出接口603用于连接输入/输出模块，以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出)，也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等，输出设备可以包括显示器、扬声器、振动器、指示灯等。

通信接口604用于连接通信模块(图中未示出)，以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。

总线605包括一通路，在设备的各个组件(例如处理器601、存储器602、输入/输出接口603和通信接口604)之间传输信息。

需要说明的是，尽管上述设备仅示出了处理器601、存储器602、输入/输出接口603、通信接口604以及总线605，但是在具体实施过程中，该设备还可以包括实现正常运行所必需的其他组件。此外，本领域的技术人员可以理解的是，上述设备中也可以仅包含实现本申请实施例方案所必需的组件，而不必包含图中所示的全部组件。

本申请实施例还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例提供的任一所述的方法的步骤。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：周驰;车皓阳;姚雷;
专利申请人：浙江极氪智能科技有限公司;浙江吉利控股集团有限公司;

上一篇：具有缓冲层的纳米粒子
下一篇：语音设备配置系统和离线语音控制系统