一种自适应设置推荐系统表征模长的方法

文献发布时间：2023-06-19 19:04:00

技术领域

本发明涉及推荐系统协同过滤的技术领域，特别是基于表征学习的协同过滤技术领域。

背景技术

为实现更为精准高效的推荐系统设计，现有推荐系统模型不断更新迭代，旨在设计出真实场景适配性较强的模型。随着过去十年硬件的快速发展，以及大数据技术的深耕，基于表征学习的推荐系统正逐步替代过去基于规则或者矩阵分解技术的模型。而其中协同过滤任务仅仅通过用户的历史点击记录这一数据，不借助其他额外辅助信息的前提下，实现较为精准的用户推荐，是推荐系统中最为广泛的也最为基础的任务之一。

尽管现有的基于表征学习的推荐模型通过搭建愈发庞大愈发复杂的网络架构，实现了较为不错的性能提升，但现有推荐模型缺乏对表征模长的探索，而模长对推荐的性能起着至关重要的作用。现有方法要么采用正则项来隐式控制模长，然而这会导致推荐结果遭受流行度偏差问题同时也会影响模型训练的收敛速度；要么直接暴力的采用模长归一化的方式，并用一个超参数即温度系数来控制归一化的模长，然而模型性能会对温度系数非常敏感，手工的方式往往难以找到合适的温度系数。同时，统一的温度系数缺乏灵活性，也不利于推荐模型的训练。为了克服这一问题，必须要设计一种自适应的温度系数的设置方法。

发明内容

本发明要克服现有技术的以上问题，提出一种自适应设置推荐系统表征模长的方法。

本发明的一种自适应设置推荐系统表征模长的方法，包括以下步骤：

1)根据当前模型的状态，按照式(1)计算基准温度系数：

其中μ

2)根据以上τ

这里L(u)为每个用户的累计损失均值即

3)根据以上τ

这里|.|代表向量的L2范数。

以常用的模型矩阵分解MF和协同图神经网络LGN为基础推荐模型，选取两个公开的真实数据集Yelp，MovieLens进行实验。按照隐式反馈的推荐系统评判原则出发，将数据集划分为训练集，验证集以及测试集。以Recall@20及NDCG@20作为度量。

表1不同方法在两个数据集上的性能比较

从表1可以发现：在两种不同类型的数据集上，本发明提出的模长控制方法(即MF+Adapt-τ、LGN+Adapt-τ)均可以超过现有的基于L2或者基于手工暴力搜索的方法(即MF+L2、LGN+L2、MF+Norm、LGN+Norm)。

本发明提出了一种自适应设置推荐系统表征模长的方法，通过考察推荐模型的预测值、累计损失等统计指标，来实现对模长的自适应细粒度的设置。

相比于的现有的基于L2正则以及手工暴力搜索的方法，本发明的优点是：能够自适应寻找细粒度的最优的表征模长，提高了模型的推荐性能。

附图说明

图1是本发明的总体流程图。

具体实施方式

现详细说明本发明的多种示例性实施方式，该详细说明不应认为是对本发明的限制，而应理解为是对本发明的某些方面、特性和实施方案的更详细的描述。应理解本发明中所述的术语仅仅是为描述特别的实施方式，并非用于限制本发明。另外，对于本发明中的数值范围，应理解为还具体公开了该范围的上限和下限之间的每个中间值。在任何陈述值或陈述范围内的中间值以及任何其他陈述值或在所述范围内的中间值之间的每个较小的范围也包括在本发明内。这些较小范围的上限和下限可独立地包括或排除在范围内。

除非另有说明，否则本文使用的所有技术和科学术语具有本发明所述领域的常规技术人员通常理解的相同含义。虽然本发明仅描述了优选的方法和材料，但是在本发明的实施或测试中也可以使用与本文所述相似或等同的任何方法和材料。本说明书中提到的所有文献通过引用并入，用以公开和描述与所述文献相关的方法和/或材料。在与任何并入的文献冲突时，以本说明书的内容为准。

在不背离本发明的范围或精神的情况下，可对本发明说明书的具体实施方式做多种改进和变化，这对本领域技术人员而言是显而易见的。由本发明的说明书得到的其他实施方式对技术人员而言是显而易见得的。本申请说明书和实施例仅是示例性的。

关于本文中所使用的“包含”、“包括”、“具有”、“含有”等等，均为开放性的用语，即意指包含但不限于。

本发明中所述的“份”如无特别说明，均按质量份计。

应用本发明提供一种基于自适应设置表征模长的网络商品推荐方法，如图1所示，其步骤包括：

步骤S1：获取与处理数据。

具体为：在一种推荐系统的应用场景下，以商品点评平台Yelp为例，收集平台中用户与商品的交互数据，表示为正样本集合D，他的每个元素是一个用户物品对(u,i)∈D，代表用户u喜欢物品i。我们也使用标签r

步骤S2：采用基于自适应设置表征模长的方式来训练推荐模型。

本步骤是本发明的核心，下面对其展开阐述，并以经典的基于矩阵分解的推荐模型为例说明。具体包括以下子步骤：

1)根据当前模型的状态，按照如下式子计算基准温度系数：

其中μ

2)根据以上τ

这里L(u)为每个用户的累计损失均值即

3)根据以上τ

这里|.|代表向量的L2范数。

4)利用模长调节后的表征来进行模型训练，即使用如下公式来计算损失函数：

并使用梯度下降算法来更新模型。

步骤S3：根据学习得到的模长调节后的表征，实现商品推荐。

具体为：对于每个用户u，按照

本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：陈佳伟;吴俊康;何向南;王灿;
专利申请人：浙江大学;