掌桥专利:专业的专利平台
掌桥专利
首页

一种基于时间和图结构的搜索式推荐方法

文献发布时间:2023-06-19 19:27:02


一种基于时间和图结构的搜索式推荐方法

技术领域

本发明涉及推荐系统领域,尤其涉及一种基于时间和图结构的搜索式推荐方法。

背景技术

随着用户行为历史长度的迅速增常,如何有效地从互联网平台上数量巨大的候选商品中帮助用户找到他们感兴趣的商品已经成为了推荐系统领域一个非常重要的问题。经典推荐方法,比如协作过滤模型和因式分解机模型等方法,主要集中于对用户的总体兴趣进行建模以期得到用户感兴趣的物品。但是此类模型较少探索用户在固定时间段内的需求,而时间其实是影响用户需求的非常重要的因素之一。因此,近来也有一些通过记忆网络、循环神经网络或者时间点模型的方式来尝试捕捉用户的序列模式,但是大多数方法在用户历史序列过长时就由于计算复杂性和存储空间的限制无法应用在实际互联网环境中。

经典的推荐算法通常是通过丰富的用户-物品交互历史来推荐用户想要的物品,这些交互历史通常是表格、序列或者图形式的。但是根据秦佳锐等在国际信息检索大会上发表的《点击率预测的用户行为检索》,随着用户行为数据等积累得越来越多,由于在线计算的限制,从整个用户日志中训练模型是非常困难的。一种可行的方法是仅聚焦于用户的近期历史,使用短期历史代替长期历史,从而生成个性化的推荐。但是近期的论文指出(如信息和知识管理会议上的《点击率预测的基于搜索的用户兴趣建模和长时顺序行为》),这些方法无法编码用户的周期性和长期性的需求依赖,所以仅聚焦于用户近期历史实际上是一个次优解。上述两篇论文随即提出可以对整个用户历史中进行硬检索和软检索。秦佳锐还提出了通过强化学习来为上下文数据进行查询构建建模,然后使用该模块使用BM25相关性函数来查询检索相关行为。也有论文(《点击率预测的基于搜索的用户兴趣建模和长时顺序行为》)提出通过物品种类的硬检索来匹配相关物品和基于物品表征向量来软检索匹配相关物品。通过上述方式,模型就可以使用在整个用户行为历史中检索得到的相关物品来进行推荐。但是现存的基于搜索的方法忽视了用户行为历史中的时间间隔。而且通常检索的相关物品都是正反馈的(比如用户点击了该物品),这就给了同时考虑正反馈和负反馈相关物品的机会以使得整个用户序列得到充分利用。

发表在人工智能国际联合会议上的《用时间LSTM模型建模用户行为》和侯赛尼等人发表在知识与数据工程期刊上的《时间推荐的递推泊松因子分解》等文章通过使用用户行为之间的时间间隔来更好的捕捉用户的表现,而传统的序列结构并不能使用这种方法。一个方向是通过使用新的专用的时间门来控制短期和长期兴趣的更新,比如赵朋朋的《一个用于推荐下一个兴趣点的空间-时间LSTM模型》提出了一种基于循环神经网络的距离门来控制短期和长期的兴趣点的更新。另一个利用时间间隔信息的方法是通过点过程来规定用户的序列历史,即用户历史中离散的时间被建模成连续的时间,比如梅洪源等发表在神经信息处理系统大会论文《神经霍克斯过程:一个神经上自我调节的多变量点过程》提出了一种霍克斯过程,此过程允许过去的事件通过一种复杂而现实的风格影响未来的预测。这些方法除了计算复杂度高和时间耗费高之外,直接将长用户序列输入进模型也会带来非常大的噪声(干扰信息),这使得在用户日志中直接捕捉丰富的序列模式并不可行。

在推荐系统、社交网络、药物发现和数学编程等领域,将对一个图上的节点进行学习得到的表征向量作为模型中的基础性的数据模块在深度学习方法有很大的应用。主流的图表征学习主要是通过模拟图的邻接矩阵或通过随机游走并且拟合实际的邻近关系来建立更泛化的节点邻近关系。最常见的深度游走模型就是最早使用随机游走的模型之一,通过在有向图中随机游走来得到足够多的节点序列,并且将这些节点序列视为一种类似于自然语言的句子,输入进跳图模型中来学习节点的嵌入向量。节点向量模型则是深度游走模型的一种变体,其通过p和q两个参数来控制随机游走的倾向使其变为有偏的随机游走。此外还有额外信息增强图表征学习模型,此模型通过互联网上的数亿用户的连续物品访问行为来建物品的节点图,并且通过随机游走来采样节点序列,通过一个具有特征的跳图模型来训练得到节点的嵌入向量。王宏伟在知识与数据工程期刊上发表的《用生成式对抗网学习图表征》提出了一种通过对抗生成网络来进行图表征学习的模型,该模型首先基于可学习的图算子在图上进行策略随机游走和重启,对中心节点和重启前的最后一个节点的节点对进行采样,然后判别器进行学习判断一对节点是否具有边。通过这种对抗式方法来学习节点的嵌入向量。

对于国内外的相关研究总结而言:目前业界使用广泛的推荐算法难以解决用户行为历史长度过长时在线计算过于复杂的情况,同时常见的算法无法有效利用用户行为历史,存在着忽视用户行为的时间间隔和用户的负反馈等问题。此外近年的时间感知算法通常难以解决直接输入时间间隔导致带来较大的噪声问题等。

因此,本领域的技术人员致力于研发一种用户历史行为利用效率更高的、时间感知更合理的模型,在更多情形下能够相比传统推荐算法表现得更好。

发明内容

有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种基于搜索的预测模型,该模型融合用户历史数据中对物品的反馈信息和历史序列信息,能够提高模型在预测长尾用户上的表现。

为实现上述目的,本发明提供了一种基于时间和图结构的搜索式推荐方法,其特征在于,所述方法包括以下步骤:

S101:收集互联网平台用户行为历史数据,使用内积神经网络对所述用户和所述历史数据中的物品进行编码,并使用所述内积神经网络计算所述用户的嵌入向量和所述物品的嵌入向量;

S103:对所述用户的历史物品进行建图、采样和学习,捕捉所述物品之间的关联信息,将所述物品的嵌入向量作为物品特征一同输入模型中;

S105:基于所述用户和所述物品特征,使用搜索模型在所述用户历史数据中检索目标物品的相似物品;

S107:使用所述搜索模型获取所述目标用户的相似用户,从所述相似用户的历史数据中检索所述目标物品的相似物品;

S109:将检索得到的用户历史序列输入时间感知模型中,经过门循环单元和注意力机制之后得到隐状态序列,所述用户历史序列包括用户历史反馈信息和用户历史时间间隔;

S111:将所述隐状态序列输入多层感知机中进行预测,并根据第一损失函数进行反向传播;

S113:将训练完毕的算法模型应用于推荐算法中。

进一步地,所述步骤S101中,在使用所述内积神经网络计算所述嵌入向量时,采用如下方式:

其中,

进一步地,所述步骤S103中,在获取所述物品的嵌入向量时,采用图表征学习进行增强的拓展算法,使用额外信息增强图嵌入模型来对所述用户历史中的物品序列进行建模。

进一步地,所述步骤S103中对所述用户的历史物品进行建图时,在图中进行正样本和负样本采样,对所述正样本通过随机游走进行重采样,将物品种类作为额外信息,将所述正样本、所述负样本和所述额外信息输入所述额外信息增强图嵌入模型进行学习,得到所述物品的嵌入向量。

进一步地,所述随机游走是节点嵌入学习中的游走方式,在所述正样本和所述负样本采样之后使用所述第二损失函数进行训练,采用如下公式来计算所述物品嵌入向量:

所述第二损失函数为:

其中,

进一步地,在步骤S105中,所述搜索模型使用自适应搜索算法,所述自适应搜索算法支持硬检索和软检索,所述硬检索为检索物品种类完全相同的检索,所述软检索为检索物品种类完全不相似的检索,所述自适应搜索算法采用如下方式计算目标物品种类和所述用户历史物品种类的相似度:

/>

其中,

进一步地,在步骤S107中,通过计算目标用户和其他用户历史中相同种类的物品来计算用户之间的相似度,进而检索出所述目标用户的相似用户,所述相似用户的历史行为作为额外信息进行补充,所述用户之间的相似度采用如下计算方式:

其中,

进一步地,在步骤S109中,通过所述门循环单元计算得到所述隐状态的初步结果,所述初步结果再经过所述注意力机制进一步计算得到所述隐状态,所述隐状态集合通过聚合函数进行聚合;

其中,所述门循环单元采用如下计算公式:

h′

所述注意力机制采用如下计算公式:

f

/>

h

所述聚合函数为:

其中,

表示隐状态集合。

进一步地,在步骤S111中,所述多层感知机为智能感知机和非线性函数结合的神经网络,所述神经网络为:

所述第一损失函数为:

其中,

进一步地,在步骤S113中还包括对所述推荐算法进行测试,所述测试的测试环境包括基于公开数据集和在线实验,记录所述测试结果,比较所述推荐方法与其他模型的结果差异。

在本发明的较佳实施方式中,相对于现有技术,本发明具有如下有益效果:

1、本发明提出的基于搜索和时间感知的序列推荐算法,从硬搜索逐步过渡到软搜索,使搜索过程更加合理,相比以往经典序列推荐算法(包括时间感知的序列推荐算法),能够在在线环境下处理大规模的用户历史序列,能有效提升推荐效率和表现;

2、本发明将用户的历史反馈作为额外信息输入进模型中,使模型具有更好的效果,通过图表征学习的方法来对用户-物品进行建模,通过学习物品的嵌入向量来捕捉物品之间的关联,本发明在三类来自现实互联网应用的经典数据集上取得了相较于国内外先进推荐算法很好的效果。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

图1是本发明的一个较佳实施例的流程示意图;

图2是本发明的一个较佳实施例的离线公开数据集上的对比实验结果;

图3是本发明的一个较佳实施例的在线场景上的对比实验结果;

图4是本发明的一个较佳实施例的在线场景上的两种配置的本文算法对比实验结果;

图5是本发明的一个较佳实施例的在线场景上的拓展算法和原算法分桶统计对比实验结果。

具体实施方式

以下参考说明书附图介绍本发明的多个优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。

在附图中,结构相同的部件以相同数字标号表示,各处结构或功能相似的组件以相似数字标号表示。附图所示的每一组件的尺寸和厚度是任意示出的,本发明并没有限定每个组件的尺寸和厚度。为了使图示更清晰,附图中有些地方适当夸大了部件的厚度。

如图1所示,本发明实施例提供的基于时间和图结构的搜索式推荐方法,包括以下步骤:

S101:收集互联网平台用户行为历史数据,使用内积神经网络对用户和历史数据中的物品进行编码,并使用内积神经网络计算用户和物品的嵌入向量。

在使用该内积神经网络计算嵌入向量时,采用如下方式:

其中,

S103:对用户的历史物品进行建图、采样和学习,捕捉物品之间的关联信息,将物品的嵌入向量作为物品特征一同输入模型中。

在获取物品的嵌入向量时,采用图表征学习进行增强的拓展算法,使用额外信息增强图嵌入模型来对用户历史中的物品序列进行建模。在对用户的历史物品进行建图时,在图中进行正样本和负样本采样,对正样本通过随机游走进行重采样,将物品种类作为额外信息,将正样本、负样本和额外信息输入额外信息增强图嵌入模型进行学习,得到物品的嵌入向量。对正样本通过随机游走进行重采样时,该随机游走是节点嵌入学习中的游走方式,在该正样本和负样本采样之后使用所述第二损失函数进行训练,采用如下公式来计算物品嵌入向量:

第二损失函数为:

/>

其中,

S105:基于用户和物品特征,使用搜索模型在用户历史数据中检索目标物品的相似物品。

通过计算目标物品的种类和用户历史物品的种类之间的相似度来在用户历史中检索出与目标物品相似的物品。物品相似度的计算是自适应的,从要求较高的硬相似度(极端情况下要求物品种类完全相同)随着训练过程逐步过渡到软相似度(极端情况下完全不相似)。上述的搜索模型使用自适应搜索算法,该自适应搜索算法支持硬检索和软检索,硬检索为检索物品种类完全相同的检索,软检索为检索物品种类完全不相似的检索,该自适应搜索算法采用如下方式计算目标物品种类和所述用户历史物品种类的相似度:

其中,

S107:使用搜索模型获取目标用户的相似用户,从该相似用户的历史数据中检索目标物品的相似物品。

通过计算目标用户和其他用户历史中相同种类的物品来计算用户之间的相似度,进而检索出目标用户的相似用户,该相似用户的历史行为作为额外信息进行补充。

用户之间的相似度采用如下计算方式:

其中,

S109:将检索得到的用户历史序列输入时间感知模型中,经过门循环单元和注意力机制之后得到隐状态序列,上述用户历史序列包括用户历史反馈信息和用户历史时间间隔等信息。

通过上述门循环单元计算得到隐状态的初步结果,该初步结果再经过注意力机制进一步计算得到最终的隐状态,该隐状态集合通过聚合函数进行聚合。

其中,门循环单元采用如下计算公式:

h′

注意力机制采用如下计算公式:

f

h

聚合函数为:

其中,

表示隐状态集合。

S111:将隐状态序列输入多层感知机中进行预测,并根据第一损失函数进行反向传播。

上述多层感知机为智能感知机和非线性函数结合的神经网络,该神经网络为:

第一损失函数为:

其中,

S113:将训练完毕的算法模型应用于推荐算法中。

对推荐算法进行测试,该测试包括基于公开数据集和在线实验,记录测试结果,比较本发明的推荐方法与其他模型的结果差异。

本发明实施例提供的基于时间和图结构的搜索式推荐方法,具有如下技术效果:

1、本发明提出了一个基于搜索和时间感知的序列推荐算法,相比以往经典序列推荐算法(包括时间感知的序列推荐算法),能够在在线环境下处理大规模的用户历史序列。

2、本发明中提出了自适应的基于搜索的算法,从硬搜索逐步过渡到软搜索,使搜索过程更加合理。

3、本发明中将用户的历史反馈输入进模型中作为额外信息,使用了此技巧的模型具有更好的实验效果。

4、本发明中使用了图表征学习的方法来对用户-物品进行建模,通过学习物品的嵌入向量来捕捉物品之间的关联。

5、本发明在三类来自现实互联网应用的经典数据集上,均可以取得相较于国内外先进推荐算法很好的效果,并且在在线推荐场景中能有效提升推荐效率和表现。

如图2-图5所示,针对本发明实施例提供的基于时间和图结构的搜索式推荐方法,为了验证本发明的实验结果,本发明展示了在三类真实离线公开数据集以及一个真实在线推荐场景中的对比实验结果,对于离线公开数据集,对比的基线算法为推荐算法中常用的3种基准方法:深度兴趣网络、深度兴趣进化网络、基于搜索的行为建模三种推荐算法。

分别在天猫、支付宝、淘宝三个公开数据集,以及招商银行“猜你喜欢”推荐场景进行对比试验,前三个数据集来自于真实互联网平台的应用,而“猜你喜欢”推荐场景则是工业界非常重要的一个在线场景。在离线数据集对比实验中,主要的评测指标为ROC曲线下面积(AUC)、精确度(ACC)、对数损失值(LogLoss),“本文算法-”是在本发明算法中不使用标签技巧的配置,“本文算法+”是在本发明算法中使用图表征学习的配置;对于“猜你喜欢”在线推荐场景,主要的评测指标为点击通过率(CTR)、AUC、平均物品点击率(AIC)和用户点击率(CUR),在比较拓展算法和原算法时,还使用了平均点击次数(CPC),其中下标具有w/o的指标是在剔除完全没有点击的用户之后得到的结果,同时还对拓展实验进行了分桶统计,统计不同历史长度的用户在两个算法下的实验结果对比(CTR的差值指的是拓展算法的CTR结果减原算法的CTR值),整体的对比试验效果如图1,2,3,4所示。从图中可以观察得出,本发明相比于基线推荐算法的结果可以在效益指标上取得更好的结果,表明本发明技术方案更有效,同时拓展算法也相比于原算法有更好的结果。

下面结合本发明的优选实施例,对本发明进行详细说明。

如图1所示,本发明的实施流程包括如下步骤:

步骤一、对在互联网平台收集真实的用户行为历史使用内积神经网络来编码用户自身和物品本身的类型进行编码进行统一处理。

在此步骤中,定义基本元素如下:

①用户标识号u和物品标识号i:表示每个不同的用户和物品唯一的标识号的向量,其中u

②用户属性向量x

③用户嵌入向量e

在此基础上使用内积神经网络来计算嵌入向量:

其中

步骤二、使用图表征学习进行增强的拓展算法,对用户的历史物品进行建图、采样、学习,捕捉物品之间的关联信息,将学习到的物品嵌入向量作为物品特征一同输入模型之中。

使用额外信息增强图嵌入模型来对用户历史中的物品序列进行建模,获得其物品的嵌入向量。通过对用户历史中的物品进行建图,在图中进行正负样本采样,将正样本通过随机游走进行重采样,将物品种类作为额外信息,将得到的正样本、负样本和额外信息通过额外信息增强图嵌入模型来进行学习,得到嵌入向量,作为物品的额外特征一同处理。重采样使用的游走方式是节点嵌入学习中的游走方式,计算物品嵌入向量的方式如下:

其中,

其中,

步骤三、基于步骤一和步骤二得到的用户以及物品特征,对于目标用户和目标物品使用基于搜索的模型,使用自适应算法在用户的历史中检索和目标物品相似度较高的物品。

将步骤一和步骤二得到的用户和物品编码对通过一个自适应的基于搜索的模块来检索需要与目标物品相似的用户历史中的物品。通过计算目标物品的种类和用户历史物品的种类之间的相似度来在用户历史中检索出与目标物品相似的物品。物品相似度的计算是自适应的,从要求较高的硬相似度(极端情况下要求物品种类完全相同)随着训练过程逐步过渡到软相似度(极端情况下完全不相似)。在此种自适应算法下,整个算法架构将形成一种端到端的风格。除了计算目标物品种类和用户历史物品种类的相似度,这种自适应算法还将应用在寻找相似用户上。通过计算目标用户和其他用户历史中相同种类的物品来计算用户之间的相似度,进而检索出与目标用户相似的用户,用这些用户的历史行为作为额外信息进行补充得到更好的效果。

在此基础上,定义基本元素如下:

①物品属性向量x

②用户嵌入向量e

③用户种类c

④用户标识号u和物品标识号i:表示每个不同的用户和物品唯一的标识号的向量,其中u

在此基础上,检索出需要相似的物品:

其中,

寻找相似用户的方法类似:

其中,

步骤四、类似步骤三,使用自适应算法得到与目标用户相似度较高的用户,将这些用户的历史中与目标物品相似度较高的物品检索出来。

对于一个给定的用户u

①物品特征向量

②用户反馈向量

在门循环单元内部,我们会通过如下方式计算隐状态:

h′

在此公式中,W

f

h

在此公式中,W

对于每个集合

其中

步骤五、将检索得到的用户历史序列输入进时间感知的模型中,在此处将用户历史反馈信息和用户历史时间间隔作为特征输入进模型中。

最终用于预测的神经网络为一个智能感知机和一个非线性函数的结合,如下:

其中使用的第一损失函数为:

步骤六、将得到的隐状态输入进多层感知机中进行预测,并根据第一损失函数进行反向传播。

步骤七、将训练完毕的算法模型应用于公开数据集和在线实验中,记录其实验结果,比较其与其他模型的结果的差异。

针对本发明实施例提供的基于时间和图结构的搜索式推荐方法,在三类真实离线公开数据集以及一个真实在线推荐场景中进行了对比实验,试验结果如图2-图5所示。在对比实验时,离线公开数据集选择天猫、支付宝和淘宝等三个来自于真实互联网平台的应用,在线场景选择招商银行“猜你喜欢”推荐场景(“猜你喜欢”推荐场景则是工业界非常重要的一个在线场景)。对于离线公开数据集,对比的基线算法为推荐算法中常用的3种基准方法:深度兴趣网络、深度兴趣进化网络、基于搜索的行为建模三种推荐算法。在离线数据集对比实验中,主要的评测指标为ROC曲线下面积(AUC)、精确度(ACC)、对数损失值(LogLoss),“本文算法-”是在本发明算法中不使用标签技巧的配置,“本文算法+”是在本发明算法中使用图表征学习的配置;对于“猜你喜欢”在线推荐场景,主要的评测指标为点击通过率(CTR)、AUC、平均物品点击率(AIC)和用户点击率(CUR),在比较拓展算法和原算法时,还使用了平均点击次数(CPC),其中下标具有w/o的指标是在剔除完全没有点击的用户之后得到的结果,同时还对拓展实验进行了分桶统计,统计不同历史长度的用户在两个算法下的实验结果对比(CTR的差值指的是拓展算法的CTR结果减原算法的CTR值)。从图2-5中可以观察得出,本发明相比于基线推荐算法的结果可以在效益指标上取得更好的结果,表明本发明技术方案更有效,同时拓展算法也相比于原算法有更好的结果。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

技术分类

06120115918074