掌桥专利:专业的专利平台
掌桥专利
首页

一种基于用户兴趣的自适应推荐方法及装置

文献发布时间:2023-06-19 18:47:50


一种基于用户兴趣的自适应推荐方法及装置

技术领域

本申请涉及智能推荐技术领域,尤其涉及一种基于用户兴趣的自适应推荐方法及装置。

背景技术

随着互联网技术的发展,互联网能够为用户提供各式各样的网络服务。在互联网平台中,用户可以搜索自己需要的内容。同时,为了便于用户获取内容,互联网平台还可以基于用户行为为用户主动推荐内容。

现有技术中,内容推荐方法一般是基于用户行为计算用户的兴趣标签,并对标签做层次化处理,在用户的层次标签里面做兴趣探索,这类探索是基于用户标签多个维度上的扩展探索,例如为用户A匹配的兴趣标签为a标签,a标签和b标签关联度高,则为用户A推荐b标签对应的内容。

现有的内容推荐方法虽然能够满足用户在某个兴趣维度上的内容推荐,但是无法考虑用户自身兴趣的集中分散程度对内容推荐的影响,进而容易导致为用户推荐千篇一律且业务场景效果转化不高的内容。因此,现在亟需一种内容自适应推荐方法,能够依据用户兴趣自适应调整为用户推荐的内容,进而实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率。

发明内容

有鉴于此,本申请提供了一种基于用户兴趣的自适应推荐方法及装置,用以实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率。

其技术方案如下:

第一方面,本申请实施例提供了一种基于用户兴趣的自适应推荐方法,所述方法包括:

根据预先获取的用户行为数据获取用户兴趣标签以及所述用户兴趣标签对应的兴趣权重向量,所述兴趣权重向量用于表征用户对所述用户兴趣标签的感兴趣程度;

根据所述兴趣权重向量计算用户兴趣分散度得分,并根据所述用户兴趣分散度得分确定内容推荐机制;

基于所述内容推荐机制为用户推荐内容。

可选的,所述用户行为数据包括:显性用户行为数据以及隐性用户行为数据;其中所述显性用户行为数据包括:历史搜索数据、历史观看数据、历史点赞数据、历史分享数据以及用户收藏数据中的至少一种,所述隐性用户行为数据包括:曝光未点击数据。

可选的,所述根据预先获取的用户行为数据获取用户兴趣标签以及所述用户兴趣标签对应的兴趣权重向量,包括:

根据所述用户行为数据确定所述用户兴趣标签;

基于所述用户行为数据以及预设的用户行为权重计算所述用户兴趣标签的历史兴趣权重向量;

采用预设的预处理模型对所述历史兴趣权重向量进行降权处理,得到所述兴趣权重向量。

可选的,所述根据所述兴趣权重向量计算用户兴趣分散度得分,包括:

将所述兴趣权重向量进行归一化处理,以得到第一兴趣权重向量;

将所述归一化后的兴趣权重向量中小于预设的兴趣权重阈值的维度值设置为零,并维持所述归一化后的兴趣权重向量中大于或等于所述预设的兴趣权重阈值的维度值,以得到第二兴趣权重向量;

基于预设的用户兴趣分散度得分计算模型计算所述用户兴趣分散度得分,所述用户兴趣分散度得分计算模型为:

可选的,所述根据所述用户兴趣分散度得分确定内容推荐机制,包括:

若所述用户兴趣分散度得分大于预设的兴趣分散度置信值,则确定所述内容推荐机制为优先探索内容推荐机制;

若所述用户兴趣分散度得分小于或等于所述预设的兴趣分散度置信值,则确定所述内容推荐机制为优先兴趣内容推荐机制。

第二方面,本申请实施例提供了一种基于用户兴趣的自适应推荐装置,所述装置包括:

获取模块,用于根据预先获取的用户行为数据获取用户兴趣标签以及所述用户兴趣标签对应的兴趣权重向量,所述兴趣权重向量用于表征用户对所述用户兴趣标签的感兴趣程度;

计算模块,用于根据所述兴趣权重向量计算用户兴趣分散度得分,并根据所述用户兴趣分散度得分确定内容推荐机制;

推荐模块,用于基于所述内容推荐机制为用户推荐内容。

可选的,所述用户行为数据包括:显性用户行为数据以及隐性用户行为数据;其中所述显性用户行为数据包括:历史搜索数据、历史观看数据、历史点赞数据、历史分享数据以及用户收藏数据中的至少一种,所述隐性用户行为数据包括:曝光未点击数据。

可选的,所述获取模块,具体用于:

根据所述用户行为数据确定所述用户兴趣标签;

基于所述用户行为数据以及预设的用户行为权重计算所述用户兴趣标签的历史兴趣权重向量;

采用预设的预处理模型对所述历史兴趣权重向量进行降权处理,得到所述兴趣权重向量。

可选的,所述计算模块包括得分计算子模块;所述得分计算子模块具体用于:

将所述兴趣权重向量进行归一化处理,以得到第一兴趣权重向量;

将所述归一化后的兴趣权重向量中小于预设的兴趣权重阈值的维度值设置为零,并维持所述归一化后的兴趣权重向量中大于或等于所述预设的兴趣权重阈值的维度值,以得到第二兴趣权重向量;

基于预设的用户兴趣分散度得分计算模型计算所述用户兴趣分散度得分,所述用户兴趣分散度得分计算模型为:

可选的,所述计算模块包括机制确定子模块;所述机制确定子模块具体用于:

若所述用户兴趣分散度得分大于预设的兴趣分散度置信值,则确定所述内容推荐机制为优先探索内容推荐机制;

若所述用户兴趣分散度得分小于或等于所述预设的兴趣分散度置信值,则确定所述内容推荐机制为优先兴趣内容推荐机制。

上述技术方案具有如下有益效果:

本申请实施例提供的一种基于用户兴趣的自适应推荐方法,在执行所述方法时,根据预先获取的用户行为数据获取用户兴趣标签以及所述用户兴趣标签对应的兴趣权重向量,所述兴趣权重向量用于表征用户对所述用户兴趣标签的感兴趣程度;根据所述兴趣权重向量计算用户兴趣分散度得分,并根据所述用户兴趣分散度得分确定内容推荐机制;基于所述内容推荐机制为用户推荐内容。由此可知,本申请实施例基于用户兴趣以及用户兴趣的分散程度为用户确定对应的内容推送机制,依据用户兴趣分散度自适应调整为用户推荐的内容,实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率。

本申请实施例还提供了与上述方法相对应的装置,具有与上述方法相同的有益效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种基于用户兴趣的自适应推荐方法的流程示意图;

图2为本申请实施例提供的一种基于用户兴趣的自适应推荐装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率,本申请实施例提供了一种基于用户兴趣的自适应推荐方法,请参阅图1,该方法可以包括:

步骤S100:根据预先获取的用户行为数据获取用户兴趣标签以及用户兴趣标签对应的兴趣权重向量。

具体的,基于预先获取的用户行为数据获取用户兴趣标签及其对应的兴趣权重向量,兴趣权重向量可以表征用户对于该用户兴趣标签的感兴趣程度。

用户行为数据是指用户在使用互联网产品时所产生的相关数据,例如,针对视频网站,用户行为数据可以是用户的历史观看记录、历史点赞记录、收藏记录等等。本申请实施例中用户行为数据可以进一步分为显性用户行为数据与隐性用户行为数据。可以理解的是,显性用户行为数据是指可以直接体现用户兴趣与否的行为数据,例如:点赞数据、不感兴趣数据等;隐性用户行为数据则是无法直接体现用户兴趣与否的行为数据,但其可以间接反应用户的偏好,例如:曝光未点击数据。

作为一种可选项,本申请实施例中显性用户行为数据可以包括:历史搜索数据、历史观看数据、历史点赞数据、历史分享数据以及用户收藏数据中的至少一种;隐性用户行为数据可以包括:曝光未点击数据。

可以理解的是,上述用户行为数据仅作为示例,本领域技术人员能够按照需求对用户行为数据的类目做出调整,例如,新增有效观看时长数据、查看评论行为数据、关注行为数据、取消关注行为数据等等。

需要说明的是,用户行为数据的获取可以参照现有成熟技术,例如通过代码埋点的方式采集相应的行为日志获得初始的用户行为数据,在获得初始的用户行为数据后,还可以对初始的用户行为数据进行清洗过滤,例如,对观看数据中观看时长小于预设阈值的数据进行提出,以保证后续获得的用户兴趣标签的准确性。

在一种可选的实施方式中,上述步骤S100可以包括步骤S101至步骤S103,具体如下:

步骤S101:根据用户行为数据确定用户兴趣标签。

具体的,可以通过预设的行为数据与标签的映射关系从预先建立的标签库中获取用户兴趣标签,也可以通过数据分词提取方法获取用户兴趣标签,此处不限制获取用户兴趣标签的方式。

步骤S102:基于用户行为数据以及预设的用户行为权重计算用户兴趣标签的历史兴趣权重向量。

具体的,本申请实施例针对各个用户兴趣标签预先定义有权重值,由于获取的用户行为数据是当前时间节点之前的数据,继而计算得到的用户兴趣标签的权重也是用户兴趣标签的历史兴趣权重,即对应历史兴趣权重向量。

步骤S103:采用预设的预处理模型对历史兴趣权重向量进行降权处理,得到兴趣权重向量。

具体的,由于获取的历史兴趣权重向量表征是是用户在历史时刻对某一用户兴趣标签的兴趣程度,本申请实施例还可以采用预设的预处理模型对历史兴趣权重向量进行降权处理,得到用户当前的兴趣权重向量,可以理解的是,用户当前的兴趣权重向量是用于表征用户在当前时间节点下对某一兴趣标签的兴趣程度。

具体应用中,预设的预处理模型可以采用时间衰减模型以及热点降权模型,具体的,时间衰减模型为y

需要说明的是,预处理模型还可以使用其他现有的降权模型,此处做出限定。

通过上述步骤S101至步骤S103,可以获取用户兴趣标签以及该用户兴趣标签对应的兴趣权重向量。

步骤S200:根据兴趣权重向量计算用户兴趣分散度得分,并根据用户兴趣分散度得分确定内容推荐机制。

具体的,前述步骤已经获取了用户在平台上的用户兴趣标签及其对应的兴趣权重向量,基于计算获得的兴趣权重向量可以计算用户兴趣分散度得分,用户兴趣分散度得分可以反应用户兴趣所在分散程度,用户兴趣分散度得分越高,说明用户兴趣越广泛,后续可以针对该用户推荐更多的探索内容,在推荐重排过程中加强打散力度。用户兴趣分散度得分越低,说明用户兴趣越集中,后续为用户推荐兴趣类目相关的垂类内容,适当降低探索,降低推荐重排打散力度,提升推荐的精准率。

在一种可选的实施方式中,根据兴趣权重向量计算用户兴趣分散度得分,可以包括步骤S201至步骤S203,具体如下:

步骤S201:将兴趣权重向量进行归一化处理,以得到第一兴趣权重向量。

步骤S202:将归一化后的兴趣权重向量中小于预设的兴趣权重阈值的维度值设置为零,并维持归一化后的兴趣权重向量中大于或等于预设的兴趣权重阈值的维度值,以得到第二兴趣权重向量。

步骤S203:基于预设的用户兴趣分散度得分计算模型计算用户兴趣分散度得分,用户兴趣分散度得分计算模型为:

下面通过一个具体的例子对上述步骤S201至步骤S203进行说明。

假设获得用户的兴趣权重向量为{2.5 3.5 0.5 1.5},分别为用户兴趣标签A、B、C、D的兴趣权重向量,预设的兴趣权重阈值为0.3。

步骤(1):对兴趣权重向量进行归一化处理后得到第一兴趣权重向量为{0.31250.4375 0.0625 0.1875},归一化处理为成熟技术,此处不展开。

步骤(2):对第一兴趣权重向量进行阈值截断处理,得到第二兴趣权重向量为{0.3125 0.4375 0 0}。

步骤(3):基于用户兴趣分散度得分计算模型计算得到用户兴趣分散度得分

需要说明的是,上述用户兴趣分散度得分计算例子仅用于说明计算步骤,涉及的数据仅用于参考,不构成具体的限定。

在一种可选的实施方式中,根据用户兴趣分散度得分确定内容推荐机制具体可以包括:若用户兴趣分散度得分大于预设的兴趣分散度置信值,则确定内容推荐机制为优先探索内容推荐机制;若用户兴趣分散度得分小于或等于预设的兴趣分散度置信值,则确定内容推荐机制为优先兴趣内容推荐机制。

可以理解的是,预设的兴趣分散度置信值可以根据实际业务情况、平台推广上新情况进行动态调整,本申请不限定其具体数值。

需要说明的是,用户兴趣标签可以是一个也可以是多个,随着用户在平台使用的时长增加,用户历史行为越多,历史接触的标签越广泛,后续计算得到的用户兴趣分散度得分也会越精准。当用户兴趣标签较少时,若只有一个用户兴趣标签,此时根据用户兴趣分散度进行后续推荐可能会造成推荐场景的数据转化率较低,探索程度不高,用户粘性下降,因此,可以特别为刚注册使用的用户设置特定的内容推荐方式,如优先探索内容推荐方式,在用户具备一定的历史行为后,历史接触的标签达到预设数量后进行如本申请实施例的基于用户兴趣分散度得分确定内容推荐方式。

步骤S300:基于内容推荐机制为用户推荐内容。

具体的,当内容推荐机制为优先探索内容推荐机制时,可以针对这类用户推荐加重兴趣探索,在推荐重排过程中加强打散力度,为用户推荐范围设计更广的内容,便于用户探索自身爱好,提升推荐场景的数据转化率。当确定内容推荐机制为优先兴趣内容推荐机制时,可以针对这类用户推荐兴趣类目相关的垂类内容,适当降低探索,降低推荐重排打散力度,提升推荐的精准率。

综上所述,本申请实施例提供了一种基于用户兴趣的自适应推荐方法,执行所述方式时,根据预先获取的用户行为数据获取用户兴趣标签以及所述用户兴趣标签对应的兴趣权重向量,所述兴趣权重向量用于表征用户对所述用户兴趣标签的感兴趣程度;根据所述兴趣权重向量计算用户兴趣分散度得分,并根据所述用户兴趣分散度得分确定内容推荐机制;基于所述内容推荐机制为用户推荐内容。由此可知,本申请实施例基于用户兴趣以及用户兴趣的分散程度为用户确定对应的内容推送机制,依据用户兴趣分散度自适应调整为用户推荐的内容,实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率。

与上述方法相对应,本申请实施例还提供了一种基于用户兴趣的自适应推荐装置,图2示出了该装置的结构示意图,该装置可以包括:

获取模块201,用于根据预先获取的用户行为数据获取用户兴趣标签以及用户兴趣标签对应的兴趣权重向量,兴趣权重向量用于表征用户对用户兴趣标签的感兴趣程度;

计算模块202,用于根据兴趣权重向量计算用户兴趣分散度得分,并根据用户兴趣分散度得分确定内容推荐机制;

推荐模块203,用于基于内容推荐机制为用户推荐内容。

作为一种可选的实施方式,用户行为数据包括:显性用户行为数据以及隐性用户行为数据;其中显性用户行为数据包括:历史搜索数据、历史观看数据、历史点赞数据、历史分享数据以及用户收藏数据中的至少一种,隐性用户行为数据包括:曝光未点击数据。

作为一种可选的实施方式,获取模块201,具体用于:

根据用户行为数据确定用户兴趣标签;

基于用户行为数据以及预设的用户行为权重计算用户兴趣标签的历史兴趣权重向量;

采用预设的预处理模型对历史兴趣权重向量进行降权处理,得到兴趣权重向量。

作为一种可选的实施方式,计算模块202包括得分计算子模块;得分计算子模块具体用于:

将兴趣权重向量进行归一化处理,以得到第一兴趣权重向量;

将归一化后的兴趣权重向量中小于预设的兴趣权重阈值的维度值设置为零,并维持归一化后的兴趣权重向量中大于或等于预设的兴趣权重阈值的维度值,以得到第二兴趣权重向量;

基于预设的用户兴趣分散度得分计算模型计算用户兴趣分散度得分,用户兴趣分散度得分计算模型为:

作为一种可选的实施方式,计算模块202还包括机制确定子模块;机制确定子模块具体用于:

若用户兴趣分散度得分大于预设的兴趣分散度置信值,则确定内容推荐机制为优先探索内容推荐机制;

若用户兴趣分散度得分小于或等于预设的兴趣分散度置信值,则确定内容推荐机制为优先兴趣内容推荐机制。

需要说明的是,本申请实施例提供的一种基于用户兴趣的自适应推荐装置中各模块执行的步骤以及相关技术特征与申请实施例所提供方法相对应,装置部分的描述可以参见前述方法部分的实施例,此处不赘述。

综上,本申请实施例提供了一种基于用户兴趣的自适应推荐装置,装置包括:获取模块,用于根据预先获取的用户行为数据获取用户兴趣标签以及用户兴趣标签对应的兴趣权重向量,兴趣权重向量用于表征用户对用户兴趣标签的感兴趣程度;计算模块,用于根据兴趣权重向量计算用户兴趣分散度得分,并根据用户兴趣分散度得分确定内容推荐机制;推荐模块,用于基于内容推荐机制为用户推荐内容。由此可知,本申请实施例基于用户兴趣以及用户兴趣的分散程度为用户确定对应的内容推送机制,依据用户兴趣分散度自适应调整为用户推荐的内容,实现用户兴趣内容的高效推荐,提升推荐场景的数据转化率。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

本领域技术人员可以理解,图所示的流程图仅是本申请的实施方式可以在其中得以实现的一个示例,本申请实施方式的适用范围不受到该流程图任何方面的限制。

在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术分类

06120115691445