掌桥专利:专业的专利平台
掌桥专利
首页

影视个性化海报推荐方法

文献发布时间:2024-04-18 20:01:30


影视个性化海报推荐方法

技术领域

本发明涉及影视推荐技术领域,特别涉及影视个性化海报推荐方法。

背景技术

随着互联网发展,智能电视得到了更大发展空间,智能电视用户的观影需求也日益增长。影视资源的下发不仅要考虑内容质量,也要加入排序方法,尽量从影视内容、海报展示给用户展现更多个性化。

当前,市面上具有影视个性化海报推荐的产品较少,大多还是基于运营编辑的公共海报,然而,公共海报的影视内容、演员海报同质化,即影视内容相同、演员海报也相同,无法满足用户日益增长的观影需求;同质个性化海报虽然满足了用户对个性化海报的需求,但是缺乏深入挖掘用户喜好,没有针对同用户下发相应的个性化内容。

发明内容

本发明所解决的技术问题:提供一种影视个性化海报推荐方法,解决不能针对用户下发相应的个性化海报的问题。

本发明解决上述技术问题采用的技术方案:影视个性化海报推荐方法,包括以下步骤:

S1、构建用户兴趣模型,所述构建用户兴趣模型包括获取用户数据、提取特征数据、特征数据处理、模型构建、验证模型和部署模型;

S2、分析用户历史观影记录,统计演员出现的频次,按照频次降序排列,取前N个演员作为用户喜欢的演员列表;

S3、获取影视推荐列表,并获取影视推荐列表中的每一部影视的基础数据,利用所述用户兴趣模型预测用户对所述影视推荐列表中的每一部影视的喜欢概率,选取喜欢概率由大到小排名前M部影视作为针对用户的影视列表;

S4、针对用户的影视列表中的每一部影视,若影视演员集合与用户喜欢的演员列表存在交集,则向用户下发所述影视包含交集中用户最喜欢的演员的海报,否则下发公共海报。

进一步的,所述用户数据包括历史喜欢的影视列表、用户VIP值、影视VIP值、影视id、导演、演员、上映地区、影视题材、影视上映时间、影视类型、播放量、标签和海报分数。

进一步的,所述提取特征数据包括提取第一预设时间内的历史喜欢的影视的特征集合,所述特征包括导演、演员、上映地区和影视题材。

进一步的,所述特征处理包括计算待预测影视的特征与特征集合的交集,并进行归一化处理,再计算归一化后的交集与待预测影视所有演员的比率;将用户VIP值、影视VIP值、影视上映时间和影视海报分数进行归一化数据处理;以及将历史喜欢的影视列表、影视id和影视类型进行数值化。

进一步的,所述数值化包括将历史喜欢的影视列表中的每一部影视以影视id值进行表示,统计第二预设时间内的播放量由高到低排列的前P部影视的播放量,并将播放量归一化处理,记为sum_count,将影视id关联播放量sum_count,统计媒体资源库中每种类型的部数,并将部数归一化处理,记为type_count,将影视类型通过其对应的type_count,未关联到的影视id或影视类型对应的数值特征值默认为-1。

进一步的,所述模型构建包括使用机器学习算法GBDT构建模型,并通过梯度下降进行迭代。

进一步的,模型验证采用的数据集分为训练集和测试集,所述测试集为当前时间前A天的数据,训练集为所述前A天的前B天数据。

进一步的,所述部署模型包括将训练好的模型存储到hdfs,格式为PMML文件,数值化的历史喜欢的影视列表、影视id和影视类型以csv格式存储到hdfs,通过spark方法读取csv文件和模型文件。

进一步的,所述基础数据包括影视上映时间、导演、演员、上映地区、影视题材、影视类型、标签、公共海报和个性化海报。

本发明的有益效果:本发明影视个性化海报推荐方法,通过构建用户兴趣模型,利用所示用户兴趣模型从影视列表中选出用户喜欢的影视,即获得针对用户的影视列表,若针对用户的影视列表中的影视演员集合与用户喜欢的演员列表存在交集,则向用户下发包含交集中用户最喜欢的演员的海报,否则返回公共海报,以此为用户提供精准的影视推荐,以及个性化海报,解决了不能针对用户下发相应的个性化海报的问题。

附图说明

图1是本发明影视个性化海报推荐方法的流程示意图。

图2是本发明影视个性化海报推荐方法中加载用户兴趣模型完成个性化海报推荐的流程示意图。

具体实施方式

本发明影视个性化海报推荐方法,如图1所示,包括以下步骤:

S1、构建用户兴趣模型,所述构建用户兴趣模型包括获取用户数据、提取特征数据、特征数据处理、模型构建、验证模型和部署模型;

具体的,所述用户特征数据包括历史喜欢的影视列表、用户VIP值、影视VIP值、影视id、导演、演员、上映地区、影视题材、影视上映时间、影视类型、标签和海报分数;其中,标签为0或1,0表示用户不喜欢,1表示用户喜欢;海报分数通过Mongodb表获取;影视类型可以划分为六类,分别为电视剧、电影、综艺、少儿、动漫和纪录片。

所述提取特征数据包括提取第一预设时间内的历史喜欢的影视的特征集合,所述特征包括导演、演员、上映地区和影视题材,所述第一预设时间可以为最近一个月或最近两个月等。例如,第一预设时间为最近一个月,导演用historyi_director表示,演员用historyi_actor表示,上映地区用historyi_area表示,题材用historyi_genre表示,其中i表示影视列表中的第i部影视,则导演集合为historyi_director的并集,用director_his表示;演员集合为historyi_actor的并集,用actor_his表示;上映地区集合为historyi_area的并集,用area_his表示;题材集合为historyi_genre的并集,用genre_his表示。

所述特征处理包括计算待预测影视的特征与特征集合的交集,并进行归一化处理,再计算归一化后的交集与待预测影视所有演员的比率;将用户VIP值、影视VIP值、影视上映时间和影视海报分数进行归一化数据处理;以及将历史喜欢的影视列表、影视id和影视类型进行数值化。例如,待预测影视的演员记为actor,演员交集记为actor_inter,演员比率记为actor_sim,则actor_inter=actor∩actor_his,actor_sim=length(actor_inter)÷

length(actor),其中length表示归一化后的处理后的值,同理可求得导演比率、上映地区比率和影视题材比率;将用户VIP值、影视VIP值、影视上映时间和影视海报分数进行归一化数据处理,归一化区间为[-1,1];所述数值化包括将历史喜欢的影视列表中的每一部影视以影视id值进行表示,统计第二预设时间内的播放量由高到低排列的前P部影视的播放量,并将播放量归一化处理,记为sum_count,将影视id关联播放量sum_count,统计媒体资源库中每种类型的部数,并将部数归一化处理,记为type_count,将影视类型通过其对应的type_count,未关联到的影视id或影视类型对应的数值特征值默认为-1,所述第二预设时间可以为7天或8天等。

所述模型构建包括使用机器学习算法GBDT构建模型,并通过梯度下降进行迭代。

具体的,以演员比率、导演比率、上映地区比率、影视题材比率、归一化后的用户VIP值、归一化后的影视VIP值、归一化后的影视上映时间、归一化后的影视海报分数、数值化后的影视id以及数值化后的影视类型作为输入,标签作为输出,对构建的模型进行训练。

所述模型验证采用的数据集分为训练集和测试集,所述测试集为当前时间前A天的数据,训练集为所述前A天的前B天数据,例如当前时间前1天数据作为测试集,前2和3天的数据作为训练集。

所述部署模型包括将训练好的模型存储到hdfs,格式为PMML文件,数值化的历史喜欢的影视列表、影视id和影视类型以csv格式存储到hdfs,通过spark方法读取csv文件和模型文件。

S2、分析用户历史观影记录,统计演员出现的频次,按照频次降序排列,取前N个演员作为用户喜欢的演员列表;

具体的,N为正整数,可针对用户设定。

S3、获取影视推荐列表,并获取影视推荐列表中的每一部影视的基础数据,利用所述用户兴趣模型预测用户对所述影视推荐列表中的每一部影视的喜欢概率,选取喜欢概率由大到小排名前M部影视作为针对用户的影视列表;

具体的,影视推荐列表可以是影视平台推荐的热播列表、电影列表、电视剧列表、背景播、全网热播、VIP专区、卫视热播、大家都在看等,通过用户兴趣模型从影视推荐列表中选出用户喜欢的影视,作为针对用户的影视列表,以此提高推荐效果,所述基础数据包括影视上映时间、导演、演员、上映地区、影视题材、影视类型、标签、公共海报和个性化海报,其中个性化海报是指包含有特定演员的海报,所述M为预设值,可以为10或20等。

S4、针对用户的影视列表中的每一部影视,若影视演员集合与用户喜欢的演员列表存在交集,则向用户下发所述影视包含交集中用户最喜欢的演员的海报,否则下发公共海报。

具体的,交集中用户最喜欢的演员为在用户喜欢的演员列表中排名最前面的演员,针对用户的影视列表以及下发的海报存储在HBase表中,内容和海报用下划线连接。

本发明聚焦用户本身,分析用户观影数据、交互数据,提取特征,通过机器学习建模拟合特征数据,以达到对预选的影视列表进行个性化排序;同时分析出用户喜欢的演员列表,对用户下发对应喜欢的演员海报,达到影视个性化海报推荐的目的。

实施例:

在部署好用户兴趣模型后,加载用户兴趣模型完成个性化海报推荐的流程如图2所示,具体包括以下步骤:

首先,获取影视推荐列表中所有影视,加载用户兴趣模型,得到用户对影视推荐列表中的每一部影视的喜欢概率,选取喜欢概率由大到小排名前M部影视作为针对用户的影视列表。

其次,获取用户历史观影记录,统计演员出现的频次,按照频次降序排列,取前N个演员作为用户喜欢的演员列表。

最后,计算针对用户的影视列表中每一部影视的演员集合与用户喜欢的演员列表的交集,若交集为空,则下发公共海报,若交集不为空,则在交集的演员中选出在用户喜欢的演员列表中排名最前面的演员,作为用户最喜欢的演员,下发包含交集中用户最喜欢的演员的海报。

相关技术
  • 具有冷却系统的轴向分段式外转子永磁电机螺旋桨
  • 电机直驱车轴的转向架及具有该转向架的轨道车辆
  • 轴向电机系统及具有其的车辆
  • 轴向电机系统及具有其的车辆
技术分类

06120116561329