掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明涉及视频推荐技术领域,尤其涉及一种基于负反馈的用户反感标签确定方法。

背景技术

随着互联网技术的快速发展,人们能够方便的浏览大量的网络信息资源,比如视频资源。如何为用户从海量的视频资源中挑选自己感兴趣的视频播放成了目前一个热门的研究方向。

传统的视频推荐方法中有基于标签的协同过滤推荐算法。这种方法让用户给物品打标签,当一个用户对一个物品打上了标签,这个标签一方面描述了用户的兴趣,另一方面则表示了物品的语义。该方法一般根据标签频次计算用户-标签、项目-标签的相似度,从而生成用户推荐。

然而现有技术存在以下问题:

目前,许多视频推荐系统仅仅考虑用户喜欢的视频,并据此推荐相似的视频,并没有关注用户不喜欢的视频。这种做法仅考虑了正向反馈信息而忽视了负向反馈信息。对于推荐系统而言,应该充分利用负反馈信息来过滤用户不喜欢的项目,并对剩余用户较为喜欢的项目进行推荐,从中选择一个或者多个用户最喜欢的项目,这样可以在一定程度上提高推荐效率和精度。

此外,基于标签的视频推荐算法,尚未存在一种行之有效的能够确定用户标签反感程度的计算方法。

发明内容

本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。

鉴于上述现有存在的问题,提出了本发明。

因此,本发明提供了一种基于负反馈的用户反感标签确定方法,通过计算相关视频关联标签的权重大小,确定用户反感标签的方法,以解决现有对基于标签的视频推荐系统中,负反馈方式无法整合,负反馈算法准确性差不能实时计算的问题。

为解决上述技术问题,本发明提供如下技术方案,一种基于负反馈的用户反感标签确定方法,包括:

采集数据信息,根据数据信息设置滑动时间窗;

获取时间窗内用户的负反馈行为关联视频数据,统计单个标签频次、总标签频次;

计算用户视频反感权重,获取用户标签反感权重;

计算用户标签反感程度值,确定用户最终反感标签。

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述数据信息包括,用户每天的负反馈视频数据、负反馈视频播放起始时间、负反馈视频关联标签集。

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述设置滑动时间窗包括,根据设置的滑动时间窗大小收集用户当前周期的负反馈行为数据,结合边缘端进行设备本体辨识及扫描,将设备基本信息按照预置模板进行结构化录入,完成本地注册上送云端并获取初始化配置表。

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述负反馈行为关联视频数据包括,数据采集对象是用户播放时间较短、用户未观看以及用户播放后具有明确反感倾向的视频项目,将限定用户播放时间阈值作为判断依据当用户播放视频后,视频播放时间超过规定阈值时或用户设置视频为负反馈视频时,所述视频直接判定为负反馈行为数据。

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述负反馈行为关联视频数据还包括,用于计算的负反馈行为数据集具有以下数据结构:

对于某一天

对于某条视频

所述计算用户视频反感权重表示用户对视频的反感情况,具体的计算方式如下:

其中,

所述计算通过采用用户未播放视频时间在总未播放视频时间的权重表示用户当天对视频j的反感情况。

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述用户标签反感权重的计算依赖于用户视频反感权重,计算用户标签反感权重具体方式如下所示:

,/>

其中,

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述用户标签反感权重的计算包括,获取第i天的标签t

其中,

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述用户标签反感权重的计算还包括,获取标签频率指数

其中,

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述用户反感程度值计算公式如下:

其中,

作为本发明所述的基于负反馈的用户反感标签确定方法的一种优选方案,其中:所述用户反感程度包括,针对每个单位时间窗内出现的负反馈行为视频数据,计算其中每个标签的用户反感程度值

本发明的有益效果:本发明的用户反感标签计算方法具有实时性高的特点,通过一个动态的时间窗,不断计算用户近期的反感意图,能够准确表达用户近期的负反馈指向,降低向用户推荐反感视频比例。本发明独创了用户标签反感权重这一概念,考虑通过基于用户未播放视频时间来量化用户对不同视频的反感程度,进而结合视频的关联标签集给予处于不同视频下同一标签不同的反感权重,最终计算得出用户标签反感权重。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。其中:

图1为本发明一个实施例提供的一种基于负反馈的用户反感标签确定方法流程示意图;

图2为本发明一个实施例提供的一种基于负反馈的用户反感标签确定方法的实验对比示意图;

图3为本发明一个实施例提供的一种基于负反馈的用户反感标签确定方法的又一个实验对比示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。

其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。

本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。

同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

实施例1

参照图1,为本发明的第一个实施例,该实施例提供了一种基于负反馈的用户反感标签确定方法,包括:

S1:采集数据信息,根据数据信息设置滑动时间窗。

更进一步的,所述数据信息包括,用户每天的负反馈视频数据、负反馈视频播放起始时间、负反馈视频关联标签集。

应说明的是,所述设置滑动时间窗包括,根据设置的滑动时间窗大小收集用户当前周期的负反馈行为数据,结合边缘端进行设备本体辨识及扫描,将设备基本信息按照预置模板进行结构化录入,完成本地注册上送云端并获取初始化配置表。

S2:获取时间窗内用户的负反馈行为关联视频数据,统计单个标签频次、总标签频次。

更进一步的,所述负反馈行为关联视频数据包括,数据采集对象是用户播放时间较短、用户未观看以及用户播放后具有明确反感倾向的视频项目,将限定用户播放时间阈值作为判断依据当用户播放视频后,视频播放时间超过规定阈值时或用户设置视频为负反馈视频时,所述视频直接判定为负反馈行为数据。

应说明的是,所述负反馈行为关联视频数据还包括,用于计算的负反馈行为数据集具有以下数据结构:

S3:计算用户视频反感权重,获取用户标签反感权重。

更进一步的,所述计算用户视频反感权重表示用户对视频的反感情况,具体的计算方式如下:

其中,

应说明的是,所述计算通过采用用户未播放视频时间在总未播放视频时间的权重表示用户当天对视频j的反感情况。

更进一步的,所述用户标签反感权重的计算依赖于用户视频反感权重,计算用户标签反感权重具体方式如下所示:

其中,

更进一步的,所述用户标签反感权重的计算包括,获取第i天的标签t

其中,

应说明的是,所述用户标签反感权重的计算还包括,获取标签频率指数

其中,

S4:计算用户标签反感程度值,确定用户最终反感标签。

更进一步的,所述用户反感程度值计算公式如下:

其中,

应说明的是,所述用户反感程度包括,针对每个单位时间窗内出现的负反馈行为视频数据,计算其中每个标签的用户反感程度值

实施例2

参照图2和3,为本发明的一个实施例,提供了一种基于负反馈的用户反感标签确定方法,为了验证本发明的有益效果,通过实验进行科学论证。

本实施例实验采用MovieLens 1M数据集。该数据集含有来自6000名用户对4000部电影的100万条评分数据。本实验把数据集的按 7:3 分成两部分, 前 70% 作为训练集,后 30% 作为正确答案。 经过算法训练将候选集推荐给用户。最后将推荐列表和正确答案比对。

如图2所示,本实施例将使用基于物品的协同过滤推荐算法作为基本算法1,通过对比前后是否采用反感标签确定方法,综合分析本发明专利的准确性与优化性,实验结论如图。

如图3所示,本实施例还将使用基于用户的协同过滤推荐算法作为基本算法2,通过对比前后是否采用反感标签确定方法,综合分析本发明专利的准确性与优化性,实验结论如图。

可以看到采用基于负反馈的用户反感标签确定方法同基于物品的协同过滤方法和基于用户的系统过滤其指标趋势一致,且将负反馈引入后,本实施例所提供方法的F

本发明是一种基于负反馈的用户反感标签确定方法技术,主要用于用户反感标签计算。本方法首先采集数据信息,根据数据信息设置滑动时间窗,通过获取时间窗内用户的负反馈行为关联视频数据,统计单个标签频次、总标签频次,计算用户视频反感权重并获取用户标签反感权重,再计算用户标签反感程度值,确定用户最终反感标签。

应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例,或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。

本申请是参照根据本申请实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框,以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

技术分类

06120115938249