掌桥专利:专业的专利平台
掌桥专利
首页

物品推荐方法、计算机设备及计算机可读存储介质

文献发布时间:2023-06-19 13:46:35


物品推荐方法、计算机设备及计算机可读存储介质

技术领域

本申请涉及数据处理技术领域,尤其涉及一种物品推荐方法、计算机设备及计算机可读存储介质。

背景技术

推荐系统作为一种筛选信息的工具,存在于海量数据的基础上,可以有效解决信息过载的问题。推荐系统可以通过推荐算法从海量数据中挖掘出用户感兴趣的项目(如信息、服务、物品等),并将结果推荐给用户,以满足用户的需求。

现有的协同过滤算法虽然可以减缓数据稀疏性和冷启动对推荐结果的影响,但是并没有考虑用户的兴趣可能发生变化或者物品的热度衰减等因素,导致推荐效果不佳,影响用户使用体验。

发明内容

有鉴于此,有必要针对物品推荐的准确性不高的技术问题,提供一种物品推荐方法、计算机设备及计算机可读存储介质。

本申请一实施例提供一种物品推荐方法,包括:获取多个待选物品的评价信息;利用预设主题模型对多个待选物品的评价信息进行主题提取,得到每一评价信息的评论主题分布;获取每一评价信息与目标用户的关联关系,关联关系包括评价得分指标、兴趣变化指标、热度衰减指标中的至少一者;根据关联关系及每一评价信息的评论主题分布得到与目标用户对应的偏好主题分布;基于目标用户的偏好主题分布计算得到多个待选物品中的每个待选物品的预测评分;根据每个待选物品的预测评分从多个待选物品中选取至少一个物品推荐给目标用户。

在一些实施例中,物品推荐方法还包括:对评价信息进行预处理,预处理包括分词处理、停用词剔除处理、词性标注处理、大小写转换处理、词性还原处理、词干提取处理中的至少一种;将经过预处理的评价信息进行文本向量化处理,得到与评价信息对应的向量。

在一些实施例中,将经过预处理的所述评价信息进行文本向量化处理,包括:基于经过预处理的多个评价信息构建文本集;利用预设词频统计算法从文本集中提取不重复的词,及基于提取到的词构建词库表,其中所述词库表包括V个词,V为正整数;基于预设比对规则将经过预处理的评价信息与所述词库表进行比对,得到与评价信息对应的V维向量;其中,预设比对规则包括:若评价信息包括词库表中的某个词,则词库表中的该词计数加n,n为该词在评价信息中出现的次数,n为正整数,若评价信息不包括词库表中的某个词,则词库表中的该词计数加0。

在一些实施例中,预设主题模型为LDA主题模型,与目标用户对应的偏好主题分布通过以下算式计算得到:

其中,P

在一些实施例中,目标用户u对待选物品i的评价得分指标基于目标用户u对待选物品i的评分换算得到,目标用户u对待选物品i的兴趣变化指标基于目标用户u对待选物品i的评分时间换算得到,目标用户u对待选物品i的热度衰减指标基于待选物品i的被评分时间跨度、被用户u点击次数、被用户u评论次数及被用户u浏览时长换算得到。

在一些实施例中,基于目标用户的偏好主题分布计算得到多个待选物品中的每个待选物品的预测评分,包括:构建与目标用户近邻的相似用户集,其中相似用户集包括至少一个相似用户;基于目标用户所评价的历史平均评分、相似用户所评价的历史平均评分、相似用户对待选物品的评分、待选物品的热度、目标用户的偏好主题分布及相似用户的偏好主题分布计算得到待选物品的预测评分。

在一些实施例中,待选物品的预测评分通过以下算式计算得到:

其中,Pre为待选物品i的预测评分,u

在一些实施例中,根据每个待选物品的预测评分从多个待选物品中选取至少一个物品推荐给目标用户,包括:获取目标用户的历史购买记录信息;根据每个待选物品的预测评分及历史购买记录信息从多个待选物品中,选取预测评分排名前预设位且目标用户未购买过的物品推荐给目标用户。

本申请一实施例提供一种计算机设备,包括处理器及存储器,存储器上存储有若干计算机程序,处理器用于执行存储器中存储的计算机程序时实现上述物品推荐方法的步骤。

本申请一实施例还提供一种计算机可读存储介质,计算机可读存储介质存储有多条指令,多条所述指令可被一个或者多个处理器执行,以实现上述物品推荐方法的步骤。

与现有技术相比,上述物品推荐方法,基于相识用户群体的喜好来推荐目标用户感兴趣的物品,且考量了目标用户的兴趣变化情况、用户的评价得分以及物品的热度衰减等因素的影响,物品推荐更精准,推荐效果更佳。

附图说明

图1是本申请一实施方式的物品推荐方法的应用环境图。

图2是本申请一实施方式的物品推荐方法的流程图。

图3是本申请一实施方式的物品推荐装置的功能模块图。

图4是本申请一实施方式的电子设备的结构示意图。

主要元件符号说明

如下具体实施方式将结合上述附图进一步说明本申请。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

进一步需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

图1为本申请一实施例的物品推荐方法的应用环境图。参照图1,物品推荐方法应用于物品推荐系统。物品推荐系统可以包括终端11和服务器12,终端11可以是目标用户使用的电子设备。终端11和服务器12通过有线网络或无线网络连接。终端11具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器12可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

物品推荐系统是一种以海量数据挖掘为基础的关联用户和物品的一种工具,它能够在信息过载的环境中帮助用户筛选他们感兴趣的信息,为用户提供个性化的决策支持和信息服务。物品推荐系统可以指为用户进行商品(如食品、生活用品、电子产品、衣服等)推荐、音视频内容推荐、文章推荐等。本申请对此不作限定。

图2为本申请一实施方式中物品推荐方法的流程图。本实施例以该方法应用于上述图1中的服务器12来举例说明,根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。

步骤S20、获取多个待选物品的评价信息。

在一些实施例中,多个待选物品可以是预先设定的推荐给目标用户的候选物品,例如多个待选物品可以是某购物网站或某购物应用上售卖的多个物品。用户通过电子设备在某购物网站或某购物应用上购买物品时,一般会经过点击-查看-购买-评论中的某些步骤。该购物网站或该购物应用的服务器存储有其售卖的多个物品的评价信息,进而可以从该服务器上获取得到多个待选物品的评价信息。

在一些实施例中,当获取得到待选物品的评价信息时,可以对评价信息进行预处理。预处理可以包括分词处理、停用词剔除处理、词性标注处理、大小写转换处理、词性还原处理、词干提取处理中的至少一种。例如,对于中文文本的评价信息,预处理可以包括:分词处理;停用词剔除处理;词性标注处理。对于英文文本的评价信息,预处理可以包括:大小写转换处理(将所有单词统一转化为小写),如“Like”和“like”可以识别为一个词;停用词剔除处理,如剔除“is”、“,”、“@”、“、”、“:”、“in”、“a”等;使用设置了各种形式下对应的词性类型的标注器进行词性标注处理,如后缀有“ly”的一般为副词,后缀有“ness”一般为名词等;词性还原处理得到词汇的基础形态,如将“catching”处理为“catch”;词干提取处理,如将“apples”处理为“apple”。

在一些实施例中,当对评价信息进行预处理之后,还可以将经过预处理的评价信息进行文本向量化处理,得到与评价信息对应的向量。例如,可以通过以下方式实现对每一评价信息进行文本向量化处理:基于经过预处理的多个评价信息构建文本集;利用预设词频统计算法从文本集中提取不重复的词,及基于提取到的词构建词库表,其中词库表包括V个词,如词库表可以表示为{词

步骤21、利用预设主题模型对多个待选物品的评价信息进行主题提取,得到每一评价信息的评论主题分布。

在一些实施例中,预设主题模型可以是潜在狄利克雷分配(Latent DirichletAllocation,LDA)主题模型。LDA主题模型可以将文档集中每篇文档的主题按照概率分布的形式给出。多个待选物品的评价信息可以被整理成文档集的形式,例如,可以将每条评价信息视为或整理成一篇文档,将所有文档放入LDA主题模型之中,LDA可以将每条评价信息的主题按照概率分布的形式给出,即为每一评价信息的评论主题分布。

步骤22、获取每一评价信息与目标用户的关联关系。

在一些实施例中,目标用户为当前物品推荐的目标对象,例如可以是指正在使用物品推荐系统的用户。关联关系可以包括评价得分指标、兴趣变化指标、热度衰减指标中的至少一者。以下以关联关系包括评价得分指标、兴趣变化指标及热度衰减指标为例进行说明。

在一些实施例中,每条评价信息是一用户对某一物品的评价,评价得分指标可以表征用户对物品的喜爱程度,可以通过对用户的评价得分进行0~1标准化处理得到。例如,某一物品的评价得分指标可以通过下述算式(i)计算得到:

其中,A

在一些实施例中,兴趣变化指标可以用于预测用户对物品的兴趣变化,可以通过对用户的评论时间进行0~1标准化处理得到。例如,某一物品的兴趣变化指标可以通过下述算式(ii)计算得到:

其中,B

在一些实施例中,热度衰减指标可以用于预测物品的热度衰减变化,可以基于物品的被评分时间跨度、被用户点击次数、被用户评论次数及被用户浏览时长换算得到。例如,某一物品的热度衰减指标可以通过下述算式(iii)计算得到:

其中,C

步骤23、根据关联关系及每一评价信息的评论主题分布得到与目标用户对应的偏好主题分布。

在一些实施例中,可以基于评价信息与目标用户的关联关系将评价信息的评论主题分布转换为与该目标用户对应的偏好主题分布,与目标用户对应的偏好主题分布可以通过以下算式(iv)计算得到:

其中,P

步骤24、基于目标用户的偏好主题分布计算得到多个待选物品中的每个待选物品的预测评分。

在一些实施例中,待选物品的预测评分可以用于表征目标用户对该物品的购买意向程度,预测评分越高,表明该物品与目标用户匹配度越高,达成交易的可能性越高。

在一些实施例中,可以通过构建与目标用户近邻的相似用户集,其中相似用户集包括至少一个相似用户,基于目标用户所评价的历史平均评分(如在该购物网站或购物应用上所提交的所有评分的平均值)、相似用户所评价的历史平均评分、相似用户对待选物品的评分、待选物品的热度、目标用户的偏好主题分布及相似用户的偏好主题分布计算得到待选物品的预测评分。相似用户可以是指与目标用户具有相识用户画像的用户,用户画像所包括的信息可以是:年龄、性别、职业、所在城市、历史购买记录等,相似用户也可以是指与目标用户具有交集的用户(如目标用户的好友列表/通讯录中的用户)。

在一些实施例中,每个待选物品的预测评分均可以通过以下算式(v)计算得到:

其中,Pre为待选物品i的预测评分,u

步骤25、根据每个待选物品的预测评分从多个待选物品中选取至少一个物品推荐给目标用户。

在一些实施例中,当计算得到每个待选物品的预测评分时,可以根据预测评分高低进行排序,将预测评分较高的m个(例如排名前m位)待选物品推荐给目标用户。

在一些实施例中,可以获取目标用户的历史购买记录信息,及根据每个待选物品的预测评分及目标用户的历史购买记录信息从多个待选物品中,选取预测评分排名前预设位且目标用户未购买过的物品推荐给目标用户,可进一步提升物品的推荐效果。

上述物品推荐方法,基于相识用户群体的喜好来推荐目标用户感兴趣的物品,且考量了目标用户的兴趣变化情况、用户的评价得分以及物品的热度衰减等因素的影响,物品推荐更精准,推荐效果更佳。

基于与上述实施例中的物品推荐方法相同的思想,本申请还提供物品推荐装置,该装置可用于执行上述物品推荐方法。为了便于说明,物品推荐装置实施例的结构示意图中,仅仅示出了与本申请实施例相关的部分,本领域技术人员可以理解,图示结构并不构成对该装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图3所示,物品推荐装置100包括第一获取模块101、处理模块102、提取模块103、第二获取模块104、转换模块105、计算模块106及推荐模块107。在一些实施例中,上述模块可以为存储于存储器中且可被处理器调用执行的可程序化软件指令。可以理解的是,在其他实施方式中,上述模块也可为固化于处理器中的程序指令或固件(firmware)。

第一获取模块101用于获取多个待选物品的评价信息。

处理模块102用于对评价信息进行预处理与文本向量化处理,得到与评价信息对应的向量。

在一些实施例中,预处理可以包括分词处理、停用词剔除处理、词性标注处理、大小写转换处理、词性还原处理、词干提取处理中的至少一种。处理模块102可以基于经过预处理的多个评价信息构建文本集,利用预设词频统计算法从文本集中提取不重复的词,及基于提取到的词构建词库表,再基于预设比对规则将经过预处理的评价信息与词库表进行比对,得到与评价信息对应的V维向量。

提取模块103用于利用预设主题模型对多个待选物品的评价信息进行主题提取,得到每一评价信息的评论主题分布。例如预设主题模型可以是LDA主题模型。

第二获取模块104用于获取每一评价信息与目标用户的关联关系。其中,关联关系可以包括评价得分指标、兴趣变化指标、热度衰减指标中的至少一者。

转换模块105用于根据该关联关系及每一评价信息的评论主题分布得到与目标用户对应的偏好主题分布。

计算模块106用于基于目标用户的偏好主题分布计算得到多个待选物品中的每个待选物品的预测评分。

在一些实施例中,计算模块106可以构建与目标用户近邻的相似用户集,其中相似用户集包括至少一个相似用户,及基于目标用户所评价的历史平均评分、相似用户所评价的历史平均评分、相似用户对待选物品的评分、待选物品的热度、目标用户的偏好主题分布及相似用户的偏好主题分布计算得到待选物品的预测评分。

推荐模块107用于根据每个待选物品的预测评分从多个待选物品中选取至少一个物品推荐给目标用户。

在一些实施例中,推荐模块107可以获取目标用户的历史购买记录信息,及根据每个待选物品的预测评分及历史购买记录信息从多个待选物品中,选取预测评分排名前预设位且目标用户未购买过的物品推荐给目标用户。

参考图4,为本申请一实施例提供的电子设备10的硬件结构示意图。如图4所示,电子设备10可以包括处理器1001、存储器1002及通信总线1003。存储器1002用于存储一个或多个计算机程序1004。一个或多个计算机程序1004被配置为被处理器1001执行。该一个或多个计算机程序1004包括指令,上述指令可以用于实现在电子设备10中执行如图2所述的物品推荐方法。

处理器1001可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器等。

存储器1002可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。

可以理解的是,本实施例示意的结构并不构成对电子设备10的具体限定。在另一些实施例中,电子设备10可以包括比图示更多或更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。

本实施例还提供一种计算机存储介质,该计算机存储介质中存储有计算机指令,当该计算机指令在电子设备上运行时,使得电子设备执行上述相关方法步骤实现上述实施例中的物品推荐方法。

本实施例还提供了一种计算机程序产品,当该计算机程序产品在计算机上运行时,使得计算机执行上述相关步骤,以实现上述实施例中的物品推荐方法。

通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例是示意性的,例如,该模块或单元的划分,为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。

技术分类

06120113807712