掌桥专利:专业的专利平台
掌桥专利
首页

一种基于用户行为的评分方法、装置计算机设备及存储介质

文献发布时间:2023-06-19 10:32:14


一种基于用户行为的评分方法、装置计算机设备及存储介质

技术领域

本发明属于用户行为分析的技术领域,具体涉及一种基于用户行为的评分方法、装置计算机设备及存储介质。

背景技术

在当前信息数据膨胀的背景下,利用大数据来分析用户的行为,评判用户对于某一个行业或者产品的偏好程度,进而针对该用户进行精准的营销推荐,越来越成为市场中的主流方式。

在现有的技术中,通常是基于TGI、聚类、网络图谱分析、特征逻辑组合等这类方法来实现目标。TGI通常考虑单维度特征覆盖人群的倾向性,而单个特征并不足以准确的刻画人群,难以达到客观全面的要求。聚类算法对离群点、数据噪声敏感,无法准确体现数据中不同兴趣人群实际上的交互信息。网络图谱分析,难以确定其依赖的拓扑关系,有时会很模糊,不适合做人群的精准定位。特征逻辑组合,主要依赖使用者的人工经验,具有较强的主观性限制。

发明内容

本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种基于用户行为的评分方法、装置计算机设备及存储介质,既能够考察用户对某个行业或产品的偏好性,也可以量化并累计用户各种类别行为的影响。

为了解决上述技术问题,本发明采用的技术方案为:一种基于用户行为的评分方法,包括:S101、预估种子用户对某个行为特征的兴趣度;S102、预估种子用户在上述行为特征的综合兴趣度;S103、计算周期内用户的行为积分;S104、将用户按照行为积分排序,得分最高的用户,即为业务降本和扩量的目标客户。

优选地,所述预估种子用户对某个行为特征的兴趣度之前,包括:收集待评价标签的主要行为特征;根据主要行为特征确定种子用户,所述种子用户至少包括两人。

优选地,所述预估种子用户对某个行为特征的兴趣度,具体包括:根据每个种子用户的单个行为特征覆盖种子用户量,除以单个行为特征覆盖全量用户总量,计算每个行为特征的影响力系数r

式(1)中,

优选地,所述预估种子用户在上述行为特征的综合兴趣度,具体包括:计算多组种子用户在同一个标签上的综合兴趣度w

优选地,所述计算周期内用户的行为积分,具体包括:叠加单个用户访问行为特征的天数、频次信息,累计用户周期内全量行为特征的系数,预估任一用户成为目标客户的得分:

相应地,一种基于用户行为的评分装置,包括:第一预估单元:预估种子用户对某个行为特征的兴趣度;第二预估单元:预估种子用户在上述行为特征的综合兴趣度;积分计算单元:计算周期内用户的行为积分;积分排序单元:将用户按照行为积分排序,得分最高的用户,即为业务降本和扩量的目标客户。

优选地,所述的一种基于用户行为的评分方法,包括:特征数据收集单元:收集待评价标签的主要行为特征;用户数据收集单元:根据主要行为特征确定种子用户,所述种子用户至少包括两人。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于用户行为的评分方法。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于用户行为的评分方法。

本发明与现有技术相比具有以下有益效果:

1、本发明一种基于用户行为的评分方法、装置计算机设备及存储介质,逆向使用PCA原理,先由目标人群的画像分析,确定目标人群的主要特征,再由主要特征直接或间接筛选训练样本,由多个训练样本分别计算人群的各个特征对应的特征向量,由此得到每个行为特征的权重系数;最后根据单个用户的全量特征行为,结合其对应权重系数,计算用户倾向性积分,从而解决精准推荐的问题,本评分方法将各个行为特征对目标人群的影响量化处理,并且综合所有行为特征的影响值,本发明既能规避数据颗粒度较粗的缺点,又能充分挖掘、利用用户多样行为多样性的优点,在保证效果的基础上实现扩量、降本的需求,充分挖掘潜在的营销客户,具有极强的实用性。

2、易理解,相当于已知PCA的主成分,求特征向量(各个行为特征系数),再由该系数,计算单个用户的累计行为特征系数值。

3、便操作,无复杂的计算,对特征维度缺失不敏感,不存在过拟合情况,不受数据量纲影响。

4、覆盖人群广,任一用户只要存在一个特征行为,都可以由其所对应的行为系数得到一个综合的偏向性得分。

5、模型稳定性高,短时间内人群的特征行为相对稳定,因此,某个人群的积分模型中,各个行为特征的系数也会相对稳定,具体某个人特征行为的差异,但都可通过积分值体现出来。因此,该模型总能稳定地反应,近期对目标业务最感兴趣的人群。

附图说明

下面结合附图对本发明做进一步详细的说明;

图1为本发明实施例一提供的一种基于用户行为的评分方法的流程示意图;

图2为本发明实施例二提供的一种基于用户行为的评分方法的流程示意图;

图3为本发明实施例一提供的一种基于用户行为的评分装置的结构示意图;

图4为本发明实施例二提供的一种基于用户行为的评分装置的结构示意图;

图中:101为第一预估单元,102为第二预估单元,103为积分计算单元,104为积分排序单元,105为特征数据收集单元,106为用户数据收集单元。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

业务人群的行为画像,可以看作是该人群行为数据的主成分,主成分已知的情况下,反过来可以衡量每个行为特征对主成分的贡献度;通过提取部分特征明显的用户作为种子用户,近似替代主成分人群;使用rRDF模型评估总体人群对应的全量行为,给每个行为特征设定一个系数,再综合考量每个用户的具体行为,通过不同的积分公式,来实现所需人群的提取。

目前有四种形式的积分模型:

∑r*R (4)

∑r

∑r*R

∑r*R*D*F (7)

具体地,在设定时间范围的行为数据中,r、R分别代表不同的行为特征对应主成分投影的权重系数,k表示特征系数幂次调节值,D表示用户被某个行为特征覆盖的天数,F表示用户具有某个行为的频次。式(4)为对用户所有行为特征系数求和;即根据不同种子用户群体的行为偏好,预估目标人群行为偏好,对任一用户所有行为特征权重系数求和,则可估计用户成为目标客户的得分;式(5)、式(6)分别通过幂次调整不同种子用户群体对应行为特征权重系数的实际影响力,对任一用户的所有行为特征,计算经处理后的权重系数和值,得到用户成为目标客户的估计得分;式(7)综合考察用户每个特征行为出现的天数和实际频次,将任一用户所有行为特征权重系数乘以该特征出现天数,再乘以用户该特征在数据时间范围内出现频次,最后,对用户所有特征的最终计算值再求和,得到任一用户成为目标客户的估计得分。本申请以式(7)为例进行目标客户的评分计算。

图1为本发明实施例一提供的一种基于用户行为的评分方法的流程示意图,如图1所示,所述一种基于用户行为的评分方法包括:

S101、预估种子用户对某个行为特征的兴趣度;

具体地,根据每个种子用户的单个行为特征覆盖种子用户量,除以单个行为特征覆盖全量用户总量,计算每个行为特征的影响力系数r

式(1)中,

S102、预估种子用户在上述行为特征的综合兴趣度,具体包括:

计算多组种子用户(反应不同特征偏好的种子用户,例如,对业务推荐比较感兴趣的用户群体,对业务成交比较感兴趣的用户群体等),在同一个标签上的综合兴趣度w

理论上,对目标人群的刻画越丰富,定义的人群就会越精准;通过式(2)计算出来的用户对目标业务的综合兴趣度越贴近真实水平。

S103、计算周期内用户的行为积分,具体包括:

叠加单个用户访问行为特征的天数、频次信息,累计用户周期内全量行为特征的系数,预估任一用户成为目标客户的得分:

S104、将用户按照行为积分排序,得分最高的用户,即为业务降本和扩量的目标客户。

具体地,以消费水平标签开发为例,使用三个月的用户行为数据,由∑r*R*D*F公式实现。

第一步,确定影响消费水平的主要特征;通过DMP画像分析,高消费人群的主要特征是:大部分人拥有高资产(好车、好房等),大部分人经常进行高档消费(海淘、奢侈品、星级酒店等)。

第二步,通过电话访问方式,收集一批准确的豪车车主、高档小区房主作为种子用户1,收集一批经常在奢侈品官方店、网易考拉等海淘网站购买高档用品的用户作为种子用户2。

第三步,根据种子用户1,由单个行为特征覆盖种子用户量,除以单个行为特征覆盖全量用户总量,计算每个行为特征的影响力系数r;根据种子用户2,同理计算出每个行为特征的影响力系数R。

第四步,计算每个行为特征的高消费水平综合影响力系数,由r*R公式得到。若有更多的种子用户,则累计相乘。

第五步,计算单个用户的高消费水平积分,由用户三个月内的行为特征、该行为出现天数、频次,得到用户在该行为特征上的总得分r*R*D*F,再对用户访问过的所有行为特征得分求和,即∑r*R*D*F。

第六步,将用户按照高消费积分排序,确定得分top10%为高消费人群,得分top10~30%区间为中高消费人群,得分top30%~top60%区间为中等消费人群,其余得分为低端消费水平人群。

本实施例逆向使用PCA原理,先由目标人群的画像分析,确定目标人群的主要特征;再由主要特征直接或间接筛选训练样本,由多个训练样本分别计算人群的各个特征对应的特征向量,由此得到每个行为特征的权重系数;最后根据单个用户的全量特征行为,结合其对应权重系数,计算用户倾向性积分,从而解决精准推荐的问题,本评分方法将各个行为特征对目标人群的影响量化处理,并且综合所有行为特征的影响值。

本方法通过已知PCA的主成分,求特征向量(各个行为特征系数),再由该系数,计算单个用户的累计行为特征系数值;无复杂的计算,对特征维度缺失不敏感,不存在过拟合情况,不受数据量纲影响;任一用户只要存在一个特征行为,都可以由其所对应的行为系数得到一个综合的偏向性得分;短时间内人群的特征行为相对稳定,因此,某个人群的积分模型中,各个行为特征的系数也会相对稳定。具体某个人特征行为的差异,但都可通过积分值体现出来。因此,该模型总能稳定地反应,近期对目标业务最感兴趣的人群。

图2为本发明实施例二提供的一种基于用户行为的评分方法的流程示意图,如图2所示,所述预估种子用户对某个行为特征的兴趣度之前,包括:收集待评价标签的主要行为特征;根据主要行为特征确定种子用户,所述种子用户至少包括两人。

图3为本发明实施例一提供的一种基于用户行为的评分装置的结构示意图,如图3所示,一种基于用户行为的评分装置,包括:

第一预估单元101:预估种子用户对某个行为特征的兴趣度;

第二预估单元102:预估种子用户在上述行为特征的综合兴趣度;

积分计算单元103:计算周期内用户的行为积分;

积分排序单元104:将用户按照行为积分排序,得分最高的用户,即为业务降本和扩量的目标客户。

图4为本发明实施例二提供的一种基于用户行为的评分装置的结构示意图,如图4所示,在实施例一的基础上,所述一种基于用户行为的评分装置包括:

特征数据收集单元105:收集待评价标签的主要行为特征;

用户数据收集单元106:根据主要行为特征确定种子用户,所述种子用户至少包括两人。

本发明提供了一种基于用户行为的评分方法和装置,全面的考量用户的行为特征,以及行为之间的交互关系,综合计算出针用户对某个行业或者产品的倾向性得分,从而对人群进行有效划分,同时该方法也可形成一套日常的生产业务;本发明既能规避数据颗粒度较粗的缺点,又能充分挖掘、利用用户多样行为多样性的优点,在保证效果的基础上实现扩量、降本的需求,充分挖掘潜在的营销客户。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于用户行为的评分方法。

处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。

存储器可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器601可以运行程序指令,以实现上文的本申请的各个实施例的存储授权变更方法中的步骤以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如光线强度、补偿光强度、滤光片的位置等信息。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于用户行为的评分方法。

计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器((RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 一种基于用户行为的评分方法、装置计算机设备及存储介质
  • 一种基于直播过程中用户行为的实时规则的配置方法、计算机设备及可读存储介质
技术分类

06120112585543