掌桥专利:专业的专利平台
掌桥专利
首页

一种数据处理方法、装置及存储介质

文献发布时间:2023-06-19 19:28:50


一种数据处理方法、装置及存储介质

技术领域

本申请涉及信息处理技术领域,尤其涉及一种数据处理方法、装置及存储介质。

背景技术

目前,电信运营商作为移动网络和有限网络的主要运营商之一,积累了大量的用户上网行为数据,为了给用户带来更好的用户体验,为用户推荐合适的产品或音视频内容,需要了解用户的上网偏好并将用户的上网偏好进行量化,根据用户对不同类型的偏好程度,实时不同的推荐策略。

现有的用户上网偏好的度量一般通过采集用户历史上网的多个指标,进行加权,得到用户的长期上网偏好,或者,将采集的用户历史上网行为指标根据时间远近进行衰减,得到用户的上网偏好,但是,用户的上网偏好往往会受到很多外部的因素,比如,内容的质量,最近流行的内容,并且随着时间的推移,用户的上网偏好会产生变化,因此,利用上述偏好度量方案确定的用户上网偏好,准确性较低。

发明内容

为解决上述技术问题,本发明实施例期望提供一种数据处理方法、装置及存储介质,针对单一用户对某一类型信息偏好度的确定,不仅利用了该用户对该类型数据的个体偏好,还结合了所有用户对该类型信息的全局偏好度,从而提高了偏好度确定的准确性。

本发明的技术方案是这样实现的:

本发明提供了一种数据处理方法,所述方法包括:

获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问所述目标类型信息产生的行为数据,确定为第二行为数据;

基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度;

基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度;

基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度。

在上述方法中,所述基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度,包括:

按照第一预设单位时间段,将所述预设时长划分为多个第一时间段;

将所述第一行为数据中,所述多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;

根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量;

基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度。

在上述方法中,所述根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量,包括:

根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于所述多个访问次数和所述访问平均次数,确定访问次数标准差;其中,所述第一组行为数据为所述多组行为数据中目标时间段对应的行为数据,所述目标时间段为所述多个第一时间段中任一时间段;所述多个访问次数中每个访问次数为不同访问对象对所述目标类型信息在所述目标时间段内的访问次数;

利用所述访问平均次数和所述访问次数标准差,对所述多个访问次数中每个访问次数进行标准化处理,得到与所述多个访问次数一一对应的多个访问次数标准值;

将所述多个访问次数标准值之和,确定为所述目标时间段内所述目标类型信息的访问总次数;

根据所述第一组行为数据包括的多个访问流量确定访问平均流量,并基于所述多个访问流量和所述访问平均流量,确定访问流量标准差;所述多个访问流量中每个访问流量为不同访问对象对所述目标类型信息在所述目标时间段内的访问流量;

利用所述访问平均流量和所述访问流量标准差,对所述多个访问流量中每个访问流量进行标准化处理,得到与所述多个访问流量一一对应的多个访问流量标准值;

将所述多个访问流量标准值之和,确定为所述目标时间段内所述目标类型信息的访问总流量。

在上述方法中,所述基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度,包括:

针对所述多个第一时间段中每个第一时间段,将时间段内所述目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;

针对所述多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;

将所述多个第一时间段中不同时间段对应的阶段偏好度之和,确定为所述全局偏好度。

在上述方法中,所述基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度,包括:

从所述预设时长内确定出目标时长,并将所述第二行为数据中,所述目标时长内所述目标对象访问所述目标类型信息产生的行为数据确定为目标行为数据;

将所述目标行为数据包括的所述目标对象对所述目标类型信息在所述目标时长内的访问次数和访问流量之和,确定为所述目标对象对所述目标类型信息的短期偏好度;

基于所述第二行为数据,确定所述目标对象对所述目标类型信息的长期偏好度;

将所述短期偏好度与第一预设权重因子之积,确定为第一偏好度,并将所述长期偏好度与第二预设权重因子的之积,确定为第二偏好度;

将所述第一偏好度与所述第二偏好度之和,确定为所述个体偏好度。

在上述方法中,所述基于所述第二行为数据,确定所述目标对象对目标类型信息的长期偏好度,包括:

按照第二预设单位时间段,将所述预设时长划分为多个第二时间段;

将所述第二行为数据中,所述多个第二时间段中每个第二时间段产生的行为数据划分为一组行为数据,得到多组目标行为数据;

针对所述多个第二时间段中每个第二时间段,将所述多组目标行为数据中每组目标行为数据包括的访问次数和访问流量之和,确定为对应的访问数值;

针对所述多个第二时间段中每个第二时间段,将对应的访问数值与预设衰减因子之积,确定为对应的历史偏好度;

将所述多个第二时间段中不同时间段对应的历史偏好度之和,确定为所述长期偏好度。

在上述方法中,所述基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度,包括:

将所述全局偏好度与第三预设权重因子之积,确定为第三偏好度,并将所述个体偏好度与第四预设权重因子的之积,确定为第四偏好度;

将所述第三偏好度与所述第四偏好度之和,确定为所述实际偏好度。

本发明提供了一种数据处理装置,包括:

获取模块,用于获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问所述目标类型信息产生的行为数据,确定为第二行为数据;

第一处理模块,用于基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度;

第二处理模块,用于基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度;

确定模块,用于基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度。

在上述装置中,所述第一处理模块,具体用于按照第一预设单位时间段,将所述预设时长划分为多个第一时间段;将所述第一行为数据中,所述多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量;基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度。

在上述装置中,所述第一处理模块,具体用于根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于所述多个访问次数和所述访问平均次数,确定访问次数标准差;其中,所述第一组行为数据为所述多组行为数据中目标时间段对应的行为数据,所述目标时间段为所述多个第一时间段中任一时间段;所述多个访问次数中每个访问次数为不同访问对象对所述目标类型信息在所述目标时间段内的访问次数;利用所述访问平均次数和所述访问次数标准差,对所述多个访问次数中每个访问次数进行标准化处理,得到与所述多个访问次数一一对应的多个访问次数标准值;将所述多个访问次数标准值之和,确定为所述目标时间段内所述目标类型信息的访问总次数;根据所述第一组行为数据包括的多个访问流量确定访问平均流量,并基于所述多个访问流量和所述访问平均流量,确定访问流量标准差;所述多个访问流量中每个访问流量为不同访问对象对所述目标类型信息在所述目标时间段内的访问流量;利用所述访问平均流量和所述访问流量标准差,对所述多个访问流量中每个访问流量进行标准化处理,得到与所述多个访问流量一一对应的多个访问流量标准值;将所述多个访问流量标准值之和,确定为所述目标时间段内所述目标类型信息的访问总流量。

在上述装置中,所述第一处理模块,具体用于针对所述多个第一时间段中每个第一时间段,将时间段内所述目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;针对所述多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;将所述多个第一时间段中不同时间段对应的阶段偏好度之和,确定为所述全局偏好度。

在上述装置中,所述第二处理模块,具体用于从所述预设时长内确定出目标时长,并将所述第二行为数据中,所述目标时长内所述目标对象访问所述目标类型信息产生的行为数据确定为目标行为数据;将所述目标行为数据包括的所述目标对象对所述目标类型信息在所述目标时长内的访问次数和访问流量之和,确定为所述目标对象对所述目标类型信息的短期偏好度;基于所述第二行为数据,确定所述目标对象对所述目标类型信息的长期偏好度;将所述短期偏好度与第一预设权重因子之积,确定为第一偏好度,并将所述长期偏好度与第二预设权重因子的之积,确定为第二偏好度;将所述第一偏好度与所述第二偏好度之和,确定为所述个体偏好度。

在上述装置中,所述第二处理模块,具体用于按照第二预设单位时间段,将所述预设时长划分为多个第二时间段;将所述第二行为数据中,所述多个第二时间段中每个第二时间段产生的行为数据划分为一组行为数据,得到多组目标行为数据;针对所述多个第二时间段中每个第二时间段,将所述多组目标行为数据中每组目标行为数据包括的访问次数和访问流量之和,确定为对应的访问数值;针对所述多个第二时间段中每个第二时间段,将对应的访问数值与预设衰减因子之积,确定为对应的历史偏好度;将所述多个第二时间段中不同时间段对应的历史偏好度之和,确定为所述长期偏好度。

在上述装置中,所述确定模块,具体用于将所述全局偏好度与第三预设权重因子之积,确定为第三偏好度,并将所述个体偏好度与第四预设权重因子的之积,确定为第四偏好度;将所述第三偏好度与所述第四偏好度之和,确定为所述实际偏好度。

本发明提供了一种数据处理装置,包括:处理器、存储器和通信总线;

所述通信总线,用于实现所述处理器和所述存储器之间的通信连接;

所述处理器,用于执行所述存储器中存储的数据处理程序,以实现上述数据处理方法。

本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述数据处理方法。

本发明提供了一种数据处理方法、装置及存储介质,方法包括:获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据;基于第一行为数据,确定目标类型信息对应的全局偏好度;基于第二行为数据,确定目标类型信息对应的个体偏好度;基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。本发明提供的技术方案,针对单一用户对某一类型信息偏好度的确定,不仅利用了该用户对该类型数据的个体偏好,还结合了所有用户对该类型信息的全局偏好度,从而提高了偏好度确定的准确性。

附图说明

图1为本发明实施例提供的一种数据处理方法的流程示意图;

图2为本发明实施例提供的一种示例性的确定目标对象对目标类型信息偏好度的流程示意图;

图3为本发明实施例提供的一种数据处理装置的结构示意图一;

图4为本发明实施例提供的一种数据处理装置的结构示意图二。

具体实施方式

下面将结合本发明实施例中的附图,对本发明中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅仅用于解释相关申请,而非对该申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关申请相关的部分。

本发明提供了一种数据处理方法,应用于数据处理装置,图1为本发明实施例提供的一种数据处理方法的流程示意图。如图1所示,主要包括以下步骤:

S101、获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据。

在本发明的实施例中,数据处理装置获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据。

需要说明的是,在本发明的实施例中,预设时长可以是一年、一个月、一个星期,或者其他任何时长,具体的预设时长可以根据实际情况和应用需求进行设定,对此,本申请不作限定。

需要说明的是,在本发明的实施例中,如果预设时长为一年,那么,数据处理装置会获取一年内不同访问对象访问目标类型信息的行为数据,该行为数据至少包括访问次数和访问流量,具体获取的数据如表1所示:

表1

如表1所示,DATE为访问时间,比如,XX.XX.XX,表示XX年XX月XX日,VARCHAR为字符类型,VARCHAR(20)中的20代表字符数量,访问对象标识对应的VARCHAR(20)表征访问对象的唯一身份标识,用于区分不同访问对象,访问信息标识对应的VARCHAR(20)表征访问信息的唯一标识,用于区分不同访问信息,访问类型信息对应的VARCHAR(20)为访问对象的类型信息,用于区分不同类型的信息,访问次数和访问流量对应的字段类型为整数类型(INT),访问次数对应的INT表示访问对象VARCHAR(20)访问类型信息VARCHAR(20)的次数,访问流量对应的INT表示访问对象VARCHAR(20)访问类型信息VARCHAR(20)使用的流量,KB为访问类型信息流量的单位,表1存储的数据为某一用户在某一时间段访问了某一类型信息的访问次数和访问流量。

需要说明的是,在本发明的实施例中,数据处理装置在获取到第一行为数据和第二行为数据之后,利用第一行为数据和第二行为数据,判定目标对象对目标类型信息的偏好度。

S102、基于第一行为数据,确定目标类型信息对应的全局偏好度。

在本发明的实施例中,数据处理装置基于第一行为数据,确定目标类型信息对应的全局偏好度。

需要说明的是,在本发明的实施例中,由于不同访问对象访问不同类型信息会受到其他访问对象的影响,故,数据处理装置在对某一访问对象,即目标对象,进行偏好度判定时,会综合考虑到不同访问对象对目标类型信息的全局偏好度。

具体的,在本发明的实施例中,数据处理装置基于第一行为数据,确定目标类型信息对应的全局偏好度,包括:按照第一预设单位时间段,将预设时长划分为多个第一时间段;将第一行为数据中,多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;根据多组行为数据中每组行为数据,确定多个第一时间段中对应时间段内目标类型信息的访问总次数和访问总流量;基于多个第一时间段中,每个第一时间段内目标类型信息的访问总次数和访问总流量,确定全局偏好度。

需要说明的是,在本发明的实施例中,数据处理装置在获取到第一行为数据之后,利用第一行为数据,确定目标类型信息的全局偏好度。

需要说明的是,在本发明的实施例中,第一预设单位时间段可以是一天,一小时,或者一星期,也可以为其他任意时间段,具体的第一预设单位时间段可以根据实际需求和应用场景进行设定,对此,本发明不作限定。

示例性的,在预设时长为一年的情况下,如果数据处理装置以一天为第一预设单位时间段将预设时长进行划分,得到365个第一时间段,其中,每个第一时间段为一天。

需要说明的是,在本发明的实施例中,数据处理装置在得到多个第一时间段之后,将第一行为数据中,多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据,具体的多组行为数据存储方式如表2所示:

表2

其中,访问时间的单位为第一预设单位时间段,为具体的统计日期,比如,访问时间DATE为XX.XX.XX,VARCHAR为字符类型,VARCHAR(20)中的20代表字符数量,访问对象标识对应的VARCHAR(20)表征访问对象的唯一身份标识,访问类型信息对应的VARCHAR(20)表征访问对象访问的类型信息的标识,访问总次数和访问总流量对应的字段类型为整数类型(INT),访问总次数对应的INT表示不同访问对象VARCHAR(20)访问类型信息VARCHAR(20)的访问总次数,访问流量对应的INT表示访问对象VARCHAR(20)访问类型信息VARCHAR(20)使用的访问总流量,KB为访问类型信息流量的单位,表2中的访问总次数为在XX年XX月XX日这一天不同访问对象访问目标类型信息的访问总次数和访问总流量。

具体的,在本发明的实施例中,数据处理装置根据多组行为数据中每组行为数据,确定多个第一时间段中对应时间段内目标类型信息的访问总次数和访问总流量,包括:根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于多个访问次数和访问平均次数,确定访问次数标准差;其中,第一组行为数据为多组行为数据中目标时间段对应的行为数据,目标时间段为多个第一时间段中任一时间段;多个访问次数中每个访问次数为不同访问对象对目标类型信息在目标时间段内的访问次数;利用访问平均次数和访问次数标准差,对多个访问次数中每个访问次数进行标准化处理,得到与多个访问次数一一对应的多个访问次数标准值;将多个访问次数标准值之和,确定为目标时间段内目标类型信息的访问总次数;根据第一组行为数据包括的多个访问流量确定访问平均流量,并基于多个访问流量和访问平均流量,确定访问流量标准差;多个访问流量中每个访问流量为不同访问对象对目标类型信息在目标时间段内的访问流量;利用访问平均流量和访问流量标准差,对多个访问流量中每个访问流量进行标准化处理,得到与多个访问流量一一对应的多个访问流量标准值;将多个访问流量标准值之和,确定为目标时间段内目标类型信息的访问总流量。

需要说明的是,在本发明的实施例中,数据处理装置确定的访问总次数和访问总流量是经过标准化处理后的访问总流量和访问总次数,具体的标准化处理方式如以下公式(1)所示:

其中,x'为标准化处理后的标准值,x为未进行标准化处理的数据,数据处理装置在对访问次数或者访问流量进行标准化处理的过程中,是分别进行处理的,即如果x为访问次数,那么,x'为访问次数标准值,μ为目标时间段内不同访问对象对应的多个访问次数的平均访问次数,σ为目标时间段内不同访问对象对应的访问次数标准差;如果x为访问流量,那么,x'为访问流量标准值,μ为目标时间段内不同访问对象对应的多个访问流量的平均访问流量,σ为目标时间段内不同访问对象对应的访问流量标准差。

需要说明的是,在本发明的实施例中,数据处理装置对第一组行为数据包括的多个访问次数确定访问平均次数μ,然后,计算多个访问次数中每个访问次数与访问平均次数的次数差值,并将得到的与多个访问次数一一对应的多个次数差值分别进行平方,再求和,得到访问次数方差,对访问次数方差开方,得到对应的访问次数标准差σ,利用访问平均次数μ和访问次数标准差σ,对多个访问次数中每个访问次数x进行标准化处理,得到与多个访问次数一一对应的多个访问次数标准值x',最后,将多个访问次数标准值x'之和,确定为目标时间段内目标类型信息的访问总次数。

需要说明的是,在本发明的实施例中,数据处理装置对第一组行为数据包括的多个访问流量确定访问平均流量μ,然后,计算多个访问流量中每个访问流量与访问平均流量的流量差值,并将得到的与多个访问流量一一对应的多个流量差值分别进行平方,再求和,得到访问流量方差,对访问流量方差开方,得到对应的访问流量标准差σ,利用访问平均流量μ和访问流量标准差σ,对多个访问流量中每个访问流量x进行标准化处理,得到与多个访问流量一一对应的多个访问流量标准值x',最后,将多个访问流量标准值x'之和,确定为目标时间段内目标类型信息的访问总流量。

需要说明的是,在本发明的实施例中,预设时长包括多个第一时间段,数据处理装置会对多个第一时间段中每个第一时间段确定出一个访问总流量和访问总次数,因此,数据处理装置确定全局偏好度会依据多个第一时间段中,每个第一时间段内目标类型信息的访问总次数和访问总流量。

具体的,在本发明的实施例中,数据处理装置基于多个第一时间段中,每个第一时间段内目标类型信息的访问总次数和访问总流量,确定全局偏好度,包括:针对多个第一时间段中每个第一时间段,将时间段内目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;针对多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;将多个第一时间段中不同时间段对应的阶段偏好度之和,确定为全局偏好度。

需要说明的是,在本发明的实施例中,数据处理装置基于多个第一时间段中,每个第一时间段内目标类型信息的访问总次数和访问总流量,确定全局偏好度体的计算公式如公式(2)所示

其中,

需要说明的是,在本发明的实施例中,数据处理装置针对多个第一时间段中每个第一时间段,将第一时间段h

S103、基于第二行为数据,确定目标类型信息对应的个体偏好度。

在本发明的实施例中,数据处理装置基于第二行为数据,确定目标类型信息对应的个体偏好度。

需要说明的是,在本发明的实施例中,数据处理装置获取目标对象在预设时长内访问目标类型信息产生的第二行为数据之后,基于第二行为数据,确定目标对象对目标类型信息的个体偏好度。

具体的,在本发明的实施例中,数据处理装置基于第二行为数据,确定目标类型信息对应的个体偏好度,包括:从预设时长内确定出目标时长,并将第二行为数据中,目标时长内目标对象访问目标类型信息产生的行为数据确定为目标行为数据;将目标行为数据包括的目标对象对目标类型信息在目标时长内的访问次数和访问流量之和,确定为目标对象对目标类型信息的短期偏好度;基于第二行为数据,确定目标对象对目标类型信息的长期偏好度;将短期偏好度与第一预设权重因子之积,确定为第一偏好度,并将长期偏好度与第二预设权重因子的之积,确定为第二偏好度;将第一偏好度与第二偏好度之和,确定为个体偏好度。

需要说明的是,在本发明的实施例中,目标时长为预设时长的一部分,如果,预设时长为一年,那么,目标时长可以为一个季度,一个月,一个星期,或者其他时长,如果预设时长为一个月,那么,目标时长可以为一个星期,两天,或者其他时长,具体的目标时长可以根据实际情况和应用需求进行设定,对此,本发明不作限定。

需要说明的是,在本发明的实施例中,数据处理装置从预设时长中确定出目标时长之后,将第二行为数据中的目标时长内目标对象访问目标类型信息产生的行为数据,确定为目标行为数据,然后将目标行为数据中包括的访问次数和访问流量之和,确定为目标对象对目标类型信息的短期偏好度,具体的短期偏好度的计算公式如公式(3)所示:

其中,

具体的,在本发明的实施例中,数据处理装置基于第二行为数据,确定目标对象对目标类型信息的长期偏好度,包括:按照第二预设单位时间段,将预设时长划分为多个第二时间段;将第二行为数据中,多个第二时间段中每个第二时间段产生的行为数据划分为一组行为数据,得到多组目标行为数据;针对多个第二时间段中每个第二时间段,将多组目标行为数据中每组目标行为数据包括的访问次数和访问流量之和,确定为对应的访问数值;针对多个第二时间段中每个第二时间段,将对应的访问数值与预设衰减因子之积,确定为对应的阶段偏好度;将多个第二时间段中不同时间段对应的阶段偏好度之和,确定为长期偏好度。

需要说明的是,在本发明的实施例中,第二预设单位时间段可以是一天,一小时,一星期,或者,其他任意时间段,当然,第二预设单元时间段可以与上述第一预设单元时间段设置为相同的时间段,也可以为不同的时间段,具体的第二预设单位时间段可以根据实际需求和应用场景进行设定,对此,本发明不作限定。

需要说明的是,在本发明的实施例中,数据处理装置可以利用公式(4)确定目标对象对目标类型信息的长期偏好度,见下式:

其中,

需要说明的是,在本发明的实施例中,数据处理装置将第二行为数据中,多个第二时间段中每个第二时间段产生的行为数据确定为一组目标行为数据,对于多个第二时间段中每个第二时间段,将多组目标行为数据中每组目标行为数据包括的访问次数

需要说明的是,在本发明的实施例中,数据处理装置针对多个第二时间段中每个第二时间段,将对应的访问数值

需要说明的是,在本发明的实施例中,数据处理装置在获取到短期偏好度和长期偏好度之后,对短期偏好度设置对应的第一预设权重因子,并将短期偏好度和第一预设权重因子的乘积,确定为第一偏好度;对长期偏好度设置对应的第二预设权重因子,并将长期偏好度和第二预设权重因子的乘积确定为第二偏好度,然后,将第一偏好度和第二偏好度相加,得到目标对象对目标类型信息的个体偏好度,具体的计算公式如下:

其中,

S104、基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。

在本发明的实施例中,数据处理装置基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。

具体的,在本发明的实施例中,数据处理装置基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度,包括:将全局偏好度与第三预设权重因子之积,确定为第三偏好度,并将个体偏好度与第四预设权重因子的之积,确定为第四偏好度;将第三偏好度与第四偏好度之和,确定为实际偏好度。

需要说明的是,在本发明的实施例中,数据处理装置在获取到全局偏好度和个体偏好度之后,对全局偏好度设置对应的第三预设权重因子,并将全局偏好度和第三预设权重因子的乘积,确定为第三偏好度;对个体偏好度设置对应的第四预设权重因子,并将个体偏好度和第四预设权重因子的乘积确定为第四偏好度,然后,将第三偏好度和第四偏好度相加,得到目标对象对目标类型信息的实际偏好度,具体的计算公式如下:

其中,

图2为本发明实施例提供的一种示例性的确定目标对象对目标类型信息偏好度的流程示意图。如图2所示,在数据处理装置获取到不同访问对象访问目标类型数据的第一行为数据之后,依据第一行为数据确定全局偏好度;在数据处理装置获取到目标对象访问目标类型数据的第二行为数据之后,利用第二行为数据确定目标对象对目标类型信息的长期偏好度,并从第一行为数据中选取出目标行为数据,该目标行为数据为数据处理装置从第二行为数据中获取的部分数据,利用该目标行为数据确定目标对象对目标类型信息的短期偏好度,进而利用短期偏好度和长期偏好度确定目标对象对目标类型信息的个体偏好度,最后,结合利用第一行为数据确定的全局偏好度,确定目标对象对目标类型信息的实际偏好度,在确定目标对象对目标类型信息的偏好度的过程中,不仅将目标对象的长期偏好度与短期偏好度进行结合,还将结合后的个体偏好度,与全局偏好度进行结合,提高了偏好度确定的准确性。

本发明提供了一种数据处理方法,方法包括:获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据;基于第一行为数据,确定目标类型信息对应的全局偏好度;基于第二行为数据,确定目标类型信息对应的个体偏好度;基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。本发明提供的数据处理方法,针对单一用户对某一类型信息偏好度的确定,不仅利用了该用户对该类型数据的个体偏好,还结合了所有用户对该类型信息的全局偏好度,从而提高了偏好度确定的准确性。

本发明提供了一种数据处理装置,图3为本发明实施例提供的一种数据处理装置的结构示意图一。如图3所示,包括:

获取模块301,用于获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问所述目标类型信息产生的行为数据,确定为第二行为数据;

第一处理模块302,用于基于所述第一行为数据,确定所述目标类型信息对应的全局偏好度;

第二处理模块303,用于基于所述第二行为数据,确定所述目标类型信息对应的个体偏好度;

确定模块304,用于基于所述全局偏好度和所述个体偏好度,确定所述目标对象对所述目标类型信息的实际偏好度。

可选的,所述第一处理模块302,具体用于按照第一预设单位时间段,将所述预设时长划分为多个第一时间段;将所述第一行为数据中,所述多个第一时间段中每个第一时间段内产生的行为数据划分为一组行为数据,得到多组行为数据;根据所述多组行为数据中每组行为数据,确定所述多个第一时间段中对应时间段内所述目标类型信息的访问总次数和访问总流量;基于所述多个第一时间段中,每个第一时间段内所述目标类型信息的访问总次数和访问总流量,确定所述全局偏好度。

可选的,所述第一处理模块302,具体用于根据第一组行为数据包括的多个访问次数确定访问平均次数,并基于所述多个访问次数和所述访问平均次数,确定访问次数标准差;其中,所述第一组行为数据为所述多组行为数据中目标时间段对应的行为数据,所述目标时间段为所述多个第一时间段中任一时间段;所述多个访问次数中每个访问次数为不同访问对象对所述目标类型信息在所述目标时间段内的访问次数;利用所述访问平均次数和所述访问次数标准差,对所述多个访问次数中每个访问次数进行标准化处理,得到与所述多个访问次数一一对应的多个访问次数标准值;将所述多个访问次数标准值之和,确定为所述目标时间段内所述目标类型信息的访问总次数;根据所述第一组行为数据包括的多个访问流量确定访问平均流量,并基于所述多个访问流量和所述访问平均流量,确定访问流量标准差;所述多个访问流量中每个访问流量为不同访问对象对所述目标类型信息在所述目标时间段内的访问流量;利用所述访问平均流量和所述访问流量标准差,对所述多个访问流量中每个访问流量进行标准化处理,得到与所述多个访问流量一一对应的多个访问流量标准值;将所述多个访问流量标准值之和,确定为所述目标时间段内所述目标类型信息的访问总流量。

可选的,所述第一处理模块302,具体用于针对所述多个第一时间段中每个第一时间段,将时间段内所述目标类型信息的访问总次数和访问总流量之和确定为对应的访问总值;针对所述多个第一时间段中每个第一时间段,将对应的访问总值与预设衰减因子之积,确定为对应的阶段偏好度;将所述多个第一时间段中不同时间段对应的阶段偏好度之和,确定为所述全局偏好度。

可选的,所述第二处理模块303,具体用于从所述预设时长内确定出目标时长,并将所述第二行为数据中,所述目标时长内所述目标对象访问所述目标类型信息产生的行为数据确定为目标行为数据;将所述目标行为数据包括的所述目标对象对所述目标类型信息在所述目标时长内的访问次数和访问流量之和,确定为所述目标对象对所述目标类型信息的短期偏好度;基于所述第二行为数据,确定所述目标对象对所述目标类型信息的长期偏好度;将所述短期偏好度与第一预设权重因子之积,确定为第一偏好度,并将所述长期偏好度与第二预设权重因子的之积,确定为第二偏好度;将所述第一偏好度与所述第二偏好度之和,确定为所述个体偏好度。

可选的,所述第二处理模块303,具体用于按照第二预设单位时间段,将所述预设时长划分为多个第二时间段;将所述第二行为数据中,所述多个第二时间段中每个第二时间段产生的行为数据划分为一组行为数据,得到多组目标行为数据;针对所述多个第二时间段中每个第二时间段,将所述多组目标行为数据中每组目标行为数据包括的访问次数和访问流量之和,确定为对应的访问数值;针对所述多个第二时间段中每个第二时间段,将对应的访问数值与预设衰减因子之积,确定为对应的历史偏好度;将所述多个第二时间段中不同时间段对应的历史偏好度之和,确定为所述长期偏好度。

可选的,所述确定模块304,具体用于将所述全局偏好度与第三预设权重因子之积,确定为第三偏好度,并将所述个体偏好度与第四预设权重因子的之积,确定为第四偏好度;将所述第三偏好度与所述第四偏好度之和,确定为所述实际偏好度。

本发明提供了一种数据处理装置,图4为本发明实施例提供的一种数据处理装置的结构示意图二。如图4所示,所述数据处理装置包括:处理器401、存储器402和通信总线403;

所述通信总线403,用于实现所述处理器401和所述存储器402之间的通信连接;

所述处理器401,用于执行所述存储器402中存储的数据处理程序,以实现上述数据处理方法。

本发明提供了一种数据处理装置,获取在预设时长内,不同访问对象访问目标类型信息产生的行为数据,确定为第一行为数据,并获取目标对象访问目标类型信息产生的行为数据,确定为第二行为数据;基于第一行为数据,确定目标类型信息对应的全局偏好度;基于第二行为数据,确定目标类型信息对应的个体偏好度;基于全局偏好度和个体偏好度,确定目标对象对目标类型信息的实际偏好度。本发明提供的数据处理装置,针对单一用户对某一类型信息偏好度的确定,不仅利用了该用户对该类型数据的个体偏好,还结合了所有用户对该类型信息的全局偏好度,从而提高了偏好度确定的准确性。

本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述数据处理方法。计算机可读存储介质可以是是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatile memory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);也可以是包括上述存储器之一或任意组合的各自设备,如移动电话、计算机、平板设备、个人数字助理等。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本实用申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种数据处理方法、数据处理装置、计算机设备及可读存储介质
  • 一种数据处理方法及装置、一种计算设备及存储介质
  • 一种数据处理方法、装置、设备及存储介质
  • 一种调用链数据的处理方法、装置、设备及存储介质
  • 一种虚拟现实数据处理方法、装置、系统及存储介质
  • PET 数据处理方法、PET 数据处理装置、计算机可读的存储介质、以及数据处理方法
  • 分布处理方法、分布处理装置、印刷数据处理方法、印刷数据处理装置、以及存储介质
技术分类

06120115925706