掌桥专利:专业的专利平台
掌桥专利
首页

行为预测方法、装置、电子设备、存储介质和程序产品

文献发布时间:2023-06-19 11:05:16


行为预测方法、装置、电子设备、存储介质和程序产品

技术领域

本公开实施例涉及大数据技术领域,特别是涉及一种行为预测方法、装置、电子设备、存储介质和程序产品。

背景技术

近年来,随着生活质量的提高以及通信技术的发展,根据应用场景为用户推荐信息的服务越来越多,例如,为用户推荐出行方式、商品信息等等。

传统技术中,通常需要大数据的支撑,通过传感器采集业务系统中的大量用户数据,对用户数据进行人工标注,根据标注后的数据预测用户的行为、偏好等,从而为用户推荐相关信息。

然而,传统方法中,在数据采集过程中,由于传感器与业务系统的不稳定性、用户行为的不确定性等,导致采集到的数据容易受噪声影响,使得预测结果不准确。

发明内容

本公开实施例提供一种行为预测方法、装置、电子设备、存储介质和程序产品,可以用于减少传感器与业务系统的不稳定性、用户行为的不确定性等对采集到的数据的噪声影响。

第一方面,本公开实施例提供一种行为预测方法,所述方法包括:

获取用户的历史行为数据集和关联用户行为数据集;所述关联用户行为数据集包括与所述用户存在关联关系的用户的行为数据;

根据所述历史行为数据集提取所述用户的行为特征,根据所述关联用户行为数据集提取关联特征;

将所述用户的行为特征和所述关联特征进行融合,得到目标特征数据;

根据所述目标特征数据和预设的行为预测模型,得到所述用户的行为预测结果。

第二方面,本公开实施例提供一种行为预测装置,所述装置包括:

获取模块,用于获取用户的历史行为数据集和关联用户行为数据集;所述关联用户行为数据集包括与所述用户存在关联关系的用户的行为数据;

特征提取模块,用于根据所述历史行为数据集提取所述用户的行为特征,根据所述关联用户行为数据集提取关联特征;

融合模块,用于将所述用户的行为特征和所述关联特征进行融合,得到目标特征数据;

预测模块,用于根据所述目标特征数据和预设的行为预测模型,得到所述用户的行为预测结果。

第三方面,本公开实施例提供一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法。

第四方面,本公开实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的方法。

第五方面,本公开实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面所述的方法。

本公开实施例提供的据融合方法、装置、电子设备、存储介质和程序产品,获取用户的历史行为数据集和至少一个关联用户行为数据集,根据历史行为数据集提取用户的行为特征,根据至少一个关联用户行为数据集提取关联特征,将用户的行为特征和关联特征进行融合,得到目标特征数据,根据目标特征数据和预设的行为预测模型,得到用户的行为预测结果,相当于将用户的历史行为数据和关联用户的行为数据进行融合,以得到用户的行为特征,在确定用户的行为特征时,不仅以用户的大量历史数据为基础,还以用户的关联用户的行为数据作为参考对用户的行为特征进行校准,可以减少由于数据采集过程中传感器和业务系统的不稳定性、用户行为的不确定性等,对采集数据的影响,而且,在数据融合过程中,对历史行为数据集提取用户的行为特征,对关联用户行为数据集提取关联特征,既可以减少噪声的影响,还可以减少计算量。尤其是,对于历史行为数据比较匮乏的新用户,可以通过关联用户的行为数据确定该新用户的行为特征,更好的为用户提供推荐服务。

附图说明

图1为一个实施例中行为预测方法的应用环境图;

图2为一个实施例中行为预测方法的流程示意图;

图3为一个实施例中行为预测方法的流程示意图;

图4为一个实施例中行为预测方法的流程示意图;

图5为一个实施例中行为预测方法的流程示意图;

图6为一个实施例中行为预测方法的流程示意图;

图7为一个实施例中行为预测装置的结构框图;

图8为一个实施例中行为预测装置的结构框图;

图9为一个实施例中行为预测装置的结构框图;

图10为一个实施例中服务器的内部结构图。

具体实施方式

为了使本公开实施例的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开实施例进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开实施例,并不用于限定本公开实施例。

首先,在具体介绍本公开实施例的技术方案之前,先对本公开实施例基于的技术背景或者技术演进脉络进行介绍。通常情况下,在大数据领域,通常会采集用户的一些行为数据进行标注,根据标注后的数据为用户推荐信息。例如,在网约车出行领域,当前用户在选择网约车作为出行手段出行的时候,一般需要先确定明确的目的地,然后根据明确的目的地再进行打车,对于上下车点位置,通过网约车平台通常是根据用户的当前定位位置、用户输入的目的地以及历史的出行数据确定上下车点位置,从而引导司机接驾。又或者,在物联网购物领域,通过购物平台对用户的一些历史数据进行统计和标注,从而为用户推荐用户喜爱的商品、电影或音乐服务等。上述方法均是以用户行为数据为基础进行分析,从而为用户推荐信息,但是,在用户行为数据采集过程中,传感器与业务系统可能会不稳定性、用户行为也存在不确定性等因素,容易导致采集到的数据容易受噪声影响,使得预测结果不准确。例如,在预测用户上/下车点位置时,可能会存在定位系统受网路的影响不稳定,导致采集到的用户当前定位不准确;又例如,不同的用户有不同的习惯,同一个定位点,有的用户习惯在A点上车,有的用户习惯在B点下车,仅根据当前定位确定的泛性的上车点可能并不满足用户需求,再例如,随着时间的推移和环境的变化,用户的喜好也可能发生改变,比如,根据用户历史观看过的影片类型向用户推荐一些电影,推荐的电影可能并不是用户当前喜欢的影片,等等。因此,如何减少传感器与业务系统的不稳定性、用户行为的不确定性等因素对采集用户行为数据的影响,成为目前亟待解决的难题。另外,需要说明的是,从确定该技术问题以及下述实施例介绍的技术方案,申请人均付出了大量的创造性劳动。

下面结合本公开实施例所应用的场景,对本公开实施例涉及的技术方案进行介绍。

本公开实施例提供的行为预测方法,可以应用于如图1所示的应用环境中。其中,电子设备102通过网络与服务器104进行通信。其中,电子设备102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备、车辆、共享单车、网约车等用户终端,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。服务器104可以从电子设备104这一侧采集用户的行为数据,也可以是电子设备104将采集到的行为数据上报存储至数据库中,服务器104从服务器中获取行为数据,从而将当前用户的行为数据和该用户的关联用户的行为数据进行融合之后,以预测当前用户的行为。

在一个实施例中,如图2所示,提供了一种行为预测方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

S201,获取用户的历史行为数据集和关联用户行为数据集;关联用户行为数据集包括与用户存在关联关系的用户的行为数据。

其中,用户的历史行为数据集可以包括用户的一些历史行为的形成的数据,例如,用户在上车点、下车点、到过的地标位置、购买过的商品、看过的电影等。关联用户可以是与该用户存在关联关系的用户,例如,关联用户可以是该用户的家人、亲人、朋友、同事、联系人等,关联用户行为数据集中包括关联用户的历史行为数据。

在本实施例中,用户终端可以将各个用户的行为数据上报至服务器,存储在数据库中,或者,服务器也可以通过网络数据获取各个用户的行为数据存储至数据库中。服务器可以从数据库中选取预设时间段内用户A的行为数据构成历史行为数据集,根据用户与用户之间的关联关系,确定用户A的关联用户B和C,从数据库中获取关联用户B和C行为数据构建关联用户行为数据集。可以获取一个关联用户的行为数据,也可以获取多个关联用户的行为数据,本申请实施例中不加以限制。

S202,根据历史行为数据集提取用户的行为特征,根据关联用户行为数据集提取关联特征。

在本实施例中,可以对历史行为数据集中的数据进行处理何分析,提取用户的行为特征,还可以对每个关联用户行为数据集中的数据进行处理何分析,提取关联用户的行为特征作为关联特征。例如,可以对历史行为数据集和关联用户行为数据集进行连续特征化处理、线性变化、非线性变化等处理,得到用户的行为特征和关联特征。可以采用现有的一些特征提取算法分别计算用户的行为特征和关联特征,还可以利用具有特征提取功能的神经网络模型来提取用户的行为特征和关联特征,本申请实施例中不加以限制。

在一些场景中,为了减少数据计算量和特征提取的可靠性,还可以对历史行为数据集和关联用户行为数据集中的数据进行校验、过滤等处理,过滤一些不完整、错误、热度偏高的数据等,还可以适当的对一些对用户影响比较高的数据做增强处理等。

S203,将用户的行为特征和关联特征进行融合,得到目标特征数据;目标特征数据用于预测用户行为。

其中,目标特征数据中可以包括用户行为特征、用户兴趣特征等数据,例如,目标特征数据中可以包括可以用户到过的地标位置、上、下车地点、购买的商品、看过的电影等等。进一步地,目标特征数据中还可以包括用户行为和用户兴趣的不确定性。

在本实施例中,获取到用户的行为特征和关联特征之后,将用户的行为特征和关联特征进行融合,可以得到用于预测用户行为的目标特征数据。具体的,可以对关联特征和用户的行为特征进行推理和决策,通过关联用户的行为特征影响用户的行为特征,从而得到用户的比较准确和核心的行为特征作为目标特征数据。进一步地,还可以通过数据融合确定用户的行为特征对应的不确定性,例如,若该用户的行为特征为上车地点,则该行为特征对应的不确定性为用户在该上车地点上车的概率;若该用户的行为特征为电影D,则该行为特征对应的不确定性为用户观看该电影D的概率。对于具体的行为预测方法本申请实施例中不加以限制,本领域技术人员可以根据具体需求选择。

在很多场景中,由于用户的不确定性,导致用户的行为特征也存在一定的不确定性,因此,上述目标特征数据中可以包括用户行为相关特征和用户行为相关特征的不确定度,用户行为特征的不确定度表示用户出现该行为的概率或可能性。在进行用户行为预测时考虑到该用户行为特征的不确定度,可以减少用户的不确定性对用户行为预测的影响,保证用户行为预测的准确性。

S204,根据目标特征数据和预设的行为预测模型,得到用户的行为预测结果。

其中,行为预测模型可以是预先通过大量的用户历史行为数据和关联用户历史行为数据进行训练得到的,用于预测用户行为的模型。

在本实施例中,可以预先建立行为预测模型,将目标特征数据输入至行为预测模型中进行用户行为预测,得到用户的行为预测结果,也可以是对目标特征数据进行一定的处理之后,再输入至行为预测模型中进行用户行为预测,得到用户的行为预测结果。可选地,用户的行为预测结果可以包括预测得到的用户行为特征,还可以包括预测得到的用户行为特征对应的不确定性。

本申请实施例提供的行为预测方法,获取用户的历史行为数据集和至少一个关联用户行为数据集,根据历史行为数据集提取用户的行为特征,根据至少一个关联用户行为数据集提取关联特征,将用户的行为特征和关联特征进行融合,得到目标特征数据,根据目标特征数据和预设的行为预测模型,得到用户的行为预测结果,相当于将用户的历史行为数据和关联用户的行为数据进行融合,以得到用户的行为特征,在确定用户的行为特征时,不仅以用户的大量历史数据为基础,还以用户的关联用户的行为数据作为参考对用户的行为特征进行校准,可以减少由于数据采集过程中传感器和业务系统的不稳定性、用户行为的不确定性等,对采集数据的影响,而且,在数据融合过程中,对历史行为数据集提取用户的行为特征,对关联用户行为数据集提取关联特征,既可以减少噪声的影响,还可以减少计算量。尤其是,对于历史行为数据比较匮乏的新用户,可以通过关联用户的行为数据确定该新用户的行为特征,更好的为用户提供推荐服务。

在图2所示实施例中,对于特征提取可以有多种实现方式,本申请实施例中,关联用户行为数据集对最终的数据融合结果起到至关重要的作用,下面重点介绍提取关联特征的具体实现方式。如图3所示,根据至少一个关联用户行为数据集提取关联特征,可以包括以下步骤:

S301、对关联用户行为数据集进行过滤和增强处理,得到关联用户特征矩阵。

在本实施例中,为了提高数据融合结果的准确性和可靠性,可以对关联用户行为数据集进行过滤和增强处理,并将关联用户行为数据集构建为关联用户特征矩阵,以方便后续过程提取关联用户的行为特征。例如,可以对关联用户行为数据集中不完整、错误、热度偏高的数据进行过滤,也可以是将关联用户行为数据集中与当前用户的相关度比较低的数据滤除,还可以对关联用户行为数据集中与当前用户的相关度比较高的数据进行增强,等等。

进一步地,可以根据当前用户与关联用户之间的相似度对关联用户行为数据集中的数据进行过滤和增强,如图4所示,步骤S301可以包括以下步骤:

S401、根据关联用户行为数据集,构建初始关联用户特征矩阵。

在本实施例中,可以将关联用户行为数据集中的数据构建关联用户数据矩阵。例如,关联用户行为数据集n

可选地,根据关联用户行为数据集,构建初始关联用户特征矩阵,包括:对关联用户行为数据集进行连续特征化处理,得到每个关联用户对应的第一特征向量;将每个关联用户对应的特征向量按行堆叠,得到初始关联用户特征矩阵。

在本实施例中,可以将关联用户行为数据集中每一个关联用户的数据做随机连续特征化处理,从而得到k个关联用户对应的k个d维特征向量,d表示行为预测模型的参数,该行为预测模型为预先设置的预测用户行为的模型;再将k个d维特征向量按行堆叠组成初始关联用户特征矩阵N

本实施例中,对关联用户数据矩阵进行连续特征化处理,得到每个关联用户对应的第一特征向量,将每个关联用户对应的特征向量按行堆叠,得到初始关联用户特征矩阵,通过对关联用户数据矩阵进行连续特征化处理得到每个关联用户的特征向量,可以快速的构建初始关联用户特征矩阵。

S402、根据关联用户行为数据集对应的相似度集,对初始关联用户特征矩阵进行数据过滤和增强,得到关联用户特征矩阵;相似度集包括用户与关联用户之间的相似度。

其中,相似度集包括当前用户与每个关联用户之间的相似度。

在本实施例中,可以对用户的历史行为数据集和关联用户行为数据集中的数据进行统计分析,计算用户与每个关联用户之间的相似度,从而得到关联用户行为数据集对应的相似度集

N

其中,ReLu为非线性激活函数,W

本申请实施例中,根据关联用户行为数据集,构建初始关联用户特征矩阵,根据关联用户行为数据集对应的相似度集,对初始关联用户特征矩阵进行数据过滤和增强,得到关联用户特征矩阵。通过用户与关联用户之前的相似度对初始关联用户特征矩阵进行数据过滤和增强,使得提取到的关联用户的行为特征更加准确、可靠。

S302、对关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵。

在本实施例中,可以对对关联用户特征进行特征高阶化,也即抽取近邻用户之间相关关系,可以采用非线性关联表达。可选地,对关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵,包括:根据预设的空洞卷积,对关联用户特征矩阵进行非线性变化,得到高阶化特征矩阵。

在本实施例中,可以先根据公式(2)定义d度空洞卷积,然后通过公式(3)-公式(4)对关联用户特征矩阵N

……

其中,s和t为求和公式中的迭代变量,P表示(N

S303、对高阶化特征矩阵进行特征扁平化处理,得到关联特征。

在本实施例中,得到高阶化特征矩阵之后,还需要将高阶化特征矩阵进行特征扁平化处理,也即将高阶化特征矩阵拆分成每个关联用户对应的过滤和增强处理之后的特征向量,再将每个关联用户对应的过滤和增强处理之后的特征向量堆叠得到关联特征。

可选地,对高阶化特征矩阵进行特征扁平化处理,得到关联特征,包括:将高阶化特征矩阵按行拆分,得到每个关联用户数据矩阵对应的第二特征向量;将每个关联用户对应的第二特征向量按照预设顺序堆叠,得到关联特征。

在本实施例中,关联用户特征矩阵N

可选地,在本实施例中,还可以根据公式(5)提取用户的行为特征,得到用户的行为特征之后,再根据公式(6)将和关联特征进行融合,得到目标特征数据。

h(S

其中,S

其中,n

本申请实施例提供的行为预测方法,对关联用户行为数据集进行过滤和增强处理,得到关联用户特征矩阵,对关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵,对高阶化特征矩阵进行特征扁平化处理,得到关联特征,对关联用户行为数据集进行过滤、增强、特征高阶化、特征扁平化等处理,使得得到的关联特征更加贴近当前用户的行为特征,也能提高关联特征的准确性和可靠性。

在一些场景中,由于历史行为数据集和关联用户行为数据集中可能存在一些不完整、无效或缺失的数据,还可以对历史行为数据集和关联用户行为数据集进行预处理。则上述行为预测方法还可以包括:对历史行为数据集和关联用户行为数据集进行预处理;预处理包括一致性检查、滤除无效值和缺失值、抗热度除偏处理中的至少一个。进一步地,步骤S202,根据历史行为数据集提取用户的行为特征,根据关联用户行为数据集提取关联特征,包括:根据预处理后的历史行为数据集提取用户的行为特征,根据预处理后的至少一个关联用户行为数据集提取关联特征。

在本实施例中,预处理可以是对数据中的可识别的错误进行纠正,可以包括检查数据一致性,处理无效值和缺失值,还可以对历史行为数据集和关联用户行为数据集进行抗热度除偏处理,热度越高,对行为预测结果的影响力越小。

例如,通过公式(7)对历史行为数据集R进行抗热度除偏处理。

其中,P表示用户行为数据与行为预测结果的影响力,D

本申请实施例提供的行为预测方法,对历史行为数据集和关联用户行为数据集进行预处理,根据预处理后的历史行为数据集提取用户的行为特征,根据预处理后的至少一个关联用户行为数据集提取关联特征,保证了用户的行为特征和关联特征的准确性和可靠性。

本申请实施例基于图2-图4所示的行为预测方法得到的目标特征数据的基础上,采用预设的预测行为模型对进一步的对用户行为进行预测,如图5所示,步骤“根据目标特征数据和预设的行为预测模型,得到用户的行为预测结果”包括以下步骤:

S501、根据用户行为相关特征确定预测用户偏好表征期望。

S502、根据用户行为相关特征的不确定度确定不确定性协方差矩阵。

S503、将预测用户偏好表征期望和不确定性协方差矩阵输入至行为预测模型中,得到用户的行为预测结果。

在本实施例中,将用户的行为特征和关联特征进行融合后,可以得到用户行为特征h

μ

Λ

在本实施例中,行为预测模型可以如公式(10)所示,

其中,Xμ

将预测用户偏好表征期望μ

本申请实施例提供的用户行为预测方法,获取用户的历史行为数据集和至少一个关联用户行为数据集,根据历史行为数据集提取用户的行为特征,根据至少一个关联用户行为数据集提取关联特征,将用户的行为特征和关联特征进行融合,得到目标特征数据,根据目标特征数据和预设的行为预测模型中,得到用户的行为预测结果,相当于将用户的历史行为数据和关联用户的行为数据进行融合,以得到用户的行为特征,在确定用户的行为特征时,不仅以用户的大量历史数据为基础,还以用户的关联用户的行为数据作为参考对用户的行为特征进行校准,可以减少由于数据采集过程中传感器和业务系统的不稳定性、用户行为的不确定性等,对采集数据的影响,从而保证了后续对用户行为进行预测的准确性和可靠性。

本申请实施例还提供一种行为预测模型的训练方法,如图6所示,该方法包括以下步骤:

S601、根据样本用户行为数据集获取样本目标特征数据和标准用户行为结果。

在本实施例中,样本用户行为数据集中可以包括多个用户的历史行为数据,可以采用图2-图4所示实施例提供的行为预测方法得到样本目标特征数据,此处不再赘述。还可以对样本用户行为数据集进行统计分析,得到标准用户行为结果,例如,获取样本用户行为数据集中包括100个用户的历史行为数据,可以通过统计方法获取每个用户的行为特征以及行为特征的不确定度,作为标准用户行为结果。

S602、根据样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到行为预测模型。

在本实施例中,可以样本目标特征数据为输入,以标准用户行为结果为输出,以预测置信度为约束条件,对初始行为预测模型进行训练,得到行为预测模型。

其中,预测置信度Φ

其中,

进一步地,根据样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到行为预测模型,包括:将样本目标特征数据输入初始行为预测模型中,得到用户行为预测结果;采用最大均值差异算法计算用户行为预测结果与标准用户行为结果之间的差异值,根据差异值和预测置信度调整初始行为预测模型的参数,直到满足预设的训练截止条件,得到行为预测模型。

其中,训练截止条件可以包括差异值达到预设标准值,或者到达预设的迭代次数。

具体的,可以通过公式(12)计算用户行为预测结果与标准用户行为结果之间的差异值,从而根据该差异值求解初始行为预测模型中的参数,直至调整参数后的初始行为预测模型满足训练截止条件,得到行为预测模型。

其中,p(r

本申请实施例提供的行为预测模型的训练方法,根据样本用户行为数据集获取样本目标特征数据和标准用户行为结果,根据样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到行为预测模型,利用海量的用户历史行为数据对行为预测模型进行训练和优化,可以准确的为用户提供个性化推荐,例如,个性化的商品推荐结果,或者上/下车点预测服务等。

应该理解的是,虽然图2-图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图7所示,提供了一种行为预测装置,包括:

获取模块11,用于获取用户的历史行为数据集和关联用户行为数据集;关联用户行为数据集包括与用户存在关联关系的用户的行为数据;

特征提取模块12,用于根据历史行为数据集提取用户的行为特征,根据关联用户行为数据集提取关联特征;

融合模块13,用于将用户的行为特征和关联特征进行融合,得到目标特征数据;

预测模块14,用于根据所述目标特征数据和预设的行为预测模型中,得到用户的行为预测结果。

在一个实施例中,如图8所示,特征提取模块12,包括:

过滤增强单元121,用于对关联用户行为数据集进行过滤和增强处理,得到关联用户特征矩阵;

高阶化单元122,用于对关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵;

扁平化单元123,用于对高阶化特征矩阵进行特征扁平化处理,得到关联特征。

在一个实施例中,过滤增强单元121,用于根据所述关联用户行为数据集,构建初始关联用户特征矩阵;根据所述关联用户行为数据集对应的相似度集,对所述初始关联用户特征矩阵进行数据过滤和增强,得到所述关联用户特征矩阵;所述相似度集包括所述用户与关联用户之间的相似度。

在一个实施例中,过滤增强单元121,用于对所述关联用户行为数据集进行连续特征化处理,得到每个关联用户对应的第一特征向量;将所述每个关联用户对应的特征向量按行堆叠,得到所述初始关联用户特征矩阵。

在一个实施例中,高阶化单元122,用于根据预设的空洞卷积,对所述关联用户特征矩阵进行非线性变化,得到所述高阶化特征矩阵。

在一个实施例中,扁平化单元123,用于将所述高阶化特征矩阵按行拆分,得到每个所述关联用户数据矩阵对应的第二特征向量;将每个关联用户对应的第二特征向量按照预设顺序堆叠,得到所述关联特征。

在一个实施例中,如图9所示,该行为预测装置还包括:

预处理模块15,用于对所述历史行为数据集和所述关联用户行为数据集进行预处理;所述预处理包括一致性检查、滤除无效值和缺失值、抗热度除偏处理中的至少一个;

特征提取模块12,用于根据预处理后的历史行为数据集提取所述用户的行为特征,根据预处理后的至少一个关联用户行为数据集提取关联特征。

在一个实施例中,目标特征数据包括用户行为特征和所述用户行为特征的不确定度。

在一个实施例中,预测模块14,具体用于根据所述用户行为相关特征确定预测用户偏好表征期望;根据所述用户行为相关特征的不确定度确定不确定性协方差矩阵;将所述预测用户偏好表征期望和所述不确定性协方差矩阵输入至所述行为预测模型中,得到用户的行为预测结果。

在一个实施例中,如图9所示,该行为预测装置还包括:

确定模块16,用于根据样本用户行为数据集获取样本目标特征数据和标准用户行为结果;

训练模块17,用于根据所述样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到所述行为预测模型。

在一个实施例中,训练模块17,用于将所述样本目标特征数据输入所述初始行为预测模型中,得到用户行为预测结果;采用最大均值差异算法计算所述用户行为预测结果与所述标准用户行为结果之间的差异值,根据所述差异值和所述预测置信度调整所述初始行为预测模型的参数,直到满足预设的训练截止条件,得到所述行为预测模型。

上述实施例提供的行为预测装置,其实现原理和有益效果可参照图2-图4所示方法实施例,此处不再赘述。

关于行为预测装置的具体限定可以参见上文中对于行为预测方法的限定,在此不再赘述。上述行为预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于电子设备中的处理器中,也可以以软件形式存储于电子设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

图10是根据一示例性实施例示出的一种服务器1400的框图。参照图10,服务器1400包括处理组件1420,其进一步包括一个或多个处理器,以及由存储器1422所代表的存储器资源,用于存储可由处理组件1420执行的指令或者计算机程序,例如应用程序。存储器1422中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1420被配置为执行指令,以执行上述数据融合的方法。

服务器1400还可以包括一个电源组件1424被配置为执行设备1400的电源管理,一个有线或无线网络接口1426被配置为将设备1400连接到网络,和一个输入输出(I/O)接口1428。服务器1400可以操作基于存储在存储器1422的操作系统,例如Window1414erverTM,Mac O14 XTM,UnixTM,LinuxTM,FreeB14DTM或类似。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1304,上述指令可由电子设备1300的处理器1320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器1422,上述指令可由服务器1400的处理器执行以完成上述方法。存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品,该计算机程序被处理器执行时,可以实现上述方法。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行这些计算机指令时,可以全部或部分地按照本公开实施例所述的流程或功能实现上述方法中的部分或者全部。

示例性的,本申请实施例公开了TS1、一种数据融合的方法,所述方法包括:

获取用户的历史行为数据集和关联用户行为数据集;所述关联用户行为数据集包括与所述用户存在关联关系的用户的行为数据;

根据所述历史行为数据集提取所述用户的行为特征,根据所述关联用户行为数据集提取关联特征;

将所述用户的行为特征和所述关联特征进行融合,得到目标特征数据;

根据所述目标特征数据和预设的行为预测模型,得到所述用户的行为预测结果。

TS2、如TS1所述的方法,其中,所述根据所述关联用户行为数据集提取关联特征,包括:

对所述关联用户行为数据集进行过滤和增强处理,得到关联用户特征矩阵;

对所述关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵;

对所述高阶化特征矩阵进行特征扁平化处理,得到所述关联特征。

TS3、如TS2所述的方法,其中,所述对所述关联用户行为数据集进行过滤和增强处理,得到关联用户特征矩阵,包括:

根据所述关联用户行为数据集,构建初始关联用户特征矩阵;

根据所述关联用户行为数据集对应的相似度集,对所述初始关联用户特征矩阵进行数据过滤和增强,得到所述关联用户特征矩阵;所述相似度集包括所述用户与关联用户之间的相似度。

TS4、如TS3所述的方法,其中,根据所述关联用户行为数据集,构建初始关联用户特征矩阵,包括:

对所述关联用户数据矩阵进行连续特征化处理,得到每个关联用户对应的第一特征向量;

将所述每个关联用户对应的特征向量按行堆叠,得到所述初始关联用户特征矩阵。

TS5、如TS2所述的方法,其中,所述对所述关联用户特征矩阵进行特征高阶化处理,得到高阶化特征矩阵,包括:

根据预设的空洞卷积,对所述关联用户特征矩阵进行非线性变化,得到所述高阶化特征矩阵。

TS6、如TS2所述的方法,其中,所述对所述高阶化特征矩阵进行特征扁平化处理,得到所述关联特征,包括:

将所述高阶化特征矩阵按行拆分,得到每个所述关联用户数据矩阵对应的第二特征向量;

将每个关联用户对应的第二特征向量按照预设顺序堆叠,得到所述关联特征。

TS7、如TS1-TS6任一项所述的方法,其中,所述方法还包括:

对所述历史行为数据集和所述关联用户行为数据集进行预处理;所述预处理包括一致性检查、滤除无效值和缺失值、抗热度除偏处理中的至少一个;

所述根据所述历史行为数据集提取所述用户的行为特征,根据所述至少一个关联用户行为数据集提取关联特征,包括:

根据预处理后的历史行为数据集提取所述用户的行为特征,根据预处理后的至少一个关联用户行为数据集提取关联特征。

TS8、如TS1-TS6任一项所述的方法,其中,所述目标特征数据包括用户行为相关特征和所述用户行为相关特征的不确定度。

TS9、如TS8所述的方法,其中,所述根据所述目标特征数据和预设的行为预测模型中,得到用户的行为预测结果,包括:

根据所述用户行为相关特征确定预测用户偏好表征期望;

根据所述用户行为相关特征的不确定度确定不确定性协方差矩阵;

将所述预测用户偏好表征期望和所述不确定性协方差矩阵输入至所述行为预测模型中,得到用户的行为预测结果。

TS10、如TS1-TS6任一项任一项所述的方法,其中,所述方法还包括:

根据样本用户行为数据集获取样本目标特征数据和标准用户行为结果;

根据所述样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到所述行为预测模型。

TS11、如TS110任一项所述的方法,其中,所述根据所述样本目标特征数据、标准用户行为结果和预测置信度,对初始行为预测模型进行训练,得到所述行为预测模型,包括:

将所述样本目标特征数据输入所述初始行为预测模型中,得到用户行为预测结果;

采用最大均值差异算法计算所述用户行为预测结果与所述标准用户行为结果之间的差异值,根据所述差异值和所述预测置信度调整所述初始行为预测模型的参数,直到满足预设的训练截止条件,得到所述行为预测模型。

TS12、一种行为预测装置,其中,所述装置包括:

获取模块,用于获取用户的历史行为数据集和关联用户行为数据集;所述关联用户行为数据集包括与所述用户存在关联关系的用户的行为数据;

特征提取模块,用于根据所述历史行为数据集提取所述用户的行为特征,根据所述关联用户行为数据集提取关联特征;

融合模块,用于将所述用户的行为特征和所述关联特征进行融合,得到目标特征数据;

预测模块,用于根据所述目标特征数据和预设的行为预测模型,得到所述用户的行为预测结果。

TS13、一种服务器,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现权利要求TS1至TS11中任一项所述的方法的步骤。

TS14、一种存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现权利要求TS1至TS11中任一项所述的方法的步骤。

TS15、一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求TS1至TS11中任一项所述的方法的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开实施例所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccess Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本公开实施例的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开实施例构思的前提下,还可以做出若干变形和改进,这些都属于本公开实施例的保护范围。因此,本公开实施例专利的保护范围应以所附权利要求为准。

相关技术
  • 行为预测方法、装置、电子设备、存储介质和程序产品
  • 行为克隆方法、电子设备、存储介质和程序产品
技术分类

06120112792109