掌桥专利:专业的专利平台
掌桥专利
首页

训练时序预测模型、预测行为序列的方法和装置

文献发布时间:2023-06-19 19:30:30


训练时序预测模型、预测行为序列的方法和装置

技术领域

本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习的方式,训练时序预测模型,以及利用时序预测模型预测用户行为序列的方法和装置。

背景技术

随着计算机技术的发展,机器学习已经应用到各种各样的技术领域,用于分析、预测各种业务数据。在互联网环境中,用户行为是常见的分析来源。

用户行为是随时间线而发生的一系列用户动作,这些动作包括,例如,登录、搜索、点击、访问网页时收藏某个页面、购买某个商品、将某个商品加入购物车(加购),等等。对用户个体行为进行建模和分析,可以直接地用于理解该用户的个体偏好和用户意图,进而有助于为用户提供针对性的、个性化的服务。

由此,希望能有改进的方案,可以更为有效地对一个时段内的用户行为序列进行整体预测,从而便于服务平台更好地针对用户进行业务部署。

发明内容

本说明书一个或多个实施例描述了一种训练时序预测模型的方案,以及利用这样的时序预测模型预测用户行为序列的方案,可以更准确地进行长周期中用户行为序列的预测,提升预测性能。

根据第一方面,提供了一种训练时序预测模型的方法,所述时序预测模型包括,自回归预测模型和能量计算模型,所述方法包括:

获取标签行为序列,其中包括,样本用户在第一时段中的第一行为序列,以及在接续第一时段的第二时段中的第二行为序列;

将所述第一行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于第二时段中依次发生行为的概率分布信息;

基于所述概率分布信息进行采样,得到N个采样行为序列;

利用所述能量计算模型,确定标签行为序列的标签能量值,以及N个采样全序列各自的采样能量值;所述N个采样全序列,是所述第一行为序列分别与N个采样行为序列拼接的序列;

以目标函数的函数值趋于增大为目标,调整所述能量计算模型中的模型参数;其中所述目标函数与所述标签能量值负相关,与所述采样能量值正相关。

在一个实施例中,在将所述第一行为序列输入所述自回归预测模型进行模型处理之前,还包括:基于行为序列样本,以该样本中用户行为序列的时序点过程的似然性最大化为目标,训练所述自回归预测模型。

根据一种实施方式,自回归的预测模型中的模型处理包括,将所述第一行为序列作为初始的当前行为序列,执行多次迭代过程,任意迭代过程包括:利用所述自回归模型处理当前行为序列,确定下一行为的预测概率信息;根据所述预测概率信息确定下一预测行为,将其添加到当前行为序列中,作为更新的当前行为序列;所述预测概率分布包括,多次迭代分别得到的预测概率信息。

在一个实施例中,上述预测概率信息包括,下一行为属于预设的多种行为类别中各个类别的概率,下一行为发生时间的置信度。

在另一实施例中,上述预测概率信息包括,各个行为类别的强度函数值。

在一个示例中,基于所述概率分布信息进行采样包括,利用细化算法,基于强度函数值进行采样。

根据一种实施方式,能量计算模型包括transformer神经网络和多层感知机MLP,其中,所述transformer神经网络用于对输入行为序列进行注意力处理,得到表征整个行为序列的固定维度的向量;所述MLP用于将该固定维度的向量映射处理为标量,作为输入行为序列的能量值。

根据一种实现方式,目标函数包含第一项和第二项之和,其中第一项为基于所述标签能量值确定的标签行为序列为真实行为序列的似然度,其与所述标签能量值负相关;第二项为各个采样全序列不是真实行为序列的似然度之和,其与各个采样能量值正相关。

根据另一种实现方式,目标函数包含第三项和第四项之和,其中第三项为标签能量值的相反数;第四项负相关于所述标签行为序列和N个采样全序列形成的N+1个行为序列的指标分数之和,各指标分数与对应行为序列的能量值负相关。

在一个实施例中,目标函数还包括正则项,所述正则项用于将任一采样全序列的采样能量值和标签能量值的差值,约束在基于目标距离确定的边界范围中,所述目标距离为该采样全序列与标签行为序列之间的序列距离。

根据第二方面,提供了一种预测用户行为序列的方法,该方法利用预先训练的时序预测模型进行,所述时序预测模型包括,自回归预测模型和能量计算模型,所述方法包括:

获取目标用户在第一时段中的目标行为序列;

将所述目标行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于待预测的第二时段中依次发生行为的概率分布信息;

基于所述概率分布信息进行采样,得到M个备选行为序列;

利用所述能量计算模型,确定M个备选全序列对应的M个能量值,所述M个备选全序列为所述目标行为序列分别与M个备选行为序列拼接的序列;

根据所述M个能量值,确定所述M个备选行为序列的M个权重值;

根据所述M个备选行为序列和所述M个权重值,确定所述第二时段中的预测行为序列。

在一个实施例中,确定所述第二时段中的预测行为序列,包括:将权重值最大的备选行为序列,确定为所述预测行为序列。

在另一实施例中,确定所述第二时段中的预测行为序列,包括:基于所述M个权重值组合所述M个备选行为序列,根据组合结果得到所述预测行为序列

根据第三方面,提供了一种训练时序预测模型的装置,所述时序预测模型包括,自回归预测模型和能量计算模型,所述装置包括:

标签获取单元,配置为获取标签行为序列,其中包括,样本用户在第一时段中的第一行为序列,以及在接续第一时段的第二时段中的第二行为序列;

第一预测单元,配置为将所述第一行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于第二时段中依次发生行为的概率分布信息;

采样单元,配置为基于所述概率分布信息进行采样,得到N个采样行为序列;

能量确定单元,配置为利用所述能量计算模型,确定标签行为序列的标签能量值,以及N个采样全序列各自的采样能量值;所述N个采样全序列,是所述第一行为序列分别与N个采样行为序列拼接的序列;

参数调整单元,配置为以目标函数的函数值趋于增大为目标,调整所述能量计算模型中的模型参数;其中所述目标函数与所述标签能量值负相关,与所述采样能量值正相关。

根据第四方面,提供了一种预测用户行为序列的装置,该装置利用预先训练的时序预测模型进行,所述时序预测模型包括,自回归预测模型和能量计算模型,所述装置包括:

序列获取单元,配置为获取目标用户在第一时段中的目标行为序列;

第一预测单元,配置为将所述目标行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于待预测的第二时段中依次发生行为的概率分布信息;

采样单元,配置为基于所述概率分布信息进行采样,得到M个备选行为序列;

能量确定单元,利用所述能量计算模型,确定M个备选全序列对应的M个能量值,所述M个备选全序列为所述目标行为序列分别与M个备选行为序列拼接的序列;

权重确定单元,配置为根据所述M个能量值,确定所述M个备选行为序列的M个权重值;

第二预测单元,配置为根据所述M个备选行为序列和所述M个权重值,确定所述第二时段中的预测行为序列。

根据第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面所述的方法。

根据第六方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。

在本说明书的实施例中,提出一种适于进行长周期预测的时序预测模型,该模型在建模原理上组合时序点过程和能量函数的建模,在模型功能结构上包括,自回归预测模型以及能量计算模型。利用该时序预测模型进行长周期预测时,预测行为序列不是通过逐个确定用户行为而得到的,而是作为整体,基于各个备选全序列的能量值而选择确定的,如此,避免了利用常规自回归模型进行逐个行为预测造成的误差累积。在训练过程和预测过程中,通过序列采样的方式获得简化的归一化常量,使得全局归一化模型的训练和使用具有更强的可操作性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为长周期行为预测的示意图;

图2示出根据一个实施例的训练时序预测模型的方法流程图;

图3示出在一个实施例中自回归预测模型的实现示例;

图4示出根据一个实施例的预测用户行为序列的方法流程图;

图5示出根据一个实施例的训练装置的结构示意图;

图6示出根据一个实施例的预测装置的结构示意图。

具体实施方式

下面结合附图,对本说明书提供的方案进行描述。

在多种技术场景中,希望基于用户过去的历史行为序列,预测其未来行为,例如是否会点击某类对象,是否会访问某类网站,等等,从而更好地为用户提供针对性的服务,或者更好地进行业务平台的部署(例如根据预测的用户访问行为,对平台集群的硬件部署或内容部署进行调整)。

在一种相关方案中,训练自回归的预测模型,预测未来用户行为。这样的预测模型一般是基于观测到的一段用户行为序列,预测下一用户行为,例如,下一行为的类别,发生时间,等等。

在一些场景中,存在对未来的长周期内用户行为的预测需求,这里的长周期,是相对于用户的行为发生平均时间间隔而言的。一般的,长周期可以是上述平均时间间隔的若干倍;相应的,预期会在该长周期内发生多起用户行为事件。

图1为长周期行为预测的示意图。在图1中,用不同形状的图形符号(五角星,菱形,三角形,圆形等)表征不同类型的用户行为或事件。如图1所示,长周期的用户行为预测即,已知用户在一段较长的时间段T1内的行为序列,其中包括按照时间顺序排列的、依次发生的不同类型的用户行为,预测该用户在接下来的一个时间段T2内的行为或事件。例如,在一个例子中,某个内容平台,可能希望基于用户过去一个月(T1=一个月)对该平台内容的访问行为序列(阅读,收藏,转发,点赞等),预测接下来3天(T2=3天)该用户可能的访问行为。

清楚起见,下面结合数学表示,说明这一技术问题,以及本方案的技术构思。

可以观测、获取时间段[0,T]中发生的用户行为序列。假定这个时间段中发生了I个用户行为/事件,发生时间可以记为0<t

可以基于时序点过程对行为序列进行建模,如此构建自回归的预测模型。在这样的预测模型中,从左到右顺次依序生成/预测下一行为。对第i个行为事件(t

在时序点过程中,用强度函数表征“瞬时”概率的含义。具体的,定义强度函数λ

p

如此,整个用户行为序列x

从而,可以以最大似然性为目标,即以式(2)作为目标函数,以其函数值最大化为目标,训练得到自回归预测模型。

然而,当使用这样的自回归预测模型进行图1所示意的长周期预测时,可能由于误差累积的效应,影响序列预测的准确性。如前所述,自回归模型在预测过程中,从左到右顺次依序生成/预测下一行为。也就是说,该模型每次基于已知行为序列,预测下一行为,然后将预测得到的下一行为添加到已知行为序列中,作为更新的已知行为序列,继续进行后续行为的预测。如此,一旦其中某一行为的预测准确度不够,则后续的预测结果都会受到影响。这样的预测误差随着后续行为的预测数量而累积放大,最终影响长周期行为序列的预测准确性。

为此,希望构建一种针对整个行为序列空间全局归一化的模型,避免误差累积的问题。也就是说,针对任意时间段[0,T],希望模型可以给出在[0,T]中所有可能发生的行为序列的归一化的概率分布,而不是在每个瞬时间隔(t,t+dt)中的可能子序列(可假定最多包含单个用户行为)的概率分布。这样,可以直接将归一化概率最大的序列作为预测序列,从而避免依次逐个预测下一行为带来的误差累积。

为了计算归一化概率,全局归一化的模型需要针对每个序列x

p(x

根据以上公式(3),概率正比于指标分数exp(-E(x

然而,全局归一化模型的训练面临一些难题。首先,能量函数E形式的选择是需要考虑的问题;并且,训练这样的全局归一化模型需要计算归一化常量∑exp(-E(x

鉴于以上的研究,在本说明书的实施例中,提出一种适于进行长周期预测的时序预测模型,该模型在建模原理上组合时序点过程和能量函数的建模,在模型功能结构上包括,自回归预测模型以及能量计算模型。该模型针对预测时段内的子序列进行归一化,具体而言,针对已知的第一时段[0,T],和将预测的、接续第一时段的第二时段(T,T’),上述时序预测模型(又简称为HYPRO模型,混合归一化概率模型)预测第二时段中的具体序列x

其中,p

为了简化上述归一化常数的计算难度,根据本说明书的实施例,基于自回归预测模型的输出进行采样,从而将归一化常数的求和简化为对有限样本的求和,简化计算过程。

下面详细描述以上时序预测模型的训练和使用过程。

图2示出根据一个实施例的训练时序预测模型的方法流程图。可以理解,该方法可以通过任何具有计算、处理能力的装置、设备、平台、设备集群来执行。如前所述,该时序预测模型可以包括,自回归预测模型和能量计算模型,其中自回归预测模型用于根据已有用户行为序列,预测下一用户行为;能量计算模型用于计算给定的用户行为序列的能量值。其中,自回归预测模型可以在执行图2方法之前,预先训练得到。

具体地,自回归模型可以基于已知的行为序列样本训练得到。其训练的目标函数例如如前述公式(2)所示。在其他示例中,也可以根据需要采用不同的目标函数,在此不做限定。

在不同实施例中,自回归预测模型可以通过各种形式的神经网络实现。例如,在一个实施例中,可以采用时序的神经网络,例如LSTM,RNN等,实现上述自回归预测模型。

图3示出在一个实施例中自回归预测模型的实现示例。在图3的示例中,通过循环神经网络RNN实现自回归预测模型。RNN的每个单元根据上一时刻的隐状态,和当前时刻的输入,确定下一时刻的隐状态。对于用户行为序列或事件序列来说,可以将已知序列中的n个行为/事件依次输入RNN单元,RNN单元依次对n个行为进行编码。对任意的第i+1个事件进行编码时,根据第i个行为的编码(即隐状态),以及第i+1个行为的特征信息(包括行为类别,时间,时间间隔τ等),确定第i+1个事件的编码。如此,依次得到第n个行为/事件的编码,作为已知序列的序列编码。根据该编码,预测第n+1个行为/事件。如需进行序列预测,则将预测出的第n+1行为/事件的特征信息继续输入RNN,预测第n+2个行为/事件。

在另一实施例中,可以采用Transformer神经网络实现上述自回归预测模型。在采用Transformer神经网络的情况下,可以将用户行为序列的n个行为同时输入到模型,Transformer基于注意力机制对多个行为的行为表征进行处理,从而确定出序列表征,从而预测下一行为。然后,将预测到的下一行为再添加到原行为序列中,继续进行序列表征和行为预测。

在对自回归预测模型进行预训练的基础上,可以执行图2所示的方法步骤,具体包括以下过程。

在步骤21,获取标签行为序列,其中包括,样本用户在第一时段中的第一行为序列,以及在接续第一时段的第二时段中的第二行为序列。

结合之前的表述,第一时段可以表示为[0,T],第二时段可以表示为(T,T’],第二时段接续第一时段,因此第二时段的起点T是第一时段的终点。其中,第二时段是待预测的感兴趣的目标时段,对应于之前所述的长周期。也就是说,第二时段的时长,远大于用户行为的平均时间间隔,因此预期在第二时段中可能会发生多个用户行为。相应的,第一行为序列可以表示为x

需理解,以上用户行为,或称为事件,可以是互联网环境中的各种用户操作事件,例如,登录行为,购买行为,支付行为,点击行为,加购行为,交易行为,社交互动行为,等等。可以预先定义K种类别,分别对应表示各种不同的用户行为。

在步骤22,将第一行为序列输入自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于第二时段中依次发生行为的预测概率分布。

可以理解,此时的自回归预测模型经过预训练,具备了一定的预测能力。因此,可以将第一行为序列x

在利用自回归预测模型进行长周期预测时,模型预测处理一般包括多次迭代过程。首次迭代时将输入的第一行为序列x

也就是说,自回归预测模型在预测下一行为时,会基于当前行为序列的编码,首先计算出针对下一行为的预测概率信息作为中间结果。这样的预测概率信息至少包括,下一行为属于预设的K种行为类别中各类别的概率。在一些实施例中,预测概率信息还包括关于下一行为发生时间的预测置信度。在常规的自回归预测模型的使用中,将预测概率信息中概率最大的那个行为类别,确定为下一行为。结合预测的发生时间等,作为下一行为的特征信息,继续输入到自回归预测模型中进行后续预测。最终模型输出预测的一系列用户行为。

与常规不同的,在步骤22,获得自回归预测模型依次预测下一行为时的预测概率信息,形成概率分布信息,这样的概率分布信息包括,第二时段中依次发生的若干行为各自在K种行为类别中的概率分布。例如,假定K=4,自回归预测模型预测第二时段中第i个行为时,计算得到的中间结果包括,第i个行为属于4种行为类别的概率分布为(0.12,0.25,0.55,0.05)。在常规方式下,将概率最大的行为B3作为下一行为,并输出B3。而在步骤22中,还获得上述概率分布(0.12,0.25,0.55,0.05),用于形成概率分布信息。在一个实施例中,概率分布信息还包括,对第二时段中依次发生的若干行为的发生时间的预测置信度,该预测置信度可以体现,在该预测时间发生用户行为的概率。

在一种实施方式下,自回归预测模型针对第二时段各个行为预测的概率分布信息,可以包括或体现为各个行为类别的强度函数值λ

基于以上获取的概率分布信息,在步骤23,可以对第二时段的用户行为进行采样,得到N个采样行为序列。这N个采样行为序列可以表示为:

具体地,在一个实施例中,通过N次采样过程,形成N个采样行为序列。单次采样过程可以包括,针对预期依次发生的各行为,例如第二时段中第i个行为,根据该第i个行为在K种行为类别中的概率分布进行采样,概率较大的行为类别具有较大的被选中概率。组合选中的若干行为,形成该次采样的行为序列。在一个示例中,还可以根据第i个行为的预测时间的置信度,对预测时间进行调整,作为采样行为序列中第i个行为的发生时间。

在另一实施例中,基于强度函数值λ

在其他实施例中,还可以通过不同的或更多的采样方式,执行上述采样过程,得到N个采样行为序列

接着,在步骤24,利用能量计算模型,确定标签行为序列的标签能量值,以及N个采样全序列各自的采样能量值。

可以理解,能量计算模型是待训练的模型,其采用参数为θ的能量计算函数E

根据一种实施方式,能量计算模型采用神经网络实现。在一个实施例中,能量计算模型实现为transformer神经网络和多层感知机MLP的组合。在这样的情况下,首先通过transformer对输入行为序列进行注意力处理,得到一个表征整个行为序列的固定维度数的向量,然后利用MLP将该固定维度的向量映射为一个标量,作为输入行为序列的能量值。

在另一实施例中,能量计算模型还可以基于时序神经网络(例如RNN)实现。在这样的情况下,时序神经网络依次处理输入行为序列中的各个用户行为,基于最终的隐状态向量进行映射运算,得到输入行为序列的能量值。

在其他实施例中,能量计算模型还可以具有其他神经网络结构,在此不做限定。

在此基础上,在步骤25,以目标函数的函数值趋于增大为目标,调整能量计算模型中的模型参数;其中所述目标函数与标签能量值负相关,与所述采样能量值正相关。

可以理解,这里的目标函数是前述步骤24确定的能量值的函数,用于指导能量计算模型的训练。训练的方向和目标即为,目标函数趋于最大化。这里的目标函数设定为,与标签能量值负相关,与采样能量值正相关。则目标函数的函数值趋于增大意味着,标签能量值趋于减小,采样能量值趋于增大。

根据前述公式(3)可知,一个序列出现的概率或作为真实序列的概率,与其能量值负相关。因此,标签能量值趋于减小,采样能量值趋于增大意味着,标签行为序列的概率值趋于增大,采样全序列的概率值趋于减小。这与标签行为序列是真实行为序列,采样全序列是采样得到的噪声行为序列的事实相一致。根据这样的目标函数训练的能量计算模型,可以针对输入行为序列计算出恰当的能量值,基于该能量值可以得到较为准确的概率估计。

目标函数具体可以采用不同形式。

在一个实施例中,从整个时序预测模型对第二时段中具体序列的预测概率公式(4)出发,将其中的归一化常量简化为标签序列和N个采样全序列的指标分数之和,基于二元噪声对比估计NCE(noise-contrastive estimation)的算法,可以确定出如下的目标函数(下文称为第一目标函数):

公式(6)中,σ表示sigmoid函数。

可以看到,第一目标函数包含第一项和第二项之和,其中第一项为基于标签能量值确定的标签行为序列为真实行为序列的似然度(log似然性),其与标签能量值负相关;第二项为各个采样行为序列不是真实行为序列的似然度之和,其与各个采样能量值正相关。以第一目标函数最大化为目标进行训练,可以使得能量计算模型E

在另一实施例中,从预测概率公式(4)出发,基于同样简化的归一化常数,利用多元NCE的思想,确定出如下的目标函数(下文称为第二目标函数):

可以看到,第二目标函数包含第三项和第四项之和,其中第三项为标签能量值的相反数;第四项负相关于所有N+1个行为序列的指标分数(即

在又一实施例中,考虑行为序列之间的距离,在以上目标函数的基础上,添加正则项。该正则项用于将采样能量值和标签能量值的差值,约束在一定范围。在一个例子中,上述正则项表示为:

其中,d(n)表示标签行为序列

对于以上各种目标函数,在步骤25中,以目标函数的函数值趋于增大为目标,调整能量计算模型中的模型参数。具体的,可以通过计算梯度,来进行参数调整。

实践中,反复执行图2所示的过程,直到达到预定的结束条件,该结束条件可以是,例如,迭代次数达到一定阈值,目标函数达到收敛,等等。

通过以上过程,对能量计算模型进行了训练。训练好的能量计算模型,连同预训练的自回归预测模型,共同构成用于长周期预测的时序预测模型。

下面描述利用上述训练的时序预测模型进行长周期预测的过程。

图4示出根据一个实施例的预测用户行为序列的方法流程图。该方法利用前述训练的时序预测模型执行,该时序预测模型包括,自回归预测模型和能量计算模型。具体的预测过程如图4所示,包括以下步骤。

在步骤41,获取目标用户在第一时段[0,T]中的目标行为序列。可以理解,该目标行为序列是已经观测到的行为序列,是预测将来行为的基础。

在步骤42,将该目标行为序列输入自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于待预测的第二时段(T,T’]中依次发生行为的概率分布信息。该步骤的执行过程与图2步骤22的执行过程相似,不复赘述。

然后,在步骤43,基于步骤42得到的概率分布信息进行采样,得到M个备选行为序列。该步骤的执行过程与图2步骤23的执行过程相似。M的数量与步骤23中的N,可以相同也可以不同。得到的M个备选行为序列可以表示为:

接着,在步骤44,利用训练好的能量计算模型,确定M个备选全序列对应的M个能量值。能量计算模型的实现方式,以及针对输入序列计算能量值的方式,可以参照之前结合步骤24的描述,不复赘述。如此得到的M个能量值可以表示为:

在步骤45,根据所述M个能量值,确定M个备选行为序列的M个权重值。需理解,这M个权重值是归一化的权重值,反映对应备选行为序列的归一化概率,即正比于公式(4)的p

由此可见,任意备选行为序列的权重值,与该备选行为序列对应的备选全序列的能量值负相关。如之前能量计算模型的训练过程所述,能量值越低,对应为真实序列的概率越高。相应的,由此得到的本步骤中的权重值也越高。

于是,在步骤46,可以根据M个备选行为序列和M个权重值,确定感兴趣的第二时段中的预测行为序列。

在一个实施例中,直接将权重值最大的备选行为序列,确定为预测行为序列,从而实现长周期(T,T’]中用户行为序列的预测。

在另一实施例中,还可以基于M个权重值组合所述M个备选行为序列,根据组合结果得到预测行为序列。

从以上过程可以看到,预测行为序列不是通过逐个确定用户行为而得到的,而是作为整体,基于各个备选全序列的能量值而选择确定的,如此,避免了利用常规自回归模型进行逐个行为预测造成的误差累积。在训练过程和预测过程中,通过序列采样的方式获得简化的归一化常量,使得全局归一化模型的训练和使用具有更强的可操作性。

根据另一方面的实施例,提供了一种训练时序预测模型的装置。图5示出根据一个实施例的训练装置的结构示意图,该训练装置可以部署在任何具有数据存储、计算、处理能力的设备、平台或设备集群中。待训练的时序预测模型包括,自回归预测模型和能量计算模型。如图5所示,该训练装置500包括:

标签获取单元51,配置为获取标签行为序列,其中包括,样本用户在第一时段中的第一行为序列,以及在接续第一时段的第二时段中的第二行为序列;

第一预测单元52,配置为将所述第一行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于第二时段中依次发生行为的概率分布信息;

采样单元53,配置为基于所述概率分布信息进行采样,得到N个采样行为序列;

能量确定单元54,配置为利用所述能量计算模型,确定标签行为序列的标签能量值,以及N个采样全序列各自的采样能量值;所述N个采样全序列,是所述第一行为序列分别与N个采样行为序列拼接的序列;

参数调整单元55,配置为以目标函数的函数值趋于增大为目标,调整所述能量计算模型中的模型参数;其中所述目标函数与所述标签能量值负相关,与所述采样能量值正相关。

以上装置中各个单元的实现方式,可以参照之前结合图2的描述。通过以上装置,可以训练得到适于长周期预测的时序预测模型。

根据又一方面的实施例,提供了一种预测用户行为序列的装置。图6示出根据一个实施例的预测装置的结构示意图,该训练装置可以部署在任何具有数据存储、计算、处理能力的设备、平台或设备集群中。该预测装置利用预先训练的时序预测模型进行,所述时序预测模型包括,自回归预测模型和能量计算模型。如图6所示,该预测装置600包括:

序列获取单元61,配置为获取目标用户在第一时段中的目标行为序列;

第一预测单元62,配置为将所述目标行为序列输入所述自回归预测模型进行模型处理,通过逐个预测下一行为,得到对于待预测的第二时段中依次发生行为的概率分布信息;

采样单元63,配置为基于所述概率分布信息进行采样,得到M个备选行为序列;

能量确定单元64,利用所述能量计算模型,确定M个备选全序列对应的M个能量值,所述M个备选全序列为所述目标行为序列分别与M个备选行为序列拼接的序列;

权重确定单元65,配置为根据所述M个能量值,确定所述M个备选行为序列的M个权重值;

第二预测单元66,配置为根据所述M个备选行为序列和所述M个权重值,确定所述第二时段中的预测行为序列。

通过以上装置,可以更加准确有效地在长周期中进行用户行为序列的预测,提升预测性能,便于服务平台的服务部署。

根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2或图4所描述的方法。

根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2或图4所述的方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

相关技术
  • 行为序列获取方法及装置、用户转化率预测方法及装置
  • MR图像预测模型的训练方法、装置、设备及存储介质
  • 一种针对目标场景的预测模型训练方法及装置
  • CT图像预测模型的训练方法、装置、设备及存储介质
  • 时序数据预测模型的训练方法、时序数据预测方法和装置
  • 用户行为预测方法及装置、行为预测模型训练方法及装置
技术分类

06120115938500