用户行为分类方法和装置及存储介质

文献发布时间：2023-06-19 13:46:35

技术领域

本公开涉及计算机领域，具体涉及一种用户行为分类方法和装置及存储介质。

背景技术

如今，在很多资源投放平台常常会投放很多的多媒体资源，来达到对多媒体资源中携带的某种信息进行广而告之的目的。为了改善多媒体资源的投放效果，通常会对观看多媒体资源的用户的相关行为进行分析，以便于根据用户行为的分类结果确定用户的喜好，从而对其实现针对性的资源投放。

目前，对用户行为的分类方法一般常用的方式是基于统计学来进行无监督分类。采用这种分来方式进行分类后，分类得到的结果与用户真实的喜好之间实际上存在较大的偏差。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本公开提供一种用户行为分类方法和装置及存储介质，以至少解决相关技术中用户行为分类方法中存在的准确性较低的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种用户行为分类方法，包括：获取待分类的当前用户操作行为对应的时间序列数据，其中，上述时间序列数据用于记录上述当前用户操作行为在目标时间段内的统计结果，上述当前用户操作行为为当前用户账号对目标平台中展示的多媒体资源执行的操作行为；根据上述时间序列数据确定上述当前用户操作行为与每个核心操作行为之间的行为相似度，其中，上述核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为；在上述行为相似度满足目标核心操作行为的匹配条件的情况下，将上述当前用户操作行为分类到上述目标核心操作行为匹配的目标聚类簇中。

根据本公开实施例的第二方面，提供一种用户行为分类装置，包括：第一获取单元，被配置为获取待分类的当前用户操作行为对应的时间序列数据，其中，上述时间序列数据用于记录上述当前用户操作行为在目标时间段内的统计结果，上述当前用户操作行为为用户账号对目标平台中展示的多媒体资源执行的操作行为；第一确定单元，被配置根据上述时间序列数据确定上述当前用户操作行为与每个核心操作行为之间的行为相似度，其中，上述核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为；分类单元，被配置在上述行为相似度满足目标核心操作行为的匹配条件的情况下，将上述当前用户操作行为分类到上述目标核心操作行为匹配的目标聚类簇中。

根据本公开实施例的第三方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备执行所述的用户行为分类方法。

根据本公开实施例的第四方面，提供一种电子设备，包括：处理器；用于存储上述处理器可执行指令的存储器；其中，上述处理器被配置为执行上述指令，以实现上述的用户行为分类方法。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机程序/指令，上述计算机程序/指令被处理器执行时实现上述的用户行为分类方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

在本发明实施例中，在获取待分类的用户操作行为对应的时间序列数据后，根据该时间序列数据来确定上述当前用户操作行为与每个核心操作行为之间的行为相似度，其中，这里的核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为。在上述行为相似度满足目标核心操作行为的匹配条件的情况下，将上述当前用户操作行为分类到目标核心操作行为匹配的目标聚类簇中。也就是说，通过比对当前待分类的当前用户操作行为与已经为各个聚类簇确定出的核心操作行为之间的行为相似度，来确定当前用户操作行为所属的聚类簇，从而实现根据上述行为相似度来为当前用户操作行为进行更加精准地分类处理。进而克服相关技术中用户行为分类方法中存在的准确性较低的问题。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种用户行为分类方法的应用环境示意图；

图2是根据一示例性实施例示出的一种用户行为分类方法的流程图；

图3是根据一示例性实施例示出的一种可选的用户行为分类方法的示意图；

图4是根据一示例性实施例示出的另一种可选的用户行为分类方法的示意图；

图5是根据一示例性实施例示出的一种可选的用户行为分类装置的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

根据本发明实施例的一个方面，提供了一种用户行为分类方法，可选地，作为一种可选的实施方式，上述用户行为分类方法可以但不限于应用于如图1所示的硬件环境中的用户行为分类系统中。其中，该用户行为分类系统可以包括但不限于终端设备102、网络104、服务器106。其中，上述终端设备102中包括人机交互屏幕1022，处理器1024及存储器1026。人机交互屏幕1022用于展示多媒体资源。处理器1024用于响应于人机交互操作生成人机交互指令，以确定用户账号对多媒体资源执行的操作行为。存储器1026用于存储上述所要展示的多媒体资源。

此外，服务器106中包括数据库1062及处理引擎1064，数据库1062中用于保存上述从终端设备102获取到的时间序列数据，以及计算得到的各种用户操作行为与每个核心操作行为之间的行为相似度。处理引擎1064用于判断上述行为相似度是否满足目标核心操作行为的匹配条件，并在确定满足目标核心操作行为的匹配条件的情况下，将用户操作行为分类到上述目标核心操作行为相匹配的目标聚类簇中。

假设终端设备102为应用场景中的任意一个用于展示多媒体资源的硬件设备，其中，具体过程如以下步骤：如步骤S102，终端设备102通过网络104向服务器106发送待分类的当前用户操作行为对应的时间序列数据，这里的时间序列数用于记录当前用户操作行为在目标时间段内的统计结果，该当前用户操作行为是用户账号对目标平台所展示的多媒体资源(如图所示的多媒体资源1)执行的操作行为。然后服务器106中的处理引擎1064利用数据库1064中存储的接收到的时间序列数据，执行以下步骤：

如步骤S104，根据该时间序列数据确定当前用户操作行为与每个核心操作行为之间的行为相似度，这里的核心操作行为是与已分类的聚类簇匹配的操作行为。如步骤S106，在上述行为相似度满足目标核心操作行为的匹配条件的情况下，将上述用户操作行为分类到目标核心操作行为匹配的目标聚类簇。从而实现对不同的用户操作行为进行更加精准地分类处理，而不再使用无监督地分类方式，达到提高用户行为分类准确性的目的。

进一步，如步骤S108，服务器106按照上述分类后的目标聚类簇调整在终端设备102中的投放的多媒体资源，以使得投放后的多媒体资源的转化率得到提升。

需要说明的是，在本实施例中，在获取待分类的当前用户操作行为对应的时间序列数据后，根据该时间序列数据来确定上述当前用户操作行为与每个核心操作行为之间的行为相似度，其中，这里的核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为。在上述行为相似度满足目标核心操作行为的匹配条件的情况下，将上述当前用户操作行为分类到目标核心操作行为匹配的目标聚类簇中。也就是说，通过比对当前待分类的当前用户操作行为与已经为各个聚类簇确定出的核心操作行为之间的行为相似度，来确定当前用户操作行为所属的聚类簇，从而实现根据上述行为相似度来为用户操作行为进行更加精准地分类处理。进而克服相关技术中用户行为分类方法中存在的准确性较低的问题。

可选地，在本实施例中，上述终端设备可以是配置有目标客户端的终端设备，可以包括但不限于以下至少之一：手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices，移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端等允许投放多媒体资源的平台客户端。上述网络可以包括但不限于：有线网络，无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器。上述仅是一种示例，本实施例中对此不作任何限定。

可选地，作为一种可选的实施方式，如图2所示，上述用户行为分类方法包括：

S202，获取待分类的当前用户操作行为对应的时间序列数据，其中，时间序列数据用于记录当前用户操作行为在目标时间段内的统计结果，当前用户操作行为为用户账号对目标平台中展示的多媒体资源执行的操作行为；

S204，根据时间序列数据确定当前用户操作行为与每个核心操作行为之间的行为相似度，其中，核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为；

S206，在行为相似度满足目标核心操作行为的匹配条件的情况下，将当前用户操作行为分类到目标核心操作行为匹配的目标聚类簇中。

可选地，在本实施例中，上述用户行为分类方法可以但不限于应用于对在线信息流的控制策略的决策过程中。例如，以多媒体资源分配领域为例，这里的在线控制策略可以包括但不限于：用于控制多媒体资源超量分配的策略、提高预算消耗率的策略、冷启动策略(这里冷启动是指首次投放时对用户喜好未知的情况下所参考的投放策略)等。也就是说，通过对各种用户操作行为的分析来确定其所属的聚类簇，从而确定该当前用户操作行为对应采用的多媒体资源分配控制策略。此外，上述目标平台可以但不限于不同的终端应用(Application，简称APP)，例如，短视频平台应用、视频播放应用、社区空间共享应用、即时通信应用、在线购物应用等。上述为示例，这里应用场景及领域不作任何限定。

需要说明的是，在本实施例中，上述待分类的当前用户操作行为是指当前要被分类的用户操作行为，而数据池中实际上已经存储有多个不同用户操作行为的时间序列数据。

可选地，在本实施例中，上述各个用户账号对在平台所展示的多媒体资源执行的操作行为可以包括但不限于以下至少之一：曝光、播放、关注、评论、分享、付费等行为。也就是说，每个用户操作行为具有行为标签，并携带有行为时间戳。

可选地，在本实施例中，上述每个聚类簇可以但不限于是按照多媒体资源的资源特征(如业务需求)来划分的。以多媒体资源分配过程为例，对多媒体资源设计的链路周期可以包括但不限于：曝光(Aware)、吸引(Appeal)、行动(Act)、用户(Advocate)、资产(Assets)，五个部分，称其为5A模型。这里的5A模型的主要应用场景为品牌消费者全生命周期价值的度量，应用到的产品功能模块包括客户资产概览、5A链路分析等；后期还会应用到链路流转等模块等。在本实施例中，可以但不限于是将上述用户操作行为按照行为相似度的比对结果分类到各个聚类簇中，从而达到精准分类的目的。这里为示例，本实施例中对于聚类簇的分类结果不限于5A模型，还可以包括按照其他分类策略得到的多个聚类簇，这里不再赘述。

例如，假设目标平台以短视频平台应用为例，进一步假设在获取到待分类的当前用户账号ID1的当前用户操作行为对应的时间序列数据后，确定该当前用户账号ID1对很多“运动类型”的多媒体资源(如视频)点击了播放观看，则可基于上述时间序列数据来确定上述当前用户操作行为与各个核心操作行为之间的行为相似度。

假设已有的聚类簇包括：曝光、吸引、行动、拥护、资产。通过比对确定上述播放观看的当前用户操作行为与聚类簇“行动”中的核心操作行为之间的行为相似度达到匹配条件，则将上述当前用户操作行为(即播放观看行为)分类到“行动”聚类簇中。

需要说明的是，用户账号可以但不限于是执行了一系列连续的有序操作行为(可视为一条行为链路)，如曝光、播放3s(视为被吸引)、播放5s(视为完成播放)、退出播放等。这里根据用户账号的行为链路中的操作行为确定其所属的聚类簇后，可以但不限于在平台选择展示指定聚类簇中的用户人群时，后台会计算时间窗口内该聚类簇中用户账号的特征，从而利于提升对多媒体资源的关注度。

可选地，在本实施例中，上述确定当前用户操作行为与每个核心操作行为之间的行为相似度的方式可以但不限于采用动态时间规整(Dynamic Time Warping，简称DTW)算法。其中，DTW算法是基于动态规划(DP)的思想，它用满足一定条件的时间规则函数描述测试模板和参考模板的时间对应关系，求解两模板匹配时累计距离最小所对应的规整函数。假设以本实施例中的当前用户操作行为的时间序列数据和核心操作行为的时间序列数据为例进行说明：

为了对齐两个时间序列，可以但不限于构造一个矩阵网格，矩阵中的元素为两个点的距离(即一序列的每一个点和另一序列的每一个点之间的相似度，距离越小则相似度越高)，如欧式距离。可以归结为寻找一套通过此矩阵网格中若干点之间的路径的距离，确定两条序列之间的相似度。

可选地，在本实施例中，可以直接采用上述动态规整算法的计算结果(如简称DTW的最小值)来确定行为相似度，还可以但不限于结合以下至少一个距离参数值来共同确定行为相似度：最大距离值、平均距离值、合并方差的最小值、相关系数的最大值等。

可选地，在本实施例中，上述每个聚类簇匹配的核心操作行为可以但不限是预先从候选的用户操作行为中确定出的，且每个聚类簇匹配的核心操作行为的数量可以是一个，也可以是多个，这里不做任何限定。

通过本申请提供的实施例，通过比对当前待分类的当前用户操作行为与已经为各个聚类簇确定出的核心操作行为之间的行为相似度，来确定当前用户操作行为所属的聚类簇，从而实现根据上述行为相似度来为当前用户操作行为进行更加精准地分类处理。进而克服相关技术中用户行为分类方法中存在的准确性较低的问题。

作为一种可选的方案，根据时间序列数据确定当前用户操作行为与每个核心操作行为之间的行为相似度包括：

S1，根据时间序列数据确定当前用户操作行为对应的第一时序曲线，并确定与核心操作行为对应的第二时序曲线；

S2，计算第一时序曲线上任意一个第一点位置与第二时序曲线上任意一个第二点位置之间的路径的距离，得到多个距离值，其中，第一点位置与第二点位置满足第一时序曲线与第二时序曲线之间的路径边界条件；

S3，根据多个距离值确定行为相似度。

需要说明的是，在本实施例中，上述时间序列数据可以但不限于是对当前用户操作行为在目标时间段内的统计结果，其中，包括当前用户操作行为对应的行为标签和对应的行为时间戳。因而，在本实施例中，在获取到不同用户账号大量的用户操作行为后，可以基于行为标签确定该当前用户操作行为的属性，并基于行为时间戳对其进行统计。

此外，在本实施例中，基于上述时间序列数据可以绘制对应的时序曲线。在该时序曲线中横轴用于表示时间，纵轴用于表示该用户操作行为在不同时刻的执行数量的统计结果。

需要说明的是，在本实施例中，上述统计结果可以包括但不限于以独立访客次数的形式来统计，或访问次数的形式来统计。其中，独立访客(Unique Visitor，简称uv)次数是指去重后的访问次数，即同一身份无论访问几次，都计作一次独立访问。而访问次数(Page View，简称pv)，即单页点击率，用于统计页面访问量，不区分身份。

进一步，可以但不限于对上述时序曲线做特征工程，对最小值min～最大值max做归一化处理，得到0-1的曲线。进一步，吸收谱聚类算法中的相似度矩阵，来计算两个时序曲线的相似度，作为当前待分类的当前用户操作行为与当前供比对的核心操作行为之间的行为相似度。

具体结合图3所示示例进行说明，假设采用上述DTW算法来进行计算，如图3中A图和B图中所示两条时序曲线分别为上述当前用户操作行为对应的第一时序曲线(如图中所示实线)，和核心操作行为对应的第二时序曲线(如图中所示虚线)。其中，B图中两条曲线之间的连线是A图中两条曲线的DTW路径，根据上述多个连线各自的距离值(如欧式距离)之和，来确定DTW值，以作为两个时序曲线各自对应的操作行为之间的行为相似度。

需要说明的是，上述DTW算法中确定满足路径边界条件的路径可以但不限于通过以下方式：把路径定义为warping path规整路径，并用W来表示，W的第k个元素定义为w

1)路径边界条件(可简称为边界条件)：w

2)连续性：如果w

3)单调性：如果w

结合连续性和单调性约束，每一个格点的路径就只有三个方向了。例如如果路径已经通过了格点(i，j)，那么下一个通过的格点只可能是下列三种情况之一：(i+1，j)，(i，j+1)或者(i+1，j+1)。效果可以如图4所示，这里不再赘述。

通过本申请提供的实施例，在获取当前用户操作行为对应的第一时序曲线与核心操作行为对应的第二时序曲线之后，确定两个时序曲线之间满足路径边界条件的点与点之间的距离值，得到多个距离值。采用动态时间规整算法根据上述多个距离值来计算得到当前用户操作行为与各个核心操作行为之间的行为相似度，从而基于该行为相似度来确定与当前用户操作行为相似度的目标核心操作行为，进而确定出该当前用户操作行为所属的目标聚类簇(目标核心操作行为匹配的聚类簇)。

作为一种可选的方案，根据多个距离值确定行为相似度包括：

S1，对多个距离值的平方进行加权求和，得到参考距离值；

S2，将参考距离值的平方根在路径边界条件所指示的路径区间内的最小距离值，确定为行为相似度。

例如，假设仍以上述图3所示时序曲线来进行说明：上述当前用户操作行为对应的第一时序曲线(如图中所示实线)，和核心操作行为对应的第二时序曲线(如图中所示虚线)。采用动态时间规整算法，用dp动态规划算法对两条时序曲线进行如下计算：

其中x、y分别代表两条时序曲线(x对应当前用户操作行为，y对应核心操作行为)，i代表第一时序曲线x上的第i个点，j代表第二时序曲线y上的第j个点。d(x

通过本申请提供的实施例，采用DTW算法确定两条时序曲线之间满足路径边界条件的多个连线的距离值，得到多个距离值。根据该多个距离值将有利于更加准确地确定出上述当前用户操作行为与核心操作行为之间的行为相似度，从而确保对用户操作行为的分类结果的准确性。

作为一种可选的方案，根据多个距离值确定行为相似度包括：

S1，获取当前用户操作行为与核心操作行为之间的距离参数值，其中，距离参数值包括以下至少之一：多个距离值中的最大距离值、多个距离值的平均距离值、多个距离值的合并方差的最小值、多个距离值的相关系数的最大值；

S2，对最小距离值与距离参数值进行加权求和，得到行为相似度。

例如，假设除上述最小距离值DTW

P＝DTW

其中，w

通过本申请提供的实施例，结合最小距离值和当前用户操作行为与核心操作行为之间的距离参数值，来计算得到行为相似度，从而进一步确保行为相似度的准确性。

作为一种可选的方案，在将当前用户操作行为分类到目标核心操作行为匹配的目标聚类簇中之前，还包括：

1)在目标核心操作行为包括一个核心操作行为的情况下，在行为相似度小于第一阈值的情况下，确定满足目标核心操作行为的匹配条件；

2)在目标核心操作行为包括至少两个核心操作行为的情况下，获取当前用户操作行为与各个核心操作行为各自对应的行为相似度的相似度平均值；在相似度平均值小于第二阈值的情况下，确定满足目标核心操作行为的匹配条件。

需要说明的是，上述每个聚类簇匹配的核心操作行为可以是一个，也可以是多个。这里在目标核心操作行为是一个核心操作行为的情况下，可以直接比对得到的行为相似度与第一阈值，在行为相似度小于第一阈值的情况下，确定该当前用户操作行为满足目标核心操作行为的匹配条件，与目标核心操作行为相似，进一步可以将该当前用户操作行为分类到目标核心操作行为对应的目标聚类簇中。而在目标核心操作行为是至少两个核心操作行为的情况下，则可以计算当前用户操作行为和一个聚类簇匹配的各核心操作行为之间的行为相似度的平均值，得到相似度平均值。在上述相似度平均值小于第二阈值的情况下，则可以将该用户操作性别为分类到该目标核心操作行为对应的目标聚类簇中。其中，上述第一阈值和第二阈值可以但不限于是根据不同场景设置的比对阈值，且第一阈值与第二阈值可以是相同的值，也可以是不同的值。

此外，在本实施例中，针对不同的聚类簇各自匹配的核心操作行为的数量，分别确定当前用户操作行为与各个聚类簇的核心操作行为之间的行为相似度或相似度平均值。从上述行为相似度或相似度平均值中确定出最小值对应的聚类簇，将其作为目标聚类簇。然后将当前用户操作行为分类到上述目标聚类簇中。

通过本申请提供的实施例，根据每个聚类簇中目标核心操作行为的数量，使用不同的方式确定当前用户操作行为是否满足对应的匹配条件。从而实现快速确定出用户操作行为所属的目标聚类簇，并确保分类的准确性。

作为一种可选的方案，在根据时间序列数据确定用户操作行为与每个核心操作行为之间的行为相似度之前，还包括：

S1，根据多媒体资源的资源特征，从多个候选用户操作行为中确定出与每个聚类簇分别匹配的核心操作行为，其中，多个候选用户操作行为包括当前用户操作行为，每个聚类簇匹配至少一个核心操作行为。

需要说明的是，在本实施例中，可以但不限于同时吸收Kmeans和AgglomerativeClustering聚类算法的思想，根据多媒体资源的资源特征从已有的多个候选用户操作行为中确定出各个聚类簇的核心操作行为。

例如，假设本示例中预设三个聚类簇，分别包括：第一聚类簇A1的核心操作行为确定为曝光，第二聚类簇A2的核心操作行为确定为点击、评论…，第三聚类簇A3的核心操作行为确定为分享。此外，多个候选用户操作行为包括a1至a10。然后采用上述聚类算法，从a1至a10中选定三个聚类簇各自匹配的核心操作行为。其中，这里可以但不限于是基于多媒体资源的资源特征选定。

假设第一聚类簇A1的核心操作行为是a1，第二聚类簇A2的核心操作行为是a3，第三聚类簇A3的核心操作行为是a7、a10。然后再进一步采用上述实施例中记载的分类方法。

如当前待分类的当前用户操作行为是a5，获取a5对应的时间序列数据对应的时序曲线，及与上述A1至A3中各个核心操作行为各自对应的时序曲线，然后采用DTW算法计算两条时序曲线之间的相似度，进而确定当前用户操作行为与核心操作行为之间的行为相似度或相似度平均值，如a5与A1中a1之间的行为相似度为P1、a5与A2中a3之间的行为相似度为P2、a5与A3中a7、a10之间的行为相似度的平均值为P3。比对P1至P3确定出最小值为P2，则可确定该当前用户操作行为a5将被分类到P2对应的目标聚类簇A2中。

通过本申请提供的实施例，通过预先确定每个聚类簇各自匹配的核心操作行为，以便于利用该核心操作行为与待分类的当前用户操作行为进行比对，从而实现通过比对得到的行为相似度来对当前用户操作行为进行更加准确的分类处理。

作为一种可选的方案，在获取待分类的当前用户操作行为对应的时间序列数据之前，还包括：

S1，获取多个候选用户操作行为各自对应的行为链路数据，其中，每个候选用户操作行为对应的行为链路数据中包括一组有序操作行为的行为标签及行为时间戳；

S2，对行为链路数据按照目标周期进行统计，得到各个候选用户操作行为各自对应的时间序列数据。

需要说明的是，在本实施例中，上述多个候选用户操作各自的行为链路数据是其对应的行为记录数据，其中包括一组有序操作行为的行为标签和行为时间戳。在对上述行为链路数据按照目标周期进行分别统计后，才会得到各自对应的时间序列数据。

例如，在获取到N个候选用户操作各自的行为链路数据后，对其汇总，并按天对相应的uv数据或pv数据进行统计，以得到对应的时间序列数据。如一条行为链路数据中的行为可以包括但不限于：曝光、3s播放、5s播放、完播、点击、点赞、评论…等等用户行为。

图5是根据一示例性实施例示出的用于实施用户行为分类方法的用户行为分类装置的结构示意图。参照图5，该装置包括：

第一获取单元502，被配置为获取待分类的当前用户操作行为对应的时间序列数据，其中，时间序列数据用于记录当前用户操作行为在目标时间段内的统计结果，当前用户操作行为为用户账号对目标平台中展示的多媒体资源执行的操作行为；

第一确定单元504，被配置根据时间序列数据确定当前用户操作行为与每个核心操作行为之间的行为相似度，其中，核心操作行为是从各种用户操作行为中确定出的与每个聚类簇匹配的操作行为；

分类单元506，被配置在行为相似度满足目标核心操作行为的匹配条件的情况下，将当前用户操作行为分类到目标核心操作行为匹配的目标聚类簇中。

可选地，在本实施例中，上述用户行为分类方法可以但不限于应用于对在线信息流的控制策略的决策过程中。例如，以多媒体资源分配领域为例，这里的在线控制策略可以包括但不限于：用于控制多媒体资源超量分配的策略、提高预算消耗率的策略、冷启动策略(这里冷启动是指首次投放时对用户喜好未知的情况下所参考的投放策略)等。也就是说，通过对各种用户操作行为的分析来确定其所属的聚类簇，从而确定该当前用户操作行为对应采用的多媒体资源分配策略。此外，上述目标平台可以但不限于不同的终端应用(Application，简称APP)，例如，短视频平台应用、视频播放应用、社区空间共享应用、即时通信应用、在线购物应用等。上述为示例，这里应用场景及领域不作任何限定。

需要说明的是，在本实施例中，上述待分类的当前用户操作行为是指当前要被分类的当前用户操作行为，而数据池中实际上已经存储有多个不同用户操作行为的时间序列数据。

可选地，在本实施例中，上述每个聚类簇可以但不限于是按照多媒体资源的资源特征(如业务需求)来划分的。以多媒体资源分配过程为例，对多媒体资源设计的链路周期可以包括但不限于：曝光(Aware)、吸引(Appeal)、行动(Act)、用户(Advocate)、资产(Assets)，五个部分，称其为5A模型。这里的5A模型的主要应用场景为品牌消费者全生命周期价值的度量，应用到的产品功能模块包括客户资产概览、5A链路分析等；后期还会应用到链路流转等模块等。在本实施例中，可以但不限于是将上述当前用户操作行为按照行为相似度的比对结果分类到各个聚类簇中，从而达到精准分类的目的。这里为示例，本实施例中对于聚类簇的分类结果不限于5A模型，还可以包括按照其他分类策略得到的多个聚类簇，这里不再赘述。