掌桥专利:专业的专利平台
掌桥专利
首页

确定用户所属群组的方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 11:42:32


确定用户所属群组的方法、装置、电子设备和存储介质

技术领域

本申请涉及电子与信息技术领域,尤其是涉及一种确定用户所属群组的方法、装置、电子设备和存储介质。

背景技术

随着信息技术的不断发展,各企业越来越注重企业内部的风险管控并实时监测企业内部存在的安全威胁等。当企业无法提供准确的用户群组标签时,相关技术只考虑了用户与目标对象之间的直接访问关系来划分用户群组,存在用户群组划分准确性差的问题。

发明内容

本申请实施例期望提供一种确定用户所属群组的方法、装置、电子设备和存储介质,解决了相关技术只考虑了用户与目标对象之间的直接访问关系来划分用户群组,存在用户群组划分准确性差的问题,该方法对用户群组进行精细的划分,提升了用户群组划分的准确性,并基于用户群组的划分,使得用户所在群组的标签信息更加准确,同时,提升了用户所在系统的安全性。

本申请实施例的技术方案是这样实现的:

本申请实施例提供一种确定用户所属群组的方法,所述方法包括:

基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;所述行为数据包括用户的用户标识和所述目标对象的目标标识;

基于获取的所述用户访问所述目标对象的所述行为数据,生成有向权重图;所述用户标识和所述目标标识作为所述有向权重图的节点;

基于所述第一用户关系矩阵和所述有向权重图,确定所述用户所属的群组。

可选的,所述基于所述第一用户关系矩阵和所述有向权重图,确定所述用户所属的群组,包括:

对所述第一用户关系矩阵进行特征选择,得到所述第一用户关系矩阵降维后的第一用户关系矩阵;

获取所述有向权重图中节点之间的连通关系;

基于所述连通关系,生成第二用户关系矩阵;

基于所述降维后的第一用户关系矩阵和所述第二用户关系矩阵,确定所述用户所属的群组。

可选的,所述对所述第一用户关系矩阵进行特征选择,得到所述第一用户关系矩阵降维后的第一用户关系矩阵,包括:

获取目标时间段内所述用户访问所述目标对象的次数;

基于所述次数和所述目标对象,对所述第一用户关系矩阵进行特征选择,得到所述降维后的第一用户关系矩阵。

可选的,所述基于所述降维后的第一用户关系矩阵和所述第二用户关系矩阵,确定所述用户所属的群组,包括:

基于所述用户标识、所述降维后的第一用户关系矩阵和所述第二用户关系矩阵进行处理,生成第三用户关系矩阵;

基于所述第三用户关系矩阵,确定所述用户所属的群组。

可选的,所述基于所述第三用户关系矩阵,确定所述用户所属的群组,包括:

遍历所述第三用户关系矩阵中的所有元素;

获取所述所有元素的属性信息;

基于所述属性信息、所述用户标识和所述目标标识,确定所述用户所属的群组。

可选的,所述对所述第一用户关系矩阵进行特征选择,得到所述第一用户关系矩阵降维后的第一用户关系矩阵,包括:

基于主成分分析算法对所述第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

可选的,所述基于所述连通关系,生成第二用户关系矩阵,包括:

基于网络嵌入算法对所述连通关系进行处理,生成第二用户关系矩阵。

本申请实施例提供一种确定用户所属群组的装置,所述装置包括:

第一生成单元,用于基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;所述行为数据包括用户的用户标识、所述目标对象的目标标识以及访问时间;

第二生成单元,用于基于获取的所述用户访问所述目标对象的所述行为数据,生成有向权重图;所述用户标识和所述目标标识作为所述有向权重图的节点;

处理单元,用于基于所述第一用户关系矩阵和所述有向权重图,确定所述用户所属的群组。

本申请实施例提供一种电子设备,所述电子设备包括:处理器、存储器和通信总线;

所述通信总线用于实现处理器和存储器之间的通信连接;

所述处理器用于执行存储器中存储的确定用户所属群组的程序,以实现如上所述的确定用户所属群组的方法。

本申请实施例提供一种计算机存储介质,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述所述的确定用户所属群组的方法。

本申请实施例所提供的一种确定用户所属群组的方法、装置、电子设备和存储介质,基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;行为数据包括用户的用户标识、目标对象的目标标识以及访问时间;基于获取的用户访问目标对象的行为数据,生成有向权重图;用户标识和目标标识作为有向权重图的节点;基于第一用户关系矩阵和有向权重图,确定用户所属的群组;也就是说,本申请实施例中,电子设备通过获取到的用户访问目标对象的行为数据,生成第一用户关系矩阵和有向权重图,并基于第一用户关系矩阵和有向权重图,得到用户所属群组;如此,该方法对用户群组进行精细的划分,提升了用户群组划分的准确性,并基于用户群组的划分,使得用户所在群组的标签信息更加准确,同时,提升了用户所在系统的安全性。

附图说明

图1为本申请实施例提供的一种确定用户所属群组的方法的流程示意图;

图2为本申请实施例提供的一种用户基于用户标识访问内网主机的场景示意图;

图3为本申请实施例提供的一种基于用户标识和目标标识构建的有向权重图;

图4为本申请实施例提供的另一种确定用户所属群组的方法的流程示意图;

图5为本申请实施例提供的又一种确定用户所属群组的方法的流程示意图;

图6为本申请实施例提供的一种确定用户所属群组的装置的结构示意图;

图7为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

应理解,说明书通篇中提到的“本申请实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“本申请实施例中”或“在前述实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应用。在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

相关技术中,在实现企业内部风险管控、安全威胁检测过程中,对用户行为数据进行分析,得到用户群组标签,进而基于用户群组标签对用户行为进行监测,以确定异常检情况。工作关系属于同群组的用户具备相似的操作和/或访问行为,如同一群组的用户会访问相似的内部系统或进行相似的操作;而不同群组的用户的操作和/或使用行为具备明显的差异。目前,相关技术中发现某一用户某个时刻的操作行为明显偏离同组其他用户的行为基线,则认为该用户行为异常,需要进行深入分析和调查。在该过程中,用户的群组标签信息是实现上述异常检测功能的基础。

然而,申请人在研究过程中发现当企业无法提供准确的用户群组标签时,相关技术在监测企业内部的风险、安全威胁等的过程中,只考虑了用户与目标对象之间的直接访问关系来划分用户群组,存在用户群组划分准确性差的问题。

本申请实施例提供一种确定用户所属群组的方法,应用于电子设备,参考图1所示,该方法包括如下步骤:

步骤101、基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵。

其中,行为数据包括用户的用户标识和目标对象的目标标识;行为数据还包括访问时间。

这里,行为数据表征用户在何时何地与何对象进行交互的数据。第一用户关系矩阵可以理解为将用户与目标对象之间存在关联关系的数据按照矩形阵列排列的实数集合。

这里,将用户访问的目标对象的目标标识的个数作为第一用户关系矩阵中的列的特征维度;将用户标识的个数作为第一用户关系矩阵中的行的特征维度;其中,第一用户关系矩阵中的行数据表示的是在目标时间段内同一用户访问不同目标对象的累计次数;第一用户关系矩阵中的列数据不同用户访问同一目标对象的累计次数。

本申请实施例中,电子设备可以根据用户与目标对象之间的交互所生成的日志文件获取到用户访问目标对象的行为数据,基于用户的行为数据包括的用户标识、目标对象的目标标识以及用户访问目标对象的访问时间,生成用户与目标对象之间存在关联关系的第一用户关系矩阵。这里,日志文件可以理解为对系统中的操作行为事件进行记录的文件或文件集合;其中,日志文件可以分为事件日志和消息日志,并且日志文件用于处理历史数据、诊断问题的追踪以及理解系统的活动。

本申请实施例中,获取的用户访问目标对象的行为数据中,每一用户与目标对象之间的存在关联关系的行为数据都可以设置为如下格式:<用户标识,目标标识,时间>。示例性的,用户与目标对象之间的交互行为数据(Interactive Behavior Data,IBD)=∪

本申请实施例中,不同的通信交互场景,用户访问的目标对象不同。便于理解的,本申请实施例中对用户访问目标对象所产生的行为数据做进一步的描述;

通信交互场景一,用户访问目标对象指的是用户登录企业内部系统。用户通过拥有的账号即用户标识,登陆企业内部系统,实现对具有目标标识的目标对象的访问。此时,用户登陆系统的交互行为数据IBD=∪

通信交互场景二,用户访问目标对象指的是企业内部用户邮箱日常的发邮件操作。用户通过拥有的邮箱账号即用户标识,发送邮件至收件人邮箱账号,实现对具有目标标识的目标对象的邮件发送操作。此时,用户发送邮件的交互行为数据IBD=∪

通信交互场景三,在面向安全外壳协议(Secure Shell,SSH)、超文本传输协议(Hyper Text Transfer Protocol,HTTP)、远程桌面协议(Remote Desktop Protocol,RDP)、文件传输协议(File Transfer Protocol,FTP)等常见的协议和端口,对内网中的Netflow数据集做解析时,访问状态必须处于成功建立连接状态。这里,用户访问目标对象指的是主机之间的互相访问操作。用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。此时,用户使用的计算机主机IP访问目标主机IP的交互行为数据IBD=∪

在实际应用中,假设某企业内包含有i(i>0)个用户标识u

需要说明的是,第一用户关系矩阵中M

示例性的,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问,参照图2所示,u

本申请实施例中,电子设备获取到用户访问目标对象的行为数据,基于行为数据,生成原始的用户关系矩阵,对原始的用户关系矩阵进行处理,得到第一用户关系矩阵。

步骤102、基于获取的用户访问目标对象的行为数据,生成有向权重图。

其中,用户标识和目标标识作为有向权重图的节点;用户基于用户标识访问目标对象的次数作为有向权重图的边的权重。

这里,有向权重图可以理解为基于用户与目标对象之间的关联关系所构建的关系图谱。

本申请实施例中,电子设备获取到用户访问目标对象的行为数据,基于行为数据生成表征用户与目标对象之间的关联关系的有向权重图。其中,有向权重图中的节点包括基于用户的用户标识所形成的节点和基于目标对象的目标标识所形成的节点,有向权重图中边的权重为用户基于用户标识访问具有特定目标标识的目标对象的次数。

本申请实施例中,参考图3所示,有向权重图基于<用户标识节点,目标标识节点,权重>,即三元组的形式所形成的网络拓扑图;其中,第一用户关系矩阵中的用户标识u作为有向权重图中的用户标识节点;第一用户关系矩阵中的目标对象的目标标识d作为有向权重图中的目标标识节点;w表示为有向权重图中的权重值。

这里,电子设备获取用户访问目标对象的行为数据,得到以<用户标识节点,目标标识节点,权重>三元组构成的信息,有向权重图描述的是不同用户基于用户标识访问不同目标对象的拓扑关系,其中,权重的取值可以理解为在目标时间段内用户基于用户标识访问具有目标标识的目标对象的累计次数。

示例性的,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。参照图2所示,u

这里,三元组信息采用的形式,其中,w表示权重,取值为用户标识u

步骤103、基于第一用户关系矩阵和有向权重图,确定用户所属的群组。

这里,同一群组中的多个用户具有相同或相似的属性信息。例如,同一群组中多个用户在某一时间段内访问同一目标对象的行为类似。

本申请实施例中,电子设备基于用户与目标对象之间的关联关系,得到第一用户矩阵和有向权重图,根据第一用户矩阵和有向权重图,可以通过聚类算法,对用户进行分组,进而确定用户所属群组,进一步地,电子设备还可以确定不同群组的标签信息。

本申请实施例所提供的一种确定用户所属群组的方法、确定用户所属群组的装置、电子设备和存储介质,基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;行为数据包括用户的用户标识、目标对象的目标标识以及访问时间;基于获取的用户访问目标对象的行为数据,生成有向权重图;用户标识和目标标识作为有向权重图的节点;基于第一用户关系矩阵和有向权重图,确定用户所属的群组;也就是说,本申请实施例中,电子设备通过获取到的用户访问目标对象的行为数据,生成第一用户关系矩阵和有向权重图,并基于第一用户关系矩阵和有向权重图,得到用户所属群组;如此,提升了用户群组划分的准确性,进而确保了用户群组的规范化管理,提升了企业的网络安全。

基于前述实施例,本申请实施例提供一种确定用户所属群组的方法,应用于电子设备,这里,参照图4所示,对本申请实施例所提供的确定用户所属群组的方法的技术构思进行简要介绍,电子设备获取到用户访问目标对象的行为数据,基于行为数据,生成第一用户关系矩阵,并通过特征选择的方式对第一用户关系矩阵进行处理,得到降维后的第一用户关系矩阵。电子设备还基于行为数据,构建表征用户的用户标识与目标对象的目标标识之间的关联关系的有向权重图,基于有向权重图,生成第二用户关系矩阵。对降维后的第一用户关系矩阵和第二用户关系矩阵进行集成,得到第三用户关系矩阵;进一步地,电子设备利用聚类算法对第三用户关系矩阵中的用户进行聚类,得到多个群组,以及不同群组的群组标签。基于集成思想的用户关系矩阵表示方法,利用用户交互关系数据,将基于用户与目标对象之间存在第一关联关系的第一用户关系矩阵和用户与目标对象之间存在第二关联关系的第二用户关系矩阵进行拼接,得到新的、更加健壮的用户关系向量,使得用户最终通过聚类算法得到更准确分组,进而得到用户的群组标签信息。

进一步地,参考图5所示,该方法包括以下步骤:

步骤201、基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵。

其中,行为数据包括用户的用户标识和目标对象的目标标识;行为数据还包括访问时间。

步骤202、基于获取的用户访问目标对象的行为数据,生成有向权重图。

其中,用户标识和目标标识作为有向权重图的节点;用户基于用户标识访问目标对象的次数作为有向权重图的边的权重。

步骤203、对第一用户关系矩阵进行特征选择,得到第一用户关系矩阵降维后的第一用户关系矩阵。

本申请实施例中,步骤203对第一用户关系矩阵进行特征选择,得到第一用户关系矩阵降维后的第一用户关系矩阵可以通过如下步骤实现:

步骤203a、获取目标时间段内用户访问目标对象的次数。

这里,目标时间段可以理解为确定起始时间点和终止时间点之间的时间段,如目标时间段可以理解为考察期的时间段。

本申请实施例中,电子设备获取到用户访问目标对象的行为数据,基于行为数据中用户的用户标识、目标对象的目标标识以及用户访问目标对象的访问时间,确定用户在目标时间段内基于用户标识访问具有目标标识的目标对象的累计次数。

步骤203b、基于次数和目标对象,对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

这里,特征选择可以理解为选择高维度的原始数据下最重要的一些特征,去除噪声和不重要的特征;特征选择的目的是对具有高维度特征的原始数据的特征维度进行降维处理,以达到对数据快速处理的目的。

本申请实施例中,电子设备对第一用户关系矩阵进行特征选择可以通过降维算法来实现对第一用户关系矩阵的降维处理,降维算法包括线性算法和非线性算法;其中,线性算法包括主成分分析(Principal Component Analysis,PCA)算法、奇异值分解(SingularValue Decomposition,SVD)算法、因子分析(Factor Analysis,FA)算法;当然,线性算法还包括其他如独立成分分析(Independent Component Analysis,ICA)算法等,线性算法用于将第一用户关系矩阵中的原始维度直接降维到指定维度的算法,非线性算法包括方差法用于保留第一用户关系矩阵中高频维度的特征,本申请对降维算法不做具体限定。

本申请实施例中,电子设备基于次数和目标对象,对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。其中,特征选择通过降维算法来实现,将第一用户关系矩阵进行降维处理,得到降维后的第一用户关系矩阵,进而得到用户与目标对象之间的直接访问关系。

这里,电子设备基于主成分分析算法对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

本申请实施例中,电子设备基于PCA算法对第一用户关系矩阵进行特征选择,在对第一用户关系矩阵中的特征进行提取,得到降维后的第一用户关系矩阵。其中,使用PCA算法在数据降维的过程中仅以方差衡量第一用户关系矩阵中的数据,且第以用户关系矩阵中的各主成分之间正交,能够消除数据中存在的冗余数据和噪音数据。

具体的,本申请将对电子设备基于主成分分析算法对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵进行具体描述。示例性的,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。这里,对第一用户关系矩阵M

进一步地,每个用户标识主机u

在此基础上,利用公式(3)计算协方差矩阵。

并将此协方差矩阵进行分解,获得其特征向量矩阵e=[e

y

其中,A表示从e中提取最大的r个特征向量组成的矩阵,且A=[r

需要说明的是,降维后的第一用户关系矩阵M

步骤204、获取有向权重图中节点之间的连通关系。

本申请实施例中,连通关系可以理解为有向权重图中用户标识节点和目标标识节点之间的关系以及目标标识节点与其他目标标识节点之间的关系。

本申请实施例中,电子设备可以通过结合广度优先搜索(Breadth First Search,BFS)和深度优先搜索(DepthFirstSearch,DFS)的方式,确定不同节点(包括用户标识节点和目标标识节点)为起始节点即源节点,并获取源节点的直接邻居的节点以及获取距离源节点不断增加的距离处顺序采样的节点。进而电子设备获取有向权重图中源节点与其他节点之间的连通关系。

步骤205、基于连通关系,生成第二用户关系矩阵。

这里,第二用户关系矩阵可以理解为基于连通关系,用户与目标对象之间具有关联关系的数据按照矩阵阵列排列的实数集合。

本申请实施例中,电子设备基于网络嵌入算法对连通关系进行处理,得到第二用户关系矩阵。

本申请实施例中,电子设备获取有向权重图中节点之间的连通关系,并基于网络嵌入算法对有向权重图中节点之间的连通关系进行处理,得到第二用户关系矩阵。网络嵌入算法包括多维尺度分析(Multidimensional Scalling,MDS)算法,等距映射(IsometricMapping,IsoMap)算法,拉普拉斯特征映射((LaplacianEigenmaps,LE)算法、大规模信息网络嵌入(Large-scale Information Network Embedding,LINE)算法;当然,网络嵌入算法还包括其他如Node2vec算法等,本申请对网络嵌入算法不做具体限定。网络嵌入算法用于将高维数据进行降维处理。其中,把数据从高维空间降到低维空间,有利于更好的分析和利用数据。

本申请实施例中,电子设备获取到的用户访问目标对象的行为数据,基于行为数据生成用户标识与目标标识之间存在关联关系的有向权重图,并通过网络嵌入算法,对有向权重图中的用户标识与目标标识之间的连通关系进行处理,进而获取到用户标识与目标标识之间的直接访问关系以及目标标识与其他目标标识之间的间接访问关系。

本申请实施例中,电子设备基于有向权重图中用户标识节点和目标标识节点之间的关系以及目标标识节点与其他目标标识节点之间的关系,生成第二用户关系矩阵。

在实际应用中,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。电子设备获取有向权重图中节点之间的连通关系通过网络嵌入算法来实现,以网络嵌入算法采用Node2vec算法为例。Node2vec算法主要用于将信息网络嵌入到低维空间。Node2vec算法的基本原理如下:通过结合DFS和BFS,采用随机游走的方式基于权重w自动遍历用户关系图谱中的源节点即用户标识主机节点u与邻近节点即目标标识主机节点d之间的关系,以及目标标识主机节点d与其他目标标识主机节点d之间的关系。其中,如果两个节点或多个节点在有向权重图上的距离越近,则这两个节点或多个节点的功能越相似;如果两个节点或多个节点周围的结构越相近,则这两个节点或多个节点的功能越相似。Node2vec算法将网络中的用户标识主机节点和目标标识主机节点映射到欧式空间,并结合图中的权重值,通过权重值的大小以及节点之间的方向,指导游走的过程。用向量表示每个节点(包括用户主机节点和目标对象主机节点)的特征。

其中,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。电子设备获取有向权重图中节点之间的连通关系通过网络嵌入算法来实现。这里,电子设备基于Node2vec算法对连通关系进行处理,生成第二用户关系矩阵。其中,Node2vec算法通过随机游走的方式(即采样算法)选择用户标识主机节点u

需要说明的是,第二用户关系矩阵M

步骤206、基于降维后的第一用户关系矩阵和第二用户关系矩阵,确定用户所属的群组。

本申请实施例中,步骤206基于降维后的第一用户关系矩阵和第二用户关系矩阵,确定用户所属的群组可以通过如下步骤实现:

步骤206a、基于用户标识、降维后的第一用户关系矩阵和第二用户关系矩阵进行处理,生成第三用户关系矩阵。

本申请实施例中,电子设备基于的相同用户标识,对降维后的第一用户关系矩阵与第二用户关系矩阵进行拼接,生成第三用户关系矩阵。

示例性的,降维后的第一用户关系矩阵M

步骤206b、遍历第三用户关系矩阵中的所有元素。

本申请实施例中,电子设备通过遍历算法可以遍历得到第三用户关系矩阵中的所有元素。

步骤206c、获取所有元素的属性信息。

这里,属性信息可以理解为第三用户关系矩阵中每一第三用户关系向量与其他第三用户关系向量之间的距离。

本申请实施例中,电子设备获取第三用户关系矩阵中的每一第三用户关系向量与其他第三用户关系向量之间的距离,进而得到所有元素的属性信息。

步骤206d、基于属性信息、用户标识和目标标识,确定用户所属的群组。

本申请实施例中,电子设备基于第三用户关系矩阵中所有元素的属性信息、用户标识以及目标标识之间的关联关系,确定用户的属于哪些类别,并对这些类别数据取并集得到类别集合,进而确定用户所属的类别,并通过用户与目标对象之间的访问关系,确定用户所属的类别群组标签。示例性的,当某些用户通过用户的邮箱账号即用户标识,发送邮件到收件人邮箱账号即目标对象的目标标识,确定这些用户具有相同的操作,进而确定这些用户属于同一群组,并确定用户即发送邮件的用户与目标对象即接收邮件的用户之间的关系为发送与接收邮件的关系,进而确定用户所属的类别群组标签是邮件群组。

在实际应用中,电子设备基于属性信息、用户标识和目标标识,确定用户所属的群组可以通过聚类算法来实现。聚类算法包括K-Means算法、Mean-shift(均值偏移)算法、基于密度的空间(Density-Based Spatial Clustering of Applications with Noise,DBSCAN)聚类算法、高斯混合模型聚类算法;当然,线性算法还包括其他如层次聚类BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies,BIRCH)算法,本申请对聚类算法不做具体限定。聚类算法可以理解为用于将每个数据点划分到一个特定的组的算法。

本申请实施例中,电子设备利用聚类算法对目标用户关系向量进行分类处理,得到第三用户关系矩阵中的第三用户关系向量中的用户所属的用户群组,进而得到每个用户对应的用户群组标签信息。

示例性的,用户通过使用的计算机主机IP即用户标识,建立主机IP与目标主机IP之间连接关系,实现对具有目标标识的目标对象的访问。基于第三用户关系矩阵M

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本申请实施例提供一种确定用户所属群组的装置,该确定用户所属群组的装置可以应用于图1、5对应的实施例提供的一种确定用户所属群组的方法中,参照图6所示,该确定用户所属群组的装置6包括:

第一生成单元61,用于基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;行为数据包括用户的用户标识、目标对象的目标标识以及访问时间;

第二生成单元62,用于基于获取的用户访问目标对象的行为数据,生成有向权重图;用户标识和目标标识作为有向权重图的节点;

处理单元63,用于基于第一用户关系矩阵和有向权重图,确定用户所属的群组。

本申请其他实施例中,处理单元63,还用于对第一用户关系矩阵进行特征选择,得到第一用户关系矩阵降维后的第一用户关系矩阵;获取有向权重图中节点之间的连通关系;基于连通关系,生成第二用户关系矩阵;基于降维后的第一用户关系矩阵和第二用户关系矩阵,确定用户所属的群组。

本申请其他实施例中,处理单元63,还用于获取目标时间段内用户访问目标对象的次数;基于次数和目标对象,对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

本申请其他实施例中,处理单元63,还用于基于用户标识、降维后的第一用户关系矩阵和第二用户关系矩阵进行处理,生成第三用户关系矩阵;基于第三用户关系矩阵,确定用户所属的群组。

本申请其他实施例中,处理单元63,还用于遍历第三用户关系矩阵中的所有元素;获取所有元素的属性信息;基于属性信息、用户标识和目标标识,确定用户所属的群组。

本申请其他实施例中,处理单元63,还用于基于主成分分析算法对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

本申请其他实施例中,处理单元63,还用于基于网络嵌入算法对连通关系进行处理,生成第二用户关系矩阵。

基于前述实施例,本申请实施例提供一种电子设备,该电子设备可以应用于图1、5对应的实施例提供的一种确定用户所属群组的方法中,参照图7所示,该电子设备7(图7中的电子设备7对应图6中的确定用户所属群组的装置6)包括:处理器71、存储器72和通信总线73,其中:

通信总线73用于实现处理器71和存储器72之间的通信连接。

处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;行为数据包括用户的用户标识、目标对象的目标标识以及访问时间;

基于获取的用户访问目标对象的行为数据,生成有向权重图;用户标识和目标标识作为有向权重图的节点;

基于第一用户关系矩阵和有向权重图,确定用户所属的群组。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

对第一用户关系矩阵进行特征选择,得到第一用户关系矩阵降维后的第一用户关系矩阵;

获取有向权重图中节点之间的连通关系;

基于连通关系,生成第二用户关系矩阵;

基于降维后的第一用户关系矩阵和第二用户关系矩阵,确定用户所属的群组。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

获取目标时间段内用户访问目标对象的次数;

基于次数和目标对象,对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

基于用户标识、降维后的第一用户关系矩阵和第二用户关系矩阵进行处理,生成第三用户关系矩阵;

基于第三用户关系矩阵,确定用户所属的群组。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

遍历第三用户关系矩阵中的所有元素;

获取所有元素的属性信息;

基于属性信息、用户标识和目标标识,确定用户所属的群组。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

基于主成分分析算法对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

本申请的其他实施例中,处理器71用于执行存储器72中存储的确定用户所属群组的程序,以实现以下步骤:

基于网络嵌入算法对连通关系进行处理,生成第二用户关系矩阵。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本申请的实施例提供一种计算机存储介质,该计算机存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:

基于获取的用户访问目标对象的行为数据,生成第一用户关系矩阵;行为数据包括用户的用户标识、目标对象的目标标识以及访问时间;

基于获取的用户访问目标对象的行为数据,生成有向权重图;用户标识和目标标识作为有向权重图的节点;

基于第一用户关系矩阵和有向权重图,确定用户所属的群组。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

对第一用户关系矩阵进行特征选择,得到第一用户关系矩阵降维后的第一用户关系矩阵;

获取有向权重图中节点之间的连通关系;

基于连通关系,生成第二用户关系矩阵;

基于降维后的第一用户关系矩阵和第二用户关系矩阵,确定用户所属的群组。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

获取目标时间段内用户访问目标对象的次数;

基于次数和目标对象,对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

基于用户标识、降维后的第一用户关系矩阵和第二用户关系矩阵进行处理,生成第三用户关系矩阵;

基于第三用户关系矩阵,确定用户所属的群组。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

遍历第三用户关系矩阵中的所有元素;

获取所有元素的属性信息;

基于属性信息、用户标识和目标标识,确定用户所属的群组。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

基于主成分分析算法对第一用户关系矩阵进行特征选择,得到降维后的第一用户关系矩阵。

在本申请的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,还可以实现以下步骤:

基于网络嵌入算法对连通关系进行处理,生成第二用户关系矩阵。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

需要说明的是,上述计算机存储介质/存储器可以是只读存储器(Read OnlyMemory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory,FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory,CD-ROM)等存储器;也可以是包括上述存储器之一或任意组合的各种终端,如移动电话、计算机、平板设备、个人数字助理等。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本申请各实施例中的各功能单元可以全部集成在一个处理模块中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法,在不冲突的情况下可以任意组合,得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征,在不冲突的情况下可以任意组合,得到新的方法实施例或设备实施例。

以上,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

相关技术
  • 确定用户所属群组的方法、装置、电子设备和存储介质
  • 用户设备所属远端单元的确定方法、装置及存储介质
技术分类

06120113022161