掌桥专利:专业的专利平台
掌桥专利
首页

对象信息识别方法、装置、设备、存储介质及程序产品

文献发布时间:2024-04-18 20:00:50


对象信息识别方法、装置、设备、存储介质及程序产品

技术领域

本申请实施例涉及人工智能技术领域,特别涉及一种对象信息识别方法、装置、设备、存储介质及程序产品。

背景技术

在电子商务快速发展的过程中,加强对电子商务中的风险控制也极为重要,通过风险控制尽量规避一些影响正常业务的事件或者账号,最终形成一个专业和真实的良好交易环境。对象信息识别是指对网络交易中的交易账号的信息进行识别。异常账号是指网络交易中异常交易虚拟道具、虚拟币、技能、信息中的至少一种的用户账号。

相关技术中,将各个用户账号的特征输入神经网络模型,采用无监督学习聚类的方式将输入的用户账号进行聚类划分,并对聚类结果进行识别,进而识别出异常账号。

然而,上述神经网络模型只能学习到单个用户账号的特征,但网络交易中往往会与多个用户账号之间存在交易,相关技术中的方法对异常账号的识别结果不太准确。

发明内容

本申请提供了一种对象信息识别方法、装置、设备、存储介质及程序产品,能够提高异常账号的识别准确度。所述技术方案如下:

根据本申请的一方面,提供了一种对象信息识别方法,所述方法包括:

获取交易记录对应的无向图,所述无向图包括至少两个节点和所述至少两个节点之间的边,所述节点用于表征所述交易记录中的用户账号,所述边用于表征所述用户账号之间的交易关系;

基于所述无向图中的节点对应的节点特征对所述无向图进行重构,得到重构无向图,所述重构无向图是指对所述无向图中的所述节点特征和所述边进行重构后得到的图,所述重构是指对所述无向图中的所述节点特征和所述边进行修改;

根据所述重构无向图中的重构节点特征将所述节点进行聚类,得到至少两个聚类簇,所述重构节点特征是对所述节点特征进行重构后得到的特征;

基于各所述聚类簇中的用户账号信息,识别所述交易记录中的所述异常账号。

根据本申请的一方面,提供了一种对象信息识别装置,所述装置包括:

获取模块,用于获取交易记录对应的无向图,所述无向图包括至少两个节点和所述至少两个节点之间的边,所述节点用于表征所述交易记录中的用户账号,所述边用于表征所述用户账号之间的交易关系;

重构模块,用于基于所述无向图中的节点对应的节点特征对所述无向图进行重构,得到重构无向图,所述重构无向图是指对所述无向图中的所述节点特征和所述边进行重构后得到的图,所述重构是指对所述无向图中的所述节点特征和所述边进行修改;

聚类模块,用于根据所述重构无向图中的重构节点特征将所述节点进行聚类,得到至少两个聚类簇,所述重构节点特征是对所述节点特征进行重构后得到的特征;

识别模块,用于基于各所述聚类簇中的用户账号信息,识别所述交易记录中的所述异常账号。

在一些实施例中,重构模块,用于基于所述无向图中的所述节点特征对所述节点的特征进行重构,得到所述节点对应的所述重构节点特征;基于所述重构节点特征对所述无向图中的所述边进行重构,得到重构边,所述重构边是对所述无向图中的所述边进行重构后得到的边;基于所述节点对应的所述重构节点特征和所述重构边,得到所述重构无向图。

在一些实施例中,重构模块,用于将所述无向图中所述节点对应的所述节点特征与邻居节点对应的邻居节点特征进行聚合,得到所述重构节点特征。

其中,所述邻居节点用于表示与所述节点通过所述边连接的节点。

在一些实施例中,重构模块,用于将所述节点对应的所述节点特征与所述邻居节点对应的所述邻居节点特征进行加权平均,得到所述重构节点特征。

在一些实施例中,重构模块,用于将所述无向图中任意两个所述节点各自对应的所述重构节点特征进行相乘,得到节点对内积,所述节点对内积用于表征任意两个所述节点之间的关联关系;基于所述节点对内积对任意两个所述节点之间的所述边进行重构,得到所述重构边。

在一些实施例中,重构模块,用于在所述节点对内积大于或等于内积阈值的情况下,在两个所述节点之间添加所述边;在所述节点对内积小于所述内积阈值的情况下,在两个所述节点之间去掉所述边。

在一些实施例中,聚类模块,用于计算任意两个所述节点对应的所述重构节点特征之间的距离值;基于距离值将所述重构无向图中的所述节点进行聚类,得到至少两个所述聚类簇。

在一些实施例中,获取模块,用于获取每个所述聚类簇对应的标识异常账号比例,所述标识异常账号比例是指标识异常账号的数量与所述聚类簇中用户账号的总数量之间的比值,所述标识异常账号用于表示已确定为所述异常账号的用户账号。

在一些实施例中,识别模块,用于基于所述标识异常账号比例,识别所述交易记录中的所述异常账号。

在一些实施例中,获取模块,用于对每个所述聚类簇包含的所述用户账号进行统计,得到每个所述聚类簇中的所述标识异常账号的数量和所述聚类簇中所述用户账号的总数量;基于所述标识异常账号的数量和所述聚类簇中所述用户账号的总数量,确定所述标识异常账号比例。

在一些实施例中,识别模块,用于在所述标识异常账号比例大于或等于比例阈值的情况下,将所述聚类簇中的所述用户账号识别为所述异常账号。

在一些实施例中,所述装置还包括构建模块,构建模块,用于基于所述用户账号的账号特征及交易特征中的至少一种构建图,得到所述无向图。

其中,所述账号特征包括账号等级、账号地域中的至少一种,所述交易特征包括交易金额、交易笔数、交易对象、交易地域中的至少一种。

根据本申请的另一方面,提供了一种计算机设备,该计算机设备包括:处理器和存储器,存储器中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行以实现如上方面所述的对象信息识别方法。

根据本申请的另一方面,提供了一种计算机存储介质,计算机可读存储介质中存储有至少一条计算机程序,至少一条计算机程序由处理器加载并执行以实现如上方面所述的对象信息识别方法。

根据本申请的另一方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;所述计算机程序由计算机设备的处理器从所述计算机可读存储介质读取并执行,使得所述计算机设备执行如上方面所述的对象信息识别方法。

本申请提供的技术方案带来的有益效果至少包括:

通过获取交易记录对应的无向图;基于无向图中的节点对应的节点特征对无向图进行重构,得到重构无向图;根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇;基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。本申请通过重构无向图,使得无向图中的节点不仅包括了自身的信息,还融合了邻居节点的信息,实现了对用户账号之间的交易关系的捕捉;此外,基于重构节点特征对用户账号进行聚类,使得识别的范围减小,从而提高异常账号的识别准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的一种对象信息识别方法的示意图;

图2是本申请一个示例性实施例提供的计算机系统的架构示意图;

图3是本申请一个示例性实施例提供的对象信息识别方法的流程图;

图4是本申请一个示例性实施例提供的对象信息识别方法的流程图;

图5是本申请一个示例性实施例提供的无向图的示意图;

图6是本申请一个示例性实施例提供的重构无向图的示意图;

图7是本申请一个示例性实施例提供的节点聚类的示意图;

图8是本申请一个示例性实施例提供的识别异常账号的示意图;

图9是本申请一个示例性实施例提供的对象信息识别方法的流程图;

图10是本申请一个示例性实施例提供的对象信息识别装置的框图;

图11是本申请一个示例性实施例提供的计算机设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一参数也可以被称为第二参数,类似地,第二参数也可以被称为第一参数。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

需要进行说明的是,本申请在收集用户的相关数据(例如:交易记录、用户账号、交易关系、与用户账号相关的数据中的至少之一)之前以及在收集用户的相关数据的过程中,都可以显示提示界面、弹窗或输出语音提示信息,该提示界面、弹窗或语音提示信息用于提示用户当前正在搜集其相关数据,使得本申请仅仅在获取到用户对该提示界面或者弹窗发出的确认操作后,才开始执行获取用户相关数据的相关步骤,否则(即未获取到用户对该提示界面或者弹窗发出的确认操作时),结束获取用户相关数据的相关步骤,即不获取用户的相关数据。换句话说,本申请所采集的所有用户数据都是在用户同意并授权的情况下进行采集的,且相关用户数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

首先,对本申请实施例中涉及的名词进行简单介绍。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。

云技术(Cloud technology)基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。

云计算(Cloud computing)是一种计算模式,它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。

作为云计算的基础能力提供商,会建立云计算资源池(简称云平台,一般称为IaaS(Infrastructure as a Service,基础设施即服务)平台,在资源池中部署多种类型的虚拟资源,供外部客户选择使用。云计算资源池中主要包括:计算设备(为虚拟化机器,包含操作系统)、存储设备、网络设备。

按照逻辑功能划分,在IaaS(Infrastructure as a Service,基础设施即服务)层上可以部署PaaS(Platform as a Service,平台即服务)层,PaaS层之上再部署SaaS(Software as a Service,软件即服务)层,也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台,如数据库、Web(World Wide Web,全球广域网)容器等。SaaS为各式各样的业务软件,如web门户网站、短信群发器等。一般来说,SaaS和PaaS相对于IaaS是上层。

计算机视觉技术(Computer Vision,CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。大模型技术为计算机视觉技术发展带来重要变革,swin-transformer,ViT,V-MOE,MAE等视觉领域的预训练模型经过微调(fine tune)可以快速、广泛适用于下游具体任务。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的生物特征识别技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。

自编码器(Autoencoder,AE)是指一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks,ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行表征学习(Representation Learning),可以实现输入信息的降维与归纳。

图自编码器(Graph Autoencoder,GAE)是指应用在图数据结构上的自编码器。

本申请实施例提供了一种对象信息识别方法的示意图,如图1所示,该方法可以由计算机设备执行,计算机设备可以是终端或服务器。

示例性地,计算机设备获取交易记录对应的无向图10;基于无向图10中的节点对应的节点特征对无向图进行重构,得到重构无向图20;根据重构无向图20中的重构节点特征将节点进行聚类,得到至少两个聚类簇;基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。

异常账号是指网络交易中异常交易虚拟道具、虚拟币、技能、信息中的至少一种的用户账号;或,异常账号是指网络交易中非法交易虚拟道具、虚拟币、技能、信息中的至少一种的用户账号。

可选地,异常账号包括卖家账号。卖家账号是指在网络交易中异常转卖虚拟道具、虚拟币、技能、信息的用户账号;或,卖家账号是指网络交易中非法转卖虚拟道具、虚拟币、技能、信息中的用户账号。

无向图(Undirected Graph)10是指边没有方向的图。无向图10包括至少两个节点(Node)和至少两个节点之间的边(Edge)。

节点用于表征交易记录中的用户账号。边用于表征用户账号之间的交易关系。在两个用户账号之间存在交易关系的情况下,则将这两个用户账号对应的节点连接成边。例如,用户账号A卖给用户账号B一个苹果,则在无向图10中用户账号A为一个节点,用户账号B为一个节点,用户账号A和用户账号B之间通过边连接。

可选地,用户账号包括卖家账号、买家账号中的至少一种。

重构无向图20是指对无向图10中的节点对应的节点特征和边进行重构后得到的图。

重构是指对无向图10中的节点特征和边进行修改。

可选地,重构的方式包括以下方式中的至少一种,但不限于此:

·修改无向图10中节点对应的节点特征;

·修改无向图10中节点之间的边。

可选地,修改无向图10中节点之间的边包括在节点之间增加边、在节点之间增加边、修改节点之间的边的权重值中的至少一种,但不限于此,本申请实施例对此不作具体限定。

重构节点特征是对节点特征进行修改后得到的特征。

聚类是指将至少两个相似的节点组成类的过程;或,聚类是指将至少两个相似的节点归为一个组合的过程;或,聚类是指将所有的节点分成由类似的节点组成的多个聚类簇。

其中,同一个聚类簇中的节点彼此相似,与其他聚类簇中的节点不相似。

聚类簇是将至少两个相似的节点进行汇总得到的类或集合。

示例性地,交易记录对应的无向图10如图1中的(a)图所示,在无向图20中包括7个用户账号,每个账号对应有自己节点特征,分别为:用户账号一对应节点特征X1、用户账号二对应节点特征X2、用户账号三对应节点特征X3、用户账号四对应节点特征X4、用户账号五对应节点特征X5、用户账号六对应节点特征X6、用户账号七对应节点特征X7。用户账号一、用户账号二和用户账号三之间具有交易关系,因此通过边相互连接,用户账号三、用户账号四和用户账号六之间具有交易关系,因此通过边相互连接,用户账号四和用户账号五之间具有交易关系,因此通过边连接,用户账号三和用户账号七之间具有交易关系,因此通过边连接。

在一些实施例中,计算机设备基于节点特征对节点的特征进行重构,得到节点对应的重构节点特征;计算机设备基于重构节点特征对无向图10中的边进行重构,得到重构边;计算机设备基于节点对应的重构节点特征和重构边,得到重构无向图20。

重构边是对无向图10中的边进行重构后得到的边。

对无向图10中的节点的特征进行重构的步骤如下:

计算机设备将节点对应的节点特征与邻居节点对应的邻居节点特征进行加权平均,得到重构节点特征。

邻居节点用于表示与节点通过边连接的节点。

例如,如图1中的(b)图所示,针对用户账号一,计算机设备将用户账号一对应的节点特征X1和用户账号二对应的节点特征X2、用户账号三对应节点特征X3进行加权平均,得到用户账号一对应的重构节点特征Y1。针对用户账号二,计算机设备将用户账号二对应的节点特征X2和用户账号一对应的节点特征X1、用户账号三对应节点特征X3进行加权平均,得到用户账号二对应的重构节点特征Y2。同样步骤,针对用户账号三,计算机设备将用户账号三对应的节点特征X3和用户账号一对应的节点特征X1、用户账号二对应节点特征X2、用户账号四对应的节点特征X4、用户账号六对应的节点特征X6、用户账号七对应的节点特征X7进行加权平均,得到用户账号三对应的重构节点特征Y3。

对无向图10中的节点之间的边进行重构的步骤如下:

计算机设备将无向图10中任意两节点各自对应的构节点特征进行相乘,得到节点对内积;计算机设备基节点对内积对任意两个点之间的边进行重构,得到重构边。

节点对内积用于表征任意两个节点之间的关联关系。

可选地,在节点对内积大于或等于内积阈值的情况下,在两个节点之间添加边;节点对内积小于内积阈值的情况下,在两个节点之间去掉边。

例如,如图1中的(b)图所示,用户账号一和用户账号二之间的边被删除,用户账号三和用户账号六之间的边被删除,用户账号三和用户账号四之间的边被删除。

在一些实施例中,在得到重构无向图20后,计算机设备计算任意两个节点对应的重构节点特征之间的距离值;计算机设备基于距离值将重构无向图20中的节点进行聚类,得到至少两个聚类簇。例如,如图1中的(c)图所示,计算机设备计算任意两个节点对应的重构节点特征之间的距离值将距离最近的节点归在同一聚类簇中,以实现同一聚类簇内的重构节点特征之间的距离值最小,不同聚类簇间的重构节点特征之间的距离值最大,比如,得到第一聚类簇30和第二聚类簇40,第一聚类簇30中包括用户账号一、用户账号二、用户账号三、用户账号七,第二聚类簇40中包括用户账号四、用户账号五、用户账号六。

在一些实施例中,对每个聚类簇包含的用户账号进行统计,得到每个聚类簇中的标识异常账号的数量和聚类簇中用户账号的总数量;计算机设备基于标识异常账号的数量和聚类簇中用户账号的总数量,确定标识异常账号比例。在标识异常账号比例大于或等于比例阈值的情况下,将聚类簇中的用户账号识别为异常账号。

标识异常账号用于表示已确定为异常账号的用户账号。

标识异常账号比例是指标识异常账号的数量与聚类簇中用户账号的总数量之间的比值。

例如,如图1中的(c)图所示,在第一聚类簇30中,共有4个用户账号,用户账号三为标识异常账号,在第二聚类簇40中,共有3个用户账号,用户账号六为标识异常账号。在第一聚类簇30中的标识异常账号比例为25%,在第二聚类簇40中的标识异常账号比例为33%。假设比例阈值为30%,则,如图1中的(d)图所示,第二聚类簇40中的用户账号识别为异常账号。

综上所述,本实施例提供的方法,通过获取交易记录对应的无向图;基于无向图中的节点对应的节点特征对无向图进行重构,得到重构无向图;根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇;基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。本申请通过重构无向图,使得无向图中的节点不仅包括了自身的信息,还融合了邻居节点的信息,实现了对用户账号之间的交易关系的捕捉;此外,基于重构节点特征对用户账号进行聚类,使得识别的范围减小,从而提高异常账号的识别准确度。

图2示出了本申请一个实施例提供的计算机系统的架构示意图。该计算机系统可以包括:终端100和服务器200。

终端100可以是诸如手机、平板电脑、车载终端(车机)、可穿戴设备、个人计算机(Personal Computer,PC)、掌部图像识别语音交互设备、掌部图像识别家电、车载终端、飞行器、无人售货终端等电子设备。终端100中可以安装运行目标应用程序的客户端,该目标应用程序可以是参考掌部图像识别的应用程序,也可以是提供有掌部图像识别功能的其他应用程序,本申请对此不作限定。另外,本申请对该目标应用程序的形式不作限定,包括但不限于安装在终端100中的应用程序(Application,App)、小程序等,还可以是网页形式。

服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工掌部图像识别平台等基础云计算服务的云服务器。服务器200可以是上述目标应用程序的后台服务器,用于为目标应用程序的客户端提供后台服务。

其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源,如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用,将来每个物品都有可能存在自己的识别标志,都需要传输到后台系统进行逻辑处理,不同程度级别的数据将会分开处理,各类行业数据皆需要强大的系统后盾支撑,只能通过云计算来实现。

在一些实施例中,上述服务器还可以实现为区块链系统中的节点。区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链,本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。

终端100和服务器200之间可以通过网络进行通信,如有线或无线网络。

本申请实施例提供的对象信息识别方法,各步骤的执行主体可以是计算机设备,所述计算机设备是指具备数据计算、处理和存储能力的电子设备。以图2所示的方案实施环境为例,可以由终端100执行对象信息识别方法(如终端100中安装运行的目标应用程序的客户端执行对象信息识别方法),也可以由服务器200执行该对象信息识别方法,或者由终端100和服务器200交互配合执行,本申请对此不作限定。

图3是本申请一个示例性实施例提供的对象信息识别方法的流程图。该方法可以由计算机设备执行,计算机设备可以是终端或服务器。该方法包括:

步骤302:获取交易记录对应的无向图。

无向图是指边没有方向的图。无向图包括至少两个节点和至少两个节点之间的边。

节点用于表征交易记录中的用户账号。边用于表征用户账号之间的交易关系。在两个用户账号之间存在交易关系的情况下,则将这两个用户账号对应的节点连接成边。

交易记录包括卖家账号、买家账号、交易时间、交易内容、交易方式中的至少一种,但不限于此,本申请实施例对此不作具体限定。

步骤304:基于无向图中的节点对应的节点特征对无向图进行重构,得到重构无向图。

节点特征是指节点对应的描述矩阵。

重构是指对无向图中的节点特征和边进行修改。

重构无向图是指对无向图中的节点和边进行重构后得到的图。

重构的方式包括修改无向图中节点对应的节点特征和修改无向图中节点之间的边中的至少一种,但不限于此,本申请实施例对此不作具体限定。

可选地,修改无向图中节点对应的节点特征包括将任一个节点的节点特征与邻居节点的邻居节点特征进行聚合,并将聚合后的特征作为该节点的重构节点特征。

重构节点特征是对节点特征进行修改后得到的特征。

可选地,修改无向图中节点之间的边包括在节点之间增加边、在节点之间增加边、修改节点之间的边的权重值中的至少一种,但不限于此,本申请实施例对此不作具体限定。

步骤306:根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇。

聚类是指将至少两个相似的节点组成类的过程;或,聚类是指将至少两个相似的节点归为一个组合的过程;或,聚类是指将所有的节点分成由类似的节点组成的多个聚类簇。

其中,同一个聚类簇中的节点彼此相似,与其他聚类簇中的节点不相似。

聚类簇是将至少两个相似的节点进行汇总得到的类或集合。

步骤308:基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。

异常账号是指网络交易中异常交易虚拟道具、虚拟币、技能、信息中的至少一种的用户账号。

用户账号信息包括聚类簇中标识异常账号的数量、标识异常账号的比例、非异常账号的数量、非异常账号的比例中的至少一种,但不限于此,本申请实施例对此不作具体限定。

标识异常账号用于表示已确定为异常账号的用户账号。

示例性地,计算机设备基于各个聚类簇中标识异常账号的数量,识别该聚类簇是否为异常账号,也即为聚类簇赋予异常账号的语义。

综上所述,本实施例提供的方法,通过获取交易记录对应的无向图;基于无向图中的节点对应的节点特征对无向图进行重构,得到重构无向图;根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇;基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。本申请通过重构无向图,使得无向图中的节点不仅包括了自身的信息,还融合了邻居节点的信息,实现了对用户账号之间的交易关系的捕捉;此外,基于重构节点特征对用户账号进行聚类,使得识别的范围减小,从而提高异常账号的识别准确度。

图4是本申请一个示例性实施例提供的对象信息识别方法的流程图。该方法可以由计算机设备执行,计算机设备可以是终端或服务器。该方法包括:

步骤402:获取交易记录对应的无向图。

无向图是指边没有方向的图。无向图包括至少两个节点和至少两个节点之间的边。

节点用于表征交易记录中的用户账号。边用于表征用户账号之间的交易关系。在两个用户账号之间存在交易关系的情况下,则将这两个用户账号对应的节点连接成边。

交易记录包括卖家账号、买家账号、交易时间、交易内容、交易方式中的至少一种,但不限于此,本申请实施例对此不作具体限定。

可选地,交易记录的期限可以是当天的交易记录、昨天的交易记录、近三天的交易记录、近一周的交易记录、近一月的交易记录、近三月的交易记录、近一年的交易记录中的至少一种,但不限于此,本申请实施例对此不作具体限定。

示例性地,计算机设备基于用户账号的账号特征及交易特征中的至少一种构建图,得到无向图。

账号特征用于表示用户账号自身的特征。

可选地,账号特征包括账号等级、账号地域中的至少一种,但不限于此,本申请实施例对此不作具体限定。

账号等级是指账号的排名或级别,比如,青铜、白银、黄金。账号地域是指用户账号对应的常用位置,或,账号地域是指用户账号对应的注册位置。

交易特征(也可称为交易流水)用于表示用户账号之间发生交易关系时的特征。

可选地,交易特征包括交易金额、交易笔数、交易对象、交易地域中的至少一种,但不限于此,本申请实施例对此不作具体限定。

例如,计算机设备获取近一周的交易记录,根据交易记录中的账号特征和交易特征构建无向图。

如图5所示出的无向图的示意图,在无向图501中包括7个用户账号,每个账号对应有自己节点特征,分别为:用户账号一对应节点特征X1、用户账号二对应节点特征X2、用户账号三对应节点特征X3、用户账号四对应节点特征X4、用户账号五对应节点特征X5、用户账号六对应节点特征X6、用户账号七对应节点特征X7。用户账号一、用户账号二和用户账号三之间具有交易关系,因此通过边相互连接,用户账号三、用户账号四和用户账号六之间具有交易关系,因此通过边相互连接,用户账号四和用户账号五之间具有交易关系,因此通过边连接,用户账号三和用户账号七之间具有交易关系,因此通过边连接。

步骤404:基于无向图中的节点特征对节点的特征进行重构,得到节点对应的重构节点特征。

重构是指对无向图中的节点特征和边进行修改。

重构无向图是指对无向图中的节点和边进行重构后得到的图。

可选地,修改无向图中节点对应的节点特征包括将任一个节点的节点特征与邻居节点的邻居节点特征进行聚合,并将聚合后的特征作为该节点的重构节点特征。

重构节点特征是对节点特征进行修改后得到的特征。

在一些实施例中,计算机设备将无向图中节点对应的节点特征与邻居节点对应的邻居节点特征进行聚合,得到重构节点特征。

邻居节点用于表示与节点通过边连接的节点。

示例性的,计算机设备将节点对应的节点特征与邻居节点对应的邻居节点特征进行加权平均,得到重构节点特征。将邻居节点对应的邻居节点特征进行加权平均的目的在于在自身节点的信息的基础上融合了邻居节点的信息,而且还结合注意力机制学习邻居节点的权重,这样便可使得该节点表达的信息更加充分、全面。

示例性地,计算机设备包括异常账号识别模型,针对无向图的重构,可通过异常账号识别模型中的GAE实现,将无向图中节点对应的节点特征与邻居节点对应的邻居节点特征进行聚合的公式可表示为:

式中,

可选地,针对无向图的重构还可以使用图卷积网络(Graph ConvolutionalNetworks,GCN)来实现。

步骤406:基于重构节点特征对无向图中的边进行重构,得到重构边;基于节点对应的重构节点特征和重构边,得到重构无向图。

重构边是对无向图中的边进行重构后得到的边。

可选地,修改(重构)无向图中节点之间的边包括在节点之间增加边、在节点之间增加边、修改节点之间的边的权重值中的至少一种,但不限于此,本申请实施例对此不作具体限定。

重构无向图是指对无向图中的节点对应的节点特征和边进行重构后得到的图。

在一些实施例中,计算机设备将无向图中任意两个节点各自对应的重构节点特征进行相乘,得到节点对内积;计算机设备基于节点对内积对任意两个节点之间的边进行重构,得到重构边。

节点对内积用于表征任意两个节点之间的关联关系。

示例性的,在节点对内积大于或等于内积阈值的情况下,在两个节点之间添加边,或维持两个节点之间的边;在节点对内积小于内积阈值的情况下,在两个节点之间去掉边。

在一些实施例中,在对无向图中的节点特征进行重构得到重构节点特征后,GAE可以通过计算节点对的内积来重构无向图的网络结构,进而实现无监督的节点表示学习。基于节点对内积对任意两个节点之间的边进行重构的公式可表示为:

/>

式中,

示例性地,如图6所示出的重构无向图的示意图,如图6中的(a)图所示,在无向图601中包括7个用户账号,每个账号对应有自己节点特征,具有交易关系的用户账号之间通过边连接。如图6中的(b)图所示,对节点对应的节点特征进行重构的步骤包括:针对用户账号一,计算机设备将用户账号一对应的节点特征X1和用户账号二对应的节点特征X2、用户账号三对应节点特征X3进行加权平均,得到用户账号一对应的重构节点特征Y1。针对用户账号二,计算机设备将用户账号二对应的节点特征X2和用户账号一对应的节点特征X1、用户账号三对应节点特征X3进行加权平均,得到用户账号二对应的重构节点特征Y2。同样步骤,针对用户账号三,计算机设备将用户账号三对应的节点特征X3和用户账号一对应的节点特征X1、用户账号二对应节点特征X2、用户账号四对应的节点特征X4、用户账号六对应的节点特征X6、用户账号七对应的节点特征X7进行加权平均,得到用户账号三对应的重构节点特征Y3。

对节点之间的边进行重构的步骤包括:针对用户账号一和用户账号二之间的边,计算机设备将用户账号一对应的重构节点特征Y1和用户账号二对应的重构节点特征Y2进行相乘,得到用户账号一和用户账号二之间的节点对内积,在用户账号一和用户账号二之间的节点对内积小于内积阈值的情况下,取消用户账号一和用户账号二之间的边;同样步骤,计算机设备将无向图中任意两个节点各自对应的重构节点特征进行相乘,得到节点对内积;计算机设备基于节点对内积对任意两个节点之间的边进行重构,得到重构边,计算机设备基于节点对应的重构节点特征和重构边,得到重构无向图602。

步骤408:根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇。

聚类是指将至少两个相似的节点组成类的过程;或,聚类是指将至少两个相似的节点归为一个组合的过程;或,聚类是指将所有的节点分成由类似的节点组成的多个聚类簇。

其中,同一个聚类簇中的节点彼此相似,与其他聚类簇中的节点不相似。

聚类簇是将至少两个相似的节点进行汇总得到的类或集合。

示例性地,计算机设备计算任意两个节点对应的重构节点特征之间的距离值;计算机设备基于距离值将重构无向图中的节点进行聚类,得到至少两个聚类簇。

可选地,以任意两个节点为第一节点和第二节点为例,计算机设备将第一节点对应的重构节点特征与第二节点对应的重构节点特征、两节点之间的权重值相乘,得到第一节点和第二节点之间的距离值;计算机设备基于距离值将重构无向图中的节点进行聚类,得到至少两个聚类簇。

在一些实施例中,计算机设备还可以采用聚类算法将节点进行聚类,得到多个聚类簇。聚类算法包括以下至少一种:K均值聚类算法(K-Means Clustering Algorithm,K-Means)、层次聚类算法、基于密度的聚类算法(Density-Based Spatial Clustering ofApplications with Noise,DBSCAN)。

在一些实施例中,异常账号识别模型还包括聚类网络层,针对重构无向图中的节点聚类,可通过聚类网络层实现。在对无向图进行重构得到重构无向图后,重构无向图中的节点不仅包含了自身的信息,还包含了邻居节点的信息。假定聚类中心为u

式中,q

最后,节点i所属的聚类簇可表示为:

式中,s

示例性地,如图7所示出的节点聚类的示意图,在得到重构无向图701后,如图7中的(a)图所示,计算机设备计算任意两个节点对应的重构节点特征之间的距离值;计算机设备基于距离值将重构无向图701中的节点进行聚类,得到至少两个聚类簇。如图7中的(b)图所示,计算机设备计算任意两个节点对应的重构节点特征之间的距离值将距离最近的节点归在同一聚类簇中,以实现同一聚类簇内的重构节点特征之间的距离值最小,不同聚类簇间的重构节点特征之间的距离值最大,比如,得到第一聚类簇702和第二聚类簇703,第一聚类簇702中包括用户账号一、用户账号二、用户账号三、用户账号七,第二聚类簇703中包括用户账号四、用户账号五、用户账号六。

步骤410:基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。

异常账号是指网络交易中异常交易虚拟道具、虚拟币、技能、信息中的至少一种的用户账号。

用户账号信息包括聚类簇中标识异常账号的数量、标识异常账号的比例、非异常账号的数量、非异常账号的比例中的至少一种,但不限于此,本申请实施例对此不作具体限定。

标识异常账号用于表示已确定为异常账号的用户账号。

示例性地,计算机设备基于各个聚类簇中标识异常账号的数量,识别该聚类簇是否为异常账号,也即,为聚类簇赋予异常账号的语义。

在一些实施例中,计算机设备获取每个聚类簇对应的标识异常账号比例;计算机设备基于标识异常账号比例,识别交易记录中的异常账号。

标识异常账号比例是指标识异常账号的数量与聚类簇中用户账号的总数量之间的比值。

可选地,标识异常账号的确定可以是人为确定的、异常账号的历史识别记录中记载的异常账号、上一次识别出的异常账号中的至少一种,但不限于此,本申请实施例对此不作具体限定。

示例性地,标识异常账号比例的获取步骤包括:计算机设备对每个聚类簇包含的用户账号进行统计,得到每个聚类簇中的标识异常账号的数量和聚类簇中所户账号的总数量;计算机设备基于标识异常账号的数量和聚类簇中用户账号的总数量,确定标识异常账号比例。

示例性地,在标识异常账号比例大于或等于比例阈值的情况下,将聚类簇中的用户账号识别为异常账号,也即为该聚类簇赋予异常账号的语义。

示例性地,如图8所示出的识别异常账号的示意图,如图8中的(a)图所示,在第一聚类簇801中,共有4个用户账号,用户账号三为标识异常账号,在第二聚类簇802中,共有3个用户账号,用户账号六为标识异常账号。在第一聚类簇801中的标识异常账号比例为25%,在第二聚类簇802中的标识异常账号比例为33%。假设比例阈值为30%,则,如图8中的(b)图所示,第二聚类簇802中的用户账号均被识别为异常账号。

在一些实施例中,在确定聚类簇对应的标识异常账号比例的情况下,基于标识异常账号比例进行风险等级划分,将标识异常账号比例低于风险阈值的聚类簇中的用户账号剔除、释放或人工排查,将标识异常账号比例大于或等于风险阈值的聚类簇中的用户账号进行标定,并对标定的异常账号进行交易拦截。

在实际应用中,本申请实施例提供的方法的异常账号识别准确率得到明显提升,准确率提升20%左右。

综上所述,本实施例提供的方法,通过获取交易记录对应的无向图;基于无向图中的节点对应的节点特征对无向图进行重构,得到重构无向图;根据重构无向图中的重构节点特征将节点进行聚类,得到至少两个聚类簇;基于各聚类簇中的用户账号信息,识别交易记录中的异常账号。本申请通过重构无向图,使得无向图中的节点不仅包括了自身的信息,还融合了邻居节点的信息,实现了对用户账号之间的交易关系的捕捉;此外,基于重构节点特征对用户账号进行聚类,使得识别的范围减小,从而提高异常账号的识别准确度。

本实施例提供的方法,通过对无向图中进行重构的方式,使得无向图表现的节点特征不再停留在低纬度的自身信息层面,而是能够表达的信息的维度更深。

本实施例提供的方法,通过对无向图中的节点对应的节点特征进行重构,使得无向图中的节点不仅包括了自身的信息,还融合了邻居节点的信息,实现了对用户账号之间的交易关系的捕捉。

本实施例提供的方法,通过对无向图中的边进行重构,使得无向图中的边在重构节点特征的基础上进行更新,去除了一些并不重要的边,从而使得用户账号之间的交易关系更加准确。

本实施例提供的方法,通过基于重构节点特征对用户账号进行聚类,使得识别的范围减小,从而提高异常账号的识别准确度。

本实施例提供的方法,通过聚类簇中标识异常账号的数量,识别该聚类簇是否为异常账号,通过检测标识异常账号的数量便可直接对聚类簇进行识别,简化了识别过程,提高了识别效率。

接下来,对异常账号识别模型中的GAE和聚类网络层的训练进行说明。

针对无向图的重构,可通过异常账号识别模型中的GAE实现,在将无向图中节点对应的节点特征与邻居节点对应的邻居节点特征进行聚合,得到重构节点特征后,GAE将无向图中任意两个节点各自对应的重构节点特征进行相乘,得到节点对内积;基于样本节点对内积与节点对内积,计算GAE对应的第一训练损失。第一训练损失的计算公式如下所示:

式中,L

针对重构无向图中的节点聚类,可通过聚类网络层实现,在对无向图进行重构得到重构无向图后,重构无向图中的节点不仅包含了自身的信息,还包含了邻居节点的信息。聚类网络层计算任意两个节点对应的重构节点特征之间的距离值;计算机设备基于距离值将重构无向图中的节点进行聚类,得到至少两个聚类簇,得到的节点分布可表示为:

式中,q

q

式中,p

基于节点分布和目标分布,可得到聚类网络层对应的第二训练损失。第二训练损失可通过节点分布和目标分布之间的KL散度表示,第二训练损失的计算公式如下所示:

式中,L

综上所述,异常账号识别模型的训练损失为第一训练损失和第二训练损失的和,异常账号识别模型的总训练损失可表示为:

L=L

式中,L为异常账号识别模型的总训练损失,L

在异常账号识别模型的训练过程中,可通过第一训练损失仅对GAE进行参数更新,也可以通过第二训练损失仅对聚类网络层进行参数更新,还可以通过总训练损失对整个异常账号识别模型进行参数更新,本申请对此不作具体限定。

在异常账号识别模型的训练过程中,基于训练损失,将训练损失对应的损失函数值作为训练指标对异常账号识别模型中的GAE和/或聚类网络层的网络参数进行更新,直至损失函数值发生收敛,从而得到训练完成的异常账号识别模型。

损失函数值发生收敛是指损失函数值不再发生改变,或,异常账号识别模型的训练时相邻两次迭代之间的误差差别小于预设值,或,异常账号识别模型的训练次数达到预设次数中的至少一种,但不限于此,本申请实施例对此不作限定。

可选的,训练满足的目标条件可以为初始模型的训练迭代次数达到目标次数,技术人员可以预先设定训练迭代次数。或者,训练满足的目标条件可以为损失值满足目标阈值条件,但不限于此,本申请实施例对此不作限定。

图9是本申请一个示例性实施例提供的对象信息识别方法的流程图。该方法可以由计算机设备执行,计算机设备可以是终端或服务器。该方法包括:

步骤901:构建无向图。

无向图是指边没有方向的图。无向图包括至少两个节点和至少两个节点之间的边。

节点用于表征交易记录中的用户账号。边用于表征用户账号之间的交易关系。在两个用户账号之间存在交易关系的情况下,则将这两个用户账号对应的节点连接成边。

示例性地,在算法层面上,计算机设备基于用户账号的账号特征及交易特征中的至少一种构建图,得到无向图。

可选地,账号特征包括账号等级、账号地域中的至少一种,但不限于此,本申请实施例对此不作具体限定。

可选地,交易特征包括交易金额、交易笔数、交易对象、交易地域中的至少一种,但不限于此,本申请实施例对此不作具体限定。

步骤902:重构无向图。

重构是指对无向图中的节点特征和边进行修改。

示例性地,在算法层面上,计算机设备将节点对应的节点特征与邻居节点对应的邻居节点特征进行加权平均,得到重构节点特征。将邻居节点对应的邻居节点特征进行加权平均的目的在于在自身节点的信息的基础上融合了邻居节点的信息,而且还结合注意力机制学习邻居节点的权重,这样便可使得该节点表达的信息更加充分、全面。

在确定无向图中的重构节点特征后,计算机设备将无向图中任意两个节点各自对应的重构节点特征进行相乘,得到节点对内积;计算机设备基于节点对内积对任意两个节点之间的边进行重构,得到重构边。计算机设备基于节点对应的重构节点特征和重构边,得到重构无向图。

重构无向图是指对无向图中的节点对应的节点特征和边进行重构后得到的图。

步骤903:将节点进行聚类。

聚类是指将至少两个相似的节点组成类的过程;或,聚类是指将至少两个相似的节点归为一个组合的过程;或,聚类是指将所有的节点分成由类似的节点组成的多个聚类簇。其中,同一个聚类簇中的节点彼此相似,与其他聚类簇中的节点不相似。

示例性地,在算法层面上,计算机设备计算任意两个节点对应的重构节点特征之间的距离值;计算机设备基于距离值将重构无向图中的节点进行聚类,得到至少两个聚类簇。

步骤904:输出聚类簇。

示例性地,在对重构无向图中的节点进行聚类后,输出至少两个聚类簇。

步骤905:计算标识异常账号比例。

标识异常账号用于表示已确定为异常账号的用户账号。

标识异常账号比例是指标识异常账号的数量与聚类簇中用户账号的总数量之间的比值。

示例性地,在得到输出的至少两个聚类簇的情况下,计算机设备对每个聚类簇包含的用户账号进行统计,得到每个聚类簇中的标识异常账号的数量和聚类簇中所户账号的总数量;计算机设备基于标识异常账号的数量和聚类簇中用户账号的总数量,确定标识异常账号比例。

步骤906:输出异常账号风险等级。

示例性地,在得到每个聚类簇对应的标识异常账号比例的情况下,在标识异常账号比例大于或等于比例阈值的情况下,将聚类簇中的用户账号识别为异常账号,也即为该聚类簇赋予异常账号的语义。

在一些实施例中,在确定聚类簇对应的标识异常账号比例的情况下,基于标识异常账号比例进行风险等级划分。

步骤907:实时交易记录。

示例性地,计算机设备获取实时交易记录。

步骤908:结合异常账号风险等级实施交易评分。

示例性地,在得到风险等级的情况下,计算机设备结合异常账号的风险等级对交易进行评分,并输出评分结果。

步骤909:拦截或警告。

示例性地,针对评分结果,将评分结果低的用户账号进行交易拦截或警告。

示例性地,本申请一个示例性实施例提供了一种的对象信息识别方法。该方法可以由计算机设备执行,计算机设备可以是终端或服务器。

交易记录中的用户账号具有一定的聚集性,多个买家账号会向一个异常账号支付金额,且多个支付账号大部分都有历史累计交易标签。历史累计交易标签用于表示该买家账号与异常账号之间存在交易。

因此,本申请一个示例性实施例提供了一种的对象信息识别方法,首先,基于用户账号的账号特征及交易特征构建无向图,以无向图中的邻居节点对应的邻居节点特征(也称为邻接矩阵)和节点对应的节点特征(也称为节点特征矩阵)作为输入,通过对邻居节点的聚合来学习节点表示,然后利用节点对的内积来重构无向图中的原始网络结构,比较有特色的部分就是结合注意力机制来学习邻居的权重,这样可以更好的学习节点表示。然后通过图聚类增强同一簇节点之间的内聚性,即对所学习到的节点特征进行约束和整合,使其更适合于聚类出更多的异常账号。

本申请一示例性实施例提供的对象信息识别方法的流程如下:

(1)基于用户账号的账号特征及交易特征构建无向图。

抽取近7天的用户账号的所有交易,构建用户账号和与其交易的邻居用户账号,基于它们之间的交易流水和账号属性联系。

(2)基于带有注意力机制的图自编码器更新无向图中的节点。

经典的GAE架构:通过对邻居节点的聚合来学习节点表示,然后利用节点对的内积来重构原始网络结构。

(3)对重构无向图中的节点进行聚类。

GAE所学习到的节点表示只是为了更好的重构网络结构,和聚类并没有直接联系。自训练聚类模块就是对GAE所学习到的重构节点特征进行约束和整合,使其更适合于聚类任务。

(4)基于聚类结果进行线上拦截方案。

根据最终聚类结果把账号分为几个聚类簇,再结合每个聚类簇的标识异常账号比例(也可称为实锤异常账号浓度)划分异常账号的风险等级,然后将标识异常账号比例低于比例阈值的聚类簇剔除或者人工排查风险等级。最后将聚类簇的风险等级结合交易可疑模型实时线上拦截。

图10示出了本申请一个示例性实施例提供的对象信息识别装置的结构示意图。该装置可以通过软件、硬件或者两者的结合实现成为计算机设备的全部或一部分,该装置包括:

获取模块1001,用于获取交易记录对应的无向图,所述无向图包括至少两个节点和所述至少两个节点之间的边,所述节点用于表征所述交易记录中的用户账号,所述边用于表征所述用户账号之间的交易关系;

重构模块1002,用于基于所述无向图中的节点对应的节点特征对所述无向图进行重构,得到重构无向图,所述重构无向图是指对所述无向图中的所述节点特征和所述边进行重构后得到的图,所述重构是指对所述无向图中的所述节点特征和所述边进行修改;

聚类模块1003,用于根据所述重构无向图中的重构节点特征将所述节点进行聚类,得到至少两个聚类簇,所述重构节点特征是对所述节点特征进行重构后得到的特征;

识别模块1004,用于基于各所述聚类簇中的用户账号信息,识别所述交易记录中的所述异常账号。

在一些实施例中,重构模块1002,用于基于所述无向图中的所述节点特征对所述节点的特征进行重构,得到所述节点对应的所述重构节点特征;基于所述重构节点特征对所述无向图中的所述边进行重构,得到重构边,所述重构边是对所述无向图中的所述边进行重构后得到的边;基于所述节点对应的所述重构节点特征和所述重构边,得到所述重构无向图。

在一些实施例中,重构模块1002,用于将所述无向图中所述节点对应的所述节点特征与邻居节点对应的邻居节点特征进行聚合,得到所述重构节点特征。

其中,所述邻居节点用于表示与所述节点通过所述边连接的节点。

在一些实施例中,重构模块1002,用于将所述节点对应的所述节点特征与所述邻居节点对应的所述邻居节点特征进行加权平均,得到所述重构节点特征。

在一些实施例中,重构模块1002,用于将所述无向图中任意两个所述节点各自对应的所述重构节点特征进行相乘,得到节点对内积,所述节点对内积用于表征任意两个所述节点之间的关联关系;基于所述节点对内积对任意两个所述节点之间的所述边进行重构,得到所述重构边。

在一些实施例中,重构模块1002,用于在所述节点对内积大于或等于内积阈值的情况下,在两个所述节点之间添加所述边;在所述节点对内积小于所述内积阈值的情况下,在两个所述节点之间去掉所述边。

在一些实施例中,聚类模块1003,用于计算任意两个所述节点对应的所述重构节点特征之间的距离值;基于距离值将所述重构无向图中的所述节点进行聚类,得到至少两个所述聚类簇。

在一些实施例中,获取模块1001,用于获取每个所述聚类簇对应的标识异常账号比例,所述标识异常账号比例是指标识异常账号的数量与所述聚类簇中用户账号的总数量之间的比值,所述标识异常账号用于表示已确定为所述异常账号的用户账号。

在一些实施例中,识别模块1004,用于基于所述标识异常账号比例,识别所述交易记录中的所述异常账号。

在一些实施例中,获取模块1001,用于对每个所述聚类簇包含的所述用户账号进行统计,得到每个所述聚类簇中的所述标识异常账号的数量和所述聚类簇中所述用户账号的总数量;基于所述标识异常账号的数量和所述聚类簇中所述用户账号的总数量,确定所述标识异常账号比例。

在一些实施例中,识别模块1004,用于在所述标识异常账号比例大于或等于比例阈值的情况下,将所述聚类簇中的所述用户账号识别为所述异常账号。

在一些实施例中,所述装置还包括构建模块1005,构建模块1005,用于基于所述用户账号的账号特征及交易特征中的至少一种构建图,得到所述无向图。

其中,所述账号特征包括账号等级、账号地域中的至少一种,所述交易特征包括交易金额、交易笔数、交易对象、交易地域中的至少一种。

图11示出了本申请一示例性实施例示出的计算机设备1100的结构框图。该计算机设备可以实现为本申请上述方案中的服务器。所述计算机设备1100包括中央处理单元(Central Processing Unit,CPU)1101、包括随机存取存储器(Random Access Memory,RAM)1102和只读存储器(Read-Only Memory,ROM)1103的系统存储器1104,以及连接系统存储器1104和中央处理单元1101的系统总线1105。所述计算机设备1100还包括用于存储操作系统1109、应用程序1110和其他程序模块1111的大容量存储设备1106。

所述大容量存储设备1106通过连接到系统总线1105的大容量存储控制器(未示出)连接到中央处理单元1101。所述大容量存储设备1106及其相关联的计算机可读介质为计算机设备1100提供非易失性存储。也就是说,所述大容量存储设备1106可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。

不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、可擦除可编程只读寄存器(Erasable Programmable Read Only Memory,EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)闪存或其他固态存储其技术,CD-ROM、数字多功能光盘(Digital Versatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1104和大容量存储设备1106可以统称为存储器。

根据本公开的各种实施例,所述计算机设备1100还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1100可以通过连接在所述系统总线1105上的网络接口单元1107连接到网络1108,或者说,也可以使用网络接口单元1107来连接到其他类型的网络或远程计算机系统(未示出)。

所述存储器还包括至少一段计算机程序,所述至少一段计算机程序存储于存储器中,中央处理器1101通过执行该至少一段程序来实现上述各个实施例所示的对象信息识别方法中的全部或部分步骤。

本申请实施例还提供一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条程序,该至少一条程序由处理器加载并执行以实现上述各方法实施例提供的对象信息识别方法。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现上述各方法实施例提供的对象信息识别方法。

本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;所述计算机程序由计算机设备的处理器从所述计算机可读存储介质读取并执行,使得所述计算机设备执行以实现上述各方法实施例提供的对象信息识别方法。

可以理解的是,在本申请的具体实施方式中,涉及到的数据,历史数据,以及画像等与用户身份或特性相关的用户数据处理等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

需要说明的是,除非本文中另外明确定义,否则用于权利要求中的所有术语根据它们在技术领域中的普通含义来解释。除非另外明确叙述,否则对“一个元件、装置、部件、设备、步骤等”的所有参考将被开放地解释为指代元件、装置、部件、设备、步骤等的至少一个实例。除非明确叙述,否则本文所公开的任意方法的步骤不是必须以所公开的确切顺序来执行。

应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同切换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 具有气体回收机构的质谱检漏设备及质谱检漏方法
  • 具有分级充气机构的质谱检漏设备及质谱检漏方法
  • 具有分级抽气机构的质谱检漏设备及质谱检漏方法
  • 一种绝缘件检漏方法及检漏系统
  • 一种气、液体软包装袋真空检漏装置及检漏方法
  • 一种磁流体旋转密封机构检漏工具及检漏方法
  • 一种磁流体旋转密封机构检漏工具及检漏方法
技术分类

06120116538024