掌桥专利:专业的专利平台
掌桥专利
首页

一种基于胶囊网络的虚拟货币异常地址检测方法及装置

文献发布时间:2023-06-19 19:28:50


一种基于胶囊网络的虚拟货币异常地址检测方法及装置

技术领域

本发明涉及计算机技术领域,具体涉及一种基于胶囊网络的虚拟货币异常地址检测方法及装置。

背景技术

目前关于虚拟货币异常地址检测方法主要采用机器学习虚拟货币地址分类和深度学习识别异常虚拟货币节点。上述方法通过爬虫技术从第三方网站或者论坛中得到虚拟货币异常地址并进行交易信息检索来构建数据集,将得到的数据集输入到所选机器学习分类模型得到异常地址分类结果,或是通过数据集构建图网络并通过半监督学习对网络进行训练得到异常地址检测模型。上述方案虽然能一定程度的实现虚拟货币异常地址检测,但在特征选取和处理上存在角度单一,并且在虚拟货币地址检测中无法考虑到地址存在的各项特征之间的关系。

区块链技术是以数据库作为数据载体,通过P2P网络进行通信传输,依赖密码学保障隐私。区块链本质上是一个具有去中心化、不可篡改、数据加密的分布式共享账本及数据库。虚拟货币是一种由开发者进行控制的货币,是对价值的数字化体现,且只在特定场景下使用。随着区块链技术和虚拟货币的发展,越来越多的不法分子凭借区块链的匿名性获取非法收入。由于区块链中账本数据量巨大、节点匿名化,难以对整个区块链进行监管,无法准确识别并预防虚拟货币非法行为。因此,根据区块链链上数据的公开特性对虚拟货币交易地址进行风险评估,能够为监管区块链虚拟货币提供极大帮助。

胶囊网络是由Hinton等人基于卷积神经网络提出的一种新型神经网络结构,该网络引入了向量胶囊层和动态路由算法,用胶囊表示神经元的集合,使用动态路由的方法连接不同隐藏层之间的胶囊以映射不同特征间的相对关系。胶囊网络改善了传统卷积神经网络对目标位置不敏感的问题。根据已有的研究工作证明,深度学习技术在货币交易账户分类领域是一种可行的方案,能够在小样本条件下完成分类工作。

发明内容

发明目的:为了能对区块链中虚拟货币地址进行实时的异常检测,本发明提供了一种基于胶囊网络的虚拟货币异常地址检测方法及装置。

技术方案:本发明提出的一种基于胶囊网络的虚拟货币异常地址检测方法,包括如下步骤:

步骤1:获取区块链虚拟货币平台中异常地址和正常地址及其交易数据作为基础数据集;

步骤2:对地址数据进行数据预处理,并进行样本类别不均衡处理,构建特征矩阵,并将所述特征矩阵转换为热图,得到样本数据集;

步骤3:基于胶囊网络构建训练模型,获取高级特征胶囊;

步骤4:随机选取部分虚拟货币地址,通过步骤2方法构建测试集,将测试集输入到步骤3训练好的胶囊网络中,输出得到分类结果完成异常地址检测。

进一步地,所述步骤1中获取地址数据,包括如下步骤:

步骤1.1:通过第三方平台获取公开的区块链虚拟货币异常地址,随机从区块链虚拟货币平台选取部分正常地址;

步骤1.2:对异常地址和正常地址进行交易信息检索,得到基础数据集,基础数据集包含地址交易日期时间、交易虚拟货币数量、应用合约类别、交易手续费、交易所在区块号。

进一步地,所述步骤2中的数据预处理具体为包对步骤1中基础数据集中的地址包含数据缺失百分比超过所定范围、地址包含数据数量不足的地址进行删除操作。

进一步地,所述步骤2中样本类别不均衡处理具体为使用边界合成少数类过采样技术处理后更新基础数据集,使异常地址数据量与正常地址数据量的比列达到1∶2。

进一步地,所述步骤2中特征矩阵构建具体包括如下步骤:

依据样本类别不均衡处理更新后的基础数据集,通过不同时间窗口构建特征矩阵,时间窗口范围为3天至数月,每一个地址拥有一个特征矩阵,构成特征矩阵集,其中特征属性包括:某段时间范围内的输出虚拟货币总数量、某段时间范围内的输出虚拟货币平均数量、某段时间范围内的交易手续费总数量、某段时间范围内应用合约总数量,某段时间范围内交易频率。

进一步地,热图转换具体为:将特征矩阵转换为32×32格式、大小小于10KB的热图,转换所得的全部热图构成样本数据集。

进一步地,所述步骤3中基于胶囊网络的模型包含普通卷积层、PrimaryCaps层、DigitCaps层;普通卷积层应用ReLU函数作为非线性激活函数,输入热图提取局部特征;将普通卷积层的输出作为PrimaryCaps层的输入,通过卷积得到多个基础特征胶囊;DigitCaps层采用全连接模式,通过迭代动态路由计算;具体包括如下步骤:

步骤3.1:普通卷积层采用步长为1、核大小为9×9的卷积核并应用ReLU函数作为非线性激活函数提取样本数据的局部特征;

步骤3.2:将步骤3.1的输出作为PrimaryCaps层的输入,通过卷积得到多个基础特征胶囊;

步骤3.3:所述DigitCaps层应用迭代动态路由计算得到高级特征胶囊,经过Squashing函数对高级胶囊进行压缩计算得到其长度即特征存在的概率,输出地址分类结果。

本发明还公开一种基于胶囊网络的虚拟货币异常地址检测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现上述基于胶囊网络的虚拟货币异常地址检测方法。

有益效果:

本发明经过对虚拟货币交易中异常地址和正常地址的特征学习从而检测模糊类别地址的风险状况,能够解决区块链网络中虚拟货币地址风险状态模糊的问题;采用边界合成少数类过采样技术,解决了地址数据类别不平衡问题,提高了模型整体的评估效率。本发明应用胶囊网络,将数据信息以不同时间窗口进行重组构建,以不同时间窗口下的交易行为为角度挖掘异常地址特征信息,组成新的特征矩阵并转换成热图格式,通过胶囊网络在小样本条件下实现了对虚拟货币异常地址的检测。

附图说明

图1为本发明虚拟货币异常地址检测方法的整体流程框架图;

图2为本发明虚拟货币异常地址检测方法的交易信息检索、特征矩阵构建及热图转换流程图;

图3为本发明虚拟货币异常地址检测方法的胶囊网络检测虚拟货币异常地址流程图;

图4为本发明虚拟货币异常地址检测方法的胶囊网络迭代动态路由流程图。

具体实施方案

下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

本发明提出了一种基于胶囊网络的虚拟货币异常地址检测方法,首先利用数据挖掘的方式对区块链中虚拟货币地址参与的交易信息进行分析,获取该交易地址的特征数据;采用特征工程的方式对特征数据进行处理,经过构建特征矩阵、热图转换等工作后构建样本数据集,基于胶囊网络构建模型,输入训练集训练模型,完成一个对以太坊异常地址检测的方案,具体步骤如下:

步骤1:从以太坊平台爬取异常地址和正常地址及其交易数据,具体的:

步骤1.1:通过第三方平台获取公开的区块链虚拟货币异常地址,如黑客、旁氏骗局和诈骗勒索地址,随机从区块链虚拟货币平台选取部分正常地址;

步骤1.2:对异常地址和正常地址进行交易信息检索,得到基础数据集,基础数据集包含地址交易日期时间、交易虚拟货币数量、应用合约类别、交易手续费、交易所在区块号等。

步骤2:对所述类别地址数据进行数据预处理、样本类别不均衡处理、特征矩阵构建、热图转化,得到样本数据集,具体的:

步骤2.1:对上述基础数据集中的地址包含数据缺失百分比超过所定范围、地址包含数据数量不足的地址进行删除操作;

步骤2.2:对特征数据集进行数据预处理,筛除空值占比过高的特征数据;

步骤2.3:针对所述未知类比地址数据集中样本类别不均衡问题,使用边界合成少数类过采样技术(Borderline SMOTE)处理后获更新基础数据集,使异常地址数据量与正常地址数据量的比列达到1∶2。Borderline SMOTE采样过程是将少数类样本分为3类,分别为Safe、Danger和Noise,其中,Safe样本周围一半以上均为少数类样本;Danger样本周围一半以上均为多数类样本;Noise样本周围均为多数类样本。Borderline SMOTE仅对Danger的少数类样本过采样。过采样共含三个步骤:a.计算Danger样本集中的每一个样本fi(0<i<n)在Safe样本集中的K临近,组成fij;b.随机选出s(0<s<n)个最近邻并计算它们各自与该样本之间的全部属性的差值dij=fi-fij(j=1,2,...,s),然后乘以一个随机数rij(0<rij<1),生成少数类样本hij=fi+rij*dij;c.重复步骤b直至少数类样本数目满足要求。

步骤2.4:依据上述更新后的基础数据集,通过不同时间窗口构建特征矩阵,时间窗口范围为3天至数月,每一个地址拥有一个特征矩阵,构成特征矩阵集,其中特征属性包括:某段时间范围内的输出以太币总数量、某段时间范围内的输出以太币平均数量、某段时间范围内的交易手续费总数量、某段时间范围内应用合约总数量,某段时间范围内交易频率等,如表1所示;

步骤2.5:根据上述特征矩阵将其转换为32×32格式、大小小于10KB的热图,转换所得的全部热图构成样本数据集,如图2所示。

步骤3:基于胶囊网络构建训练模型,该模型包含普通卷积层、PrimaryCaps层、DigitCaps层。普通卷积层应用ReLU函数作为非线性激活函数,输入热图提取局部特征。将普通卷积层的输出作为PrimaryCaps层的输入,通过卷积得到多个基础特征胶囊。DigitCaps层采用全连接模式,通过迭代动态路由计算高级特征胶囊,如图3所示,具体的:

步骤3.1:普通卷积层采用步长为1、核大小为9×9的卷积核并应用ReLU函数作为非线性激活函数提取样本数据的局部特征;

步骤3.2:将上述步骤1的输出作为PrimaryCaps层的输入,通过卷积得到多个基础特征胶囊;

步骤3.3:如图4所示,所述DigitCaps层通过迭代动态路由算法计算特征胶囊,设置权重矩阵W

调用公式2计算通过动态路由得来的耦合系数c

调用公式3求得输出第j个胶囊的输出向量s

调用公式4的squash函数使得输出向量在保存向量方向的同时把输出向量的长度压缩在[0,1]的范围之间,代表其特征存在的概率:

调用公式5对b

步骤4:随机从以太坊平台另外选取部分虚拟货币地址,通过步骤2所述方法构建测试集,将测试集输入到步骤3所述训练完的胶囊网络中,得到分类结果。

基于上述的虚拟货币异常地址检测方法,本发明还公开一种装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,计算机程序被加载至处理器时实现上述基于胶囊网络的虚拟货币异常地址检测方法。

上述实施方式只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。

相关技术
  • 一种基于机器学习的终端接入数据异常检测方法及装置
  • 一种基于表观特征的异常着装检测方法以及装置
  • 一种基于时间相关基线的异常行为检测方法、装置及设备
  • 一种基于时空IP地址画像的网络流异常检测方法
  • 基于图神经网络的异常虚拟币钱包地址检测方法
技术分类

06120115922025