掌桥专利:专业的专利平台
掌桥专利
首页

基于图网络融合伪标签和后处理加密货币异常交易识别方法

文献发布时间:2024-04-18 19:58:26


基于图网络融合伪标签和后处理加密货币异常交易识别方法

技术领域

本发明利用融合了伪标签技术、后处理技术和图卷积神经网络(GCNs)的模型,实现预测。非法交易节点检测是维护金融系统的稳定运转的重要环节,利用深度学习技术检测属于金融安全领域,又属于大数据分析领域。

背景技术

随着区块链技术的迅速发展,精准高效的从大规模交易网络中识别非法交易节点网络安全十分重要。

由于区块链的去中心化和匿名化特点,提高了效率的同时也能保护隐私。还隐藏了许多非法行为:欺诈,网络钓鱼,庞氏骗局等。为了维护区块链的稳定运作,人们开始采取一定措施来预防非法行为,但是现有的区块链监管系统中采取的检测措施不能有效检测到非法行为,因此,非法行为变化多样,检测一直都是金融安全监管研究的重点。

集成学习通过局部特征和图结构结合训练得到了非常可观的结果,图神经网络则可以更加有效的捕获图结点之间的结构,并且能有效映射交易结点之间的信息关系。但是集成学习非法检测准确率相较于图神经网络还是不太尽如人意,而图神经网络往往需要更高性能的计算设备和更长的训练时间。在区块链交易数据与日俱增的情况下,只使用图神经网络很难完成大规模交易特征捕获。因此,人们必须探索图神经网络中消息传递框架的有效性,同时尝试用小容量的深度学习模型结合消息传递框架来达到性能优越,训练时间短的框架。半监督学习中伪标签生成技术是利用分类模型为没有标签的数据生成近似标签。使用这些近似标签结合真实标签的数据更新模型训练参数,这样不仅可以缓解区块链异常交易检测中样本分布不均衡的问题,也能精确原有模型的决策边界,提升模型的准确性和健壮性

本发明设计了一种基于图网络融合伪标签和后处理技术的加密货币异常交易识别方法,通过图卷积神经网络(GCNs)预测欺诈性交易行为节点,用伪标签技术和后处理技术进一步矫正欺诈性交易节点标签预测结果。

发明内容

本发明框架主体主要包括三个部分:1.真实标签预测模型.将加密货币交易数据集按时间切片划分成不同的子图,分别转换成对应的邻接矩阵和节点特征矩阵,并使用邻居信息,网络结构对节点进行特征编码;2.伪标签生成;在真实标签预测模型的基础上,对模型进行调优;利用图神经网络(GCNs)来学习节点嵌入,然后将运用数据分析技术对伪标签训练预测结果经行筛选,选取置信度较高的节点标签和节点特征对模型进行更新;模型的更新采用的损失函数策略是分类函数交叉熵损失和带权重参数的未标记数据交叉熵联合更新模型;3.后处理技术;将结合伪标签二次训练好的模型加载进来,对所有的节点进行基本预测,使用误差传播修正模型的预测,最后通过标签传播的原理对没有标记的标签平滑矫正;通过图卷积神经网络(GCNs)获得初步的加密货币交易节点嵌入结果,用伪标签技术减少对人工标签的依赖,提高加密货币交易数据的利用率,同时提升原有神经网络的性能;对加密货币交易节点嵌入误差矫正和最终交易节点标签平滑,提高异常交易检测的精度,保障加密货币交易网络的安全运转;

步骤一,真实标签预测模型的设计,包括以下步骤:

(1)划分加密货币交易子图;给定输入节点和交易关系的区块链交易网络,首先构建交易图G=(V,E),不同实体表示为V={v

(2)设计用于交易异常检测,两层图卷积神经网络GCNs交易节点预测函数:

其中

是交易节点和边关系生成的邻接矩阵A的标准化以后的结果,I是单位矩阵,度矩阵/>

(3)设计用于捕捉加密货币节点交易的结构信息,解决区块链交易网络边缘更新变化对模型性能干扰,用注意力机制的逐顶点更新的图注意力神经网络GAT:

X

其中A

步骤二,设计伪标签生成模型,包括以下步骤:

(1)设计用于标签预测模型预测方法的目标函数f

X

(2)使用交叉熵正则化来使用伪标签矫正预目标函数模型:

N

(3)α(t)最优化模型平衡系数函数设计:

T

步骤三,后处理技术:矫正和平滑(C&S)模型的设计,包括以下步骤:

(1)从伪标签训练结束的模型获得所有交易节点的预测结果和模型训练中的最优参数;利用交易图结构扩散矫正预测误差:

E

(2)从伪标签训练结束的模型获得所有交易节点的预测结果和模型训练中的最优参数;利用交易图结构扩散矫正预测误差:

ζ

本发明的创造性主要体现在:

(3)本发明聚焦大量未标记的交易数据,通过伪标签生成技术并结合数据分析未标记的交易数据,有效利用未标记的交易数据参与原有模型训练,减少对人工标签标记的依赖,提升模型的非法交易检测的性能;

(3)本发明将后处理技术引入区块链非法交易领域,对所有的交易数据预测误差矫正和标签平滑,进一步提升伪标签调优后的模型性能。特别是在多层感知机(MLP)上结合本发明所使用的方法可以用较少参数的模型和训练时间达到代表性图神经网络中基线模型的性能。

(3)本发明在不改变区块链样本分布的情况下,结合伪标签和后处理技术的各种基线模型具有更高的性能,在小样本交易数据下,本发明使用的方法准确率和精确率相比于基线模型也有较好的表现。通过交易节点可视化展现本发明所使用的方法,相比于单独使用基线模型具有类别之间更好的分离效果。

特别要注意:本发明只是为了描述方便,采用的是非法交易节点常见的三种基线模型的描述,同样该发明也可适用其他基线模型检测区块链异常交易,只要采用了本发明的原理进行区块链异常交易检测都应该属于本发明的范围。

附图说明

图1是本发明的模型框架图;

图2是本发明交易节点预测可视化;

图3是本发明小样本预测性能;

具体实施方式

本发明框架主体主要包括三个部分:1.真实标签预测模型.将加密货币交易数据集按时间切片划分成不同的子图,分别转换成对应的邻接矩阵和节点特征矩阵,并使用邻居信息,网络结构对节点进行特征编码;2.伪标签生成;在真实标签预测模型的基础上,对模型进行调优;利用图神经网络(GCNs)来学习节点嵌入,然后将运用数据分析技术对伪标签训练预测结果经行筛选,选取置信度较高的节点标签和节点特征对模型进行更新;模型的更新采用的损失函数策略是分类函数交叉熵损失和带权重参数的未标记数据交叉熵联合更新模型;3.后处理技术;将结合伪标签二次训练好的模型加载进来,对所有的节点进行基本预测,使用误差传播修正模型的预测,最后通过标签传播的原理对没有标记的标签平滑矫正;通过图卷积神经网络(GCNs)获得初步的加密货币交易节点嵌入结果,用伪标签技术减少对人工标签的依赖,提高加密货币交易数据的利用率,同时提升原有神经网络的性能;对加密货币交易节点嵌入误差矫正和最终交易节点标签平滑,提高异常交易检测的精度,保障加密货币交易网络的安全运转;

实验数据来自某区块链公司收集的区块链交易数据;实验样本经数据预处理划分成49个交易子图,将全部的49个交易子图分为两部分:其中前34个交易子图用作为训练样本,其余15个交易子图作为测试样本;

本发明采用了如下的技术方案及实现步骤:

1.真实标签预测模型的设计,包括以下步骤:

(1)划分加密货币交易子图;给定输入节点和交易关系的区块链交易网络,首先构建交易图G=(V,E),不同实体表示为V={v

(2)设计用于交易异常检测,两层图卷积神经网络GCNs交易节点预测函数:

其中

是交易节点和边关系生成的邻接矩阵A的标准化以后的结果,I是单位矩阵,度矩阵/>

(3)设计用于捕捉加密货币节点交易的结构信息,解决区块链交易网络边缘更新变化对模型性能干扰,用注意力机制的逐顶点更新的图注意力神经网络GAT:

X

其中A

步骤二,设计伪标签生成模型,包括以下步骤:

(1)设计用于标签预测模型预测方法的目标函数f

X

(2)使用交叉熵正则化来使用伪标签矫正预目标函数模型:

N

(3)α(t)最优化模型平衡系数函数设计:

T

步骤三,后处理技术:矫正和平滑(C&S)模型的设计,包括以下步骤:

(1)从伪标签训练结束的模型获得所有交易节点的预测结果和模型训练中的最优参数;利用交易图结构扩散矫正预测误差:

E

(2)从伪标签训练结束的模型获得所有交易节点的预测结果和模型训练中的最优参数;利用交易图结构扩散矫正预测误差:

ζ

相关技术
  • 一种基于资金交易网络的异常交易识别方法及系统
  • 一种基于联邦图神经网络技术的比特币异常交易识别方法
  • 一种基于加密货币交易网络节点分类的钓鱼地址识别方法
技术分类

06120116490989