导航：首页> 一般的物理或化学的方法或装置>一种基于区块链和演化博弈的数据共享激励方法

一种基于区块链和演化博弈的数据共享激励方法

文献发布时间：2024-01-17 01:26:37

技术领域

本发明属于数据共享激励机制技术领域，具体涉及一种基于区块链和演化博弈的数据共享激励方法。

背景技术

近年来，大量的研究者对MEC系统中的计算卸载，资源分配等方面进行了广泛地研究。由于新兴的智能优化算法，如强化学习(RL)和深度学习(DRL)等，使得MEC与智能算法的结合能够实现数据的实时处理，同时在动态环境中提供一些有效和智能的服务。此外，许多研究中提出云边协同的计算架构可以为MEC服务器提高计算能力和缓解计算负载。因此，许多研究提出在边缘计算中可结合云边协同和深度强化学习。集体强化学习(collectivereinforcement learning，CRL)算法和区块链(blockchain)的结合就是其中一种，集体强化学习通过在不同的智能体之间共享训练结果，提升传统机器学习的训练效率。但是，目前这种方法从实际实现的角度来看，各个智能体节点(MEC服务器)进行数据共享的意愿不强烈，因为相互缺乏信任并且缺少相应的激励机制和利益驱动。目前，区块链技术可以用来解决数据共享过程中的安全和可靠性问题。利用区块链的去中心化，数据的防篡改等特性可为解决此类问题提供了新的解决思路。

综上所述，亟需一种分布式场景下安全可靠的训练数据共享激励机制。

发明内容

针对现有技术存在的不足，本发明提出了一种基于区块链和演化博弈的数据共享激励方法，该方法包括：

S1：构建数据共享激励模型；

S2：根据数据共享激励模型计算用户采用不同策略的期望收益；

S3：根据用户采用不同策略的期望收益计算复制动态力学方程；

S4：根据复制动态力学方程求解演化稳态点并根据演化稳态点分析稳态条件，得到共享策略。

优选的，数据共享激励模型包括：多个参与数据共享的用户构成的集合P、所有用户构成的集合N，用户的策略空间S＝(s

优选的，计算用户采用不同策略的期望收益的过程包括：设置直接收益函数和协作收益函数；在用户与其他用户进行博弈下根据直接收益函数和协作收益函数计算用户选择参数共享的期望收益以及用户选择不参数共享的期望收益。

进一步的，所述直接收益函数和协作收益函数分别为：

Z＝μln(1+R)

Y＝kμln(1+R)

其中，Z表示直接收益，Y表示协作收益，k表示协作收益系数，μ表示缩放系数，R表示直接收益参数。

进一步的，用户选择参数共享的期望收益和用户选择不参数共享的期望收益分别为：

u(s

其中，u(s

优选的，复制动态力学方程表示为：

F(x)＝x(1-x)·[u(s

其中，x表示用户选择参与数据共享的概率，u(s

优选的，所述演化稳态点包括第一演化稳态点、第二演化稳态点和第三演化稳态点；三个演化稳态点分别为：x

优选的，所述共享激励方案为：判断参与数据共享的初始用户比例是否小于第三演化稳态点，若小于，则增加共享激励I

本发明的有益效果为：本发明通过区块链的智能合约技术采用演化博弈的激励方法保证了数据的安全性；本发明激励节点共享训练结果，这有利于分布式强化学习加快智能算法模型的收敛，减少单个智能节点的计算资源浪费，实现数据价值和资源利用最大化；本发明的演化博弈激励方法可在实现用户参与率的提高的同时保证数据共享的稳定性。

附图说明

图1为本发明中基于区块链和演化博弈的数据共享激励方法流程图；

图2为本发明中多MEC服务器的云边协同分布式场景模型图；

图3为本发明中数据共享激励模型的演化稳定策略趋势图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提出了一种基于区块链和演化博弈的数据共享激励方法，如图1所示，所述方法包括以下内容：

S1：构建数据共享激励模型。

如图2所示，本发明适用于多MEC服务器的云边协同分布式场景，本发明使用演化博弈算法建立激励机制，依托区块链技术封装博弈模型，使能智能体集群在区块链网络中分享自身训练数据，同时区块链网络的去中心化特点也保障了分享数据的隐私。

在多MEC服务器环境场景下，构建数据共享激励模型，该模型可表示为一个四元数组G＝(P,N,S,U)；P表示多个参与数据共享的用户构成的集合P，N表示所有用户构成的集合，S＝(s

对该模型存在的相关参数进行说明：

(1)演化博弈的两个参与方属于同一主体，即数据共享社区的用户。这些用户具有相同的策略空间S＝(s

(2)用户在数据共享阶段，用户节点需要花费一定的数据共享成本，记为τ，其与区块链共识阶段所消耗的CPU周期数有关。

(3)假定在博弈的初级阶段，所有用户节点所组成的集合N中，每个用户选择参与数据共享策略的概率为x；因此，用户选择不参与数据共享的概率是1-x；可等效为选择共享策略的人数比率为x(t)，则有选择不共享的用户比率为1-x(t)，后面描述x(t)简写为x；其中x是时间t的函数，x∈[0,1]。

(4)激励机制的目标是鼓励更多用户参与数据共享；在数据共享社区中，为了鼓励用户分享数据，数据共享区块链平台可以为所有用户提供一定的外部激励奖励即每个节点用户参与共享自身的训练数据可以得到区块链系统的奖励，记为I。

(5)用户节点上传数据会给它们带来收益。在博弈过程中，相关数据提供者通过计算收益和成本来决定是否参与数据共享。用户的收益可分为两类：直接收益Z和协作收益Y。

在本发明的模型建立过程中，参与主体均被认为是有限理性的，这意味着它们无法在博弈开始阶段直接达到纳什均衡状态。因此，需要使用一个演化模拟学习他人策略的过程，进行动态地调节和反复尝试，以实现最终的最优平衡，从而最大化整体利益。用户的收益策略是两个用户在双方博弈中形成的，博弈过程符合“一般二人对称博弈”，即群体中成员进行随机配对重复博弈。博弈下用户的收益策略如下：

1)情况1：用户A、B双方都参与数据共享。所有成员均共享了数据，博弈双方不仅具有原本的收益，还会从中得到数据共享带来的共享收益，即总的收益为协作收益Y；

2)情况2：用户A和B都不参与数据共享，此时，数据共享社区所面临的场景即为没有人愿意共享数据，所以主体双方只能获得原本的直接收益Z；

3)情况3：用户A和B之间只有一个选择参与数据共享。选择参与该策略的用户加入数据共享区块链平台，共享自己的数据，但无法从其他用户获取数据，在没有额外共享收益的情况下将产生额外成本。非参与用户不支付任何费用，也不获得任何利益。

S2：根据数据共享激励模型计算用户采用不同策略的期望收益。

设置直接收益函数和协作收益函数；具体的：

直接收益是指数据提供者原本就可以获得的收益。对于第i个节点而言，它的直接收益仅代表自己节点上经过训练得到的训练参数；直接收益函数表示为：

Z＝μln(1+R)

其中，Z表示直接收益；μ表示缩放系数，可以是一个合适的固定值；R表示直接收益参数。

协作收益指当参与决策的节点i和j都选择参与数据共享时，每个节点可以共享数据，也可以接收其他节点共享的数据，帮助增加收益；协作收益函数表示为：

Y＝kμln(1+R)

其中，Y表示协作收益，k表示协作收益系数。根据实际情况的合理性分析，协作的收益系数k>1，否则节点将没有动机进行共享。

本发明采用对数收益函数ln(以e为底数的对数函数)来计算收益，该函数特征符合现实社会经济学特征，即收益是有一定增长抑制的。

用户采用不同共享策略对应的收益用收益矩阵表示如下：

其中，I

在用户与其他用户进行博弈下根据直接收益函数和协作收益函数计算用户选择参数共享的期望收益以及用户选择不参数共享的期望收益，具体的：

如果用户A想要获得更多利益就必须参与。那么，A的收益是x[kμln(1+R)+I

u(s

用户选择不参数共享的期望收益表示为：

u(s

其中，u(s

S3：根据用户采用不同策略的期望收益计算复制动态力学方程。

数据共享的平均期望收益为：

复制动态方程实际上是描述一个特定策略在一个种群中被采用的频率的微分方程。如果参与策略的结果优于平均水平，那么选择该策略的那些群体在整个群体中的比例就会增加。复制动态方程表示如下：

S4：根据复制动态力学方程求解演化稳态点并根据演化稳态点分析稳态条件，得到共享策略。

利用局部稳定性分析方法对模型的稳定性进行分析，具体的：

根据复制动态方程的稳定性定理，通过将均衡点x带入复制动态方程中，可以判断分析用户的稳定策略。设F(x)＝0，则可以得到用户复制动态方程F(x)的三个稳定状态：第一演化稳态点x

在基于博弈演化稳定策略(ESS)和稳定性定理的分析中，当动态系统中存在小扰动时，稳态应该是稳定的。因此如果一个点为稳定状态，它应该满足F′(x)＜0即F′(x)＝(1-2x)[x(k-1)μln(1+R)+I

如图3所示，从以下情况分析ESS：

1)情况一：(τ-I

2)情况二：0<(τ-I

3)情况三：(τ-I

以上内容分析了数据共享的演进和稳定趋势。用户对策略的选择会影响进化稳定性。ESS取决于从用户数据共享中获得的收益和系统初始状态中涉及的用户比例。参与者的总收益与参与成本τ、直接收益参数R和动态激励收益I有关，在用户可以分配固定收益的情况下，动态激励收益是提高系统用户参与比例的关键因素。

基于上述稳定性分析，当参与数据共享的初始用户比例

因此，为了鼓励用户参与数据共享，可以使用以下共享激励方案：

当参与数据共享的初始用户比例小于阈值x

以上所举实施例，对本发明的目的、技术方案和优点进行了进一步的详细说明，所应理解的是，以上所举实施例仅为本发明的优选实施方式而已，并不用以限制本发明，凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载