掌桥专利:专业的专利平台
掌桥专利
首页

面向物联网隐私保护的聚合验证方法

文献发布时间:2023-06-19 19:30:30


面向物联网隐私保护的聚合验证方法

技术领域

本发明属于物联网数据隐私保护技术领域,具体涉及一种面向物联网隐私保护的聚合验证方法。

背景技术

物联网技术利用多种传感器设备按照协议将各类物品与互联网相连接,进行信息交换和通信,以实现万物互联,其本质上是一种集成了多种现代信息技术和物理基础设施的微型计算机控制系统,传统的物联网系统架构主要由物联网终端、网关和服务器三部分构成,物联网终端负责收集并上报物联网数据、网关负责转发数据,服务器负责数据存储和数据分析,随着物联网技术的发展和生活需求的不断增加,各类物联网应用及物联网终端不断增加,海量的物联网数据产生并需要存储于服务器中,传统的数据库技术虽然能完成数据的分类存储,但无法满足日益增长的数据隐私性需求及出现的安全性问题。

联邦学习的提出,为数据的隐私性保护提出了一种新思路,联邦学习作为一种新兴分布式机器学习技术,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私的前提下,在多参与方或多计算结点之间开展高效率的机器学习,联邦学习的学习框架如下:

在确定训练各参与方后,联邦学习首先在服务器中部署一全局模型,并在各参与方中部署相同的机器学习模型使其构建一个独特的训练小组,使得各参与方能够协作训练机器学习模型,同时将数据保持在本地;

在每一轮训练中,部署全局模型的服务器将全局模型参数共享给每个参与者,每个参与者基于其本地数据集训练本地模型,并将训练后的本地模型参数发送回服务器;

服务器根据训练组中预先设定好的聚合规则对所有接收到的本地模型进行聚合。

根据多参与方之间数据分布的不同,把联邦学习分为三类:横向联邦学习、纵向联邦学习和联邦迁移学习,横向联邦学习适用于联邦学习的参与方的数据特征有重叠,而数据样本空间不同,横向联邦学习中数据特征重叠维度较多,根据重合维度进行对齐,取出参与方数据中特征相同而用户不完全相同的部分进行联合训练,纵向联邦学习适用于联邦学习参与方的训练数据有重叠的数据样本,但是数据特征不相同,联邦迁移学习适用于参与方的数据样本和数据特征重叠都很少的情况。

同时,随着比特币的提出及发展,作为其底层支撑的区块链技术被视为重要的物联网数据安全解决方案之一,区块链技术作为一种分布式数据存储方案,其去中心化和不可篡改的特点与物联网系统的数据存储需求基本吻合,区块链技术的基础数据结构是一系列被称为“区块”的数据记录通过密码学的方式链接起来形成的账本,其中每一个“区块”包含了上一个“区块”的部分信息,区块链技术通过在各设备上部署区块链节点构成区块链网络,区块链网络内的各节点共同维护区块链账本,保持节点间的数据一致性。

近年来,随着联邦学习的发展,将联邦学习应用到物联网系统,已成为了保护物联网系统数据隐私性的重要方法之一,在现有的研究中,本地模型和全局模型通常分别部署在物联网终端和服务器上,使各物联网终端构成一个联邦学习训练组,然而,部署联邦学习模型给物联网系统带来了较大的计算负担,按照联邦学习的算法流程,训练组中的所有参与者参与联邦学习模型的聚合,在物联网系统中普遍存在大量物联网终端,全部参与模型聚合会给服务器带来很大的负荷,影响物联网系统的系统效率,甚至影响系统的正常运行,目前将物联网系统与区块链技术相结合的目的是保证物联网数据的安全性同时提供数据可追溯性,现有研究的普遍做法是将区块链节点部署于物联网服务器中,由各服务器构成区块链网络,这种方案虽然能保证物联网数据的安全存储,但会进一步加剧服务器的负载压力,并对部分时延敏感类物联网应用产生不良影响,同时,将物联网数据集中上链存储不能满足部分用户的数据隐私存储需求。

在传统的联邦学习算法流程中,本地模型首先根据本地数据集进行训练,并将本地模型参数上传至全局模型进行模型聚合,为了缓解执行聚合任务对部署全局模型的物联网模块的负载,现有面向物联网的联邦学习研究中,研究者结合了边缘计算的概念,并采用一种分层聚合的方式实现联邦学习模型聚合,即在进行联邦学习模型聚合时由基站和服务器分别执行两次模型聚合。

采用分层聚合的目的是充分利用物联网系统中边缘层模块,例如基站的计算资源,承担了部分聚合任务,但同时,随着系统中物联网终端的增加,作为边缘服务器的基站承担的负载压力也随之增加,基站的受限硬件资源可能成为限制系统效率的因素之一,除了采用分层聚合分散聚合任务外,部分研究在系统中设计节点选取机制,选择部分物联网终端参与模型聚合以减少执行模型聚合任务所需完成的计算量,从而提高联邦学习效率并缓解服务器负载压力,现有研究中的选取方法主要是基于终端具备的资源或终端上报的本地模型参数性能。

例如,一种现有技术公开了一种基于区块链的联邦学习参与节点选择方法,该联邦学习参与节点选择方法用于包括终端设备和基站的物联网系统,该联邦学习参与节点选择方法包括:获取每个终端设备与基站、其它终端设备之间在预设时间内的交互次数和距离,根据预设截断距离、数据交互次数、终端设备与其它终端设备的距离确定每个终端设备的活跃度密度,根据活跃度密度的大小以选择目标终端设备,计算终端设备到目标终端设备的偏移距离,根据活跃度密度和偏移距离确定终端设备的聚类中心点,通过聚类中心点的终端设备传输对应聚类模型物联网第二终端设备的数据至基站,该方法通过上述步骤减少了进行模型聚合时在物联网系统中模型参数的传输时间,减少联邦学习的整体时延。

再如,另一种现有技术公开一种基于声誉的物联网边云协同联邦学习节点选择方法,该方法包括:构建基于声誉的物联网边云协同联邦学习体系架构,根据构建的基于声誉的物联网边云协同联邦学习体系架构采用基于多权重主观逻辑模型的声誉评分方法对参与联邦学习模型聚合的节点进行选取,得到最优的节点组合;该发明利用多权重主观逻辑模型来计算每个参与节点的声誉值,目的是提高联邦学习的准确率和训练速度。

但是,上述现有技术在实际的使用过程中存在着如下技术问题:

当基站的覆盖范围内存在超出其处理能力的物联网终端时,基站执行模型聚合任务会造成较大的时延并对系统的正常运行产生影响;

在现有节点选取方法中,普遍由基站或服务器收集部署了本地模型的物联网终端的终端信息或模型信息以进行节点选取,被恶意攻击者劫持的物联网终端可能会提交虚构的相关信息以被选为聚合节点,从而通过上述方式影响模型聚合。因此,基于节点信息的节点选择方法存在着安全性问题。

基于现有技术存在的上述技术问题,本发明提出一种面向物联网隐私保护的聚合验证方法。

发明内容

本发明的目的是针对现有技术的不足,提供一种面向物联网隐私保护的聚合验证方法,包括:

步骤1,构建物联网系统,物联网系统包括服务器、基站、物联网终端,其中,物联网终端包括物联网第一终端、物联网第二终端和物联网第三终端,物联网第三终端用于收集物联网数据并上报至距离其最近的物联网第二终端,物联网第二终端用于部署联邦学习本地模型,收集物联网第三终端上报的数据并训练本地模型,物联网第一终端用于部署分簇模型,收集物联网第二终端的本地模型参数并执行模型聚合,服务器用于部署全局模型执行全局模型聚合,构建由物联网第一终端和基站构成的边缘区块链网络用于实现物联网系统中信息的可信存证,边缘区块链网络采用RAFT+[4]作为共识机制;

步骤2,将物联网终端分簇,每个分簇中包含一个物联网第一终端、若干个物联网第二终端和若干个物联网第三终端,每个分簇的物联网第一终端和物联网第二终端共同维护一个本地区块链网络,本地区块链网络内的物联网第二终端执行模型性能的相互验证并存储验证结果,本地区块链网络采用RAFT+[4]作为共识机制,基站在边缘区块链网络内的物联网第一终端中选择一个Leader节点,被选中的Leader节点打包数据区块并主导区块共识,其余的物联网第一终端是Follower节点,参与区块共识;

步骤3,对恶意节点进行建模用于影响物联网系统的安全性和效率;

步骤4,物联网第三终端根据设定的采集间隔收集物联网数据并上报至距离其最近的物联网第二终端,物联网第二终端将收集到的数据加入其本地数据集并进行本地模型训练,物联网第二终端将本地模型参数上传至物联网第一终端参与模型聚合,由物联网第一终端、基站和服务器分别执行模型聚合后,全局模型参数将被同步至物联网系统中全部的联邦学习模型上,一方面通过模型参数的逐层传递避免了具体数据的上传,保护了数据隐私;另一方面,通过分层聚合及选取节点参与聚合的方式缓解了模型聚合给服务器带来的负载压力,通过验证保障了聚合的安全性。

进一步地,步骤4包括:

步骤4.1,在每轮训练开始时,物联网第三终端根据基于模型性能的聚合节点选取机制选取参与此次模型聚合的Leader节点和聚合节点,物联网第三终端根据其预设类型收集物联网感知数据并上报至距离其最近的物联网第二终端,物联网第二终端收集由物联网第三终端上报的物联网数据并将其加入本地数据集,物联网第二终端根据预设时刻训练部署在物联网第二终端上的本地模型;

步骤4.2,物联网第二终端本地训练结束后,本地模型参数被上传到分簇内的物联网第一终端,物联网第二终端在收集了分簇内所有物联网第二终端的本地模型参数后执行分簇模型聚合,物联网第一终端i收集本地模型参数和执行分簇模型聚合的时延用

步骤4.3,物联网第一终端为分簇内的每个物联网第二终端分配验证节点并生成簇内验证任务,并将验证任务打包生成验证区块在本地区块链网络内进行广播,由分簇内的物联网第二终端进行相互验证;

步骤4.4,由基站通过聚合节点选取机制被选为聚合节点的物联网第一终端上报其分簇模型参数参与边缘模型聚合,未被选为聚合节点的物联网第一终端将在此次模型聚合中作为聚合验证方法中的验证节点,基站收集到所有聚合节点上报的分簇模型参数后执行边缘模型聚合,基站收集聚合节点模型参数、执行边缘模型聚合表示为

步骤4.5,基站根据聚合节点集合生成验证任务,验证任务将被打包生成验证任务区块,验证任务区块生成后被同步至边缘区块链网络内的各物联网第一终端,此次边缘聚合中作为验证节点的物联网第一终端执行验证任务区块中为其分配的验证任务,并将验证结果包含在响应中发送至Leader节点,当Leader节点收集到的验证结果满足基于区块链的模型性能验证机制的要求后,验证过程完成,Leader节点根据性能验证机制计算各聚合节点的模型准确度,验证时延表示为

步骤4.6,Leader节点将各模型准确度与验证结果以交易的形式打包生成验证结果区块并在边缘区块链网络内进行区块共识,各物联网第一终端检查各聚合节点模型准确度及验证任务与验证结果的对应关系,并发送确认响应至Leader节点,验证结果区块生成时延与共识时延分别表示为

步骤4.7,服务器执行全局模型聚合并将全局模型参数依次同步至边缘模型、分簇模型和本地模型,时延表示为

步骤4.8,面向物联网隐私保护的聚合验证方法中完成一轮联邦学习模型训练所需的总时延表示为:

重复执行步骤4.1-4.7直至联邦学习全局模型收敛。

进一步地,步骤4中还包括对物联网终端进行分簇的步骤:

根据物联网系统中基站覆盖范围内物联网第一终端的数量确定分簇的数量,并以物联网第一终端为分簇簇头建立N

各物联网第二终端根据物联网第二终端与各簇头的距离确认加入的分簇,为了平衡分簇间的计算任务,各分簇内的物联网第二终端数量满足

当各物联网第二终端确认物联网第二终端加入的分簇后,物联网第三终端根据物联网第三终端与各物联网第二终端的距离确认物联网第三终端上报数据的目标,以确认物联网第三终端加入的分簇间,各物联网第三终端确认物联网第三终端加入的分簇后,终端分簇完成。

进一步地,步骤4中还包括联邦学习分层聚合的步骤:

在物联网终端分簇完成后,系统中的服务器、基站、物联网第一终端和物联网第二终端通过部署的全局模型、边缘模型、分簇模型和本地模型以参与分层模型聚合,从而实现系统中物联网模块的负载平衡,在分层聚合中,分别通过全局模型、边缘模型、分簇模型执行三次模型聚合以分散模型聚合任务。

进一步地,步骤4中还包括模型性能的聚合节点选取的步骤:

步骤421,在节点选取开始时,基站收集各物联网第一终端参与聚合的次数、物联网第一终端的计算资源和系统通信环境信息,参与聚合次数最多的节点成为新的Leader,在聚合节点选取过程中,确定参与模型聚合的物联网第一终端数量并根据模型准确度对参与上次模型聚合的物联网第一终端进行排序,前50%的物联网第一终端继续参与模型聚合,并加入聚合节点集合W,其余参与上次模型聚合的物联网第一终端作为此次模型聚合的验证节点,参加此次模型聚合的物联网第一终端数量是根据

步骤422,为了建立马尔科夫决策模型并求解优化问题,需要首先对系统状态进行定义,状态S∈S由基站覆盖范围内的各物联网第一终端状态构成,定义如下:

S=(ξ,ρ,μ,η),

其中,ξ表示在网络中Leader的索引;

ρ=(ρ

ρ

步骤423,为了模拟系统的运行,在建立系统状态后,采取相应的动作模拟节点选取并进行模型聚合,以选取得到的聚合节点集合作为系统动作;通过一个行动列表来建立具体动作和动作索引之间的映射关系,所选择的动作

其中,a

步骤424,在建立状态和动作后,确定在状态下采用动作后的状态转移情况,用状态-动作二元组(S,A)的函数描述模型在当前状态S下执行动作A后,转移至新状态S′的过程;系统状态μ在周期τ+1的更新是基于信噪比值,表示为:

设在周期τ的动作是A

/>

基于在每个周期的聚合节点集合W,在周期τ+1的ρ

随着系统的运行,按照步骤424进行状态转移直至系统到达其预设的运行周期;

步骤425,为了评估在系统状态下采取系统动作给系统整体带来的收益,建立系统收益函数R,收益R(S,A)是一个关于状态S和动作A的实值函数,反映当前A的优劣,收益的定义与优化目标一致,被定义为在周期τ内得到的全局模型准确率与完成一轮联邦学习模型训练所需时延倒数的乘积,完成一轮训练所需时延越短且全局模型准确率越高表示策略越优,奖励功能定义如下:

步骤426,在得到完整的马尔科夫决策过程模型后,需要基于DDPG算法进行求解,从而得到最优的聚合节点选取策略;求解MDP问题是找一个最优策略π来最大化长期累积收益平均值的期望

θ

行为者网络的

其中,y=R+γQ′,γ是折扣系数。

进一步地,步骤4.3包括:

步骤4.31,分配验证任务,簇内物联网第一终端收集各本地模型的参数以执行簇内模型聚合,并生成模型验证任务,为每个物联网第二终端分配N

步骤4.32,执行验证任务,物联网第二终端执行区块中的验证任务,根据本地数据集来评估分簇内其余物联网第二终端的模型准确度作为验证结果,在完成验证后,物联网第二终端将验证结果发送至分簇中的物联网第一终端;

步骤4.33,计算模型准确度,模型准确度长期低于一定数值(为经验值)的物联网第二终端将被视为恶意节点,物联网第一终端在计算模型准确度时选择部分验证结果进行均值计算,以抵消恶意节点的负面影响并同时考虑准确率长期变化的情况,在收到分簇内所有物联网第二终端发送的验证结果后,物联网第一终端计算每个物联网第一终端的模型准确度,各验证结果和计算得到的各本地模型准确度将被物联网第一终端打包生成新区块,新区块将在区块链网络中广播。

进一步地,步骤4.5包括:

步骤4.51,在分配验证任务阶段,基站为每个聚合节点分配N

步骤4.52,执行验证结果,在执行验证任务阶段,边缘区块链网络内各节点收到区块m后,将本地数据集作为验证数据集并执行区块中包含的验证任务;

步骤4.53,收集验证结果阶段,在收集验证结果阶段,Leader从为每个聚集节点分配的N

步骤4.54,计算模型准确度,在计算模型准确度阶段,Leader根据所选的验证结果计算每个聚合节点的模型准确度,经计算得到的模型准确度将被提供给基于模型性能的聚合节点选取机制用于聚合节点选取,当计算完所有聚合节点的模型准确度后,Leader将验证结果和计算得到的模型准确度打包生成区块n,并将区块在区块链网络中广播,以达成区块共识。

本发明的有益效果是:

1、本发明所述面向物联网隐私保护的聚合验证方法,能够在保障聚合公平性的前提下,维持联邦学习算法效率,并提升结合联邦学习的物联网系统效率。

2、本发明所述面向物联网隐私保护的聚合验证方法,在物联网系统中结合联邦学习,在数据传输时通过模型参数的上传替代具体物联网数据的上传,从而保护了物联网的数据隐私性,在各类物联网模块中根据模块性能部署不同等级的联邦学习模型以维持系统中各类物联网模块的稳定运行。

3、本发明所述面向物联网隐私保护的聚合验证方法,对物联网终端进行分簇,并采用了基于物联网终端分簇的分层聚合机制进行模型聚合,采用终端分簇的方式能够有效分散联邦学习模型聚合任务,在此基础上进行分层聚合能够充分利用物联网系统中各类模块的空闲资源,以缓解服务器的负载压力,维持系统的运行效率。

4、本发明所述面向物联网隐私保护的聚合验证方法,基于模型性能的聚合节点选取机制,该机制根据物联网终端性能、系统通信环境、模型准确度等信息选取部分物联网终端参与模型聚合,通过深度强化学习方法得到最优节点选取策略以减少执行模型聚合任务所需的计算量并提升模型聚合效率,从而提升结合联邦学习后物联网系统的运行效率。

5、本发明所述面向物联网隐私保护的聚合验证方法,基于区块链的模型性能验证机制,该机制为聚合节点选取提供了公平性证明,性能验证机制基于区块链网络实现了验证任务的同步及验证结果的收集,从而实现了物联网终端间的模型性能相互验证和验证过程的可信存证,并为聚合节点选取提供了经验证得到的模型信息。

附图说明

图1为本发明实施例中面向物联网隐私保护的聚合验证方法的流程示意图;

图2为本发明实施例中物联网终端分簇的分层聚合的示意图;

图3为本发明实施例中簇间验证结果选取过程的示意图;

图4为本发明实施例中不同聚合方案下联邦学习模型收敛情况的对比示意图;

图5为本发明实施例中不同聚合方案下联邦学习模型准确度的对比示意图;

图6为本发明实施例中不同方案下联邦学习训练总时延的对比示意图;

图7为本发明实施例中性能验证机制下联邦学习训练总时延的对比示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述,需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

实施例

本发明旨在解决现有物联网系统中存在的隐私性问题,及后续出现的系统效率和公平性问题,为此,在本实施例中设计了一种面向物联网系统特点联邦学习聚合验证方法,所述方法通过在物联网系统中使用联邦学习来保障物联网数据的隐私性,所述方法通过采用分层聚合机制分散模型聚合任务以缓解部署全局模型的物联网模块的负载压力,为了进一步缓解边缘物联网模块执行模型聚合造成的负载,所述方法基于通信环境和本地模型参数质量等信息选取节点参与模型聚合,并通过深度强化学习算法得到最优的节点选取策略,为了实现公平的聚合节点选取,所述方法在不引入第三方的前提下由物联网终端构成区块链网络以实现本地模型参数的相互验证,同时将验证结果存储于网络内的区块链账本中,以提供验证的可追溯性,从而解决隐私性问题、系统效率问题和公平性等问题。

如图1所示,所述方法,应用该聚合验证方法的基础是建立一个使用联邦学习的物联网系统,根据各类物联网模块特点部署对应的联邦学习模型,并在系统运行时结合联邦学习算法通过模型参数的上传避免具体物联网数据的公开传输与存储,本实施例中提出的聚合验证方法包括三个机制:基于物联网终端分簇的分层聚合机制、基于模型性能的聚合节点选取机制和基于区块链的模型性能验证机制,其中:

基于物联网终端分簇的分层聚合机制和基于模型性能的聚合节点选取机制旨在通过不同方法解决使用联邦学习后的物联网系统效率问题,分层聚合机制旨在分散模型任务以缓解服务器的负载压力,具体做法是利用各物联网终端的可用计算资源执行部分模型聚合任务;

聚合节点选取机制旨在通过减少参与模型聚合的节点数量以减少模型聚合任务总量,该机制通过深度强化学习方法得到最优的聚合节点选取策略在保证联邦学习聚合效率的前提下减少系统时延;

为了保障节点选取机制中的安全性,基于区块链的模型性能验证机制实现了节点间模型性能的相互验证并提供了可信选取凭证,具体的,所述方法包括:构建应用聚合验证方法的物联网系统;物联网隐私保护的聚合验证;物联网终端分簇的分层聚合;模型性能的聚合节点选取;区块链的模型性能验证。

构建应用聚合验证方法的物联网系统包括:

步骤1,物联网系统结构构建,在使用本实施例的物联网系统中,包括服务器、基站、物联网终端等三类节点,上述节点沿用了传统物联网系统的模块任务分工,物联网终端根据其性能被分为物联网第一终端、物联网第二终端和物联网第三终端,物联网第三终端收集物联网数据并上报至距离其最近的物联网第二终端;物联网第二终端部署联邦学习本地模型,收集物联网第三终端上报的数据并训练本地模型;物联网第一终端部署分簇模型,收集物联网第二终端的本地模型参数并执行模型聚合,物联网第一终端编号以i表示,i∈{1,2,...,N

步骤2,将物联网终端分簇,在步骤1所建立的物联网系统中,物联网终端被分为多个分簇,每个分簇中包含一个物联网第一终端、若干个物联网第二终端和物联网第三终端,包含物联网第一终端i的集群用C

步骤3,对恶意节点进行建模,在物联网系统中,恶意攻击者通过劫持物联网终端进行数据中毒攻击,以影响系统的安全性和效率,被劫持的物联网终端被视为恶意节点,通过以下方式影响模型聚合:

被劫持的物联网第二终端提供未经训练的本地模型参数以影响初始模型聚合;

被劫持的物联网第一终端上报伪造的模型信息以被基站选为聚合节点,并提供未经训练的模型参数以影响模型聚合,同时,被劫持的物联网第一终端提供不正确的验证结果,误导聚合节点的选择;

步骤4,模型参数的传输及模型训练,在按上述步骤建立物联网系统后,物联网第三终端根据设定的采集间隔收集物联网数据并上报至距离其最近的物联网第二终端,物联网第二终端将收集到的数据加入其本地数据集并进行本地模型训练,物联网第二终端将本地模型参数上传至物联网第一终端参与模型聚合,由物联网第一终端、基站和服务器分别执行模型聚合后,全局模型参数将被同步至系统中全部的联邦学习模型上;

如图2所示,聚合验证方法参照联邦学习算法基础结构,与物联网系统的实际运行流程相结合,基于物联网系统特点,本实施例设计了三个机制:基于物联网终端分簇的分层聚合机制、基于模型性能的聚合节点选取机制和基于区块链的模型性能验证机制,建立马尔科夫模型的过程包括建立状态、建立动作、建立状态转移函数和建立收益函数,物联网隐私保护的聚合验证具体包括:

步骤4.1,在每轮训练开始时,基站根据基于模型性能的聚合节点选取机制选取参与此次模型聚合的Leader节点和聚合节点,物联网第三终端根据其预设类型收集物联网感知数据并上报至距离其最近的物联网第二终端,物联网第二终端收集由物联网第三终端上报的物联网数据并将其加入本地数据集,物联网第二终端根据预设时刻训练部署在物联网第二终端上的本地模型;

步骤4.2,物联网第二终端本地训练结束后,本地模型参数被上传到分簇内的物联网第一终端,物联网第一终端在收集了分簇内所有物联网第二终端的本地模型参数后执行分簇模型聚合,物联网第一终端i收集本地模型参数和执行分簇模型聚合的时延用

步骤4.3,物联网第一终端为分簇内的每个物联网第二终端分配验证节点并生成簇内验证任务,并将验证任务打包生成验证区块在本地区块链网络内进行广播,由分簇内的物联网第二终端进行相互验证;

步骤4.4,由基站通过聚合节点选取机制被选为聚合节点的物联网第一终端上报其分簇模型参数参与边缘模型聚合,未被选为聚合节点的物联网第一终端将在此次模型聚合中作为聚合验证方法中的验证节点,基站收集到所有聚合节点上报的分簇模型参数后执行边缘模型聚合,基站收集聚合节点模型参数、执行边缘模型聚合的时延表示为

步骤4.5,基站根据聚合节点集合生成验证任务,验证任务将被打包生成验证任务区块,验证任务区块生成后将被同步至边缘区块链网络内的各物联网第一终端,此次边缘聚合中作为验证节点的物联网第一终端将执行验证任务区块中为其分配的验证任务,并将验证结果包含在响应中发送至Leader节点,当Leader节点收集到的验证结果满足基于区块链的模型性能验证机制的要求后,验证过程完成,Leader节点根据性能验证机制计算各聚合节点的模型准确度,验证时延表示为

步骤4.6,Leader节点将各模型准确度与验证结果以交易的形式打包生成验证结果区块并在边缘区块链网络内进行区块共识,各物联网第一终端检查各聚合节点模型准确度及验证任务与验证结果的对应关系,并发送确认响应至Leader节点,验证结果区块生成时延与共识时延分别表示为

步骤4.7,服务器执行全局模型聚合并将全局模型参数依次同步至边缘模型、分簇模型和本地模型,时延表示为

综上所述,在本实施例提出的面向物联网隐私保护的聚合验证方法中完成一轮联邦学习模型训练所需的总时延表示为:

步骤4.1到步骤4.7将被重复进行直至联邦学习全局模型收敛。

物联网终端分簇的分层聚合具体包括:

步骤A1,在建立物联网系统后对物联网终端进行分簇,首先根据系统中基站覆盖范围内物联网第一终端的数量确定分簇的数量,并以物联网第一终端为分簇簇头建立N

步骤A2,联邦学习分层聚合,在物联网终端分簇完成后,系统中的服务器、基站、物联网第一终端和物联网第二终端通过部署的全局模型、边缘模型、分簇模型和本地模型以参与分层模型聚合,从而实现系统中物联网模块的负载平衡,在分层聚合机制中,分别需要通过全局模型、边缘模型、分簇模型执行三次模型聚合以分散模型聚合任务,物联网第一终端、基站、服务器执行模型聚合分别对应聚合验证方法的步骤4.2、4.4、4.7,本实施例中包含的基于物联网终端分簇的分层聚合机制如图2所示。

模型性能的聚合节点选取具体包括:

步骤B1,基于模型性能的聚合节点选取机制可分为两部分,即Leader选取和聚合节点选取,其中Leader选取参考RAFT+[4],在节点选取开始时,基站收集各物联网第一终端参与聚合的次数、物联网第一终端的计算资源和系统通信环境信息,其中参与聚合次数最多的节点成为新的Leader,在聚合节点选取过程中,首先确定参与模型聚合的物联网第一终端数量并根据模型准确度对参与上次模型聚合的物联网第一终端进行排序,前50%的物联网第一终端继续参与模型聚合,并加入聚合节点集合W,其余参与上次模型聚合的物联网第一终端作为此次模型聚合的验证节点,参加此次模型聚合的物联网第一终端数量是根据

步骤B2,各物联网第一终端的分布状态,状态S∈S由基站覆盖范围内的各物联网第一终端状态构成,定义如下:

S=(ξ,ρ,μ,η),

其中,ξ表示在网络中Leader的索引;

ρ=(ρ

ρ

μ=(μ

μ

步骤B3,聚合节点集合选取动作,为了简化具体决策,通过一个行动列表来建立具体动作和动作索引之间的映射关系,所选择的动作

其中,a

步骤B4,状态转移即状态-动作二元组(S,A)的函数用于描述模型在当前状态S下执行动作A后,转移至新状态S′的过程;系统状态μ在周期τ+1的更新是基于信噪比值的,表示为:

假设在周期τ的动作是A

基于在每个周期的聚合节点集合W,在周期τ+1的ρ

随着系统的运行,按照步骤B4进行状态转移直至系统到达其预设的运行周期;

步骤B5,收益;每次状态转移都会产生一定的收益,收益R(S,A)是一个关于状态S和动作A的实值函数,反应了当前A的优劣,收益的定义与优化目标一致,被定义为在周期τ内得到的全局模型准确率与完成一轮联邦学习模型训练所需时延倒数的乘积,完成一轮训练所需时延越短且全局模型准确率越高表示策略越优,具体奖励功能如下:

步骤B6,基于DDPG的聚合节点选取策略;求解MDP问题是找一个最优策略π来最大化长期累积收益平均值的期望:

在聚合节点选取过程中,随着终端数量的增加,动作空间及状态空间的维度会超出一般深度强化学习方法的限制,并且不同动作间存在连续性,所以本机制选取DDPG算法求解最优策略,在DDPG算法中,存在四个神经网络,即行为者网络、目标行为者网络、批评者网络和目标批评者网络,令

θ

行为者网络的

其中,y=R+γQ′,γ是折扣系数。

区块链的模型性能验证具体包括:

步骤C1,簇内验证,在每轮联邦学习训练中,物联网第二终端在本地训练完成后于分簇内广播本地模型参数,簇内验证为在分簇内物联网第一终端的主导下物联网第二终端进行的相互验证,对应聚合验证方法的步骤4.3,簇内验证主要分为三个部分,分配验证任务、执行验证任务、计算模型准确度;

步骤C1.1,分配验证任务,簇内物联网第一终端收集各本地模型的参数以执行簇内模型聚合,并生成模型验证任务,为每个物联网第二终端分配N

步骤C1.2,执行验证任务,物联网第二终端执行区块中的验证任务,根据本地数据集来评估分簇内其余物联网第二终端的模型准确度作为验证结果,在完成验证后,物联网第二终端将验证结果发送至分簇中的物联网第一终端;

步骤C1.3,计算模型准确度,当物联网第二终端被劫持时,可能会报告未经训练的模型参数和不准确的验证结果,在区块链的模型性能验证机制中,模型准确度长期低于一定数值(此数值可根据经验确定)的物联网第二终端将被视为恶意节点,物联网第一终端在计算模型准确度时选择部分验证结果进行均值计算以抵消恶意节点的负面影响并同时考虑准确率长期变化的情况,在收到分簇内所有物联网第二终端发送的验证结果后,物联网第一终端计算每个物联网第二终端的模型准确度,各验证结果和计算得到的各本地模型准确度将被物联网第一终端打包生成新区块,新区块将在区块链网络中广播;

步骤C2,簇间验证,在簇间验证中,通过物联网第一终端间的相互验证来评估各分簇模型的准确性,为聚合方案提供可靠的模型准确度证明,对应聚合验证方法的步骤4.5,簇间验证主要分为四个部分,即分配验证任务、执行验证任务、收集验证结果和计算模型准确度;

步骤C2.1,在分配验证任务阶段,基站为每个聚合节点分配N

步骤C2.2,执行验证结果,在执行验证任务阶段,边缘区块链网络内各节点收到区块m后,将本地数据集作为验证数据集并执行区块中包含的验证任务;

步骤C2.3,收集验证结果阶段,在收集验证结果阶段,Leader从为每个聚集节点分配的N

步骤C2.4,计算模型准确度,在计算模型准确度阶段,Leader根据所选的验证结果计算每个聚合节点的模型准确度,经计算得到的模型准确度将被提供给基于模型性能的聚合节点选取机制用于聚合节点选取,当计算完所有聚合节点的模型准确度后,Leader将验证结果和计算得到的模型准确度打包生成区块n,并将区块在区块链网络中广播,以达成区块共识。

为了进一步地验证所述面向物联网隐私保护的聚合验证方法的优越技术效果,本实施例建立于一个基于Python的仿真平台来评估本发明提出的方法性能,该平台部署于一台服务器中,该服务器处理器型号为Intel(R)Xeon(R)W-2123CPU@3.60GHz,内存为32GB,系统为Ubuntu 16.04.3LTS,在该平台中基于系统架构建立了一个结合联邦学习的物联网系统,在该系统中,存在一个服务器、一个基站及若干个物联网终端,各物联网终端随机分布在基站的覆盖范围内并假设与电源直连,在各终端上根据系统架构部署对应的联邦学习模型,系统中物联网第一终端的数量由具体配置决定,物联网第二终端的数量随着物联网第一终端数量的增加而增加,物联网第三终端的数量与物联网第二终端的数量保持一致,物联网第二终端从物联网第三终端收集数据,并将数据添加到本地数据集,系统内的物联网终端间、物联网终端与基站间采用无线传输进行数据传输,只考虑包括路径损耗和阴影衰落在内的大规模衰落,基站与服务器间采用有线传输的数据传输方式。

为了尽可能全面的分析本发明所提出方法与现有技术相比的优势,在实施例中具体进行了三种测试,分别是在不同聚合方案下的联邦学习模型准确度测试、联邦学习模型收敛效率测试和系统效率测试,在测试过程中,每次数据通信的最大容忍时延为300秒,此外,在测试中采用手写体数据集作为物联网数据训练联邦学习本地模型,在仿真过程中,手写体数据根据预设的物联网数据发送间隔(5分钟)由物联网第三终端发送至物联网第二终端并加入对应终端的本地数据集,同时,为了测试本实施例所提方法对于恶意节点攻击的抵抗能力,系统中最多存在1/3的物联网终端被劫持变为恶意节点,具体参数如表1所示:

表1系统仿真参数配置

图4展示了采用原生联邦学习聚合方案和本实施例所提出的聚合验证方法下,随着训练轮次的增加,分簇模型和全局模型的收敛情况,其中,通过模型的Loss值表示模型的收敛情况,通过对分簇模型的Loss值进行均值计算,得到图中的分簇模型Loss值曲线,在相同的训练轮次下,采用本实施例所提出的聚合验证方法下的全局及分簇模型Loss值较高于采用原生联邦学习聚合方案的模型Loss值,由于在每轮模型训练中聚合验证方案通过聚合节点选取机制选取一个节点子集参与边缘模型聚合,因此不参与模型聚合的分簇模型的Loss值导致了分簇模型平均Loss值较高,同时,由于只有部分分簇模型参与模型聚合,导致全局模型需要更多训练轮次才能学习到数据的全部特征,当训练轮次达到1200时,两种方案下的全局模型和原生联邦学习聚合方案下的各分簇模型收敛,当训练轮次达到1200时,采用本实施例所提出的聚合验证方法下的各分簇模型收敛,综上,采用本实施例所提出的聚合验证方法能够保证联邦学习中全局模型的学习效率;

图5展示了在采用原生联邦学习聚合方案和本实施例所提出的聚合验证方法下,随着训练轮次增加,分簇模型和全局模型的准确度的变化情况,随着训练轮次的增加,在原生联邦学习聚合方案和本实施例所提出的聚合验证方法下,分簇模型的平均准确度和全局模型的准确度都随之提高,在系统运行之初,在相同的训练轮次下,采用原生联邦学习聚合方案下的分簇模型准确度更高,由于聚合方案选择了一个节点子集参与边缘模型聚合,在同步全局模型参数后,未参与模型聚合的分簇模型准确度较低,导致平均模型准确度较低,当训练轮次达到1200和1800时,采用原生联邦学习聚合方案和本实施例所提出的聚合验证方法下的模型准确度分别到达稳定值;

图6和图7展示了在不同的物联网第一终端数量下,采用原生联邦学习聚合方案和本实施例所提出的聚合验证方法对完成一轮联邦学习模型训练所需时延的影响,不采用基于区块链的模型性能验证机制的仿真结果如图6所示,物联网第一终端的数量从7个增加到16个,在分簇模型聚合中,模型参数量随着各分簇内物联网第二终端数量的增加而增加,从而导致了分簇聚合时延的增加,由于物联网第一终端的计算资源是独立配置的,这直接导致了不同物联网第一终端作为Leader节点时区块打包时延的波动,从而影响了完成一轮联邦学习模型训练所需时延,与采用原生联邦学习聚合方案相比,仅采用本实施例所提出的分层聚合机制会提升约10%的总训练时延,这是由于物联网终端、基站等物联网模块与服务器相比性能存在较大差异,将聚合任务分散造成了时延上的增加,但当聚合任务量达到更高量级时,采用分层聚合机制会对时延产生正向影响,仅采用本实施例方法中提出的聚合验证方法在终端数量较多的情况下能够减少约12%的总训练时延,同时采用分层聚合机制和聚合节点选取机制能够减少约6%的总训练时延,但由于在聚合节点选取机制中对聚合节点的选取考虑了长期因素的影响,所以性能的提升存在一定限制,采用完整聚合验证方法的仿真结果如图7所示,采用基于区块链的模型性能验证机制会在一定程度上导致时延的增加,根据性能验证机制,在模型聚合过程中,未参与边缘模型聚合的验证节点需要在区块共识过程中执行由基站分配的模型验证任务,这造成了区块共识时延的增加,但同时,在性能验证机制中根据最优停止理论设置停止条件能够在保证公平性的前提下,将总训练时延降低13%左右,从而尽可能的维持了系统运行效率,综上,采用本实施例提出的聚合验证方法能够在保障聚合公平性的前提下,维持联邦学习算法效率,并提升结合联邦学习的物联网系统效率。

本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书界定。

相关技术
  • 基于物联网应用场景的隐私查询和隐私身份验证的保护方法
  • 基于物联网应用场景的隐私查询和隐私身份验证的保护方法
技术分类

06120115935633