掌桥专利:专业的专利平台
掌桥专利
首页

无线联邦学习调度优化方法及装置

文献发布时间:2023-06-19 11:45:49


无线联邦学习调度优化方法及装置

【技术领域】

本申请涉及一种无线联邦学习调度优化方法及装置,属于计算机技术领域。

【背景技术】

联邦学习(Federated Learning)是一种机器学习框架,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。其中,联邦学习可使用的机器学习算法不局限于神经网络,还包括随机森林等重要算法。

在联邦学习过程中,基站向所有被选择的处理设备逐一发送全局模型ω,来保证计算和通信的并行性,以此更好地使用整个系统的资源。

然而,随机生成的模型分发顺序对应的联邦学习效率可能较低。

【发明内容】

本申请提供了一种无线联邦学习调度优化方法及装置,可以解决随机分配全局模型时联邦学习效率可能较低的问题。本申请提供如下技术方案:

第一方面,提供一种无线联邦学习调度优化方法,所述方法包括:

在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;所述资源查询请求用于请求所述处理设备返回资源信息;

在接收到所述处理设备反馈的资源信息后,从所述多个处理设备中选择处理所述学习任务的i个处理设备,所述i为正整数;

根据所述资源信息确定所述i个处理设备的下载顺序;

按照所述下载顺序为所述i个处理设备分配所述学习任务对应的全局模型;所述i个处理设备中的每个处理设备在下载所述全局模型完成后对所述全局模型进行训练,并在上传资源未被占用时上传训练得到的模型参数;所述下载顺序使得所述i个处理设备的处理总延迟最小,所述处理总延迟包括各个处理设备的下载前的等待时长、下载时长、上传时长、计算时长和上传前的等待时长;

获取所述i个处理设备上传的模型参数;

基于所述模型参数确定新的全局模型。

可选地,所述根据所述资源信息确定所述i个处理设备的下载顺序,包括:

根据所述资源信息,确定所述i个处理设备中每个处理设备处理所述学习任务所需的计算时长和下载时长;

获取预先设置的j个优先级参数,所述j为大于1的整数;

对于所述j个优先级参数中的每个优先级参数,使用所述优先级参数计算每个处理设备的优先级概率,并将所述i个处理设备的优先级概率按照从大到小的顺序排列,得到所述优先级参数对应的设备序列;

分别模拟所述j个优先级参数对应的设备序列的总循环时长;

将最小的总循环时长对应的设备序列确定为所述下载顺序。

可选地,所述使用所述优先级参数计算每个处理设备的优先级概率,通过下式表示:

其中,

可选地,所述计算时长通过下式表示:

其中,τ是本地更新的次数,d

可选地,所述下载时长通过下式表示:

对于处理设备i,P

可选地,所述上传时长通过下式表示:

对于处理设备i,P

可选地,所述基于所述模型参数确定新的全局模型,包括:

计算所述模型参数的平均值,使用所述平均值更新上一轮的全局模型,得到所述新的全局模型。

第二方面,提供一种无线联邦学习调度优化装置,所述装置包括:

资源查询模块,用于在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;所述资源查询请求用于请求所述处理设备返回资源信息;

设备选择模块,用于在接收到所述处理设备反馈的资源信息后,从所述多个处理设备中选择处理所述学习任务的i个处理设备,所述i为正整数;

顺序确定模块,用于根据所述资源信息确定所述i个处理设备的下载顺序;

任务分配模块,用于按照所述下载顺序为所述i个处理设备分配所述学习任务对应的全局模型;所述i个处理设备中的每个处理设备在下载所述全局模型完成后对所述全局模型进行训练,并在上传资源未被占用时上传训练得到的模型参数;所述下载顺序使得所述i个处理设备的处理总延迟最小,所述处理总延迟包括各个处理设备的下载前的等待时长、下载时长、上传时长、计算时长和上传前的等待时长;

参数获取模块,用于获取所述i个处理设备上传的模型参数;

模型更新模块,用于基于所述模型参数确定新的全局模型。

可选地,所述顺序确定模块,用于:

根据所述资源信息,确定所述i个处理设备中每个处理设备处理所述学习任务所需的计算时长和下载时长;

获取预先设置的j个优先级参数,所述j为大于1的整数;

对于所述j个优先级参数中的每个优先级参数,使用所述优先级参数计算每个处理设备的优先级概率,并将所述i个处理设备的优先级概率按照从大到小的顺序排列,得到所述优先级参数对应的设备序列;

分别模拟所述j个优先级参数对应的设备序列的总循环时长;

将最小的总循环时长对应的设备序列确定为所述下载顺序。

可选地,所述使用所述优先级参数计算每个处理设备的优先级概率,通过下式表示:

其中,

本申请的有益效果在于:通过在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;在接收到处理设备反馈的资源信息后,从多个处理设备中选择处理学习任务的i个处理设备;根据资源信息确定i个处理设备的下载顺序;按照下载顺序为i个处理设备分配学习任务对应的全局模型;下载顺序使得i个处理设备的处理总延迟最小;获取i个处理设备上传的模型参数;基于模型参数确定新的全局模型;可以解决随机分配全局模型时联邦学习效率可能较低的问题;可以调节通信和计算能力之间的权重,依次全面评估每个设备的优先级,最终,每个处理设备根据优先级序列进行模型的下载;且可以让将处理设备先进行计算,同时不长时间占用通信信道,从而提高总体的训练效率。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,并可依照说明书的内容予以实施,以下以本申请的较佳实施例并配合附图详细说明如后。

【附图说明】

图1是本申请一个实施例提供的无线联邦学习调度优化系统的结构示意图;

图2是本申请一个实施例提供的无线联邦学习调度优化方法的流程图;

图3是本申请一个实施例提供的无线联邦学习调度优化装置的框图。

【具体实施方式】

下面结合附图和实施例,对本申请的具体实施方式作进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。

本申请提供的无线联邦学习调度优化方法,主要对给定第k轮的调度策略Π

图1是本申请一个实施例提供的无线联邦学习调度优化系统的结构示意图。该系统至少包括:基站110和处理设备120。

基站110用于基于联邦学习协议控制处理设备120对预先创建的全局模型进行联邦学习。其中,全局模型可以是通用模型;或者是使用公共数据对该通用模型进行预训练得到的。

在其它实施例中,基站110也可以称为服务器、服务平台等,本实施例不对基站110的名称作限定。

基站110与处理设备120通信相连。其中,通信方式可以为有线通信或者无线通信,本实施例不对基站110与处理设备120之间的通信方式作限定。

处理设备120的为M个,M为大于1的整数。处理设备可以为边缘设备,或者也可以是非边缘设备,处理设备120可以为手机、计算机、平板电脑等,本实施例不对处理设备120的设备类型作限定。对于每个处理设备,本申请中通过M={1,2,…,M}来进行索引。对于处理设备i,它有大小为D

对于每个处理设备120,全局模型训练的目标是:确定在整个本地数据集最小化特定损失函数的模型参数ω,处理设备i上的损失函数基于特定的损失函数f

之后,最优化任务可以通过下式表示:

传统的轮联邦学习过程使用多轮迭代的方法来训练一个全局模型,对于第k轮迭代循环,k为正整数,至少包括以下3个步骤:

步骤1,基站110向所有在第k轮被调度的处理设备Π

在k的值为1时,基站110广播的模型参数为初始化的模型参数。

步骤2,每个属于调度设备集合Π

其中,τ是本地重复迭代次数,η是学习率。

步骤3,基站110收到设备集合Π

聚合过程参考下式:

在第k轮迭代循环中,处理总延迟包括以下部分:

1、计算延迟:为了描述本地模型更新时计算时延的随机性,本实施例中使用移位指数分布。具体的计算延迟(下文中的计算时长)通过下式表示:

其中,τ是本地更新的次数,d

由于基站110有相对较强的计算能力以及模型聚合的计算复杂度很低,因此,本实施例中,忽略了模型聚合的时延。

2、通信延迟:考虑到调度设备本地模型的上传和下载,本实施例中设定了总带宽大小为B的时分复用系统。对于处理设备i,它下载时可达到的传输速度可以定义为:

其中,P

R表示全局模型的模型参数w

同样的,处理设备上传时可达到的传输速度可以定义为:

其中,P

R表示处理设备i训练得到的模型参数的大小。

联邦学习是进行同步模型聚合的,每轮的总时延

本实施例中,相较于传统的联邦学习协议通过使用处理设备的资信息,构造了一个处理设备的调度序列,并要求所选的处理设备依照这个序列下载模型,从而提高联邦学习效率。

下面对本申请提供的无线联邦学习调度优化方法进行详细介绍。

图2是本申请一个实施例提供的无线联邦学习调度优化方法的流程图。本实施例以执行主体为图1中的基站110为例进行说明,该方法至少包括以下几个步骤:

步骤201,在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;资源查询请求用于请求处理设备返回资源信息。

步骤202,在接收到处理设备反馈的资源信息后,从多个处理设备中选择处理学习任务的i个处理设备,i为正整数。

基站可以随机选择i个处理设备,或者通过其它算法选择处理设备,本实施例不对基站选择处理设备的方式作限定。

步骤203,根据资源信息确定i个处理设备的下载顺序。

下载顺序使得i个处理设备的处理总延迟最小,处理总延迟包括各个处理设备的下载前的等待时长、下载时长、上传时长、计算时长和上传前的等待时长。

给定第k轮的调度策略Π

决定最优序列的最优化问题

其中,

本实施例中,处理设备下载完模型后立即计算模型。为了解决最优化问题

1)假定所有设备训练完毕之后,才开放上传,由此,总的上传时长是确定的,只要优化最后训练完设备的总时长即可。这个简化的问题就是问题

2)为了找到下载和上传时长的影响,本实施例中简化问题以消除训练时长的影响,这个简化的问题就是

通过以上两种特例,可以发现处理设备的调度序列会影响总的训练时间,侧重于计算的调度与侧重于通信的调度会有着截然不同的调度效果。基于此,本实施例通过在设备通信与计算能力进行权衡的设备调度,来解决问题

本实施例提出的基于通信和计算的优先级(Priority based on communicationand computation,PCC)算法的核心就是找到一个较好的下载顺序的设备序列,从而缩短一轮联邦学习的训练时长。本实施中,通过实验为优先级参数α挑选了一些值,即预设了一些优先级参数,同时,将上述两种特殊情况囊括其中,分别对应于α=1和α=0。对于每个α,可以得到一个优先队列并且模拟需要的时间,最终,选择其中最好的作为调度序列。

具体地,根据资源信息确定i个处理设备的下载顺序,包括以下几个步骤:

步骤1,根据资源信息,确定i个处理设备中每个处理设备处理学习任务所需的计算时长和下载时长。

计算时长通过下式计算:

其中,τ是本地更新的次数,d

下载时长通过下式计算:

其中,P

步骤2,获取预先设置的j个优先级参数,j为大于1的整数。

j个优先级参数α的取值范围为[0,1],且α=0对应短通信优先调度的特殊情况,α=1对应长计算优先调度的特殊情况。

步骤3,对于j个优先级参数中的每个优先级参数,使用优先级参数计算每个处理设备的优先级概率,并将i个处理设备的优先级概率按照从大到小的顺序排列,得到优先级参数对应的设备序列。

其中,使用优先级参数计算每个处理设备的优先级概率,通过下式表示:

其中,

步骤4,分别模拟j个优先级参数对应的设备序列的总循环时长。

步骤5,将最小的总循环时长对应的设备序列确定为下载顺序。

本实施例中,全面考虑不同处理设备之间通信与计算能力的不同,使用优先级参数α来调节通信和计算能力之间的权重,依次全面评估每个设备的优先级,最终,每个处理设备根据优先级序列进行模型的下载。基于本实施例提供的下载顺序确定方式,可以让将处理设备先进行计算,同时不长时间占用通信信道,以此提高总体的训练效率。

步骤204,按照下载顺序为i个处理设备分配学习任务对应的全局模型;i个处理设备中的每个处理设备在下载全局模型完成后对全局模型进行训练,并在上传资源未被占用时上传训练得到的模型参数。

步骤205,获取i个处理设备上传的模型参数。

步骤206,基于模型参数确定新的全局模型。

基于模型参数确定新的全局模型,包括:计算模型参数的平均值,使用平均值更新上一轮的全局模型,得到新的全局模型。

本实施例中,在全局模型未训练结束时,新的全局模型的模型参数为下一轮联邦学习时处理设备所需下载的模型参数。

综上所述,本实施例提供的无线联邦学习调度优化方法,通过在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;在接收到处理设备反馈的资源信息后,从多个处理设备中选择处理学习任务的i个处理设备;根据资源信息确定i个处理设备的下载顺序;按照下载顺序为i个处理设备分配学习任务对应的全局模型;下载顺序使得i个处理设备的处理总延迟最小;获取i个处理设备上传的模型参数;基于模型参数确定新的全局模型;可以解决随机分配全局模型时联邦学习效率可能较低的问题;可以调节通信和计算能力之间的权重,依次全面评估每个设备的优先级,最终,每个处理设备根据优先级序列进行模型的下载;且可以让将处理设备先进行计算,同时不长时间占用通信信道,从而提高总体的训练效率。

图3是本申请一个实施例提供的无线联邦学习调度优化装置的框图。该装置至少包括以下几个模块:资源查询模块310、设备选择模块320、顺序确定模块330、任务分配模块340、参数获取模块350和模型更新模块360。

资源查询模块310,用于在学习任务创建完成后,在联邦学习的每轮迭代循环中,向多个处理设备发送资源查询请求;所述资源查询请求用于请求所述处理设备返回资源信息;

设备选择模块320,用于在接收到所述处理设备反馈的资源信息后,从所述多个处理设备中选择处理所述学习任务的i个处理设备,所述i为正整数;

顺序确定模块330,用于根据所述资源信息确定所述i个处理设备的下载顺序;

任务分配模块340,用于按照所述下载顺序为所述i个处理设备分配所述学习任务对应的全局模型;所述i个处理设备中的每个处理设备在下载所述全局模型完成后对所述全局模型进行训练,并在上传资源未被占用时上传训练得到的模型参数;所述下载顺序使得所述i个处理设备的处理总延迟最小,所述处理总延迟包括各个处理设备的下载前的等待时长、下载时长、上传时长、计算时长和上传前的等待时长;

参数获取模块350,用于获取所述i个处理设备上传的模型参数;

模型更新模块360,用于基于所述模型参数确定新的全局模型。

可选地,所述顺序确定模块330,用于:

根据所述资源信息,确定所述i个处理设备中每个处理设备处理所述学习任务所需的计算时长和下载时长;

获取预先设置的j个优先级参数,所述j为大于1的整数;

对于所述j个优先级参数中的每个优先级参数,使用所述优先级参数计算每个处理设备的优先级概率,并将所述i个处理设备的优先级概率按照从大到小的顺序排列,得到所述优先级参数对应的设备序列;

分别模拟所述j个优先级参数对应的设备序列的总循环时长;

将最小的总循环时长对应的设备序列确定为所述下载顺序。

可选地,所述使用所述优先级参数计算每个处理设备的优先级概率,通过下式表示:

其中,

相关细节参考上述方法实施例。

需要说明的是:上述实施例中提供的无线联邦学习调度优化装置在进行无线联邦学习调度优化时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将无线联邦学习调度优化装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的无线联邦学习调度优化装置与无线联邦学习调度优化方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

可选地,本申请还提供有一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的无线联邦学习调度优化方法。

可选地,本申请还提供有一种计算机产品,该计算机产品包括计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序由处理器加载并执行以实现上述方法实施例的无线联邦学习调度优化方法。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

上述仅为本申请的一个具体实施方式,其它基于本申请构思的前提下做出的任何改进都视为本申请的保护范围。

相关技术
  • 无线联邦学习调度优化方法及装置
  • 无线边缘网络中有效联邦学习的最小-最大代价优化方法
技术分类

06120113047843