掌桥专利:专业的专利平台
掌桥专利
首页

基于状态转移核优化的数据处理方法、装置、设备及介质

文献发布时间:2023-06-19 11:57:35


基于状态转移核优化的数据处理方法、装置、设备及介质

技术领域

本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种基 于状态转移核优化的数据处理方法、装置、设备及介质。

背景技术

随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术应 用在金融领域,但金融业也对技术提出了更高的要求,如金融业对基于状态 转移核优化的数据处理也有更高的要求。

目前,在参与方通过机器学习训练模型的过程中,通常是直接与其他参 与方进行数据交换,而直接与其他参与方进行数据交换会侵犯用户的隐私, 造成安全隐患,另外,在参与方训练模型时,样本数据常常是存在不同的识 别状态的,如在语音识别过程(语音识别过程是把数据帧识别为状态,把状 态组合为因素,把因素组合为单词)中,数据帧可以被识别为A状态,B状 态,C状态等,其中,A状态,B状态,C状态等类型是存在不同识别概率的,现有技术在确定样本数据不同状态的识别概率的过程中,往往通过固定的方 式进行确定,通过固定的方式确定样本数据不同状态的识别概率,导致模型 训练过程中资源适配性差的问题。

发明内容

本申请的主要目的在于提供一种基于状态转移核优化的数据处理方法、 装置、设备和介质,旨在解决现有技术中通过固定的方式确定样本数据不同 状态的识别概率,致使模型训练过程资源适配性差,且易侵犯用户隐私的技 术问题。

为实现上述目的,本申请提供一种基于状态转移核优化的数据处理方法, 应用于第一参与方,所述第一参与方与第二参与方进行联邦通信连接,所述 基于状态转移核优化的数据处理方法包括:

在第一参与方每次训练本地模型参数的过程中,根据所述第一参与方的 资源属性信息动态确定预设本地样本数据的状态采样算法,以得到预设本地 样本数据的识别状态信息,以确定第一参与方所有预设本地模型参数的组合 状态信息;

根据所述组合状态信息,确定待联邦的目标模型参数;

基于所述待联邦的目标模型参数,与各个第二参与方进行联邦训练,得 到所述第一参与方的预设预测模型。

可选地,所述在第一参与方每次训练本地模型参数的过程中,根据所述 第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算法,以 得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地模 型参数的组合状态信息的步骤,包括:

在第一参与方每次训练本地模型参数的过程中,根据所述第一参与方的 资源属性信息确定内存消耗上限;

根据所述内存消耗上限以及预设采样消耗计算规则,动态确定预设本地 样本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确 定第一参与方每个预设本地模型参数的状态信息,以确定第一参与方所有预 设本地模型参数的组合状态信息。

可选地,所述根据所述内存消耗上限以及预设采样消耗计算规则,动态 确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状 态信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定第一 参与方所有预设本地模型参数的组合状态信息的步骤,包括:

分别确定各个预设本地模型参数的子内存消耗上限;

确定每个预设本地模型参数的类型与数量,根据所述子内存消耗上限, 所述预设采样消耗计算规则以及所述状态类型与数量,通过遍历方式确定预 设本地样本数据的状态采样算法;

确定每个预设本地模型参数在对应所述状态采样算法下的最小状态转移 路线;

根据所述状态采样算法以及所述最小状态转移路线,得到预设本地样本 数据的识别状态,以确定第一参与方所有预设本地模型参数的组合状态信息。

可选地,所述分别确定各个预设本地模型参数的子内存消耗上限的步骤, 包括:

确定各个预设本地模型参数对模型训练结果的影响程度;

根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限。

可选地,在动态确定预设本地样本数据的状态采样算法的过程中,还根 据所述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样中间参 数。

可选地,所述基于所述待联邦的第一模型参数,与各个第二参与方进行 联邦训练,得到所述第一参与方的预设预测模型的步骤,包括:

基于所述待联邦的第一模型参数,通过执行预设联邦流程,与各个第二 参与方的待联邦的第二模型参数进行聚合,以得到聚合参数,以基于所述聚 合参数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的替换 更新的模型参数;

继续动态确定所述替换更新后的所述模型参数的状态采样算法,以继续 确定待联邦的第一参与方的其他模型参数,并不断进行迭代训练,直至达到 预设训练完成条件,得到预设预测模型。

可选地,所述第一参与方通过第三方与第二参与方进行联邦通信连接;

所述基于所述待联邦的第一模型参数,通过执行预设联邦流程,与各个 第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数,以基于所 述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的 替换更新的模型参数的步骤,包括:

将所述待联邦的第一模型参数,加密发送给第三方,以供所述第三方基 于所述待联邦的第一模型参数,以及接收到的各个第二参与方的待联邦的第 二模型参数进行聚合,得到聚合参数;

接收所述第三方加密发送的聚合参数,基于所述聚合参数对待联邦的第 一模型参数进行替换更新,得到所述第一参与方的替换更新的模型参数。

本申请还提供一种基于状态转移核优化的数据处理装置,应用于第一参 与方,所述第一参与方与第二参与方进行联邦通信连接,所述基于状态转移 核优化的数据处理装置包括:

第一确定模块,用于在第一参与方每次训练本地模型参数的过程中,根 据所述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算 法,以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设 本地模型参数的组合状态信息;

第二确定模块,用于根据所述组合状态信息,确定待联邦的目标模型参 数;

联邦模块,用于基于所述待联邦的目标模型参数,与各个第二参与方进 行联邦训练,得到所述第一参与方的预设预测模型。

可选地,所述第一确定模块包括:

第一确定单元,用于在第一参与方每次训练本地模型参数的过程中,根 据所述第一参与方的资源属性信息确定内存消耗上限;

第二确定单元,用于根据所述内存消耗上限以及预设采样消耗计算规则, 动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识 别状态信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定 第一参与方所有预设本地模型参数的组合状态信息。

可选地,所述第二确定单元包括:

第一确定子单元,用于分别确定各个预设本地模型参数的子内存消耗上 限;

第二确定子单元,用于确定每个预设本地模型参数的类型与数量,根据 所述子内存消耗上限,所述预设采样消耗计算规则以及所述状态类型与数量, 通过遍历方式确定预设本地样本数据的状态采样算法;

第三确定子单元,用于确定每个预设本地模型参数在对应所述状态采样 算法下的最小状态转移路线;

第四确定子单元,用于根据所述状态采样算法以及所述最小状态转移路 线,得到预设本地样本数据的识别状态,以确定第一参与方所有预设本地模 型参数的组合状态信息。

可选地,所述第一确定子单元用于实现:

确定各个预设本地模型参数对模型训练结果的影响程度;

根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限。

可选地,在动态确定预设本地样本数据的状态采样算法的过程中,还根 据所述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样中间参 数。

可选地,所述联邦模块包括:

聚合单元,用于基于所述待联邦的第一模型参数,通过执行预设联邦流 程,与各个第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数, 以基于所述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一 参与方的替换更新的模型参数;

第三确定单元,用于继续动态确定所述替换更新后的所述模型参数的状 态采样算法,以继续确定待联邦的第一参与方的其他模型参数,并不断进行 迭代训练,直至达到预设训练完成条件,得到预设预测模型。

可选地,所述第一参与方通过第三方与第二参与方进行联邦通信连接;

所述第三确定单元包括:

发送单元,用于将所述待联邦的第一模型参数,加密发送给第三方,以 供所述第三方基于所述待联邦的第一模型参数,以及接收到的各个第二参与 方的待联邦的第二模型参数进行聚合,得到聚合参数;

接收单元,用于接收所述第三方加密发送的聚合参数,基于所述聚合参 数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的替换更新 的模型参数。

本申请还提供一种基于状态转移核优化的数据处理设备,所述基于状态 转移核优化的数据处理设备为实体设备,所述基于状态转移核优化的数据处 理设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上 运行的所述基于状态转移核优化的数据处理方法的程序,所述基于状态转移 核优化的数据处理方法的程序被处理器执行时可实现如上述的基于状态转移 核优化的数据处理方法的步骤。

本申请还提供一种介质,所述介质上存储有实现上述基于状态转移核优 化的数据处理方法的程序,所述基于状态转移核优化的数据处理方法的程序 被处理器执行时实现如上述的基于状态转移核优化的数据处理方法的步骤。

本申请还提供一种计算机程序产品、包括计算机程序,该计算机程序被 处理器执行时实现上述的基于状态转移核优化的数据处理方法的步骤。

本申请提供一种基于状态转移核优化的数据处理方法、装置、设备及介 质,与现有技术中,不同参与方直接进行数据交换,且通过固定的方式确定 样本数据不同状态的识别概率,致使模型训练过程中资源适用性差,侵犯用 户隐私相比,本申请在第一参与方每次训练本地模型参数的过程中,根据所 述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算法, 以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地 模型参数的组合状态信息;根据所述组合状态信息,确定待联邦的目标模型参数;基于所述待联邦的目标模型参数,与各个第二参与方进行联邦训练, 得到所述第一参与方的预设预测模型。在本申请中,由于第一参与方与各个 第二参与方进行联邦训练,因而,避免不同参与方直接进行数据的交互造成 用户的隐私安全隐患,另外,在本申请中,在第一参与方每次训练本地模型 参数的过程中,根据所述第一参与方的资源属性信息动态确定预设本地样本 数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第 一参与方所有预设本地模型参数的组合状态信息,即是基于资源属性信息以 动态方式确定本地样本数据的识别状态的识别状态信息,以确定第一参与方 所有预设本地模型参数的组合状态信息,而不是通过固定的方式确定样本数 据不同状态的识别状态信息如识别概率,因而,提升了模型训练过程中资源 适配性,解决了现有技术中通过固定的方式确定样本数据不同状态的识别概 率,致使模型训练过程资源适配性差,且易侵犯用户隐私的技术问题。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申 请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实 施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于 本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这 些附图获得其他的附图。

图1为本申请基于状态转移核优化的数据处理方法第一实施例的流程示 意图;

图2为本申请基于状态转移核优化的数据处理方法中在第一参与方每次 训练本地模型参数的过程中,根据所述第一参与方的资源属性信息动态确定 预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信 息,以确定第一参与方所有预设本地模型参数的组合状态信息的步骤的细化 步骤流程示意图;

图3为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说 明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限 定本申请。

本申请实施例提供一种基于状态转移核优化的数据处理方法,在本申请 基于状态转移核优化的数据处理方法的第一实施例中,参照图1,应用于第一 参与方,所述第一参与方与第二参与方进行联邦通信连接,所述基于状态转 移核优化的数据处理方法包括:

步骤S10,在第一参与方每次训练本地模型参数的过程中,根据所述第一 参与方的资源属性信息动态确定预设本地样本数据的状态采样算法,以得到 预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地模型参 数的组合状态信息;

步骤S20,根据所述组合状态信息,确定待联邦的目标模型参数;

步骤S30,基于所述待联邦的目标模型参数,与各个第二参与方进行联邦 训练,得到所述第一参与方的预设预测模型。

具体步骤如下:

步骤S10,在第一参与方每次训练本地模型参数的过程中,根据所述第一 参与方的资源属性信息动态确定预设本地样本数据的状态采样算法,以得到 预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地模型参 数的组合状态信息;

在本实施例中,需要说明的是,基于状态转移核优化的数据处理方法可 以应用于基于状态转移核优化的数据处理系统(特别地,应用于基于状态转 移核优化的数据处理系统中的第一参与方),该基于状态转移核优化的数据 处理系统从属于基于状态转移核优化的数据处理设备,对于基于状态转移核 优化的数据处理系统而言,还可以内置有第二参与方,或者与第二参与方进 行通信连接,需要说明的是,该第一参与方与第二参与方之间(可以都属于 基于状态转移核优化的数据处理系统)可以直接进行联邦通信连接,另外, 该第一参与方与第二参与方之间还可以通过第三参与方间接进行联邦通信连 接。

需要说明的是,在第一参与方与第二参与方进行联邦之前,第一参与方 是需要先在本地训练自身的模型参数的,具体地,例如,第一参与方在本地 迭代训练500次(训练模型参数)之后,与第二参与方进行联邦通信,得到 聚合参数,然后将聚合参数作为替换更新模型参数替换掉本地的模型参数, 并基于替换更新模型参数继续进行下一轮的迭代训练,直至最后得到需要的 模型。

在本实施例中,基于状态转移核优化的数据处理方法是应用在第一参与 方训练自身的模型参数的过程中,在该过程中,需要根据所述第一参与方的 资源属性信息动态确定预设本地样本数据的状态采样算法,进而根据状态采 样算法,得到预设本地样本数据的识别状态信息,其中,资源属性信息包括 算力资源,存储资源以及传输资源等信息,预设本地样本数据的状态采样算 法包括有放回采样,无放回采样,联邦蒙特普洛斯-黑廷斯采样,优化的联邦 蒙特普洛斯-黑廷斯采样等采样算法,其中,各状态采样算法可以是预存在第一参与方本地的,或者各状态采样算法是临时调用或者生成的,根据状态采 样算法,得到预设本地样本数据的识别状态信息,具体地,根据状态采样算 法,得到预设本地样本数据的各识别状态的识别概率,进而根据状态采样算 法,得到预设本地样本数据的各识别状态对应模型参数的数值,需要说明的 是,不管采用何种采样算法,各识别状态的识别概率是一致的,或者在预设 误差范围内的,但是不同采样算法,资源消耗以及采样的速率是不同的,具 体地,例如,在第一参与方本地训练本地模型参数的过程中,某一样本数据 存在A状态-B状态-C状态,通过不同采样算法,可能A状态都是占比70%, B状态都是占比20%,C状态都是占比10%,但是通过联邦蒙特普洛斯-黑廷 斯采样算法,可能得到A状态占比70%的资源是M1内存消耗,通过优化的 联邦蒙特普洛斯-黑廷斯采样算法,可能得到A状态占比70%的的资源是M2 内存消耗,而通过有放回采样,可能得到A状态占比70%的的资源是M3内 存消耗,其中,M2内存消耗最少。

需要说明的是,样本数据是由多个样本特征构成的数据,根据所述第一 参与方的资源属性信息动态确定预设本地样本数据的状态采样算法包括:根 据所述第一参与方的资源属性信息动态确定预设本地样本数据中不同样本特 征的状态采样算法,即是对于相应样本特征,对应针对性预存的状态采样算 法不同,进而获取对应样本特征的不同状态的识别概率,由于样本特征存在 多个,因而,可以通过不同样本数据识别概率的相乘得到整体样本数据对应 输出数据的概率,而为了得到输出数据的概率的资源消耗,则可以首先得到 每个样本特征不同状态的识别概率所消耗的算力资源等,进而将对应算力资 源等相加得到需要的整体资源。在现有技术中,是通过固定状态采样算法, 确定对应样本数据中样本特征的状态的识别概率,通过固定状态采样算法确 定对应样本数据中样本特征的状态的识别概率,难以兼顾模型训练时的资源 配置,具体地,例如,若第一参与方资源配置少时,固定状态采样算消耗多 则会造成服务器的崩溃,致使难以满足模型训练时对资源限制的需求,若第 一参与方资源配置多时,固定状态采样算消耗少则会造成资源的浪费,致使难以满足模型训练时对速度的需求,在本实施例中,可以实现模型训练时资 源消耗属性与速率的均衡或者适配。

需要说明的是,由于预设本地样本数据中存在不同样本特征,每个样本 特征对应不同的状态采样算法,在通过每个样本特征对应不同的状态采样算 法,得到预设本地样本数据不同样本特征的识别状态信息后,得到预设本地 样本数据的识别状态信息,进而,确定第一参与方所有预设本地模型参数的 组合状态信息,也即,预设本地样本数据的识别状态信息隐含了对应预设本 地模型参数的组合状态信息,进而,可以得到第一参与方所有预设本地模型 参数的组合状态信息,具体地,例如,假设样本特征存在A状态,B状态,C 状态三种状态,A状态,B状态,C状态三种状态分别对应的识别概率为70%, 20%,10%,则样本特征被识别为A状态时,对应的识别模型参数如权重可以 是0.7。

其中,参照图2,所述在第一参与方每次训练本地模型参数的过程中,根 据所述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算 法,以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设 本地模型参数的组合状态信息的步骤,包括:

步骤S11,在第一参与方每次训练本地模型参数的过程中,根据所述第一 参与方的资源属性信息确定内存消耗上限;

在本实施例中,在第一参与方每次训练本地模型参数的过程中,根据所 述第一参与方的资源属性信息确定内存消耗上限,即是根据读取第一参与方 服务器的内存容量确定内存消耗上限。

步骤S12,根据所述内存消耗上限以及预设采样消耗计算规则,动态确定 预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态信 息,以确定第一参与方每个预设本地模型参数的状态信息,以确定第一参与 方所有预设本地模型参数的组合状态信息。

根据所述内存消耗上限如500G,以及预设采样消耗计算规则如每采样一 次的消耗计算规则以及不同状态类型的消耗计算规则,动态确定预设本地样 本数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定 第一参与方每个预设本地模型参数的状态信息,以确定第一参与方所有预设 本地模型参数的组合状态信息,需要说明的是,不同状态采样算法得到预设 本地样本数据的识别状态信息的资源消耗是不同的,不同状态采样算法与资 源消耗存在第一预设关联关系,或者不同状态采样算法,状态类型等与资源 消耗存在预设第二关联关系。

其中,所述根据所述内存消耗上限以及预设采样消耗计算规则,动态确 定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识别状态 信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定第一参 与方所有预设本地模型参数的组合状态吗信息的步骤,包括:

步骤a1,分别确定各个预设本地模型参数的子内存消耗上限;

分别确定各个预设本地模型参数的子内存消耗上限,确定各个预设本地 模型参数的子内存消耗上限的方式包括:

方式一:根据各个预设本地模型参数的类型,确定对应子内存消耗上限;

方式二:根据各个预设本地模型参数的权重,确定对应子内存消耗上限。

步骤a2,确定每个预设本地模型参数的类型与数量,根据所述子内存消 耗上限,所述预设采样消耗计算规则以及所述状态类型与数量,通过遍历方 式确定预设本地样本数据的状态采样算法;

确定子内存消耗上限后,根据所述子内存消耗上限,所述预设采样消耗 计算规则以及所述状态类型与数量,通过遍历方式确定预设本地样本数据的 状态采样算法,即是从预存在第一参与方本地的各状态采样算法中对应确定 预设本地样本数据的状态采样算法。

具体地,例如,若所述子内存消耗上限为100消耗计量值,根据所述预 设采样消耗计算规则,所述状态类型与数量,遍历各状态采样算法(为了节 约资源,遍历过程只计算而不执行实际的采样操作),得到各状态采样算法 对应具体采用过程的内存消耗上限分别为200消耗计量值,300消耗计量值,150 消耗计量值,90消耗计量值,则选择90消耗计量值的状态采样算法进行采样。

步骤a3,确定每个预设本地模型参数在对应所述状态采样算法下的最小 状态转移路线;

确定每个预设本地模型参数在对应所述状态采样算法下的最小状态转移 路线,具体地,最小状态转移路线可以指的是:确定最小状态组合数的采用 路线,具体地,例如,存在A状态,B状态以及D状态,则采样过程中,可 以将A状态和B状态作为一组,D状态作为一组,则最小状态组合数为2组, 若存在A状态,B状态以及D状态,则采样过程中,可以将A状态,B状态 以及D状态分别都作为不同的组,则最小状态组合数为3组,需要说明的是, 分组不同,采样过程中的消耗均不同,因而,需要在满足资源消耗限制下, 确定每个预设本地模型参数在对应所述状态采样算法下的最小状态转移路 线。

步骤a4,根据所述状态采样算法以及所述最小状态转移路线,得到预设 本地样本数据的识别状态,以确定第一参与方所有预设本地模型参数的组合 状态信息。

根据所述状态采样算法以及各个最小状态转移路线,组合得到预设本地 样本数据的识别状态,以确定第一参与方所有预设本地模型参数的组合状态 信息。

步骤S20,根据所述组合状态信息,确定待联邦的目标模型参数;

步骤S30,基于所述待联邦的目标模型参数,与各个第二参与方进行联邦 训练,得到所述第一参与方的预设预测模型。

在本实施例中,根据所述组合状态信息,确定待联邦的目标模型参数, 例如,假设样本特征存在A状态,B状态,C状态三种状态,A状态,B状 态,C状态三种状态分别对应的识别概率为70%,20%,10%,则样本特征被 识别为A状态时,对应的识别模型参数如权重可以是0.7。在得到目标模型参 数后,基于所述待联邦的目标模型参数,与各个第二参与方进行联邦训练, 得到所述第一参与方的预设预测模型。

本申请提供一种基于状态转移核优化的数据处理方法、装置、设备及介 质,与现有技术中,不同参与方直接进行数据交换,且通过固定的方式确定 样本数据不同状态的识别概率,致使模型训练过程中资源适用性差,侵犯用 户隐私相比,本申请在第一参与方每次训练本地模型参数的过程中,根据所 述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算法, 以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设本地 模型参数的组合状态信息;根据所述组合状态信息,确定待联邦的目标模型参数;基于所述待联邦的目标模型参数,与各个第二参与方进行联邦训练, 得到所述第一参与方的预设预测模型。在本申请中,由于第一参与方与各个 第二参与方进行联邦训练,因而,避免不同参与方直接进行数据的交互造成 用户的隐私安全隐患,另外,在本申请中,在第一参与方每次训练本地模型 参数的过程中,根据所述第一参与方的资源属性信息动态确定预设本地样本 数据的状态采样算法,以得到预设本地样本数据的识别状态信息,以确定第 一参与方所有预设本地模型参数的组合状态信息,即是基于资源属性信息以 动态方式确定本地样本数据的识别状态,以确定第一参与方所有预设本地模 型参数的组合状态信息,而不是通过固定的方式确定样本数据不同状态的识 别概率,因而,提升了模型训练过程中资源适配性,解决了现有技术中通过 固定的方式确定样本数据不同状态的识别概率,致使模型训练过程资源适配 性差,且易侵犯用户隐私的技术问题。

进一步地,基于本申请中第一实施例,提供另一实施例,在该实施例中, 所述分别确定各个预设本地模型参数的子内存消耗上限的步骤,包括:

步骤A1,确定各个预设本地模型参数对模型训练结果的影响程度;

确定各个预设本地模型参数对模型训练结果的影响程度,确定各个预设 本地模型参数对模型训练结果的影响程度的方式包括;

确定各个预设本地模型参数的权重大小,以确定对模型训练结果的影响 程度,或者确定各个预设本地模型参数的影响因子的大小,以确定对模型训 练结果的影响程度。

步骤A2,根据所述影响程度,确定各个预设本地模型参数的子内存消耗 上限。

根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限,其 中,影响程度大,则确定各个预设本地模型参数的子内存消耗上限高,其中, 影响程度可以通过影响因子大小确定。

在本实施例中,通过确定各个预设本地模型参数对模型训练结果的影响 程度;根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限。 在本实施例中,准确确定各个预设本地模型参数的子内存消耗上限。

进一步地,基于本申请中第一实施例,提供另一实施例,在该实施例中, 具体地,在动态确定预设本地样本数据的状态采样算法的过程中,还根据所 述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样中间参数。

在本实施例中,在内存资源丰富时,可以使用内存资源换取效率,具体 地,根据所述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样 中间参数,例如,由于样本数据包括各个样本特征Q1特征,Q2特征,Q3特 征,每个样本特征又有不同的状态如Q1特征的A状态,B状态,C状态, Q2特征的D状态,E状态,Q3特征的F状态,G状态以及H状态,在基于 各个样本特征对应各状态得到组合状态信息的过程中,如Q1特征-A状态, Q2特征D状态以及Q3特征F状态组合,或者Q1特征-B状态,Q2特征D 状态以及Q3特征F状态组合等等,在现有技术中,是随机组合的,而在本实 施例中,为了提升组合效率,进行有序组合,具体地,在组合的过程中,可 以保存Q1特征-A状态(占据一定内存,能否根据所述内存消耗上限以及预 设采样消耗计算规则确定),进而,先将Q1特征-A状态和Q2特征各个状态, 以及Q3特征各个状态进行组合,再将Q1特征-B状态和Q2特征各个状态, 以及Q3特征各个状态进行组合,进而,提升得到输出数据的效率。具体地, 在本实施例中,还可以针对不同特征设置一个别名表(AliasTable),然后基于每 个别名表进行状态的组合,提升效率。

进一步地,基于本申请中第一实施例和第二实施例,所述基于所述待联 邦的第一模型参数,与各个第二参与方进行联邦训练,得到所述第一参与方 的预设预测模型的步骤,包括:

步骤B1,基于所述待联邦的第一模型参数,通过执行预设联邦流程,与 各个第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数,以基 于所述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一参与 方的替换更新的模型参数;

在本实施例中,基于所述待联邦的第一模型参数,通过执行预设联邦流 程,直接与各个第二参与方的待联邦的第二模型参数进行聚合,以得到聚合 参数,以基于所述聚合参数对待联邦的第一模型参数进行替换更新,得到所 述第一参与方的替换更新的模型参数。

步骤B2,继续动态确定所述替换更新后的所述模型参数的状态采样算法, 以继续确定待联邦的第一参与方的其他模型参数,并不断进行迭代训练,直 至达到预设训练完成条件,得到预设预测模型。

与上述确定模型参数的状态采样算法一样,继续动态确定所述替换更新 后的所述模型参数的状态采样算法,以继续确定待联邦的第一参与方的其他 模型参数如下一轮替换更新的模型参数,并不断进行迭代训练,直至达到预 设训练完成条件如预设损失函数收敛,得到预设预测模型。

所述第一参与方通过第三方与第二参与方进行联邦通信连接;

所述基于所述待联邦的第一模型参数,通过执行预设联邦流程,与各个 第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数,以基于所 述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的 替换更新的模型参数的步骤,包括:

步骤C1,将所述待联邦的第一模型参数,加密发送给第三方,以供所述 第三方基于所述待联邦的第一模型参数,以及接收到的各个第二参与方的待 联邦的第二模型参数进行聚合,得到聚合参数;

将所述待联邦的第一模型参数,加密发送给第三方,以避免模型参数泄 露,以供所述第三方基于所述待联邦的第一模型参数,以及接收到的各个第 二参与方的待联邦的第二模型参数进行聚合,得到聚合参数,将所述待联邦 的第一模型参数,加密发送给第三方,以供所述第三方基于所述待联邦的第 一模型参数,以及接收到的各个第二参与方的待联邦的第二模型参数进行聚 合,得到聚合参数。

步骤C2,接收所述第三方加密发送的聚合参数,基于所述聚合参数对待 联邦的第一模型参数进行替换更新,得到所述第一参与方的替换更新的模型 参数。

接收所述第三方加密发送的聚合参数,基于所述聚合参数对待联邦的第 一模型参数进行替换更新,得到所述第一参与方的替换更新的模型参数。

本实施例中,通过联邦模型准确得到预设预测模型。

参照图3,图3是本申请实施例方案涉及的硬件运行环境的设备结构示意 图。

如图3所示,该基于状态转移核优化的数据处理设备可以包括:处理器 1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于 实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速 RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存 储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地,该基于状态转移核优化的数据处理设备还可以包括矩形用户接 口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频 电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模 块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、 无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接 口)。

本领域技术人员可以理解,图3中示出的基于状态转移核优化的数据处理 设备结构并不构成对基于状态转移核优化的数据处理设备的限定,可以包括 比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图3所示,作为一种介质的存储器1005中可以包括操作系统、网络通信 模块以及基于状态转移核优化的数据处理程序。操作系统是管理和控制基于 状态转移核优化的数据处理设备硬件和软件资源的程序,支持基于状态转移 核优化的数据处理程序以及其它软件和/或程序的运行。网络通信模块用于实 现存储器1005内部各组件之间的通信,以及与基于状态转移核优化的数据处 理系统中其它硬件和软件之间通信。

在图3所示的基于状态转移核优化的数据处理设备中,处理器1001用于 执行存储器1005中存储的基于状态转移核优化的数据处理程序,实现上述任 一项所述的基于状态转移核优化的数据处理方法的步骤。

本申请基于状态转移核优化的数据处理设备具体实施方式与上述基于状 态转移核优化的数据处理方法各实施例基本相同,在此不再赘述。

本申请还提供一种基于状态转移核优化的数据处理装置,应用于第一参 与方,所述第一参与方与第二参与方进行联邦通信连接,所述基于状态转移 核优化的数据处理装置包括:

第一确定模块,用于在第一参与方每次训练本地模型参数的过程中,根 据所述第一参与方的资源属性信息动态确定预设本地样本数据的状态采样算 法,以得到预设本地样本数据的识别状态信息,以确定第一参与方所有预设 本地模型参数的组合状态信息;

第二确定模块,用于根据所述组合状态信息,确定待联邦的目标模型参 数;

联邦模块,用于基于所述待联邦的目标模型参数,与各个第二参与方进 行联邦训练,得到所述第一参与方的预设预测模型。

可选地,所述第一确定模块包括:

第一确定单元,用于在第一参与方每次训练本地模型参数的过程中,根 据所述第一参与方的资源属性信息确定内存消耗上限;

第二确定单元,用于根据所述内存消耗上限以及预设采样消耗计算规则, 动态确定预设本地样本数据的状态采样算法,以得到预设本地样本数据的识 别状态信息,以确定第一参与方每个预设本地模型参数的状态信息,以确定 第一参与方所有预设本地模型参数的组合状态信息。

可选地,所述第二确定单元包括:

第一确定子单元,用于分别确定各个预设本地模型参数的子内存消耗上 限;

第二确定子单元,用于确定每个预设本地模型参数的类型与数量,根据 所述子内存消耗上限,所述预设采样消耗计算规则以及所述状态类型与数量, 通过遍历方式确定预设本地样本数据的状态采样算法;

第三确定子单元,用于确定每个预设本地模型参数在对应所述状态采样 算法下的最小状态转移路线;

第四确定子单元,用于根据所述状态采样算法以及所述最小状态转移路 线,得到预设本地样本数据的识别状态,以确定第一参与方所有预设本地模 型参数的组合状态信息。

可选地,所述第一确定子单元用于实现:

确定各个预设本地模型参数对模型训练结果的影响程度;

根据所述影响程度,确定各个预设本地模型参数的子内存消耗上限。

可选地,在动态确定预设本地样本数据的状态采样算法的过程中,还根 据所述内存消耗上限以及预设采样消耗计算规则确定需要保存的采样中间参 数。

可选地,所述联邦模块包括:

聚合单元,用于基于所述待联邦的第一模型参数,通过执行预设联邦流 程,与各个第二参与方的待联邦的第二模型参数进行聚合,以得到聚合参数, 以基于所述聚合参数对待联邦的第一模型参数进行替换更新,得到所述第一 参与方的替换更新的模型参数;

第三确定单元,用于继续动态确定所述替换更新后的所述模型参数的状 态采样算法,以继续确定待联邦的第一参与方的其他模型参数,并不断进行 迭代训练,直至达到预设训练完成条件,得到预设预测模型。

可选地,所述第一参与方通过第三方与第二参与方进行联邦通信连接;

所述第三确定单元包括:

发送单元,用于将所述待联邦的第一模型参数,加密发送给第三方,以 供所述第三方基于所述待联邦的第一模型参数,以及接收到的各个第二参与 方的待联邦的第二模型参数进行聚合,得到聚合参数;

接收单元,用于接收所述第三方加密发送的聚合参数,基于所述聚合参 数对待联邦的第一模型参数进行替换更新,得到所述第一参与方的替换更新 的模型参数。

本申请基于状态转移核优化的数据处理装置的具体实施方式与上述基于 状态转移核优化的数据处理方法各实施例基本相同,在此不再赘述。

本申请实施例提供了一种介质,且所述介质存储有一个或者一个以上程 序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用 于实现上述任一项所述的基于状态转移核优化的数据处理方法的步骤。

本申请介质具体实施方式与上述基于状态转移核优化的数据处理方法各 实施例基本相同,在此不再赘述。

本申请还提供一种计算机程序产品、包括计算机程序,该计算机程序被 处理器执行时实现上述的基于状态转移核优化的数据处理方法的步骤。

本申请计算机程序产品的具体实施方式与上述基于状态转移核优化的数 据处理方法各实施例基本相同,在此不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装 置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括 为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下, 由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物 品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个介质(如ROM/RAM、磁碟、光盘) 中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器, 空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是 利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

相关技术
  • 基于状态转移核优化的数据处理方法、装置、设备及介质
  • 基于分解径向对称卷积核的卷积优化方法、装置、终端设备及计算机可读存储介质
技术分类

06120113116756