掌桥专利:专业的专利平台
掌桥专利
首页

数据处理方法和装置

文献发布时间:2023-06-19 13:48:08


数据处理方法和装置

技术领域

本申请涉及通信技术,尤其涉及一种数据处理方法和装置。

背景技术

第三代合作伙伴计划(3rd generation partnership project,3GPP)标准从R15开始,在通信网络中引入网络数据分析功能(network data analytics function,NWDAF)网元,NWDAF网元用于提供数据收集和数据分析、训练等功能,NWDAF网元能够向网络中的网络功能(network function,NF)网元或第三方应用功能(application function,AF)网元或操作、管理和维护(operation,administration and maintenance,OAM)网元反馈数据分析结果,以便NF网元或AF网元或OAM网元基于数据分析结果做业务流程的实现或增强。例如,会话管理功能(session management function,SMF)网元基于NWDAF网元反馈的用户面功能(user plane function,UPF)网元数据分析结果,做UPF网元选择的增强。又如,策略控制功能(policy control function,PCF)网元基于NWDAF网元反馈的应用程序(application)的服务(service)平均意见分(mean opinion score,MOS)数据分析结果做服务质量(quality of service,QoS)参数增强,等。

通常的,由于各种隐私或安全等原因,运营商网络与第三方之间的数据通常不能完全开放,甚至运营商网络内部各域之间的数据也不能完全开放,这导致出现数据隔离问题。

数据隔离问题导致通常的数据收集和集中式数据分析训练存在困难,NWDAF网元不能提供较为准确的数据收集和数据分析、训练等功能。

发明内容

本申请实施例提供一种数据处理方法和装置,在多个网元不交换原始数据的情况下,网络数据分析网元可以利用多个网元计算的用于反映网元中的本地模型对目标模型的影响值的输出结果,训练目标模型,即避免发生数据泄露,又能得到较为全面准确的目标模型,从而可以提供较为准确的数据收集和数据分析、训练等功能。

第一方面,本申请实施例提供一种数据处理方法,包括:第一网络数据分析网元确定与目标模型相关的一个或多个子模型的标识信息;对于子模型的标识信息对应的网元,第一网络数据分析网元向网元发送第一请求消息;第一请求消息包括子模型的标识信息;第一网络数据分析网元接收来自网元的第一响应消息,第一响应消息包括网元利用子模型计算的第一输出结果,第一输出结果用于反映子模型对目标模型的影响值;第一网络数据分析网元依据一个或多个子模型的标识信息对应的一个或多个网元的第一输出结果训练得到目标模型。这样,在多个网元不交换原始数据的情况下,网络数据分析网元可以利用多个网元计算的用于反映网元中的本地模型对目标模型的影响值的输出结果,训练目标模型,即避免发生数据泄露,又能得到较为全面准确的目标模型,从而可以提供较为准确的数据收集和数据分析、训练等功能。

在一种可能的实现方式中,第一网络数据分析网元确定与目标模型相关的一个或多个子模型的标识信息,包括:第一网络数据分析网元基于本地配置确定与目标模型相关的一个或多个子模型的标识信息;或者,第一网络数据分析网元确定与目标模型相关的具有保密需求的网元;第一网络数据分析网元从具有保密需求的网元获取一个或多个子模型的标识信息。

在一种可能的实现方式中,第一请求消息还包括下述的一种或多种:第一切片标识信息、第一业务标识信息、第一区域信息、第一时间信息、第一终端标识信息、第一网络设备标识信息、第一模型训练算法信息、第一模型反馈有效时间信息或第一模型收敛条件信息;其中,第一切片标识信息用于指示提供第一切片标识信息对应的输出结果;第一业务标识信息用于指示提供第一业务标识信息对应的输出结果;第一区域信息用于指示提供第一区域信息对应的输出结果;第一时间信息用于指示提供第一时间信息对应的输出结果;第一终端标识信息用于指示提供第一终端标识信息对应的输出结果;第一网络设备标识信息用于指示提供第一网络设备标识信息对应的输出结果;第一模型训练算法信息用于推荐子模型所使用的模型训练算法;第一模型反馈有效时间信息用于指示反馈输出结果的有效时间;第一模型收敛条件信息用于指示模型训练的收敛条件。

在一种可能的实现方式中,第一响应消息还包括下述的一种或多种:子模型的标识信息、关联信息、迭代次数N、第二模型训练算法信息、第二切片标识信息、第二业务标识信息或第二区域信息;其中,关联信息用于将同一样本对象的输出结果进行关联;迭代次数N用于指示来自子模型的标识信息对应的网元的输出结果是在第N次迭代过程中产生的结果;第二模型算法信息用于指示子模型的标识信息对应的网元所使用的算法;第二切片标识信息用于标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对切片标识信息的输出结果;第二业务标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对业务标识信息的输出结果;第二区域信息用于来自子模型的标识信息对应的网元的输出结果包括针对区域信息的输出结果。

在一种可能的实现方式中,关联信息包括下述的一种或多种:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI;或者,关联信息包括关联指示和下述的一种或多种信息:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI。

在一种可能的实现方式中,第一网络数据分析网元依据一个或多个子模型的标识信息对应的一个或多个网元的第一输出结果训练得到目标模型,包括:第一网络数据分析网元将一个或多个网元的第一输出结果输入预设模型;第一网络数据分析网元根据样本标签数据与预设模型的输出结果之间的损失函数差值调整预设模型,直到样本标签数据与预设模型的输出结果之间的损失函数差值满足条件,得到目标模型。

在一种可能的实现方式中,方法还包括:第一网络数据分析网元向一个或多个子模型的标识信息对应的网元发送损失函数差值,用于一个或多个子模型的标识信息对应的网元依据损失函数差值更新一个或多个子模型。

在一种可能的实现方式中,方法还包括:第一网络数据分析网元接收来自第二网络数据分析网元的第二请求消息,第二请求消息用于请求训练目标模型,第二请求消息包括目标模型的标识。

在一种可能的实现方式中,第二请求消息包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息、第三模型训练算法信息、第三模型反馈有效时间信息或第三模型收敛条件信息。

在一种可能的实现方式中,方法还包括:第一网络数据分析网元向第二网络数据分析网元发送第二响应消息,第二响应消息包括目标模型或目标模型对应的地址信息。

在一种可能的实现方式中,第二响应求消息还包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息或模型训练完成指示信息。

在一种可能的实现方式中,还包括:第一网络数据分析网元接收来自第一网元的的推理结果;推理结果是第一网元根据第一网元中的子模型获得的;第一网络数据分析网元依据目标模型并利用第一网元的推理结果,输出目标推理结果;第一网络数据分析网元向第二网元发送目标推理结果,第二网元与第一网元相同或不同。

第二方面,本申请实施例提供一种数据处理方法,包括:第二网络数据分析网元分别获取来自一个或多个网元的推理结果;推理结果为一个或多个网元利用子模型计算得到的,推理结果用于反映子模型对第二网络数据分析网元的目标模型的影响值;第二网络数据分析网元依据目标模型并利用一个或多个网元的推理结果计算目标推理结果;第二网络数据分析网元向一个或多个网元发送目标推理结果。

在一种可能的实现方式中,网元的数量为多个,包括第一网元和第二网元;第二网络数据分析网元分别获取来自一个或多个网元的推理结果,包括:第二网络数据分析网元接收来自第一网元的第一信息;第一信息中包括第一网元的推理结果以及第一子模型的标识信息,第一网元的推理结果是第一网元备依据第一子模型计算得到的;第二网络数据分析网元确定与第一子模型的标识信息相关的第二子模型的标识信息;第二子模型设置在第二网元中;第二网络数据分析网元向第二网元发送用于请求第二网元的推荐结果的请求消息;请求消息包括第二子模型的标识信息;第二网络数据分析网元接收来自第二网元的响应消息,响应消息包括第二网元的推荐结果,第二网元的推荐结果是第二网元依据第二子模型计算得到的。

在一种可能的实现方式中,第一信息和/或请求消息和/或响应消息还包括:关联信息,关联信息用于:将第一网元和第二网元的同一样本对象的推理结果进行关联。

在一种可能的实现方式中,关联信息包括下述的一种或多种:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI;或者,关联信息包括关联指示和下述的一种或多种信息:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI。

在一种可能的实现方式中,方法还包括:第二网络数据分析网元向第一网络数据分析网元发送第二请求消息,第二请求消息用于请求训练目标模型,第二请求消息包括目标模型的标识;第二网络数据分析网元接收来自第一网络数据分析网元的第二响应消息,第二响应消息包括目标模型或目标模型对应的地址信息。

在一种可能的实现方式中,第二请求消息包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息、第三模型训练算法信息、第三模型反馈有效时间信息或第三模型收敛条件信息。

在一种可能的实现方式中,第二响应求消息还包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息或模型训练完成指示信息。

第三方面,本申请实施例提供一种数据处理装置,该数据处理装置可以是第一网络数据分析网元,也可以是第一网络数据分析网元内的芯片或者芯片系统。该数据处理装置可以包括处理单元和通信单元。当该数据处理装置是第一网络数据分析网元时,该处理单元可以是处理器,该通信单元可以是通信接口或接口电路。该数据处理装置还可以包括存储单元,该存储单元可以是存储器。该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该第一网络数据分析网元实现第一方面或第一方面的任意一种可能的实现方式中描述的一种数据处理方法。当该数据处理装置是第一网络数据分析网元内的芯片或者芯片系统时,该处理单元可以是处理器,该通信单元可以是通信接口。例如通信接口可以为输入/输出接口、管脚或电路等。该处理单元执行存储单元所存储的指令,以使该第一网络数据分析网元实现第一方面或第一方面的任意一种可能的实现方式中描述的一种数据处理方法。该存储单元可以是该芯片内的存储单元(例如,寄存器、缓存等),也可以是该第一网络数据分析网元内的位于该芯片外部的存储单元(例如,只读存储器、随机存取存储器等)。

示例性的,处理单元,用于确定与目标模型相关的一个或多个子模型的标识信息;对于子模型的标识信息对应的网元,通信单元,用于向网元发送第一请求消息;第一请求消息包括子模型的标识信息;通信单元,还用于接收来自网元的第一响应消息,第一响应消息包括网元利用子模型计算的第一输出结果,第一输出结果用于反映子模型对目标模型的影响值;处理单元,还用于依据一个或多个子模型的标识信息对应的一个或多个网元的第一输出结果训练得到目标模型。

在一种可能的实现方式中,处理单元,具体用于基于本地配置确定与目标模型相关的一个或多个子模型的标识信息;或者,处理单元,具体用于确定与目标模型相关的具有保密需求的网元;从具有保密需求的网元获取一个或多个子模型的标识信息。

在一种可能的实现方式中,第一请求消息还包括下述的一种或多种:第一切片标识信息、第一业务标识信息、第一区域信息、第一时间信息、第一终端标识信息、第一网络设备标识信息、第一模型训练算法信息、第一模型反馈有效时间信息或第一模型收敛条件信息;其中,第一切片标识信息用于指示提供第一切片标识信息对应的输出结果;第一业务标识信息用于指示提供第一业务标识信息对应的输出结果;第一区域信息用于指示提供第一区域信息对应的输出结果;第一时间信息用于指示提供第一时间信息对应的输出结果;第一终端标识信息用于指示提供第一终端标识信息对应的输出结果;第一网络设备标识信息用于指示提供第一网络设备标识信息对应的输出结果;第一模型训练算法信息用于推荐子模型所使用的模型训练算法;第一模型反馈有效时间信息用于指示反馈输出结果的有效时间;第一模型收敛条件信息用于指示模型训练的收敛条件。

在一种可能的实现方式中,第一响应消息还包括下述的一种或多种:子模型的标识信息、关联信息、迭代次数N、第二模型训练算法信息、第二切片标识信息、第二业务标识信息或第二区域信息;其中,关联信息用于将同一样本对象的输出结果进行关联;迭代次数N用于指示来自子模型的标识信息对应的网元的输出结果是在第N次迭代过程中产生的结果;第二模型算法信息用于指示子模型的标识信息对应的网元所使用的算法;第二切片标识信息用于标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对切片标识信息的输出结果;第二业务标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对业务标识信息的输出结果;第二区域信息用于来自子模型的标识信息对应的网元的输出结果包括针对区域信息的输出结果。

在一种可能的实现方式中,关联信息包括下述的一种或多种:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI;或者,关联信息包括关联指示和下述的一种或多种信息:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI。

在一种可能的实现方式中,处理单元,具体用于将一个或多个网元的第一输出结果输入预设模型;根据样本标签数据与预设模型的输出结果之间的损失函数差值调整预设模型,直到样本标签数据与预设模型的输出结果之间的损失函数差值满足条件,得到目标模型。

在一种可能的实现方式中,通信单元,还用于向一个或多个子模型的标识信息对应的网元发送损失函数差值,用于一个或多个子模型的标识信息对应的网元依据损失函数差值更新一个或多个子模型。

在一种可能的实现方式中,通信单元,还用于接收来自第二网络数据分析网元的第二请求消息,第二请求消息用于请求训练目标模型,第二请求消息包括目标模型的标识。

在一种可能的实现方式中,第二请求消息包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息、第三模型训练算法信息、第三模型反馈有效时间信息或第三模型收敛条件信息。

在一种可能的实现方式中,通信单元,还用于向第二网络数据分析网元发送第二响应消息,第二响应消息包括目标模型或目标模型对应的地址信息。

在一种可能的实现方式中,第二响应求消息还包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息或模型训练完成指示信息。

在一种可能的实现方式中,通信单元,还用于接收来自第一网元的的推理结果;推理结果是第一网元根据第一网元中的子模型获得的;处理单元,还用于依据目标模型并利用第一网元的推理结果,输出目标推理结果;通信单元,还用于向第二网元发送目标推理结果,第二网元与第一网元相同或不同。

第四方面,本申请实施例提供一种数据处理装置,该数据处理装置可以是第二网络数据分析网元,也可以是第二网络数据分析网元内的芯片或者芯片系统。该数据处理装置可以包括处理单元和通信单元。当该数据处理装置是第二网络数据分析网元时,该处理单元可以是处理器,该通信单元可以是通信接口或接口电路。该数据处理装置还可以包括存储单元,该存储单元可以是存储器。该存储单元用于存储指令,该处理单元执行该存储单元所存储的指令,以使该第二网络数据分析网元实现第二方面或第二方面的任意一种可能的实现方式中描述的一种数据处理方法。当该数据处理装置是第二网络数据分析网元内的芯片或者芯片系统时,该处理单元可以是处理器,该通信单元可以是通信接口。例如通信接口可以为输入/输出接口、管脚或电路等。该处理单元执行存储单元所存储的指令,以使该第二网络数据分析网元实现第二方面或第二方面的任意一种可能的实现方式中描述的一种数据处理方法。该存储单元可以是该芯片内的存储单元(例如,寄存器、缓存等),也可以是该第二网络数据分析网元内的位于该芯片外部的存储单元(例如,只读存储器、随机存取存储器等)。

示例性的,处理单元,用于分别获取来自一个或多个网元的推理结果;推理结果为一个或多个网元利用子模型计算得到的,推理结果用于反映子模型对第二网络数据分析网元的目标模型的影响值;处理单元,还用于依据目标模型并利用一个或多个网元的推理结果计算目标推理结果;通信单元,用于向一个或多个网元发送目标推理结果。

一种可能的实现方式中,网元的数量为多个,包括第一网元和第二网元;通信单元,还用于接收来自第一网元的第一信息;第一信息中包括第一网元的推理结果以及第一子模型的标识信息,第一网元的推理结果是第一网元备依据第一子模型计算得到的;处理单元,还用于确定与第一子模型的标识信息相关的第二子模型的标识信息;第二子模型设置在第二网元中;通信单元,还用于向第二网元发送用于请求第二网元的推荐结果的请求消息;请求消息包括第二子模型的标识信息;通信单元,还用于接收来自第二网元的响应消息,响应消息包括第二网元的推荐结果,第二网元的推荐结果是第二网元依据第二子模型计算得到的。

一种可能的实现方式中,第一信息和/或请求消息和/或响应消息还包括:关联信息,关联信息用于:将第一网元和第二网元的同一样本对象的推理结果进行关联。

一种可能的实现方式中,关联信息包括下述的一种或多种:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI;或者,关联信息包括关联指示和下述的一种或多种信息:接口标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI。

一种可能的实现方式中,通信单元,还用于向第一网络数据分析网元发送第二请求消息,第二请求消息用于请求训练目标模型,第二请求消息包括目标模型的标识;通信单元,还用于接收来自第一网络数据分析网元的第二响应消息,第二响应消息包括目标模型或目标模型对应的地址信息。

一种可能的实现方式中,第二请求消息包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息、第三模型训练算法信息、第三模型反馈有效时间信息或第三模型收敛条件信息。

一种可能的实现方式中,第二响应求消息还包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息或模型训练完成指示信息。

第五方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序或指令,当计算机程序或指令在计算机上运行时,使得计算机执行如第一方面至第二方面的任意一种实现方式中描述的方法。

第六方面,本申请实施例提供一种包括指令的计算机程序产品,当指令在计算机上运行时,使得计算机执行第一方面至第二方面的任意一种实现方式中描述的方法。

第七方面,本申请实施例提供一种通信系统,该通信系统包括如下中任一个或多个:第三方面及各种可能的实现方式中描述的数据处理装置,以及第四方面及第四方面的各种可能的实现方式中描述的数据处理装置。

第八方面,本申请实施例提供一种通信装置,该通信装置包括处理器和存储介质,存储介质存储有指令,指令被处理器运行时,实现如第一方面至第二方面任意的实现方式描述的数据处理方法。

第九方面,本申请提供一种芯片或者芯片系统,该芯片或者芯片系统包括至少一个处理器和通信接口,通信接口和至少一个处理器通过线路互联,至少一个处理器用于运行计算机程序或指令,以进行第一方面至第二方面任意的实现方式中任一项所描述的数据处理方法。

其中,芯片中的通信接口可以为输入/输出接口、管脚或电路等。

在一种可能的实现中,本申请中上述描述的芯片或者芯片系统还包括至少一个存储器,该至少一个存储器中存储有指令。该存储器可以为芯片内部的存储单元,例如,寄存器、缓存等,也可以是该芯片的存储单元(例如,只读存储器、随机存取存储器等)。

应当理解的是,本申请实施例的第二方面至第九方面与本申请实施例的第一方面的技术方案相对应,各方面及对应的可行实施方式所取得的有益效果相似,不再赘述。

附图说明

图1为本申请实施例提供的网络架构的一种示意图;

图2为本申请实施例提供的网络架构的另一种示意图;

图3为本申请实施例提供的一种数据处理方法的架构示意图;

图4为本申请实施例提供的一种数据处理方法的构思示意图;

图5为本申请实施例提供的一种数据处理方法的信令交互示意图;

图6为本申请实施例提供的另一种数据处理方法的信令交互示意图;

图7为本申请实施例提供的一种数据处理装置的结构示意图;

图8为本申请实施例提供的一种数据处理设备的结构示意图;

图9为本申请实施例提供的一种芯片的结构示意图。

具体实施方式

为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一网元和第二网元仅仅是为了区分不同的网元,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b,或c中的至少一项(个),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是单个,也可以是多个。

通常的,NWDAF网元需要收集通信网络中各域样本数据,例如从无线接入网(radioaccess network,RAN)收集接入网数据、从核心网络(core network,CN)收集核心网数据、从用户设备(user equipment,UE)收集终端数据,从管理面功能(operationadministration and maintenance,OAM)网元收集管理域数据,从应用功能(applicationfunction,AF)网元收集第三方数据等;之后NWDAF网元基于收集的样本数据,进行集中分析训练和推理。

但是,可能因为RAN域数据的隐私保护,而导致NWDAF网元无法直接从RAN获取所需的服务质量流速率(QoS flow bit rate,QFBR)、服务质量流时延(QoS flow packetdelay,QFPD)等训练数据,进而导致NWDAF网元无法集中训练出service MOS的模型。例如,运营商并不愿意将自身的网络数据暴露给第三方,或第三方不愿意将数据暴露给运营商;或者RAN域不愿意将接入网相关数据暴露给其他域;或者终端设备由于个人隐私问题,不将自身隐私数据暴露给通信网络。数据隔离问题导致传统的数据收集和集中式数据分析训练存在困难。

基于此,本申请实施例中,可以在多个网元不交换原始数据的情况下,网络数据分析网元可以利用多个网元计算的用于反映网元中的本地模型对目标模型的影响值的输出结果,训练目标模型,即避免发生数据泄露,又能得到较为全面准确的目标模型,从而可以提供较为准确的数据收集和数据分析、训练等功能。

本申请实施例的方法可以应用在长期演进(long term evolution,LTE)中,也可以应用在第五代移动通信(5Generation,5G)系统中,或者未来的移动通信系统。

示例性的,图1为本申请实施例提供的网络架构的一种示意图。该架构不但支持第三代合作伙伴计划(3rd generation partnership project,3GPP)标准组定义的无线技术(如LTE,5G无线接入网(radio access network,RAN)等)接入核心网络(core network,CN),而且支持non-3GPP接入技术通过non-3GPP转换功能(non-3GPP interworkingfunction,N3IWF)或下一代接入网关(next generation packet data gateway,ngPDG)接入核心网络。

其中,该网络架构包括终端设备、接入网(access network,AN)、核心网和数据网络(data vetwork,DN)。其中,接入网装置主要用于实现无线物理层功能、资源调度和无线资源管理、无线接入控制以及移动性管理等功能;核心网设备可以包含管理设备和网关设备,管理设备主要用于终端设备的设备注册、安全认证、移动性管理和位置管理等,网关设备主要用于与终端设备间建立通道,在该通道上转发终端设备和外部数据网络之间的数据包;数据网络可以包含网络设备(如:服务器、路由器等设备),数据网络主要用于为终端设备提供多种数据业务服务。示例性的,以5G中的终端设备、接入网、核心网和数据网络为例进行说明。

终端设备包括但不限于:用户设备(user equipment,UE)、用户单元、用户站、移动站、移动台、远方站、远程终端设备、移动终端设备、用户终端设备、无线通信设备、用户代理、用户装置、蜂窝电话、无绳电话、会话启动协议(session initiation protocol,SIP)电话、无线本地环路(wireless local loop,WLL)站、个人数字处理(personal digitalassistant,PDA)、具有无线通信功能的手持设备、计算设备、连接到无线调制解调器的处理设备、车载设备、可穿戴设备、物联网中的终端设备设备、家用电器、虚拟现实设备、未来5G网络中的终端设备设备或者未来演进的公共陆地移动网络(public land mobilenetwork,PLMN)中的终端设备等。

5G中的接入网可以是无线接入网(radio access network,(R)AN),5G系统中的(R)AN设备可以由多个5G-(R)AN节点组成,该5G-(R)AN节点可以包括:3GPP的接入网络、非3GPP的接入网络如WiFi网络的接入点(access point,AP)、下一代基站(可统称为新一代无线接入网节点(NG-RAN node),其中,下一代基站包括新空口基站(NR nodeB,gNB)、新一代演进型基站(NG-eNB)、中心单元(central unit,CU)和分布式单元(distributed unit,DU)分离形态的gNB等)、收发点(transmission receive point,TRP)、传输点(transmissionpoint,TP)或其它节点。接入网设备可以与终端设备进行通信,例如,接入网设备可以为特定的地理区域提供通信覆盖,并且可以与位于该覆盖区域(小区)内的终端设备进行通信,终端设备的数量可以是一个或多个。

5G核心网(5G core/new generation core,5GC/NGC)包括接入和移动性管理功能(access and mobility management function,AMF)网元、会话管理功能(sessionmanagement function,SMF)网元、用户面功能(user plane function,UPF)网元、鉴权服务器功能(authentication server function,AUSF)网元、策略控制功能(policy controlfunction,PCF)网元、应用功能(application function,AF)网元、统一数据管理功能(unified data management,UDM)网元、网络切片选择功能(network slice selectionfunction,NSSF)网元、网络功能(network element function,NEF)网元、管理面功能(operation administration and maintenance,OAM)网元等多个功能单元。

AMF网元主要负责移动性管理、接入管理等服务。SMF网元主要负责会话管理、动态主机配置协议功能、用户面功能的选择和控制等。UPF网元主要负责对外连接到数据网络(data network,DN)以及用户面的数据包路由转发、报文过滤、执行服务质量(quality ofservice,QoS)控制相关功能等。DN主要为用户设备提供服务,如提供移动运营商业务,Internet服务或第三方服务等。AUSF网元主要负责对终端设备的认证功能等。PCF网元主要负责为网络行为管理提供统一的策略框架、提供控制面功能的策略规则、获取与策略决策相关的注册信息等。需要说明的是,这些功能单元可以独立工作,也可以组合在一起实现某些控制功能,如对终端设备的接入鉴权、安全加密、位置注册等接入控制和移动性管理功能,以及用户面传输路径的建立、释放和更改等会话管理功能。AF网元为用户提供某种类型业务的服务器端,因此也可称为应用服务器或业务服务器。UDM网元为统一的用户数据管理,主要用来存储用户设备签约数据。OAM网元提供网络管理功能,包括故障监测,故障申告,故障定位,以及故障修复等。

NWDAF网元具备以下至少一种功能:数据收集功能、数据训练功能、数据推理功能。其中,数据收集功能是指NWDAF可以收集来自网络网元、第三方业务服务器、终端设备或网管系统等的样本数据,该样本数据可以作为数据训练或数据推理功能的输入数据;数据训练功能是指NWDAF对获取的大量的输入数据做离线的数据分析训练操作,而得到相应的数据模型或数据规律;数据推理功能是指NWDAF基于输入数据做在线推理操作,并向网络网元、第三方业务服务器、提供终端设备或网管系统提供所推理的数据分析结果,该分析结果可协助网络选择业务的服务质量参数,或协助网络执行流量路由,或协助网络选择背景流量传输策略等。

NWDAF网元可以是独立部署的网元,也可以是与其他网元(如AMF网元,SMF网元或PCF网元等)合设在一起,或者也可以理解为,在其他网元中添加NWDAF网元的功能,本申请实施例对此不作具体限定。

5G系统中各功能单元之间可以通过下一代网络(next generation,NG)接口进行通信,如:终端设备可以通过NG接口1(简称N1)与AMF网元进行控制面消息的传输,RAN设备可以通过NG接口3(简称N3)与UPF建立用户面通信连接建立通道,AN/RAN设备可以通过NG接口2(简称N2)与AMF网元建立控制面信令连接,UPF可以通过NG接口4(简称N4)与SMF网元进行信息交互,UPF可以通过NG接口6(简称N6)与数据网络DN交互用户面数据,AMF网元可以通过NG接口11(简称N11)与SMF网元进行信息交互,SMF网元可以通过NG接口7(简称N7)与PCF网元进行信息交互,AMF网元可以通过NG接口12(简称N12)与AUSF进行信息交互。

示例性的,如图2所示,图2为当核心网支持非可信non3GPP(untrusted non3GPPaccess)接入时,一种具体的网络架构的示意图。其中,本地公用陆地移动网络(homepublic land mobile network,HPLMN)中的网络架构类似于图1中的实现,在此不再赘述。非可信non3GPP接入可以是非可信无线局域网(wireless local area networks,WLAN)接入。在该架构中,终端设备还可以通过非可信non3GPP接入、Non3GPP转换功能/non3GPP接入网关(Non3GPP interworking function,N3IWF)与AMF进行信息交互,N3IWF网元可以通过N3与UPF进行信息交互。

此外,核心网还可以支持可信的non3GPP接入和/或固定网络接入。其中,可信的non3GPP网络包括可信的WALN网络,固定网络包括固定家庭网络接入等。网络侧架构与非可信non3GPP网络架构类似,将N3IWF与非可信接入网替换成可信Non-3GPP接入网,或N3IWF替换成可信Non-3GPP接入网关,非可信接入网替换成可信接入网。其中,终端设备与可信Non-3GPP接入网关之间的接入网设备可以包括WLAN AP,固定网络接入网设备(fixed Accessnetwork,FAN),交换机,路由器等。

无论是可信Non-3GPP接入还是非可信Non-3GPP接入,核心网侧都可以采用如图1所示的点对点接口协议,或者与3GPP接入核心网架构一致采用服务化接口架构。本申请实施例对此不作具体限定。

一种可能的实现方式中,3GPP接入技术与non3GPP接入技术可以包含多种接入制式或频段,且可能同时使用。例如,3GPP接入包括4G的LTE与5G的NG-RAN两种接入技术同时接入5GC。non3GPP的wifi接入也包括两种频段同时接入,例如5GHz与2.4GHz的wifi频段同时接入5GC。一种可能的实现方式中,UE可以同时通过上述四种接入方式中的至少两种(包含四种同时用)接入5GC的架构。

本申请实施例的方法处理可以应用于上述5G 3GPP接入架构、或non3GPP接入架构、或3GPP与non3GPP同时接入的架构,还可以应用于5G蜂窝(NG-RAN)与4G蜂窝(LTE)同时接入的架构等,本申请实施例对网络架构不作具体限定。

示例性的,图3为本申请实施例的数据处理方法的一种应用场景示意图。

如图3所示,本申请实施例中,各域(如RAN域、CN域、OAM域、AF域或UE域等)可以有自身的本地训练功能,可以在本地收集本地样本数据并做分析训练,得到本地的输出结果。

在5G核心网(5G core network,5GC)中,可以部署人工智能(artificialintelligence,AI)训练平台、推理平台、AMF网元、SMF网元、PCF网元、NRF网元、NSSF网元等。

AI训练平台具备数据训练功能,可以将来自网络网元、第三方业务服务器、终端设备或网管系统中的原始样本数据或本地模型的输出结果作为训练数据,并基于训练数据做分析训练操作以生成相应的训练模型。该训练模型后续可以分发给推理平台用于推理。

一种可能的实现方式中,AI训练平台也可以是单独为运营商部署的网元,或者是第三方部署的训练平台,等。

推理平台具备数据推理功能,可以与运营支持系统(operations supportsystem,OSS)、CN域、RAN域、AI训练平台等进行通信,并可以依据需求基于训练模型进行分析推理。

本申请实施例中以AI训练平台和推理平台独立部署,并以推理平台具体为NWDAF为例加以说明。在另一种可能的实现方式中,AI训练平台与推理平台也可以合设在一起,如NWDAF既可以作为AI训练平台又可作为推理平台,本申请实施例对此不作具体限定。

下面对本申请实施例的一些词汇进行说明。

本申请实施例所描述的子模型可以是网元本地的模型,子模型可以是网元利用原始数据训练得到的,子模型的输出结果可以认为是基于子模型处理后的不同于原始数据的数据,子模型的输出结果也可以称为中间结果或中间训练结果等(为便于表述,后续将子模型的输出结果简称为中间结果),利用中间结果进行目标模型的训练时,子模型的输出结果可以反映子模型对目标模型的影响值,可以达到即保证隐私又能得到较准确目标模型的效果。子模型可以是深度学习的模型,也可以是任意的人工智能模型,本申请实施例对此不作具体限定。

本申请实施例所描述的目标模型可以是利用多个中间结果训练得到的,或者可以是利用多个中间结果以及原始样本数据等综合训练得到的。目标模型可以用于分析推理等。目标模型可以是深度学习的模型,也可以是任意的人工智能模型,本申请实施例对此不作具体限定。

本申请实施例所描述的第一网络数据分析网元可以是AI训练平台,也可以实现数据训练功能的网元,例如NWDAF网元、AMF网元,SMF网元或PCF网元等。第一网络数据分析网元可以用于训练目标模型。

本申请实施例所描述的第二网络数据分析网元可以是NWDAF网元(也可以成为NWDAF推理平台等),也可以实现数据推理功能的网元,例如AMF网元,SMF网元或PCF网元等。

可能的实现方式中,AI训练平台与NWDAF网元可以是合设在一起的,第一网络数据分析网元可以与第二网络数据分析网元相同,第一网络数据分析网元与第二网络数据分析网元之间可以不需要进行请求、应答等通信。

可能的实现方式中,AI训练平台与NWDAF网元是相互独立的,第一网络数据分析网元可以用于训练目标模型,第二网络数据分析网元可以从第一网络数据分析网元获取目标模型,并基于目标模型进行推理分析等。

示例性的,图4示出了一种AI训练平台与NWDAF网元相互独立的应用场景示意图。如图4所示,可以包括下述步骤:

S401:NWDAF网元向AI训练平台发送用于请求模型训练的请求消息,请求消息中携带模型标识ID1,其中ID1可以用于标识NWDAF网元所请求的具体是哪种模型(如voiceserviceMOS对应的模型标识)。

S402:AI训练平台确定ID1模型受RAN参数影响,而RAN参数又因数据隔离(或者可以认为具有保密需求或隐私需求)无法上报,则AI训练平台向RAN发送用于请求RAN提供本地模型所对应的中间结果请求消息。例如,本地模型(或称为子模型)为f(x)=θ

示例性的,上述语音业务的service MOS的函数模型为:

h(x)=w1x1+w2x2+w3x3+w4x4+w5x5+w6x6+……+wDxD

其中,w1-wD可以为权重值,x1-xD可以为样本对象的D维样本向量的数据值,D为自然数,w1x1至wDxD中的一项或多项可以为中间值,或者w1x1至wDxD的其中几项可以作为一种中间值,例如w4x4+w5x5+w6x6可以作为一种中间值,代表RAN对于service MOS的中间贡献值。需要说明的是,通常的的集中式的模型训练方式中,RAN上报每个对象的x4、x5、x6样本数据值。本申请实施例中,RAN可以仅上报w4x4+w5x5+w6x6的加权值,不需要暴露每个样本数据本身,可以满足隐私需求。

S403:RAN向AI训练平台反馈中间结果(如θ

S404:AI训练平台计算精度差值di,并根据di判断精度差值是否到达预设要求,或者可以理解为判断模型是否收敛。

例如,AI训练平台基于:RAN反馈的中间结果(如θ

若根据di值AI训练平台判断模型并未收敛,一种可能的实现方式中,AI训练平台根据di值迭代调整AI训练平台本地数据对应的模型参数值,如在上述h(x)模型举例中,更新上述w1,w2,w3,wD的权重值。同时,AI训练平台向RAN反馈精度差值di,用于RAN根据di迭代本地模型。如本地模型为f(x)=θ

重复S3至S4,直至di到达精度要求,可以认为模型收敛。

S405:AI训练平台向NWDAF网元反馈所分析的模型结果,用于将模型安装至推理平台NWDAF网元。如上述举例中,AI训练平台将h(x)=w1x1+w2x2+w3x3+f(x)+……+wDxD的函数关系反馈给NWDAF网元,其中f(x)可以认为是中间结果(或称为本地模型的输出结果等)。

S406:对于现网中待推理的对象j,RAN在线将待推理对象j相关的中间结果f(x

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以独立实现,也可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。

图5为本申请实施例提供的一种数据处理方法的流程示意图,该实施例中以第一网络数据分析网元为AI训练平台,第二网络数据分析网元为NWDAF网元为例进行说明,在AI训练平台与NWDAF网元合设的情况下,S501和S506可以省略,在AI训练平台与NWDAF网元相互独立的情况下,可以包括S501和S506。如图5所示,该方法可以包括以下步骤:

S501:NWDAF网元向AI训练平台请求训练目标模型。

可能的实现方式中,NWDAF网元可以向AI训练平台发送第二请求消息,用于请求训练目标模型。

示例性的,第二请求消息中可以携带目标模型的标识(或称为标识信息),目标模型的标识可以用于指示具体请求训练哪个模型,目标模型的标识的表现形式不限,例如可以是字符串类型(例如,ID1=service experience、service MOS或network performance等)、数值类型(如整数类型ID1=200或者二进制类型ID1=010101111等)、文本类型等。

NWDAF网元在接收到其他网元发送的用于提供分析结果的请求消息时,NWDAF网元确定自身无用于提供分析结果的相关模型,则NWDAF网元可以向AI训练平台发送第二请求消息,用于请求训练目标模型。或者,示例性的,NWDAF网元因自身需求等需要获取或更新目标模型,则NWDAF网元可以向AI训练平台发送第二请求消息,用于请求训练目标模型。本申请实施例对触发NWDAF网元向AI训练平台请求训练目标模型的具体场景不作具体限定。

S502:AI训练平台确定与目标模型相关的一个或多个子模型的标识信息。

本申请实施例中,AI训练平台确定待训练的目标模型具体与那些子模型相关,子模型也可以是RAN本地模型、UE本地模型、CN本地模型等的一种或多种。

一种可能的实现方式中,AI训练平台本地配置(或可以称为内部配置)了与目标模型相关的一个或多个子模型。例如,AI训练平台本地配置(如配置在网管系统OAM中)了目标模型(如service MOS模型)与RAN域、CN域的AMF网元和UPF网元、第三方域AF的子模型所提供的输入数据类型相关。则AI训练平台可以基于该本地配置确认与目标模型相关的一个或多个子模型的标识信息。

一种可能的实现方式中,AI训练平台可以确定与目标模型相关的具有保密需求的网元,并从具有保密需求的网元获取一个或多个子模型的标识信息。示例性的,AI训练平台内部可以配置哪些域或网元无法提供原始训练数据,哪些域或网元可以提供原始训练数据。例如,AI训练平台可根据内部配置信息获知RAN域无法提供原始训练数据,而CN域AMF网元可提供原始训练数据,CN域的UPF网元无法提供原始训练数据,第三方域的AF无法提供原始训练数据等。

一种可能的实现方式中,训练平台可以向各相关域或网元发送询问消息,用于获知对方是否可以提供原始训练数据,进一步还可获知对方可以提供哪些类型的原始训练数据。例如,训练平台向RAN域接入网网元发送询问消息,接入网网元反馈是否可以提供接入网侧原始训练数据,进一步还可以反馈对于哪些接入网数据类型(如RSRP)可以原始训练数据。

本申请实施例中,AI训练平台可以确定模型标识ID1相关的域或网元。对于无法提供原始训练数据的相关域或相关网元,AI训练平台需要从该域或网元获取子模型对应的中间结果。

S503:AI训练平台向一个或多个子模型的标识信息对应的网元发送第一请求消息,第一请求消息包括各网元对应的子模型的标识信息(图中未示出)。

本申请实施例中,子模型的标识信息可以是AI训练平台根据第二请求消息中的目标模型的标识(如ID1)获取的,子模型的标识信息可以与ID1相同,也可以与ID1不同。例如,RAN域本地模型标识可以为ID1或ID2,CN域本地模型标识可以为ID1或IID3。本申请实施例对此不作具体限定。

本申请实施例中,一个或多个子模型可以分别设置在UE、RAN或CN中的一个或多个中,AI训练平台可以向子模型的标识信息对应的网元分别发送请求消息,请求子模型的输出结果。

示例性的,如图5所示,一个或多个子模型在UE、RAN和CN中均有涉及的情况下,S503可以包括:S5031、AI训练平台向RAN请求RAN中的子模型的中间结果(在训练阶段,子模型的中间结果可能称为中间训练结果)。S5032、AI训练平台向CN请求CN中的子模型的中间结果。S5033、AI训练平台向UE请求UE中的子模型的中间结果。本申请实施例中,S5031-S5033的执行顺序可以是任意的,也可以是同时执行的,本申请实施例对此不作具体限定。

可以理解,一个或多个子模型在UE、RAN或CN中的其中一个或两个中设置的情况下,AI训练平台可以向UE、RAN或CN中的其中一个或两个请求子模型的中间结果,在此不作赘述。

可能的实现方式中,UE中可以包括多个子模型,RAN中可以包括多个子模型,CN中可以包括多个子模型,AI向UE发送第一请求消息时,可以携带UE对应的多个子模型的标识信息,AI向RAN发送第一请求消息时,可以携带RAN对应的多个子模型的标识信息,AI向CN发送第一请求消息时,可以携带CN对应的多个子模型的标识信息,本申请实施例对此不作具体限定。

可能的实现方式中,在向其中一个网元发送第一请求消息时,第一请求消息中可以包括该网元对应的一个或多个子模型的标识。第一请求消息中也可以包括在S502中确定的全部子模型的标识信息,本申请实施例对此不作具体限定。

S504:AI训练平台接收来自一个或多个子模型的标识信息对应的网元发送第一响应消息,第一响应消息包括各网元利用子模型计算的第一输出结果(图中未示出)。

本申请实施例中,一个或多个子模型对应的网元在接收到AI训练平台的第一请求消息后,可以收集相关本地训练数据,并做本地模型训练,进而计算对应的中间结果。

例如,RAN根据ID2获知训练平台请求的具体是RAN的本地模型ID2。RAN根据ID2收集RAN域相关样本数据x

例如,CN根据ID3获知训练平台请求的具体是哪个CN本地模型。CN根据ID3收集CN域相关样本数据x

本申请实施例中,AI训练平台可以接收来自一个或多个子模型的标识信息对应的网元发送第一响应消息。每个网元发送的第一响应消息中,可以包括该网元的子模型计算的第一输出结果。

示例性的,如图5所示,一个或多个子模型在UE、RAN和CN中均有涉及的情况下,S504可以包括:S5041、AI训练平台接收来自RAN的RAN中的子模型的第一输出结果。S5042、AI训练平台接收来自CN的CN中的子模型的第一输出结果。S5043、AI训练平台接收来自UE的UE中的子模型的第一输出结果。本申请实施例中,S5041-S5043的执行顺序可以是任意的,也可以是同时执行的,本申请实施例对此不作具体限定。

可以理解,一个或多个子模型在UE、RAN或CN中的其中一个或两个中设置的情况下,AI训练平台可以接收来自UE、RAN或CN中的其中一个或两个的子模型的第一输出结果,在此不作赘述。

S505:AI训练平台依据各网元反馈的第一输出结果训练得到目标模型。

本申请实施例中,AI训练平台可以依据模型训练的可能实现方式,利用第一输出结果作为输入训练得到目标模型。

可能的实现方式中,AI训练平台可以利用各域或网元上报的关联信息,将各域或网元上报的中间结果关联起来。例如,将第i个样本对象的θ

AI训练平台可以计算样本输入数据对应的输出结果,并计算样本输入数据对应的输出结果与标签数据之间的损失函数差值。例如,以目标模型为线性模型为例:

y*=h(x)=g(x)+f(x)+……+θ

若样本数据中包含RAN上报的g(x

可能的实现方式中,若损失差值di不满足预设要求(如小于等于0.001),则训练平台自身更新迭代已有的目标模型。例如,调整h(x)函数中的参数或者各部分(如中间结果g(x),f(x),xiC)之间的函数关系,如将线性关系调整成指数关系等。可以理解,具体如何更新迭代已有的目标模型,AI训练平台可根据现有的机器学习相关方法,例如梯度更新法,本申请实施例对此不作具体限定。若损失差值di满足预设要求,则模型迭代过程终止,AI训练平台可获取目标模型(例如样本输入数据与标签数据之间的关系模型)。

例如AI训练平台获取voice service Mos对应的目标模型为一种线性模型,如下函数关系式:

y=h(x)=g(x)+f(x)+……+θ

其中g(x)是CN域上报的本地模型对应的中间结果(在推理阶段,中间结果可能称为中间推理结果),f(x)是RAN域上报的本地模型对应的中间结果,x

需要说明的是,除上述以线性关系为例的模型外,AI训练平台最终训练获取的目标模型还可以是其他形式的函数关系,如指数关系,倒数关系,神经网络关系等。以上述RAN域、CN域各自上报中间结果g(x)、f(x)且训练平台本地还可以获取一些原始上报数据x

Y=h[g(x),f(x),x

可能的实现方式中,若损失差值di还没有满足预设要求,AI训练平台可以向一个或多个子模型的标识信息对应的网元(也可以称为本地域或网元)反馈损失函数差值(也可以称为损失差值),用于一个或多个子模型的标识信息对应的网元依据损失函数差值更新一个或多个子模型。

示例性的,对于每个样本对象i,AI训练平台向各本地域或网元反馈损失差值di。各本地域或网元接收损失差值di后,可以根据损失差值更新迭代本地训练模型。如RAN域根据di更新f(x)=θ

可能的实现方式中,AI训练平台还可以向各本地域和网元反馈di对应样本对象i的关联信息。该关联信息用于各域和网元将di与样本对象i的样本数据(如x

可能的实现方式中,AI训练平台还可以向各本地域和网元发送以下至少一种信息:本地模型标识信息、迭代次数信息。

S506:AI训练平台向NWDAF网元反馈目标模型。

可能的实现方式中,AI训练平台向NWDAF网元发送第二响应消息,第二响应消息包括目标模型或目标模型的地址信息,NWDAF网元可以依据第二响应消息得到目标模型,用于后续的分析推理。

示例性的,第二响应消息中包括目标模型的的模型结果。其中模型结果的承载形式不限,可以是接口消息形式,也可以是文件形式。模型结果具体可包含以下形式的一种或多种内容:模型标识信息,模型使用的算法信息,算法参数值,模型输入数据,模型输出数据。其中模型使用算法信息用于指示各种输入数据与输出数据之间使用了何种算法(如神经网络或线性回归等)和其他算法附加信息(如隐藏层数或激活函数等)。例如,上述示例中,ID1对应的模型结果为h(x),其中使用算法信息为线性回归,算法参数值为(1,1,1(θ

综上,本申请实施例中,可以在多个网元不交换原始数据的情况下,数据分析网元(如AI训练平台)可以利用多个网元计算的用于反映网元中的本地模型对目标模型的影响值的输出结果,训练目标模型,即避免发生数据泄露,又能得到较为全面准确的目标模型,从而可以提供较为准确的数据收集和数据分析、训练等功能。

在图5对应的实施例的基础上,可能的实现方式中,第一请求消息中可以包括下述信息的一种或多种:第一切片标识信息、第一业务标识信息、第一区域信息、第一时间信息、第一终端标识信息、第一网络设备标识信息、第一模型训练算法信息、第一模型反馈有效时间信息或第一模型收敛条件信息。

示例性的,第一切片标识信息用于指示提供第一切片标识信息对应的输出结果,其中输出结果即为本地模型对应的中间结果。

示例性的,第一业务标识信息用于指示提供第一业务标识信息对应的输出结果。

示例性的,第一区域信息用于指示提供第一区域信息对应的输出结果。

示例性的,第一时间信息用于指示提供第一时间信息对应的输出结果。

示例性的,第一终端标识信息用于指示提供第一终端标识信息对应的输出结果。

示例性的,第一网络设备标识信息用于指示提供第一网络设备标识信息对应的输出结果。

示例性的,第一模型训练算法信息用于推荐子模型所使用的模型训练算法。

示例性的,第一模型反馈有效时间信息用于指示反馈输出结果的有效时间。

示例性的,第一模型收敛条件信息用于指示子模型训练的收敛条件,如子模型的损失差值小于预设值。

其中,上述输出结果即为本地域或网元根据本地子模型输出的相应的中间结果。

在图5对应的实施例的基础上,可能的实现方式中,第一响应消息还包括下述的一种或多种:子模型的标识信息、关联信息、迭代次数N、第二模型训练算法信息、第二切片标识信息、第二业务标识信息或第二区域信息。

示例性的,关联信息用于将同一样本对象的不同子模型对应的输出结果进行关联。

示例性的,迭代次数N用于指示来自子模型的标识信息对应的网元的输出结果是在第N次迭代过程中产生的结果。该迭代次数N有助于AI训练平台关联同一次迭代过程中上报的各域中间结果。

示例性的,第二模型算法信息用于指示子模型的标识信息对应的网元所使用的算法;该信息有助于AI训练平台选择对应的算法进行目标模型的训练过程。例如,若本地网元使用神经网络算法获取了子模型,则本地网元可将相应的神经网络算法作为第二模型算法信息在第一响应消息中发送给AI训练平台,以便于AI训练平台也尽量使用神经网络算法进行目标模型的训练。

示例性的,第二切片标识信息用于标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对切片标识信息的输出结果。

示例性的,第二业务标识信息用于指示来自子模型的标识信息对应的网元的输出结果包括针对业务标识信息的输出结果。

示例性的,第二区域信息用于来自子模型的标识信息对应的网元的输出结果包括针对区域信息的输出结果。

可能的实现方式中,针对第i个样本对象的关联信息包括第i个样本对象对应的下述信息的一种或多种:下一代应用协议(NG application protocol,NG-AP)标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码(international mobile subscriber identity,IMSI)、一般公共订阅标识符(generic public subscription identifier,GPSI)或用户永久标识符(subscriberpermanent identity,SUPI)。可能的理解中,该实现方式可以是隐性的指出根据哪些信息进行关联,即在第一响应消息中包括NG-AP标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI的一种或多种时,可以表明可以基于该信息对同一样本对象进行关联。

可能的实现方式中,关联信息包括关联指示和第i个样本对象对应的下述信息一种或多种:NG-AP标识、N2隧道标识、N3隧道标识、关联时间信息、服务质量流标识QFI、网络协议IP五元组、国际移动用户识别码IMSI、一般公共订阅标识符GPSI或用户永久标识符SUPI。可能的理解中,该实现方式可以是基于关联指示显性的指出需要关联,并且基于具体的信息指出具体哪些信息用于关联。关联指示可以是字符、数字等,本申请实施例对关联指示不作具体限定。

在图5对应的实施例的基础上,可能的实现方式中,第二请求消息中可以包括下述信息的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息、第三模型训练算法信息、第三模型反馈有效时间信息或第三模型收敛条件信息。上述每种信息用于向AI训练平台指示模型训练的限定对象或范围。

示例性的,切片标识信息用于指示针对某切片、切片实例、切片子实例提供所训练的模型。

示例性的,业务标识信息用于指示针对某业务提供所训练的模型;

示例性的,区域信息用于指示针对某区域提供所训练的模型;

示例性的,时间信息用于指示针对某时间段提供所训练的模型;

示例性的,终端标识信息(可以是单个终端标识、多个终端标识或终端群组标识)用于指示针对某终端提供所训练的模型;

示例性的,网络设备标识信息用于指示针对某网络设备提供所训练的模型。

示例性的,模型训练算法信息用于向AI训练平台推荐一种或多种模型训练所使用的算法,如神经网络、线性回归、随机森林、K-means聚类等;或者模型训练算法信息用于向训练平台推荐每类算法的具体的一种,如回归算法类中的逻辑斯特回归。

示例性的,模型反馈有效时间信息用于向AI训练平台指示模型反馈的有效时间,如指示训练平台在接收请求消息后24小时内反馈训练模型,超过24小时反馈的模型视为无效。

示例性的,模型收敛条件信息用于向AI训练平台指示模型在什么条件下视为已经收敛,或者理解为什么条件下训练过程完成,如AI指示训练平台在确定所训练的模型能够使得训练目标与标签值之间的和方误差小于等于0.001时则判定所训练的模型已经达到收敛。

在图5对应的实施例的基础上,可能的实现方式中,第二响应消息还包括下述的一种或多种:第三切片标识信息、第三业务标识信息、第三区域信息、第三时间信息、第三终端标识信息、第三网络设备标识信息或模型训练完成指示信息。

其中,模型训练完成指示信息,用于指示模型训练阶段已经完成。其他各信息的具体内容可以参照上述第二请求消息的描述,在此不作赘述。

需要说明的是,本申请实施例中,第一请求消息中的包括的信息、第二请求消息中的包括的信息、第一响应消息中的包括的信息以及第二响应消息中的包括的信息,可以具有交集,也可以没有,本申请实施例对此不作具体限定。

在得到目标模型后,NWDAF网元可以进行分析推理的过程。示例性的,图6示出了本申请实施例的一种分析推理的示意图。可以包括:

S601:NWDAF网元获取来自一个或多个网元的推理结果,推理结果为一个或多个网元利用子模型计算得到的,推理结果用于反映子模型对第二网络数据分析网元的目标模型的影响值。

可能的理解方式中,第一输出结果是目标模型训练阶段中根据子模型计算出的结果,而推理结果是推理阶段根据子模型计算出的结果。

可能的实现方式中,NWDAF网元可以自动触发获取来自一个或多个网元的推理结果,进而为一个或多个网元反馈目标推理分析结果。

可能的实现方式中,NWDAF网元可以基于其他网元的触发获取来自一个或多个网元的推理结果。

示例性的,因某个触发条件(本申请实施例对触发条件不作限定),第一网元(如gNB、或UE或CN中的网元)收集某样本对象j相关的本地数据,并根据第一网元的已经训练完成的本地模型计算本地中间结果。如:在UEj的语音业务执行过程中,若UEj触发测量并上报测量报告,基于测量报告RAN判定UE即将发生小区切换。基于此触发条件,RAN实时收集UEj的模型ID2(对应语音服务MOS)对应的本地数据x

f(x)=θ

第一网元向NWDAF网元上报的本地中间推理结果。例如,gNB向NWDAF网元上报第一信息,第一信息中包括中间推理结果f(x

NWDAF网元根据第一网元上报的本地模型标识(如ID2)关联出对应的其他信息。如根据ID2关联出第二网元(如CN)中的模型标识ID3,还可以关联自身需获取的原始上报数据类型x

NWDAF网元向第二网元请求模型标识ID3对应的中间推理结果。例如,NWDAF网元向第二网元发送请求消息。请求消息中携带UEj的关联信息(如UEj的SUPI,IP五元组,NG-APID或QFI等),模型标识ID3,time等信息,用于CN域获知具体需要实时获取数据的对象以及获取的数据类型。例如根据SUPI和ID3获知需要实时获取UEj的x

第二网元向NWDAF网元反馈本地模型计算的中间推理结果。例如,CN向NWDAF网元上报包括中间推理结果g(x

S602:NWDAF网元依据目标模型和一个或多个网元的中间推理结果计算目标推理结果。

本申请实施例中,NWDAF网元可以根据一个或多个网元上报的中间推理结果,以及自身获取的推理对象(如UEj)原始数据等,计算目标模型对应的目标推理结果。

例如,NWDAF网元根据g(x

S603:NWDAF网元向第二网元发送目标推理结果。

其中,第二网元为目标推理结果的订阅或使用网元。本申请实施例中,NWDAF可以应第二网元的请求而将目标推理结果发送给第二网元,NWDAF也可以在没有接收第二网元的请求情况下而主动将目标推理结果发送给第二网元。

例如,NWDAF网元可以将voice service MOS对应的在线推理值反馈给RAN,用于RAN根据获取的实时语音业务体验MOS值确定是否对UEj进行切换。

综上所述,本申请实施例可以利用离线训练和在线推理的方法,在不交换各域原始数据的情况下,达到数据分析结果对应的精度要求,从而解决了因数据隔离和安全问题导致的推理不准确的问题。

上面结合图4至图6,对本申请实施例的方法进行了说明,下面对本申请实施例提供的执行上述方法的装置进行描述。本领域技术人员可以理解,方法和装置可以相互结合和引用,本申请实施例提供的一种数据处理装置可以执行上述数据处理方法中第一网络数据分析网元所执行的步骤。另一种数据处理装置可以执行上述实施例中的数据处理方法中第二网络数据分析网元所执行的步骤。

下面以采用对应各个功能划分各个功能模块为例进行说明:

如图7所示,图7示出了本申请实施例提供的数据处理装置的结构示意图,该数据处理装置可以是本申请实施例中的第一网络数据分析网元或第二网络数据分析网元,也可以为应用于第一网络数据分析网元或第二网络数据分析网元中的芯片。该数据处理装置包括:处理单元101和通信单元102。其中,通信单元102用于支持数据处理装置执行信息发送或接收的步骤。处理单元101用于支持数据处理装置执行信息处理的步骤。

一种示例,以该数据处理装置为第一网络数据分析网元或应用于第一网络数据分析网元中的芯片或芯片系统为例,该通信单元102用于支持数据处理装置执行上述实施例中的S501、S5031、S5032、S5033、S5041、S5042、S5043和S506;或者执行上述实施例的S601和S603;等。处理单元101用于支持数据处理装置执行上述实施例中的S502和S505,或执行上述实施例中的S602,等。

另一种示例,以该数据处理装置为第二网络数据分析网元或应用于第二网络数据分析网元中的芯片或芯片系统为例,该处理单元101用于支持数据处理装置执行上述实施例中的S502和S505,或执行上述实施例中的S602,等。通信单元102用于支持数据处理装置执行上述实施例中的S501、S5031、S5032、S5033、S5041、S5042、S5043和S506;或者执行上述实施例的S601和S603;等。

在一种可能的实施例中,数据处理装置还可以包括:存储单元103。处理单元101、通信单元102、存储单元103通过通信总线相连。

存储单元103可以包括一个或者多个存储器,存储器可以是一个或者多个设备、电路中用于存储程序或者数据的器件。

存储单元103可以独立存在,通过通信总线与数据处理装置具有的处理单元101相连。存储单元103也可以和处理单元集成在一起。

数据处理装置可以用于通信设备、电路、硬件组件或者芯片中。

以数据处理装置可以是本申请实施例中的第一网络数据分析网元或第二网络数据分析网元的芯片或芯片系统为例,则通信单元102可以是输入或者输出接口、管脚或者电路等。示例性的,存储单元103可以存储第一网络数据分析网元或第二网络数据分析网元侧的方法的计算机执行指令,以使处理单元101执行上述实施例中第一网络数据分析网元或第二网络数据分析网元的方法。存储单元103可以是寄存器、缓存或者RAM等,存储单元103可以和处理单元101集成在一起。存储单元103可以是ROM或者可存储静态信息和指令的其他类型的静态存储设备,存储单元103可以与处理单元101相独立。

本申请实施例提供了一种数据处理装置,该数据处理装置包括一个或者多个模块,用于实现上述图4-图6任一个对应的实施例中的方法,该一个或者多个模块可以与上述图4-图6任一个对应的实施例的方法的步骤相对应。具体的,本申请实施例中由第一网络数据分析网元执行的方法中的每个步骤,第一网络数据分析网元中存在执行该方法中每个步骤的单元或者模块。由第二网络数据分析网元执行的方法中的每个步骤,第二网络数据分析网元中存在执行该方法中每个步骤的单元或者模块。例如,对于执行对该数据处理装置的动作进行控制或处理的模块可以称为处理模块。对于执行对在数据处理装置侧进行消息或数据处理的步骤的模块可以称为通信模块。

图8所示为本申请实施例提供的数据处理设备的硬件结构示意图。本申请实施例中的第一网络数据分析网元和第二网络数据分析网元的硬件结构均可以参考如图8所示的数据处理设备的硬件结构示意图。该数据处理设备包括处理器41,通信线路44以及至少一个通信接口(图8中示例性的以通信接口43为例进行说明)。

处理器41可以是一个通用中央处理器(central processing unit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。

通信线路44可包括一通路,在上述组件之间传送信息。

通信接口43,使用任何收发器一类的装置,用于与其他设备或通信网络通信,如以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。

可能的,该通信设备还可以包括存储器42。

存储器42可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器可以是独立存在,通过通信线路44与处理器相连接。存储器也可以和处理器集成在一起。

其中,存储器42用于存储执行本申请方案的计算机执行指令,并由处理器41来控制执行。处理器41用于执行存储器42中存储的计算机执行指令,从而实现本申请下述实施例提供的数据处理方法。

可能的,本申请实施例中的计算机执行指令也可以称之为应用程序代码,本申请实施例对此不作具体限定。

在具体实现中,作为一种实施例,处理器41可以包括一个或多个CPU,例如图8中的CPU0和CPU1。

在具体实现中,作为一种实施例,通信设备可以包括多个处理器,例如图8中的处理器41和处理器45。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

例如,以该数据处理装置为第一网络数据分析网元或应用于第一网络数据分析网元中的芯片为例,该通信接口用于支持该数据处理装置执行上述实施例中的S501、S5031、S5032、S5033、S5041、S5042、S5043和S506;或者执行上述实施例的S601和S603;等。处理器41或处理器45用于支持数据处理装置执行上述实施例中的S502和S505,或执行上述实施例中的S602,等。

在另一种示例中,以数据处理装置可以为第二网络数据分析网元或应用于第二网络数据分析网元中的芯片或芯片系统为例,该通信接口用于支持数据处理装置执行上述实施例中的S501、S5031、S5032、S5033、S5041、S5042、S5043和S506;或者执行上述实施例的S601和S603;等。处理器41或处理器45用于支持数据处理装置执行上述实施例中的S502和S505,或执行上述实施例中的S602,等。

图9是本发明实施例提供的芯片150的结构示意图。芯片150包括一个或两个以上(包括两个)处理器1510和通信接口1530。

在一种可能的实施例中,如图9所示的芯片150还包括存储器1540,存储器1540可以包括只读存储器和随机存取存储器,并向处理器1510提供操作指令和数据。存储器1540的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。

在一些实施方式中,存储器1540存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:

在本发明实施例中,通过调用存储器1540存储的操作指令(该操作指令可存储在操作系统中),执行相应的操作。

一种可能的实现方式中为:第一网络数据分析网元或第二网络数据分析网元所用的芯片的结构类似,不同的装置可以使用不同的芯片以实现各自的功能。

处理器1510控制第一网络数据分析网元或第二网络数据分析网元的操作,处理器1510还可以称为中央处理单元(central processing unit,CPU)。存储器1540可以包括只读存储器和随机存取存储器,并向处理器1510提供指令和数据。存储器1540的一部分还可以包括非易失性随机存取存储器(non-volatile random access memory,NVRAM)。例如应用中存储器1540、通信接口1530以及存储器1540通过总线系统1520耦合在一起,其中总线系统1520除包括数据总线之外,还可以包括电源总线、控制总线和状态信号总线等。但是为了清楚说明起见,在图9中将各种总线都标为总线系统1520。

以上通信单元可以是一种该装置的接口电路或通信接口,用于从其它装置接收信号。例如,当该装置以芯片的方式实现时,该通信单元是该芯片用于从其它芯片或装置接收信号或发送信号的接口电路或通信接口。

上述本发明实施例揭示的方法可以应用于处理器1510中,或者由处理器1510实现。处理器1510可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器1510中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器1510可以是通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现成可编程门阵列(field-programmable gate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器1540,处理器1510读取存储器1540中的信息,结合其硬件完成上述方法的步骤。

一种可能的实现方式中,通信接口1530用于执行图4-图6所示的实施例中的第一网络数据分析网元或第二网络数据分析网元的接收和发送的步骤。处理器1510用于执行图4-图6所示的实施例中的第一网络数据分析网元或第二网络数据分析网元的处理的步骤。

在上述实施例中,存储器存储的供处理器执行的指令可以以计算机程序产品的形式实现。计算机程序产品可以是事先写入在存储器中,也可以是以软件形式下载并安装在存储器中。

计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包括一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid statedisk,SSD)等。

本申请实施例还提供了一种计算机可读存储介质。上述实施例中描述的方法可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。如果在软件中实现,则功能可以作为一个或多个指令或代码存储在计算机可读介质上或者在计算机可读介质上传输。计算机可读介质可以包括计算机存储介质和通信介质,还可以包括任何可以将计算机程序从一个地方传送到另一个地方的介质。存储介质可以是可由计算机访问的任何目标介质。

作为一种可能的设计,计算机可读介质可以包括RAM,ROM,EEPROM,CD-ROM或其它光盘存储器,磁盘存储器或其它磁存储设备,或目标于承载的任何其它介质或以指令或数据结构的形式存储所需的程序代码,并且可由计算机访问。而且,任何连接被适当地称为计算机可读介质。例如,如果使用同轴电缆,光纤电缆,双绞线,数字用户线(DSL)或无线技术(如红外,无线电和微波)从网站,服务器或其它远程源传输软件,则同轴电缆,光纤电缆,双绞线,DSL或诸如红外,无线电和微波之类的无线技术包括在介质的定义中。如本文所使用的磁盘和光盘包括光盘(CD),激光盘,光盘,数字通用光盘(DVD),软盘和蓝光盘,其中磁盘通常以磁性方式再现数据,而光盘利用激光光学地再现数据。上述的组合也应包括在计算机可读介质的范围内。

本申请实施例还提供了一种计算机程序产品。上述实施例中描述的方法可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。如果在软件中实现,可以全部或者部分得通过计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行上述计算机程序指令时,全部或部分地产生按照上述方法实施例中描述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、基站、终端或者其它可编程装置。

以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

需要说明的是,本申请实施例中各网元在具体的应用中也可能采用其他的定义或名称,示例性的,AI训练平台可以称为第一数据分析网元或第一核心网网元,NWDAF网元可以称为第二数据分析网元或第二核心网网元,等。或者,上述两个网元也可以统一称为数据分析网元或核心网网元。或者上述两网元也可以根据实际的功能定义其他的名称,本申请实施例对此不作具体限定。

相关技术
  • 图像数据处理方法、用于图像数据处理方法的程序、记录有用于图像数据处理方法的程序的记录介质和图像数据处理装置
  • 药箱的数据处理方法、装置、数据处理方法和装置
技术分类

06120113818892