掌桥专利:专业的专利平台
掌桥专利
首页

云边协同系统、数据处理方法、电子设备及存储介质

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及边缘计算技术领域,特别是涉及一种云边协同系统、一种云边协同的数据处理方法、一种电子设备以及一种计算机可读存储介质。

背景技术

边缘计算是指在靠近或数据源头的网络边缘侧,融合网络、计算、存储、应用核心能力的开放平台,就近提供边缘智能服务,满足行业数字化在敏捷连接、实时业务、数据优化、应用智能、安全与隐私保护等方面的关键需求。例如,在能源管理、电网管理、智能家居、工业生产等应用场景中,可以通过配置对应的边缘设备以及云端设备等进行场景的数据化处理,实现相应的边缘计算场景,在提高处理效率的同时,可以有效减轻云端的负荷。

其中,通过部署不同的人工智能模型可以适用于不同的边缘计算场景,而在模型的落地过程中,存在以下难点导致人工智能模型在实际场景中难以大规模地发挥作用:

1.有效性问题:人工智能模型在部署到不同业务场景中时,由于不同的业务特点使已成功部署在场景A上的模型无法有效地直接应用于场景B上,需要大量算法工程师重新设计并训练模型,生产效率低,难以大规模推广。此外,即使模型已经在同一场景上成功部署,由于场景自身复杂且在变化,模型的数据处理性能会逐步下降,甚至出现模型失效的情况,对于模型性能下降或模型失效等情况,往往需要人工对模型进行更新升级,进一步导致了人工智能模型难以大规模推广。

2.高成本问题:为了尽可能减缓模型部署后逐步失效的情况,需要在模型生产时就收集大量且尽可能丰富的数据,这部分工作需要耗费大量的人力成本以及时间成本,且大部分情况下所收集的数据难以满足实际的需求,数据收集的难度较高。以及,边缘计算过程中,边缘端与云端之间还存在数据传输压力以及数据存储压力,容易带来较高的数据维护成本。

发明内容

本发明实施例是提供一种云边协同系统、数据处理方法、电子设备以及计算机可读存储介质,以解决或部分解决相关技术在边缘计算过程中存在模型有效性差以及数据处理成本高的问题。

本发明实施例公开了一种云边协同系统,所述云边协同系统包括模型在线更新模块、云端设备以及与所述云端设备通信连接的边缘设备;其中,

所述云端设备,用于获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

所述模型在线更新模块,用于在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据;根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

可选地,所述云边协同系统用于:

确定所述云端设备与所述边缘设备之间的数据传输量,和/或所述云端设备的数据存储量;

若所述数据传输量大于或等于第一预设数量阈值,和/或,所述数据存储量大于或等于第二预设数量阈值,则将所述模型在线更新模块部署在所述边缘设备;

若所述数据传输量小于所述第一预设数量阈值,且所述数据存储量小于所述第二预设数量阈值,则将所述模型在线更新模块部署在所述云端设备。

可选地,所述云边协同系统用于:

响应于模块处理指令,获取与所述模块处理指令对应的设备标识;

若所述设备标识为云端设备的标识,则在所述云端设备部署所述模型在线更新模块或启动预设在云端设备的模型在线更新模块;

若所述设备标识为边缘设备的标识,则在所述边缘设备部署所述模型在线更新模块或启动预设在边缘设备的模型在线更新模块。

可选地,所述模型性能信息包括所述目标业务场景对应的场景预测信息以及所述目标业务场景对应的场景预测信息的预测数据分布特征;其中,所述模型在线更新模块具体用于:

获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据。

可选地,所述模型在线更新模块具体用于:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则获取针对所述当前场景模型的第二模型训练数据。

可选地,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述模型在线更新模块还用于:

获取针对所述历史场景数据的标注信息;

采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

可选地,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述模型在线更新模块还用于:

获取针对所述全部或部分实时场景数据的标注信息;

采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

可选地,所述云端设备还包括种子模型库;其中,

所述云端设备,用于获取与所述目标场景模型对应的模型特征数据,并对所述模型特征数据与所述目标场景模型存储至所述种子模型库。

可选地,所述云边协同系统还包括数据库,所述云端设备和/或所述边缘设备包括数据采集与标注模块;其中,

所述数据采集与标注模块,用于获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据,以及对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,并将所述场景数据、所述特征向量以及所述标注数据存储至所述数据库。

可选地,所述云边协同系统还包括数据库,所述边缘设备包括第一数据采集与标注模块,所述云端设备包括第二数据采集与标注模块;其中,

所述第一数据采集与标注模块,用于获取与目标业务场景对应的场景数据,对所述场景数据进行编码,生成场景编码数据;

所述第二数据采集与标注模块,用于对所述场景编码数据进行解码,获得所述场景数据;对所述场景数据进行标注,获得与所述场景数据对应的标注数据,并对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库;

或,

所述第一数据采集与标注模块,用于获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据;对所述场景数据以及所述标注数据进行编码,生成场景编码数据;

所述第二数据采集与标注模块,用于对所述场景编码数据进行解码,获得所述场景数据以及所述标注数据;对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库。

可选地,所述云端设备还包括模型训练模块;其中,

所述模型训练模块,用于从所述种子模型库中获取与所述特征向量对应的种子模型;并根据所述场景数据与所述标注数据对所述种子模型进行模型训练,生成与所述目标业务场景对应的场景模型。

可选地,所述云端设备包括第一模型部署模块,所述边缘设备包括第二模型部署模块;其中,

所述第一模型部署模块,用于获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

所述第二模型部署模块,用于对所述场景模型进行部署,并在部署完成后对所述场景模型进行运行。

本发明实施例还公开了一种云边协同的数据处理方法,应用于云边协同系统,所述云边协同系统包括模型在线更新模块、云端设备以及与所述云端设备通信连接的边缘设备,所述方法包括:

通过所述云端设备获取边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

通过所述模型在线更新模块在运行当前场景模型的过程中,通过所述边缘设备获取当前场景模型的模型性能信息;

若所述模型性能信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取针对所述当前场景模型的模型训练数据;

通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

可选地,还包括:

确定所述云端设备与所述边缘设备之间的数据传输量,和/或所述云端设备的数据存储量;

若所述数据传输量大于或等于第一预设数量阈值,和/或,所述数据存储量大于或等于第二预设数量阈值,则将所述模型在线更新模块部署在所述边缘设备;

若所述数据传输量小于所述第一预设数量阈值,且所述数据存储量小于所述第二预设数量阈值,则将所述模型在线更新模块部署在所述云端设备。

可选地,还包括:

响应于模块处理指令,获取与所述模块处理指令对应的设备标识;

若所述设备标识为云端设备的标识,则在所述云端设备部署所述模型在线更新模块或启动预设在云端设备的模型在线更新模块;

若所述设备标识为边缘设备的标识,则在所述边缘设备部署所述模型在线更新模块或启动预设在边缘设备的模型在线更新模块。

可选地,所述模型性能信息包括所述目标业务场景对应的场景预测信息以及所述目标业务场景对应的场景预测信息的预测数据分布特征;其中,所述若所述模型性能信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取针对所述当前场景模型的模型训练数据,包括:

通过所述模型在线更新模块获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

通过所述模型在线更新模块将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

通过所述模型在线更新模块将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取与所述预测差异信息对应的模型训练数据。

可选地,所述若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取与所述预测差异信息对应的模型训练数据,包括:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则通过所述模型在线更新模块获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则通过所述模型在线更新模块获取针对所述当前场景模型的第二模型训练数据。

可选地,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

通过所述模型在线更新模块获取针对所述历史场景数据的标注信息;

通过所述模型在线更新模块采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

通过所述模型在线更新模块采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

可选地,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

通过所述模型在线更新模块获取针对所述全部或部分实时场景数据的标注信息;

通过所述模型在线更新模块采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

通过所述模型在线更新模块采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

可选地,所述云端设备还包括种子模型库,所述方法还包括:

通过所述云端设备获取与所述目标场景模型对应的模型特征数据,并对所述模型特征数据与所述目标场景模型存储至所述种子模型库。

可选地,所述云边协同系统还包括数据库,所述云端设备和/或所述边缘设备包括数据采集与标注模块,所述方法还包括:

通过所述数据采集与标注模块获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据,以及对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,并将所述场景数据、所述特征向量以及所述标注数据存储至所述数据库。

可选地,所述云边协同系统还包括数据库,所述边缘设备包括第一数据采集与标注模块,所述云端设备包括第二数据采集与标注模块,所述方法还包括:

通过所述第一数据采集与标注模块获取与目标业务场景对应的场景数据,对所述场景数据进行编码,生成场景编码数据;

通过所述第二数据采集与标注模块对所述场景编码数据进行解码,获得所述场景数据;对所述场景数据进行标注,获得与所述场景数据对应的标注数据,并对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库;

或,

通过所述第一数据采集与标注模块获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据;对所述场景数据以及所述标注数据进行编码,生成场景编码数据;

通过所述第二数据采集与标注模块对所述场景编码数据进行解码,获得所述场景数据以及所述标注数据;对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库。

可选地,所述云端设备还包括模型训练模块,所述方法还包括:

通过所述模型训练模块从所述种子模型库中获取与所述特征向量对应的种子模型;并根据所述场景数据与所述标注数据对所述种子模型进行模型训练,生成与所述目标业务场景对应的场景模型。

可选地,所述云端设备包括第一模型部署模块,所述边缘设备包括第二模型部署模块,所述方法还包括:

通过所述第一模型部署模块获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

通过所述第二模型部署模块对所述场景模型进行部署,并在部署完成后对所述场景模型进行运行。

本发明实施例还公开了一种云边协同的数据处理方法,应用于边缘设备,所述边缘设备配置有与目标业务场景对应的场景模型,所述方法包括:

获取当前场景模型的模型性能信息;

若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据;

根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

可选地,所述模型性能信息包括所述目标业务场景对应的场景预测信息,所述若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据,包括:

获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据。

可选地,所述若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据,包括:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则获取针对所述当前场景模型的第二模型训练数据。

可选地,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述历史场景数据的标注信息;

采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

可选地,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述全部或部分实时场景数据的标注信息;

采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

本发明实施例还公开了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;

所述存储器,用于存放计算机程序;

所述处理器,用于执行存储器上所存放的程序时,实现如本发明实施例所述的方法。

本发明实施例还公开了一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如本发明实施例所述的方法。

本发明实施例包括以下优点:

在本发明实施例中,云边协同系统可以包括模型在线更新模块、云端设备以及与云端设备通信连接的边缘设备,其中,云端设备可以用于获取边缘设备对应的目标业务场景以及目标业务场景对应的场景模型,模型在线更新模块可以在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若模型性能信息表征当前场景模型存在性能异常,则获取针对当前场景模型的模型训练数据;根据模型训练数据对当前场景模型进行模型更新,生成与目标业务场景对应的目标场景模型,从而在边缘计算场景中,通过对模型进行性能检测与更新,不仅降低模型维护成本,而且可以保证模型的有效性以及避免人工对模型进行升级,大大促进了模型的规模生产与落地,以及在模型更新过程中通过获取对应的训练数据,可以有效降低模型更新的数据要求,通过收集实际场景的少量样本数据,大大降低数据收集的难度。

附图说明

图1是本发明实施例中提供的一种云边协同系统的结构框图;

图2是本发明实施例中提供的云边协同系统的结构框图;

图3是本发明实施例中提供的边缘计算的流程示意图;

图4是本发明实施例中提供的数据采集与标注的流程示意图;

图5是本发明实施例中提供的模型训练的流程示意图;

图6是本发明实施例中提供的模型更新的流程示意图;

图7是本发明实施例中提供的一种云边协同的数据处理方法的流程示意图;

图8是本发明实施例中提供的一种云边协同的数据处理方法的流程示意图;

图9是本发明实施例中提供的一种电子设备的框图;

图10是本发明实施例中提供的一种计算机可读介质的示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

工业互联网是新一代信息通信技术与现代工业技术深度融合的产物,是制造业数字化、网络化、智能化的重要载体,也是新一轮产业竞争的制高点。工业互联网通过构建连接机器、物料、人、信息系统的基础网络,实现工业数据的全面感知、动态传输、实时分析,形成科学决策与智能控制,提高制造资源配置效率。对于工业互联网,其最大的价值在于全面连接了数据和实体,并且基于连接(Connect),形成了计算(Computation)和控制(Control),使得实时决策成为可能。

作为一种示例,对于电力行业,其是工业互联网领域最大细分市场之一,由于单日数据采集量庞大,而物联网整体建设存在严重不足的问题,导致了在电网运行过程中,数据不贯通,共享实时性不强,数据在提供电网安全运行水平、效率效益和工作质量等方面没有充分体现;在基础设施建设方面,存储数据存储、处理和应用的灵活性不强,快速响应需求变化能力不足等。对此,泛在电力物联网基于原有的电网基础设施,可在配电侧发挥出更大的作用,尤其是在控制和数据采集方面,可以提高电网的工作效率和供电的可靠性。而泛在电力物联网涉及到的关键技术为“云-管-边-端”,“云”指国网云等大数据、人工智能、数据挖掘平台,综合了项目管理、营销系统等数十个业务应用;“管”指通信网络,为电网信息传输提供可靠的通信管道;“边”是指部署边缘计算装置,构建电网的分布式数据中心,提升整体的边缘计算能力;“端”是指打造智能化终端和传感器产品,实现数据的实时采集,并嵌入身份认证、行为分析等安全管控产品。

在整个体系中,边缘计算处于承上启下的关键位置。首先,边缘计算可将云平台的运算能力向靠近终端的地方下沉,并融合网络传输、储存等创新技术,提高每个节点的数据处理效率,降低了时延。第二,边缘计算可以提供更精准更本地化的数据处理,只需把结果向后台反馈,因此从源头上保护了数据的安全性和隐私性。第三,边缘计算设备极大地降低了数据传输量,节省了带宽,可以实时地对前台需求做出响应,缩短了响应时间。第四,边缘计算在弱网甚至是断网的环境下服务不中断,提高了运行的稳定性。第五,边缘计算设备和端设备可以形成良好地统一,AI(Artificial Intelligence,人工智能)组件可以部署在边缘计算设备上,可实现定制化、智能化的管理需求。由此可见,边缘计算可以为客户实现一站式的管控。在整个能源互联网的建设布局中,边缘计算是重要的一环,在打通物联网终端间的壁垒,促进数据融合方面起到了不可替代的作用。

其中,对于边缘计算,其通过部署不同的人工智能模型以适用于不同的边缘计算场景,而在模型的落地过程中,存在以下难点导致人工智能模型在实际场景中难以大规模地发挥作用:

1.有效性问题:人工智能模型在部署到不同业务场景中时,由于不同的业务特点使已成功部署在场景A上的模型无法有效地直接应用于场景B上,需要大量算法工程师重新设计并训练模型,生产效率低,难以大规模推广。此外,即使模型已经在同一场景上成功部署,由于场景自身复杂且在变化,模型的数据处理性能会逐步下降,甚至出现模型失效的情况,对于模型性能下降或模型失效等情况,往往需要人工对模型进行更新升级,进一步导致了人工智能模型难以大规模推广。

2.高成本问题:为了尽可能减缓模型部署后逐步失效的情况,需要在模型生产时就收集大量且尽可能丰富的数据,这部分工作需要耗费大量的人力成本以及时间成本,且大部分情况下所收集的数据难以满足实际的需求,数据收集的难度较高。以及,边缘计算过程中,边缘端与云端之间还存在数据传输压力以及数据存储压力,容易带来较高的数据维护成本。

对此,本发明的核心发明点之一在于在云边协同系统中部署对应的模型在线更新模块,通过该模型在线更新模块在模型运行的过程中对模型的性能进行检测与更新,从而在边缘计算场景中,通过对模型进行性能检测与更新,不仅降低模型维护成本,而且可以保证模型的有效性以及避免人工对模型进行升级,大大促进了模型的规模生产与落地,以及在模型更新过程中通过获取对应的训练数据,可以有效降低模型更新的数据要求,通过收集实际场景的少量样本数据,大大降低数据收集的难度。

参照图1,示出了本发明实施例中提供的一种云边协同系统的结构框图,云边协同系统包括模型在线更新模块、至少一个云端设备以及分别与各个所述云端设备通信连接的至少一个边缘设备;其中,

所述云端设备,用于获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

所述模型在线更新模块,用于在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据;根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

具体的,对于模型在线更新模块,其可以根据实际情况进行灵活设置,在一种情况下,设备生产商可以为设备出产阶段,通过对云端设备与边缘设备之间的数据传输成本、云端设备的存储成本等进行测算,并根据测算结果,将模型在线更新模块部署在云端设备或边缘设备上;在另一种情况下,可以在云边协同系统中添加一个检测模块,通过该检测模块对对云端设备与边缘设备之间的数据传输成本、云端设备的存储成本等进行检测,并根据检测结果,将模型在线更新模块部署在云端设备或边缘设备上;在另一种情况下,用户还可以通过应用程序或硬件等与云边协同系统进行数据通信,并向云边协同系统发送模块处理指令,以便云边协同系统在云端设备或边缘设备上部署模型在线更新模块,或者启动预设在云端设备的模型在线更新模块,或者启动预设在边缘设备的模型在线更新模块等,从而通过对实际的数据传输成本与存储成本等进行测算,可以灵活调整模型在线更新模块的部署或运行位置,可以有效满足用户的不同需求,大大提高了云边协同系统数据处理的普适性。

其中,对于云边系统系统对模型在线更新模块的自适应部署或启动,具体可以为:云边协同系统可以先确定云端设备与边缘设备之间的数据传输量,和/或云端设备的数据存储量,若数据传输量大于或等于第一预设数量阈值,和/或,数据存储量大于或等于第二预设数量阈值,则将模型在线更新模块部署在边缘设备;若数据传输量小于第一预设数量阈值,且数据存储量小于第二预设数量阈值,则将模型在线更新模块部署在云端设备。

在具体实现中,可以在云边协同系统的云端设备中配置一个模型部署与启动模块,当模型部署与启动模块检测到数据传输量、数据存储量满足条件时,若云端设备自身已有模型在线更新模块,则可以对该模块进行启动,若云端设备自身没有对应的模型在线更新模块,则可以从边缘设备或其他云端设备等获取模型在线更新模块,然后对该模型在线更新模块进行部署。例如,对于前者,模型在线更新模块可以为硬件或软件的方式预先部署在云端设备,在数据传输量和数据存储量均小于对应的阈值的情况下,云端设备可以直接启动模型在线更新模块,对模型运行性能进行检测与更新,以便保证模型的有效性;对于后者,模型在线更新模块可以为软件的形式,在数据传输量和数据存储量均小于对应的阈值的情况下,由于云端设备自身没有模型在线更新模块,则其可以通过相应的途径获取模型在线更新模块,并对其进行部署,对模型运行性能进行检测与更新,以便保证模型的有效性,本发明对此不作限制。

对于用户对模型在线更新模块的个性化部署,具体可以为:云边协同系统可以响应于模块处理指令,获取与模块处理指令对应的设备标识,若设备标识为云端设备的标识,则在云端设备部署模型在线更新模块或启动预设在云端设备的模型在线更新模块;若设备标识为边缘设备的标识,则在边缘设备部署模型在线更新模块或启动预设在边缘设备的模型在线更新模块。需要说明的是,对于在边缘设备部署模型在线更新模块,其可以参考前述描述,在此不再赘述。

在一种示例中,以将模型在线更新模块部署在边缘设备为例进行示例性说明,参照图2,示出了本发明实施例中提供的云边协同系统的结构框图,在云端设备中可以包括数据采集与标注模块、模型训练模块、模型部署模块以及种子模型库等,在边缘设备可以包括数据采集与标注模块、模型在线更新模块以及模型部署模块等,通过将模型在线更新模块部署在边缘设备,实现将场景模型部署在边缘设备,由边缘设备对场景模型进行运行、检测以及更新等,从而一方面通过将场景模型部署在边缘设备,减少了边缘设备与云端设备之间的数据传输,不仅可以降低数据传输成本,还可以保证数据的私密性与安全性,另一方面通过在边缘设备对模型进行性能检测与更新,降低模型维护成本,通过在边缘设备采集模型更新所需的与业务场景对应的数据,降低了模型更新的数据要求,基于少量样本数据即可完成模型更新,大大促进了模型的规模生产与落地。

参照图3,示出了本发明实施例中提供的边缘计算的流程示意图,对于云边协同系统,当接收到客户传来的数据流后,位于边缘设备和/或云端设备的数据采集与标注模块可以用于对传输来的场景数据进行数据质量评价与清洗,清洗后的数据使用半自动化数据标注进行数据标注,标注后进行数据特征提取,将原始图片、提取的数据特征和标注信息存放在数据库中。接着可以将标注好的数据和数据特征一起输入至云端的模型训练模块,模型训练模块可以将当前数据特征与种子模型库中的数据特征进行对比,提取与场景最相近的种子模型并在此模型基础上训练微调。针对训练好的模型,一方面存入种子模型库,另一方面输入模型部署模块进行模型压缩、量化并将模型部署在对应的边缘设备上。在模型的运行过程中,位于边缘设备上的模型在线更新模块可以对部署好的模型进行模型性能评估,当检测到模型性能下降或数据分布发生变化后,在边缘设备上开启在线学习,依照模型性能下降的程度对模型进行有监督或无监督的增量训练,完成模型的自我进化与升级,从而通过构建云边协同系统,将场景模型部署在边缘设备上,减少了边缘设备与云端设备之间的数据传输,不仅可以降低数据传输成本,还可以包括数据的私密性与安全性,同时通过在边缘设备对模型进行性能检测与更新,降低模型维护成本。

在本发明实施例中,对于数据采集与标注模块,其可以部署在云端设备,也可以部署在边缘设备,还可以同时部署在云端设备以及边缘设备。

在一种可选实施例中,云边协同系统还包括可以数据库,云端设备和/或边缘设备包括数据采集与标注模块,则对于数据采集与标注模块,其可以用于获取与目标业务场景对应的场景数据,并对场景数据进行标注,获得与场景数据对应的标注数据,以及对标注数据进行特征提取,获得与场景数据对应的特征向量,并将场景数据、特征向量以及标注数据存储至数据库,从而通过在云端设备或边缘设备进行单边部署,可以有效简化云边协同系统的结构,提高系统运行的效率,且若通过双边部署,则可以充分发挥云端设备以及边缘设备两者的运算能力,提高数据标注、特征提取的准确性。

在另一种可选实施例中,假设边缘设备包括第一数据采集与标注模块,云端设备包括第二数据采集与标注模块,则在一种情况下,第一数据采集与标注模块,用于获取与目标业务场景对应的场景数据,对场景数据进行编码,生成场景编码数据;第二数据采集与标注模块,用于对场景编码数据进行解码,获得场景数据;对场景数据进行标注,获得与场景数据对应的标注数据,并对标注数据进行特征提取,获得与场景数据对应的特征向量,将场景数据、标注数据以及特征向量存储至数据库。

在另一种情况下,第一数据采集与标注模块可以用于获取与目标业务场景对应的场景数据,并对场景数据进行标注,获得与场景数据对应的标注数据;对场景数据以及标注数据进行编码,生成场景编码数据;第二数据采集与标注模块可以用于对场景编码数据进行解码,获得场景数据以及标注数据;对标注数据进行特征提取,获得与场景数据对应的特征向量,将场景数据、标注数据以及特征向量存储至数据库。

需要说明的是,对于前者,边缘设备可以作为数据采集设备,在采集到对应的场景数据后,将场景数据压缩并发送至云端设备,有云端设备对场景数据进行标注、特征提取,得到目标数据,从而利用边缘设备进行数据采集,可以有效减少云端设备的数据收集工作量,同时利用云端设备其强大的数据运算能力进行数据标注、特征提取等数据处理,有效地保证了数据处理的准确性,为后续进行模型训练提供了较好的基础条件。而对于后者,边缘设备一方面可以作为数据采集设备,另一方面可以对所采集的数据进行初步的数据标注、特征提取等数据质量评估与清洗,接着再将数据质量评估与清洗后的数据发送至云端设备,由云端设备进行二次数据质量评估与清洗,通过多次数据质量评估与清洗有效地提高了数据准确性与有效性,为后续进行模型训练提供了较好的基础条件,从而在边缘计算过程中,用户可以根据实际需求对数据采集与标注模块的部署方式进行灵活地选择,有效地满足了不同边缘场景的需求,提高了云边协同系统数据处理的通用性。

在一种示例中,当云端设备与边缘设备之间的数据传输与存储压力较小时,可以选择将数据采集与标注模块部署在云端设备,通过数据采集与标注模块对所收集到的场景数据依次进行数据质量评价与清洗(质量评价包括但不限于图片模糊判别、异常判别、缺失值统计等,清洗包含但不限于冗余数据去除、缺失值填补、异常值剔除或纠正等)、半自动化标注、数据特征提取,将原始数据、数据特征与标注信息存放在数据库中。数据特征提取可以分为显性特征提取和隐性特征提取,显性特征如检测到的目标类别为猫,隐性特征如使用特征提取器对图片特征进行提取,形成特征向量,从而通过单边部署,充分发挥各侧的设备性能。

当云端设备与边缘设备之间的数据传输与存储压力较大时,则可以选择在云端设备与边缘端同时部署数据采集与标注模块,边缘设备的数据采集与标注模块可以用来对收集到的场景数据依次进行数据质量评价与清洗、数据压缩编码并传输到云端设备,云端设备的数据采集与标注模块用来对数据进行解码,解码后的数据使用半自动化数据标注进行数据标注,标注后的数据进行数据特征提取,最后将原始数据、数据特征和标注信息存放在数据库中,从而通过多边部署,有效减轻了各侧的数据处理压力,通过利用边缘设备与云端设备自身的场景优势(边缘设备可以实时采集业务场景对应的场景数据,云端设备具有较强的数据运算能力等)进行数据处理,有效提高了云边协同运算的数据处理效率。

可选地,场景数据可以为与业务场景对应的数据,例如,在光照亮度检测场景中,场景数据可以白天每小时的亮度数据;在变电站刀闸开合的识别场景中,场景数据可以为刀闸视频流等。特征向量可以用于表征场景数据的数据特征,如显性特征以及阴性特征等。标注数据可以为对场景数据进行数据标注得到的数据,不同数据存储类型的场景数据可以对应不同的标注数据,如图片类型的数据可以对应图像标注数据、视频类型的数据可以对应视频标注数据等,本发明对此不作限制。

在一种示例中,参照图4,示出了本发明实施例中提供的数据采集与标注的流程示意图,假设在边缘设备与云端设备均部署了对应的数据采集与标注模块,则部署在边缘设备上的第一数据采集与标注模块在接收到客户数据流之后,可以对客户数据流进行质量评价与清洗,并在完成质量评价与清洗后,所数据进行压缩,并将压缩后的数据传输至云端设备。云端设备在接收到边缘设备发送的压缩数据后,可以通过第二数据采集与标注模块对压缩数据进行解码,然后对解码后的数据进行半自动化标注、数据特征提取等,并将处理后的数据存储至对应的数据库,如种子模型库中,从而完成场景数据的质量评价与清洗,得到目标数据,以便后续进行模型训练。

在本发明实施例中,云端设备还包括模型训练模块,则当完成数据质量评价与清洗之后,云端设备可以通过模型训练模块从种子模型库中获取与特征向量对应的种子模型;并根据场景数据与标注数据对种子模型进行模型训练,生成与目标业务场景对应的场景模型。

在具体实现中,模型训练模块可以先将特征向量与种子模型库中存储的过往业务场景的数据特征进行场景特征匹配,如可以通过类别相似度匹配(例如,新场景为图像识别,具体为波斯猫识别,种子模型库中有猫的图像识别,则匹配相似度高等),也可以通过特征匹配(例如,对特征向量余弦距离等相似度),还可以是两者的结合等,从而通过场景特征匹配从种子模型库中筛选出最匹配的种子模型作为初始模型,接着在这个初始模型的基础上,通过相应的场景数据与标注数据对初始模型进行模型训练,得到满足业务场景的场景模型,进而通过在种子模型库中对过往部署成功的场景模型进行存储,可以在训练新业务场景的场景模型的情况下,基于已有的种子模型进行模型训练,有效地提高了模型训练的效率。

此外,在云端设备和边缘设备上还可以包括模型部署模块,用于对场景模型部署,具体的,云端设备可以包括第一模型部署模块,边缘设备包括第二模型部署模块,则第一模型部署模块用于获取边缘设备对应的目标业务场景以及目标业务场景对应的场景模型,第二模型部署模块用于对场景模型进行部署,并在部署完成后对场景模型进行运行。

其中,业务场景可以为边缘计算中边缘设备进行数据处理的场景,例如,在能源智能化领域中,业务场景可以为变电站刀闸开合的识别场景、光伏发电量预测场景、户用园区用电量检测场景等等。对于不同的业务场景,其所对应的边缘设备可以不同,则不同的边缘设备上可以部署有适配于业务场景的场景模型,通过场景模型可以执行与业务场景对应的数据处理,以实现边缘计算。

在一种示例中,参照图5,示出了本发明实施例中提供的模型训练的流程示意图,云端设备可以通过模型训练模块将所获取的标注数据与场景特征与种子模型库中存储的场景特征进行场景特征匹配,提取与需要训练模型的业务场景对应的种子模型,接着根据标注数据与场景特征对种子模型进行训练微调,得到训练好的模型。同时,可以将训练好的模型存储到种子模型库中,丰富所存储的种子模型的类型,进而可以在训练新业务场景的场景模型的情况下,基于已有的种子模型进行模型训练,有效地提高了模型训练的效率。

当在边缘设备上完成场景模型的部署之后,在场景模型的运行过程中,部署在边缘设备上的模型在线更新模块可以对场景模型的运行性能进行检测,以便在模型性能下降的情况下,进行训练更新,保证场景模型的有效性。

在具体实现中,部署在边缘设备的模型在线更新模块,其可以包括模型性能评估、数据特征提取以及模型更新等功能。其中,模型性能评估可以对当前正在运行的场景模型进行运行性能的评估;数据特征提取可以对场景数据进行特征提取(例如,数据特征可以为显性特征或隐性特征,显性特征如检测到的目标类别为猫,隐性特征为使用特征提取器对图片特征进行提取,形成特征向量);模型更新可以根据模型运行性能的下降程度选择对应的模型更新训练方式进行模型更新等。

在本发明实施例中,模型在线更新模块可以用于在训练好的模型上线运行或当前场景模型运行过程中,通过模块中的模型性能评估功能会对模型性能和数据分布进行检测,并记录对应的数据特征。当检测到模型性能可能下降或数据分布特征发生改变后,可以对模型性能的下降程度进行判断,如果模型性能下降较小,则开启无监督模型更新训练,如果模型性能下降较大,则可以使用半自动化标注方法对现场采集的实时数据流图片进行标注,然后开启有监督模型更新训练,从而通过在边缘设备对模型进行性能检测与更新,降低模型维护成本,通过在边缘设备采集模型更新所需的与业务场景对应的数据,降低了模型更新的数据要求,基于少量样本数据即可完成模型更新,大大促进了模型的规模生产与落地。

可选地,以将场景模型部署在边缘设备为例进行示例性说明,对应的,可以将模型在线更新模块部署在边缘设备,由边缘设备对模型运行、检测以及更新进行处理,可以理解的是,场景模型以及模型在线更新模块部署还可以部署在云端设备,其数据处理过程与边缘设备相同,本发明对此不作限制。

具体的,对于边缘设备运行的当前场景模型,其可以为部署于边缘设备的首个场景模型,此时的场景模型未进行任何更新,可以为云端设备通过收集与业务场景对应的场景数据进行训练得到的模型;也可以为部署在边缘设备上,并在运行过程中已经进行至少一次更新的模型,本发明对此不作限制。可选地,对于模型性能信息,其可以为表征模型运行性能是否满足业务场景中数据处理要求的信息,例如模型的预测性能是否满足预测要求,模型的检测性能是否满足检测要求等等。

在本发明实施例中,边缘设备可以通过模型性能信息对当前运行的场景模型的性能进行检测,以便判断是否对当前场景模型进行模型更新。其中,模型性能信息可以包括目标业务场景对应的场景预测信息以及场景预测信息对应的预测数据分布特征等,在场景模型的运行性能能够直接被检测的情况下,可以通过场景预测信息对场景模型的运行性能进行评估;在场景模型的运行性能无法直接被检测的情况下,可以通过场景预测信息所对应的预测数据分布特征对场景模型的运行性能进行评估,前者可以从模型层面对场景模型的运行性能进行评估,后者可以从数据层面对场景模型的运行性能进行评估,从而针对不同的场景模型,可以选择与其适配的评估方式对模型的运行性能进行评估,以判断是否对边缘设备当前运行的场景模型进行更新。

在具体实现中,若预设差异信息满足目标业务场景对应的第一预测异常条件,且数据分布差异信息满足目标业务场景对应的第一数据分布异常条件,则获取针对当前场景模型的第一模型训练数据;若预设差异信息满足目标业务场景对应的第二预测异常条件或数据分布差异信息满足目标业务场景对应的第二数据分布异常条件,则获取针对当前场景模型的第二模型训练数据。

对于可以从模型层面进行性能评估的场景模型,边缘设备可以通过模型在线更新模块先获取当前场景模型对应的场景参考信息,接着将场景预测信息与场景参考信息进行比对,获得预测差异信息,若预测差异信息表征当前场景模型存在性能异常,则获取与预测差异信息对应的模型训练数据。其中,预测差异信息可以用于表征场景模型运行性能的异常程度,对于不同的异常程度,可以选择不同的模型更新方式,具体的,若预测差异信息满足目标业务场景对应的第一预测异常条件,则获取与第一预测异常条件对应的第一模型训练数据;若预测差异信息满足目标业务场景对应的第二预测异常条件,则获取与第二预测异常条件对应的第二模型训练数据。

其中,场景预测信息可以为当前场景模型根据场景数据进行实时预测的预测结果信息;场景参考信息可以为评估当前场景模型的参考结果信息,则通过将场景预测信息与场景参考信息进行比对,可以实现当前场景模型的预测结果与参考结果之间比对,并通过比对后得到的预测差异信息,实现对当前场景模型的模型性能评估。此外,对于模型更新条件,其可以为判断场景模型采用什么方式进行模型更新的条件,其中,第一预测异常条件可以为场景模型性能下降较少的情况下选择第一更新方式进行模型更新的条件,第二预测异常条件可以为场景模型性能下降较大的情况下选择第二更新方式进行模型更新的条件,不同的更新方式对应不同的模型训练数据。可选地,对于模型更新条件,由于不同的业务场景对应不同的场景模型,则模型更新条件可以根据实际业务场景进行调整,例如,在电力场景中,业务场景以检测准确率为衡量标准时,则模型更新条件可以为准确率阈值(如第一准确率阈值、第二准确率阈值等);当以检测数量为衡量标准时,则模型更新条件可以为数量阈值(如第一数量阈值、第二数量阈值等),本发明对此不作限制。

在一种示例中,场景预测信息可以为当前场景模型的场景预测值,场景参考信息可以为当前场景模型的场景参考值,则可以将场景预测值与场景参考值进行比对,得到两者的差值。例如,针对当前场景模型,可以将第一预测异常条件设置为第一阈值,将第二更新条件设置为第二阈值,其中,第二阈值大于第一阈值,且第一阈值与第二阈值为大于0的数值,则当场景预测值与场景参考值之间的差值大于第一阈值且小于第二阈值时,模型在线更新模块可以获取与第一更新条件对应的第一模型训练数据;当场景预测值与场景参考值之间的差值大于第二阈值时,模型在线更新模块可以获取与第二更新条件对应的第二模型训练数据,以便根据对应的模型训练数据进行模型训练。

对于可以从数据层面进行性能评估的场景模型,边缘设备可以通过模型在线更新模块先获取当前场景模型对应的参考数据分布特征,接着将场景数据分布特征与场景数据分布特征进行比对,获得数据分布差异信息,若数据分布差异信息表征当前场景模型存在性能异常,则获取与数据分布差异信息对应的模型训练数据。其中,数据分布差异信息可以用于表征场景模型运行性能的异常程序,具体的,若数据分布差异信息满足目标业务场景对应的第一数据分布异常条件,则获取与第一数据分布异常条件对应的第一模型训练数据;若数据分布差异信息满足目标业务场景对应的第二数据分布异常条件,则获取与第二数据分布异常条件对应的第二模型训练数据。

其中,预测数据分布特征可以为当前场景模型运行过程中所输出的模型预测结果所对应的数据分布特征;参考数据分布特征可以为当前场景模型标准运行状态下输出的模型预测结果所对应的数据分布特征,在模型运行未出现异常的情况下,其预测结果所对应的数据分布特征可以为参考数据分布特征,则通过将预测数据分步特征与参考数据分布特征,可以实现当前场景模型的预测结果所对应的数据特征与参考结果所对应的数据特征之间比对,并通过比对后得到的数据特征差异,实现对当前场景模型的模型性能评估。可选地,对于模型更新条件,其可以参考前述描述,在此不再赘述。

在一种示例中,预测数据分布特征可以为当前场景模型在运行过程中预测结果所对应的数据分布,参考数据分布特征可以为当前场景模型运行过程中理想的预测结果所对应的数据分布,则可以将两者进行比对,判断预测数据分布特征是否存在异常。例如,在光照亮度检测场景中,场景模型可以对亮度值进行检测并输出对应的亮度曲线,在场景模型性能正常的情况下,亮度曲线可以为一条平滑的曲线,在场景模型性能下降或异常的情况下,亮度曲线可以为存在多个波峰的曲线,则通过将两条曲线进行比对,确定曲线的偏移量,然后与预设的第一偏移阈值和第二偏移阈值进行比对,其中,第二偏移阈值大于第一偏移阈值,则当场景预测值与场景参考值之间的差值大于第一偏移阈值且小于第二偏移阈值时,模型在线更新模块可以获取与第一更新条件对应的第一模型训练数据;当场景预测值与场景参考值之间的差值大于第二偏移阈值时,模型在线更新模块可以获取与第二更新条件对应的第二模型训练数据,以便根据对应的模型训练数据进行模型训练。

需要说明的是,本发明实施例中以第一预测异常条件和第二预测异常条件为例进行示例性说明,可以理解的是,在本发明实施例的指导下,还可以针对模型性能设置梯度下降策略的更新方式,从而通过判断模型性能的下降程度,以便根据下降程度选择合适的模型更新方式对模型进行更新,提高模型预测的准确性以及有效性。

此外,对于模型异常检测,还可以使用基于深度学习自编码的异常检测方法、自编码器异常检测方案结合背景建模的方法和基于数据分类的方法、数据模式漂移检测的方法等,本发明对此不作限制。

在本发明实施例中,由于模型更新条件的差异,场景模型性能下降程度不同,边缘设备可以通过模型在线更新模块采用不同的更新方式进行更新,更新方式不同则所对应的模型训练数据也不同。

对于可以从模型层面进行性能评估的场景模型,边缘设备可以通过模型在线更新模块采用第一模型训练数据进行模型更新。其中,第一模型训练数据包括目标业务场景对应的实时场景数据以及历史场景数据,则模型在线更新模块可以先获取针对历史场景数据的标注信息,接着采用标注信息对全部或部分历史场景数据进行标注,获得目标历史场景数据,然后采用实时场景数据与目标历史场景数据对当前场景模型进行模型训练,生成与目标业务场景对应的目标场景模型。

对于可以从数据层面进行性能评估的场景模型,边缘设备可以通过模型在线更新模块采用第二模型训练数据进行模型更新。其中,第二模型训练数据包括目标业务场景对应的全部或部分实时场景数据以及历史场景数据,则模型在线更新模块可以先获取针对全部或部分实时场景数据的标注信息,接着采用标注信息对全部或部分实时场景数据进行标注,生成目标业务场景数据,然后采用目标业务场景数据与历史场景数据对当前场景模型进行模型训练,生成与目标业务场景对应的目标场景模型。

具体的,当模型性能下降较小时,可以通过无监督模型更新的方式对当前场景模型进行更新,以便在保证模型有效更新的同时,减少模型更新的时间。其中,实时场景数据可以为业务场景所产生的场景数据,模型在线更新模块可以将实时场景数据输入当前场景模型进行数据处理,得到对应的预测结果;历史场景数据,可以包括在先的场景数据以及对场景数据进行标注的标注信息,例如,场景数据①-标注信息A、场景数据②-标注信息B以及场景数据③-标注信息C等,场景数据可以为场景模型的输入数据,标注信息则可以为场景模型的输出数据,从而通过将历史场景数据与实时场景数据对当前场景模型进行模型更新,可以在保留历史数据分布记忆的情况下,结合实时的场景数据进行训练,符合当前数据分布,不仅可以保证模型的准确性与有效性,而且通过少量的实时场景数据,可以有效减少训练样本的收集,降低数据收集成本。当模型性能下降较大时,由于通过无监督模型更新策略已经无法将模型性能重新提升到可用的程度,则可以通过有监督模型更新的方式对当前场景模型进行更新,具体的,可以先使用半自动化标注的方式对实时场景数据进行标注,接着将标注后的实时场景数据、历史场景数据结合在一起,对当前场景模型进行有监督更新训练,以便保证模型的有效性,从而通过在模型在线更新模块对模型进行性能检测与更新,降低模型维护成本,通过在边缘设备采集模型更新所需的与业务场景对应的数据,降低了模型更新的数据要求,基于少量样本数据即可完成模型更新,大大促进了模型的规模生产与落地。

在一种示例中,当预测差异信息表征模型性能有小幅下降或预测数据分布特征表征当前场景模型有较小偏移,则模型在线更新模块可以通过模型在线更新模块直接使用无标注实时数据流和已标注历史数据进行模型更新。具体的,已标注历史数据进行正常的训练,无标注实时数据有多种方式实现模型训练,包括但不限于:1.基于伪标签的模型训练更新方案,即使用当前场景模型对无标注实时数据预测出伪标签,在此基础上结合已标注的历史数据进行模型更新;2.基于一致性正则化的模型训练方案,例如,对同一张未标注图片分别进行简单的数据扩充变换和复杂的数据扩充变换得到两张不同的图片,由于在数据扩充变换过程中图像中的目标语义信息不发生变化,这两张图片的语义信息不发生改变,因此通过增加对两张图片语义信息一致性的约束来对模型进行训练。

当预测差异信息表征模型性能有大幅下降或预测数据分布特征表征当前场景模型有较大偏移,则可以通过模型在线更新模块先对实时场景数据进行标注,例如,可以图像标注、语音标注、文本标注以及视频标注等方式对实时场景数据进行标注,接着再将标注后的实时场景数据和已经标注的历史场景数据结合到一起对当前场景模型进行更新训练,从而针对场景模型的性能下降程度,通过不同的方式进行模型更新训练,在通过模型更新训练保证模型运行性能有效性的同时,通过不同的更新训练方式提高了模型训练的灵活性,以及通过在边缘设备采集模型更新所需的与业务场景对应的数据,降低了模型更新的数据要求,基于少量样本数据即可完成模型更新,大大促进模型的规模生产与落地。

在一种示例中,参照图6,示出了本发明实施例中提供的模型更新的流程示意图,对于已经成功部署在边缘设备上的场景模型,可以通过模型在线更新模块对当前场景模型进行模型性能评估,当检测到模型性能下降时,则可以获取实时数据流以及历史带标注的缓存数据,接着根据模型性能下降程度的大小,选择无监督模型更新或有监督模型更新,并在更新完成之后,将更新后的目标场景模型发送至种子模型库中进行存储,以丰富种子模型库中种子模型的种类。此外,在获取实时数据流的同时,可以对其进行数据特征提取,并将数据特征存储至种子模型库中,以及在有监督模型训练更新的过程中,可以通过半自动化标注的方式对训练数据进行标注,并将标注后的数据存储至数据库中,从而通过对数据进行存储,有利于模型训练过程中,可以直接提取,提高模型训练的效率。

需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明实施例的思想指导下,还可以根据实际需求进行设置,例如,使用基于自适应增量学习的方式,或在上述示例的基础上加入其它有益于模型训练的结构与技巧等,本发明对此不作限制。

此外,当完成模型更新训练后,可以替换掉旧的场景模型,并在新场景模型运行的过程中,继续对模型性能进行检测,以便在模型性能下降的情况下,继续对场景模型进行更新训练,以便保证场景模型的有效性。同时,当完成场景模型更新训练之后,可以将更新后的场景模型发送至云端设备,以存储到云端设备的种子模型库中,且在存储场景模型的同时,可以将训练更新场景模型所对应的训练数据一起进行存储,以便在需要部署模型或训练模型的情况下,可以通过种子模型库中存储的种子模型和训练数据等,快速训练适配于不同业务场景的场景模型。

对于种子模型库,当在边缘设备通过模型在线更新模块对场景模型更新训练完毕后,可以将更新后的目标场景模型以及更新训练过程中所对应的数据发送至云端设备,由云端设备上的种子模型库对模型特征数据与目标场景模型进行存储。

需要说明的是,本发明实施例包括但不限于上述示例,可以理解的是,本领域技术人员在本发明实施例的思想指导下,还可以根据实际需求进行设置,本发明对此不作限制。

在本发明实施例中,云边协同系统可以包括模型在线更新模块、云端设备以及与云端设备通信连接的边缘设备,其中,云端设备可以用于获取边缘设备对应的目标业务场景以及目标业务场景对应的场景模型,模型在线更新模块可以在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若模型性能信息表征当前场景模型存在性能异常,则获取针对当前场景模型的模型训练数据;根据模型训练数据对当前场景模型进行模型更新,生成与目标业务场景对应的目标场景模型,从而在边缘计算场景中,通过对模型进行性能检测与更新,不仅降低模型维护成本,而且可以保证模型的有效性以及避免人工对模型进行升级,大大促进了模型的规模生产与落地,以及在模型更新过程中通过获取对应的训练数据,可以有效降低模型更新的数据要求,通过收集实际场景的少量样本数据,大大降低数据收集的难度。

参照图7,示出了本发明实施例中提供的一种云边协同的数据处理方法的流程示意图,应用于云边协同系统,所述云边协同系统包括模型在线更新模块、云端设备以及与所述云端设备通信连接的边缘设备,具体可以包括如下步骤:

步骤701,通过所述云端设备获取边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

步骤702,通过所述模型在线更新模块在运行当前场景模型的过程中,通过所述边缘设备获取当前场景模型的模型性能信息;

步骤703,若所述模型性能信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取针对所述当前场景模型的模型训练数据;

步骤704,通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,还包括:

确定所述云端设备与所述边缘设备之间的数据传输量,和/或所述云端设备的数据存储量;

若所述数据传输量大于或等于第一预设数量阈值,和/或,所述数据存储量大于或等于第二预设数量阈值,则将所述模型在线更新模块部署在所述边缘设备;

若所述数据传输量小于所述第一预设数量阈值,且所述数据存储量小于所述第二预设数量阈值,则将所述模型在线更新模块部署在所述云端设备。

在一种可选实施例中,还包括:

响应于模块处理指令,获取与所述模块处理指令对应的设备标识;

若所述设备标识为云端设备的标识,则在所述云端设备部署所述模型在线更新模块或启动预设在云端设备的模型在线更新模块;

若所述设备标识为边缘设备的标识,则在所述边缘设备部署所述模型在线更新模块或启动预设在边缘设备的模型在线更新模块。

在一种可选实施例中,所述模型性能信息包括所述目标业务场景对应的场景预测信息以及所述目标业务场景对应的场景预测信息的预测数据分布特征;其中,所述若所述模型性能信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取针对所述当前场景模型的模型训练数据,包括:

通过所述模型在线更新模块获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

通过所述模型在线更新模块将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

通过所述模型在线更新模块将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取与所述预测差异信息对应的模型训练数据。

在一种可选实施例中,所述若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则通过所述模型在线更新模块获取与所述预测差异信息对应的模型训练数据,包括:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则通过所述模型在线更新模块获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则通过所述模型在线更新模块获取针对所述当前场景模型的第二模型训练数据。

在一种可选实施例中,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

通过所述模型在线更新模块获取针对所述历史场景数据的标注信息;

通过所述模型在线更新模块采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

通过所述模型在线更新模块采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述通过所述模型在线更新模块根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

通过所述模型在线更新模块获取针对所述全部或部分实时场景数据的标注信息;

通过所述模型在线更新模块采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

通过所述模型在线更新模块采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述云端设备还包括种子模型库,所述方法还包括:

通过所述云端设备获取与所述目标场景模型对应的模型特征数据,并对所述模型特征数据与所述目标场景模型存储至所述种子模型库。

在一种可选实施例中,所述云边协同系统还包括数据库,所述云端设备和/或所述边缘设备包括数据采集与标注模块,所述方法还包括:

通过所述数据采集与标注模块获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据,以及对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,并将所述场景数据、所述特征向量以及所述标注数据存储至所述数据库。

在一种可选实施例中,所述云边协同系统还包括数据库,所述边缘设备包括第一数据采集与标注模块,所述云端设备包括第二数据采集与标注模块,所述方法还包括:

通过所述第一数据采集与标注模块获取与目标业务场景对应的场景数据,对所述场景数据进行编码,生成场景编码数据;

通过所述第二数据采集与标注模块对所述场景编码数据进行解码,获得所述场景数据;对所述场景数据进行标注,获得与所述场景数据对应的标注数据,并对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库;

或,

通过所述第一数据采集与标注模块获取与目标业务场景对应的场景数据,并对所述场景数据进行标注,获得与所述场景数据对应的标注数据;对所述场景数据以及所述标注数据进行编码,生成场景编码数据;

通过所述第二数据采集与标注模块对所述场景编码数据进行解码,获得所述场景数据以及所述标注数据;对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量,将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库。

在一种可选实施例中,所述云端设备还包括模型训练模块,所述方法还包括:

通过所述模型训练模块从所述种子模型库中获取与所述特征向量对应的种子模型;并根据所述场景数据与所述标注数据对所述种子模型进行模型训练,生成与所述目标业务场景对应的场景模型。

在一种可选实施例中,所述云端设备包括第一模型部署模块,所述边缘设备包括第二模型部署模块,所述方法还包括:

通过所述第一模型部署模块获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

通过所述第二模型部署模块对所述场景模型进行部署,并在部署完成后对所述场景模型进行运行。

在本发明实施例中,云边协同系统可以包括模型在线更新模块、云端设备以及与云端设备通信连接的边缘设备,其中,云端设备可以用于获取边缘设备对应的目标业务场景以及目标业务场景对应的场景模型,模型在线更新模块可以在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若模型性能信息表征当前场景模型存在性能异常,则获取针对当前场景模型的模型训练数据;根据模型训练数据对当前场景模型进行模型更新,生成与目标业务场景对应的目标场景模型,从而在边缘计算场景中,通过对模型进行性能检测与更新,不仅降低模型维护成本,而且可以保证模型的有效性以及避免人工对模型进行升级,大大促进了模型的规模生产与落地,以及在模型更新过程中通过获取对应的训练数据,可以有效降低模型更新的数据要求,通过收集实际场景的少量样本数据,大大降低数据收集的难度。

参照图8,示出了本发明实施例中提供的一种云边协同的数据处理方法的流程示意图,应用于边缘设备,所述边缘设备配置有与目标业务场景对应的场景模型,具体可以包括如下步骤:

步骤801,获取当前场景模型的模型性能信息;

步骤802,若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据;

步骤803,根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述模型性能信息包括所述目标业务场景对应的场景预测信息,所述若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据,包括:

获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据。

在一种可选实施例中,所述若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据,包括:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则获取针对所述当前场景模型的第二模型训练数据。

在一种可选实施例中,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述历史场景数据的标注信息;

采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述全部或部分实时场景数据的标注信息;

采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在本发明实施例中,云边协同系统可以包括模型在线更新模块、云端设备以及与云端设备通信连接的边缘设备,其中,云端设备可以用于获取边缘设备对应的目标业务场景以及目标业务场景对应的场景模型,模型在线更新模块可以在运行当前场景模型的过程中,获取当前场景模型的模型性能信息;若模型性能信息表征当前场景模型存在性能异常,则获取针对当前场景模型的模型训练数据;根据模型训练数据对当前场景模型进行模型更新,生成与目标业务场景对应的目标场景模型,从而在边缘计算场景中,通过对模型进行性能检测与更新,不仅降低模型维护成本,而且可以保证模型的有效性以及避免人工对模型进行升级,大大促进了模型的规模生产与落地,以及在模型更新过程中通过获取对应的训练数据,可以有效降低模型更新的数据要求,通过收集实际场景的少量样本数据,大大降低数据收集的难度。

为了使本领域技术人员更好地理解本发明实施例的技术方案,下面通过一个具体的示例进行解释说明。

在能源智能化领域的相关场景中,业务场景可以是变电站刀闸开合的识别,光伏发电量预测、户用园区用电量检测等场景。边缘设备可以为不包含GPU(GraphicsProcessing Unit,图形处理器)、NPU(Neural-network Processing Unit,嵌入式网络神经处理器)等并行计算硬件的边缘盒子,也可以为包含GPU、NPU等并行计算硬件的边缘盒子。具体的,以变电站刀闸开合识别为例:

由于变电站的监控像头较多,传输压力与存储压力较大,因此在边缘端和云端均部署数据采集与标注模块。接收到变电站传来的刀闸视频流后,边缘端的数据采集与标注模块首先对刀闸视频进行数据质量评价与清洗,将由于传输错误、图片内容高度重复等问题产生的低质量刀闸图片删除,然后将清洗后的图片进行压缩编码上传云端。云端进行解码后还原出原始刀闸图片,接着使用半自动化数据标注对刀闸图片进行标注。标注好的图片进行特征提取,特征包含但不限于标注的目标类别名称、目标特性(如刀闸开状态与合状态时的图片经过神经网络进行特征抽取,得到对应的特征向量)。将原始图片、特征信息和标注信息放入数据库中保存。

标注好的刀闸数据和其数据特征一起输入模型训练模块,模型训练模块首先将刀闸数据特征与种子模型库中的数据特征进行对比,对比方式包括但不限于类别名称的相似性匹配(如种子库中存在之前训练部署成功的熔断式刀闸开关模型,类别名称与当前类别高度相似)、数据特征向量相似性匹配(如两个特征向量做余弦相似度、欧式距离相似度、曼哈顿距离相似度等相似度对比,相似度高的则数据特征较为匹配)。接着从种子模型库中挑出场景最相近的种子模型,并在此模型基础上训练微调,然后可以将训练好的模型一方面存入种子模型库,另一方面输入模型部署模块进行模型压缩、量化并将模型部署在边缘侧。

由于变电站刀闸开关状态识别的数据传输与存储成本较高,因此将模型在线更新模块部署在边缘端。当训练好的模型上线运行后,模块中的模型性能评估功能会对模型性能或数据分布进行检测。

对模型性能检测包括基于标注数据的模型性能检测方法、基于无标注数据的模型性能检测方法和两者组合。一个实例为:标注员定期(10天/1个月等)对过去一段时间(5分钟/10分钟/半小时等)的刀闸视频快速标注并作为测试集,测试模型性能是否下降。可选地,对于其他不需要标注就可以检测模型性能的方案也可以使用,本发明对此不作限制。

数据分布检测主要检测当前刀闸视频与之前的视频相比,其特点是否发生明显变化。当检测到模型性能下降或数据分布发生改变后,对模型性能的下降程度进行判断:

如果模型性能下降较小(如精确率小于95%但大于90%),则开启无监督模型更新训练;无监督模型更新包含两部分,第一部分使用已标注历史数据进行正常的训练,第二部分无标注实时数据有多种方式实现模型训练,包括但不限于:1.基于伪标签的模型训练更新方案,即使用当前模型对无标注实时数据预测出伪标签,在此基础上结合已标注的历史数据进行模型更新;2.基于一致性正则化的模型训练方案,对同一张未标注图片分别进行简单的数据扩充变换和复杂的数据扩充变换得到两张不同的图片,由于在数据扩充变换过程中图像中的目标语义信息不发生变化,这两张图片的语义信息不发生改变,因此通过增加对两张图片语义信息一致性的约束来对模型进行训练。需要说明的是,还可以使用基于自适应增量学习的方式,或在上述示例的基础上加入其它有益于模型训练的结构与技巧等,本发明对此不作限制。

如果模型性能下降较大(如精确率小于90%),则使用半自动化标注方法对现场采集的实时数据流图片进行标注,然后开启有监督模型更新训练。应当注意的是,在该方案基础上进行其他改进(如在此基础上加入其他有益于模型训练的结构与技巧)均包含在专利保护范围内。

最终,完成更新训练的模型替换掉已有的旧模型,同时将新模型和对应数据特征一起上传至种子模型库,从而在边缘计算场景中,一方面通过将场景模型部署在边缘设备,减少了边缘设备与云端设备之间的数据传输,不仅可以降低数据传输成本,还可以保证数据的私密性与安全性,另一方面通过在边缘设备对模型进行性能检测与更新,降低模型维护成本,通过在边缘设备采集模型更新所需的与业务场景对应的数据,降低了模型更新的数据要求,基于少量样本数据即可完成模型更新,大大促进了模型的规模生产与落地。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

另外,本发明实施例还提供一种电子设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信,

存储器903,用于存放计算机程序;

处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:

获取边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

在运行当前场景模型的过程中,通过所述边缘设备获取当前场景模型的模型性能信息;

若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据;

根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,还包括:

确定所述云端设备与所述边缘设备之间的数据传输量,和/或所述云端设备的数据存储量;

若所述数据传输量大于或等于第一预设数量阈值,和/或,所述数据存储量大于或等于第二预设数量阈值,则将所述模型在线更新模块部署在所述边缘设备;

若所述数据传输量小于所述第一预设数量阈值,且所述数据存储量小于所述第二预设数量阈值,则将所述模型在线更新模块部署在所述云端设备。

在一种可选实施例中,还包括:

响应于模块处理指令,获取与所述模块处理指令对应的设备标识;

若所述设备标识为云端设备的标识,则在所述云端设备部署所述模型在线更新模块或启动预设在云端设备的模型在线更新模块;

若所述设备标识为边缘设备的标识,则在所述边缘设备部署所述模型在线更新模块或启动预设在边缘设备的模型在线更新模块。

在一种可选实施例中,所述模型性能信息包括所述目标业务场景对应的场景预测信息以及所述目标业务场景对应的场景预测信息的预测数据分布特征;其中,所述若所述模型性能信息表征所述当前场景模型存在性能异常,则获取针对所述当前场景模型的模型训练数据,包括:

获取所述当前场景模型对应的场景参考信息以及所述当前场景模型对应的参考数据分布特征;

将所述场景预测信息与所述场景参考信息进行比对,获得预测差异信息;

将所述预测数据分布特征与所述参考数据分布特征进行比对,获得数据分布差异信息;

若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据。

在一种可选实施例中,所述若所述预测差异信息和/或所述数据分布差异信息表征所述当前场景模型存在性能异常,则获取与所述预测差异信息对应的模型训练数据,包括:

若所述预设差异信息满足所述目标业务场景对应的第一预测异常条件,且所述数据分布差异信息满足所述目标业务场景对应的第一数据分布异常条件,则获取针对所述当前场景模型的第一模型训练数据;

若所述预设差异信息满足所述目标业务场景对应的第二预测异常条件或所述数据分布差异信息满足所述目标业务场景对应的第二数据分布异常条件,则获取针对所述当前场景模型的第二模型训练数据。

在一种可选实施例中,所述第一模型训练数据包括所述目标业务场景对应的实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述历史场景数据的标注信息;

采用所述标注信息对全部或部分所述历史场景数据进行标注,获得目标历史场景数据;

采用所述实时场景数据与所述目标历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述第二模型训练数据包括所述目标业务场景对应的全部或部分实时场景数据以及历史场景数据,所述根据所述模型训练数据对所述当前场景模型进行模型更新,生成与所述目标业务场景对应的目标场景模型,包括:

获取针对所述全部或部分实时场景数据的标注信息;

采用所述标注信息对所述全部或部分实时场景数据进行标注,生成目标业务场景数据;

采用所述目标业务场景数据与所述历史场景数据对所述当前场景模型进行模型训练,生成与所述目标业务场景对应的目标场景模型。

在一种可选实施例中,所述方法还包括:

获取与所述目标场景模型对应的模型特征数据,并对所述模型特征数据与所述目标场景模型存储至所述种子模型库。

在一种可选实施例中,所述方法还包括:

获取与目标业务场景对应的场景数据;

对所述场景数据进行标注,获得与所述场景数据对应的标注数据;

对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量;

将所述场景数据、所述特征向量以及所述标注数据存储至所述数据库。

在一种可选实施例中,所述方法还包括:

获取与目标业务场景对应的场景数据,对所述场景数据进行编码,生成场景编码数据;

对所述场景编码数据进行解码,获得所述场景数据;

对所述场景数据进行标注,获得与所述场景数据对应的标注数据;

对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量;

所述场景数据、所述标注数据以及所述特征向量存储至所述数据库;

在一种可选实施例中,所述方法还包括:

获取与目标业务场景对应的场景数据;

对所述场景数据进行标注,获得与所述场景数据对应的标注数据;

对所述场景数据以及所述标注数据进行编码,生成场景编码数据;

对所述场景编码数据进行解码,获得所述场景数据以及所述标注数据;

对所述标注数据进行特征提取,获得与所述场景数据对应的特征向量;

将所述场景数据、所述标注数据以及所述特征向量存储至所述数据库。

在一种可选实施例中,所述方法还包括:

从所述种子模型库中获取与所述特征向量对应的种子模型;

根据所述场景数据与所述标注数据对所述种子模型进行模型训练,生成与所述目标业务场景对应的场景模型。

在一种可选实施例中,所述方法还包括:

获取所述边缘设备对应的目标业务场景以及所述目标业务场景对应的场景模型;

对所述场景模型进行部署,并在部署完成后对所述场景模型进行运行。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

如图10所示,在本发明提供的又一实施例中,还提供了一种计算机可读存储介质1001,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中所述的云边协同的数据处理方法。

在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中所述的云边协同的数据处理方法。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

技术分类

06120114737318