掌桥专利:专业的专利平台
掌桥专利
首页

一种电网数据分析方法及装置

文献发布时间:2023-06-19 12:18:04


一种电网数据分析方法及装置

技术领域

本发明涉及人工智能技术领域,尤其涉及一种电网数据分析方法及装置。

背景技术

随着电力技术的不断发展,电网系统中的数据也逐渐增大,传统的电网数据管理及分析系统在庞大的数据压力面前,无法及时响应用户输入的命令,生成对应的数据分析结果,即传统的电网数据管理及分析系统已经难以满足现阶段的用户需要。因此,提出一种能够满足大数据时代海量数据的计算分析系统,具有重要意义。

发明内容

本发明提供了一种电网数据分析方法及装置,配置针对不同类型的电网数据的神经网络模型,在需要对电力数据进行预测是,及时响应用户输入的分析请求,生成对应的数据分析结果。

第一方面,本发明提供的一种电网数据分析方法,其特征在于,包括:

获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;

基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;

确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;

将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。

可选地,获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签,包括:

获取待测电网数据,以及从本地文件结构化数据和非结构化数据中获取电网多源异构数据;

对所述电网多源异构数据进行包括拆分、标准化、正则化和二值化在内的数据转换,得到标准化数据;

基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据。

可选地,基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据,包括:

基于预先设定的数据组合特征和数据关联特征,对所述标准化数据进行提取,得到初始化数据特征;

对所述初始化数据特征进行特征转换,得到初始电网特征数据;

按照预先设定的提取比例,对所有所述初始电网特征数据进行分类提取,得到所述电网特征数据。

可选地,基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型,包括:

将所述电网特征数据输入对应的网络预测模型,生成对应的预测结果;

根据所述电网特征的数据标签和预测结果,确定所述训练误差;

基于所述训练误差,得到最优网络参数,并采用所述最优网络参数生成所述电网特征数据对应的网络预测模型。

第二方面,本发明提供的一种电网数据分析装置,包括:

获取模块,用于获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;

构建模块,用于基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;

目标网络预测模型确定模块,用于确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;

预测模块,用于将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。

可选地,所述获取模块包括:

获取子模块,用于获取待测电网数据,以及从本地文件结构化数据和非结构化数据中获取电网多源异构数据;

转换子模块,用于对所述电网多源异构数据进行包括拆分、标准化、正则化和二值化在内的数据转换,得到标准化数据;

分类子模块,用于基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据。

可选地,所述分类子模块包括:

提取单元,用于基于预先设定的数据组合特征和数据关联特征,对所述标准化数据进行提取,得到初始化数据特征;

转换单元,用于对所述初始化数据特征进行特征转换,得到初始电网特征数据;

分类单元,用于按照预先设定的提取比例,对所有所述初始电网特征数据进行分类提取,得到所述电网特征数据。

可选地,所述构建模块包括:

输入子模块,用于将所述电网特征数据输入对应的网络预测模型,生成对应的预测结果;

训练误差确定子模块,用于根据所述电网特征的数据标签和预测结果,确定所述训练误差;

模型生成子模块,用于基于所述训练误差,得到最优网络参数,并采用所述最优网络参数生成所述电网特征数据对应的网络预测模型。

第三方面,本申请提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。

第四方面,本申请提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

从以上技术方案可以看出,本发明具有以下优点:

本发明通过获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。配置针对不同类型的电网数据的神经网络模型,在需要对电力数据进行预测时,及时响应用户输入的分析请求,生成对应的数据分析结果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图;

图1为本发明的一种电网数据分析方法实施例一的步骤流程图;

图2为本发明的一种电网数据分析方法实施例二的步骤流程图;

图3为本发明的一种基电网数据分析装置实施例的结构框图。

具体实施方式

本发明实施例提供了一种电网数据分析方法及装置,配置针对不同类型的电网数据的神经网络模型,在需要对电力数据进行预测是,及时响应用户输入的分析请求,生成对应的数据分析结果。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

实施例一,请参阅图1,图1为本发明的一种电网数据分析方法实施例一的步骤流程图,所述方法包括:

S101,获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;

S102,基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;

S103,确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;

S104,将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。

在本发明实施例中,通过获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。配置针对不同类型的电网数据的神经网络模型,在需要对电力数据进行预测时,及时响应用户输入的分析请求,生成对应的数据分析结果。

实施例二,请参阅图2,图2为本发明的一种基电网数据分析方法实施例二的步骤流程图,具体包括:

步骤S201,获取待测电网数据,以及从本地文件结构化数据和非结构化数据中获取电网多源异构数据;

需要说明的是,结构化数据也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。而非结构化数据,是不适于由数据库二维表来表现的,包括所有格式的办公文档、XML、HTML、各类报表、图片和音频和视频信息等。此外,多源异构数据即包含了从简单的文件数据库到复杂的网络数据库中的所有数据,共同构成的多远异构数据。

在本发明实施例中,电网多源异构数据作为样本数据,进而形成数据集,用于为后续的模型训练做准备。

需要说明的是,样本数据即已经知道结果的历史数据,每一条独立的数据叫做样本。例如:一条用户基本信息数据,包括:姓名、年龄、性别、出生地、职业、手机号。数据集即用于训练模型前准备的初始数据。

步骤S202,对所述电网多源异构数据进行包括拆分、标准化、正则化和二值化在内的数据转换,得到标准化数据;

需要说明的是,步骤S202作为对电网多远异构数据的预处理方法,通过对数据进行标准化处理,实现对数据的数值范围缩放,使之落入特定区间,然后对数据进行正则化处理,利用先验知识,在处理过程中引入正则化因子(regulator),增加引导约束的作用,比如在逻辑回归中使用正则化,可有效降低过拟合的现象,接着对数据进行二值化处理,基于进行了拆分、标准化和正则化的电网多远异构数据,生成对应的明确值,即本发明实施例的标准化数据。

步骤S203,基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据;

在一个可选实施例中,基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据,包括:

基于预先设定的数据组合特征和数据关联特征,对所述标准化数据进行提取,得到初始化数据特征;

对所述初始化数据特征进行特征转换,得到初始电网特征数据;

按照预先设定的提取比例,对所有所述初始电网特征数据进行分类提取,得到所述电网特征数据。

在本发明实施例中,对标准化数据的处理包括特征提取、特征转换和特征选择三个阶段,具体地,特征提取为通过一些数据结构、组合和关联产出不同属性的特征,以得到更聚合的特征,改变原有的特征属性。通过特征提取能够更准确的得到影响效果更强的特征,使样本信息丢失更小,从而达到训练的模型更精准。特征转换:即从初始化数据特征中的提取得到电网特征数据,举例说明:如果某个特征是被调查人的身份证号,我们可以通过现有的身份证号转化成出生日期,把身份证号转化为不同的出生日期称为特征转换。特征选择即按照预先设定的提取比例,假如数据集特征数量为100个,而提取比例为20%,则选择20个最主要影响因素用于建模,此过程即为特征选择。

步骤S204,将所述电网特征数据输入对应的网络预测模型,生成对应的预测结果;

在本发明实施例中,每个电网特征数据作为训练集,对不同的网络预测模型进行训练,得到多种用于预测不同类型的电网特征数据的网络预测模型,并自动保存,与可供用户操作的客户端一同形成电网数据分析系统,实现机器学习模型的一站式管理,大幅降低机器学习模型的构建和管理成本,帮助电网各部门算法模型建设以及算法应用建设以极低的代价从实现数据业务从大数据时代到AI时代的落地。

该系统依托强大的分布式数据处理能力,内置丰富的算法模型,包含逻辑回归(LR)、聚类Kmeans,支持向量机(SVM)、卷积神经网络(CNN)、深度神经网络(DNN)等,满足从原始数据到模型产出的一站式服务。同时通过拖拽组件可视化建模的方式,让算法模型应用管理者及开发者在平台上可快速打造智能业务。

需要说明的是,在数据集中获取部分样本,用于训练模型中使用的数据称为训练集。能够对训练集的输入,通过内部既定的数据公式获得所要求的输出模型,得到模型的过程公式称为算法。算法能学习到训练样本数据中变量和目标值之间的函数关系,我们把学习到的这个函数关系叫做模型。

步骤S205,根据所述电网特征的数据标签和预测结果,确定所述训练误差;

步骤S206,基于所述训练误差,得到最优网络参数,并采用所述最优网络参数生成所述电网特征数据对应的网络预测模型;

在具体实现中,训练后得到的网络预测模型会进行自动的保存,无需使用者手动保存,防止创建模型意外丢失。训练完成的模型通过多项指标达到最优模型标准,使用者可对其进行保存,实现优良模型的二次使用。

步骤S207,确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;

步骤S208,将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。

在本发明实施例中,在网络预测模型中各网络参数和超网络参数达到最优后,系统会将其发布,而在发布之后,系统通过对任务进行上线下线、定时调度、状态监控的管理实现模型的任务管理。调度周期分为:小时、分钟、天、周、月;此外,还存在对发布上线的任务做实时的任务监控,从而帮助传统建模人员完成智能监控、定时调度跑批,解放繁重的人工操作。

在本发明实施例所提供的一种电网数据分析方法,通过获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。配置针对不同类型的电网数据的神经网络模型,在需要对电力数据进行预测时,及时响应用户输入的分析请求,生成对应的数据分析结果。

请参阅图3,示出了一种电网数据分析装置,所述装置包括:

获取模块401,用于获取待测电网数据,以及多个不同类型的电网特征数据及其数据标签;

构建模块402,用于基于不同类型的所述电网特征数据及其数据标签,构建多个对应的网络预测模型;

目标网络预测模型确定模块403,用于确定所述待测电网数据的待测类型,并基于所述待测类型,从多个所述网络预测模型中确定目标网络预测模型;

预测模块404,用于将所述待测电网数据输入所述目标网络预测模型,得到对应的数据预测结果。

在一个可选实施例中,所述获取模块401包括:

获取子模块,用于获取待测电网数据,以及从本地文件结构化数据和非结构化数据中获取电网多源异构数据;

转换子模块,用于对所述电网多源异构数据进行包括拆分、标准化、正则化和二值化在内的数据转换,得到标准化数据;

分类子模块,用于基于所述标准化数据的数据特征,对所述标准化数据进行分类,得到所述电网特征数据。

在一个可选实施例中,所述分类子模块包括:

提取单元,用于基于预先设定的数据组合特征和数据关联特征,对所述标准化数据进行提取,得到初始化数据特征;

转换单元,用于对所述初始化数据特征进行特征转换,得到初始电网特征数据;

分类单元,用于按照预先设定的提取比例,对所有所述初始电网特征数据进行分类提取,得到所述电网特征数据。

在一个可选实施例中,所述构建模块402包括:

输入子模块,用于将所述电网特征数据输入对应的网络预测模型,生成对应的预测结果;

训练误差确定子模块,用于根据所述电网特征的数据标签和预测结果,确定所述训练误差;

模型生成子模块,用于基于所述训练误差,得到最优网络参数,并采用所述最优网络参数生成所述电网特征数据对应的网络预测模型。

本发明实施例还提供了一种电子设备,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述任一实施例所述的电网数据分析方法的步骤。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时实现如上述任一实施例所述的电网数据分析方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 一种电网数据分析方法及装置
  • 一种智能配电网的大数据分析方法
技术分类

06120113239605