掌桥专利:专业的专利平台
掌桥专利
首页

基于火电生产指标管理的数据关联分析方法及系统

文献发布时间:2023-06-19 19:27:02


基于火电生产指标管理的数据关联分析方法及系统

技术领域

本发明涉及火电生产指标管理关联分析技术领域,尤其涉及基于火电生产指标管理的数据关联分析方法及系统。

背景技术

电力工业是节能降耗和污染减排的重点行业,火力厂是能源转换企业,也是耗能大户,火电厂技术经济指标的计算是财务统计、成本计算、审核审计工作的前提。技术经济指标不仅反映电力企业的生产能力、管理水平、还可以指导火电厂电力生产、经营等各方面的工作。目前各发电企业,在数据交流和上报时可能会发现一些问题,主要是计算公式不尽相同,致使同样的原始资料数据,计算结果可能不一致,或者会出现一些不应该有的错误。因此做好火力发电企业的指标统计与计算,对于火力发电厂的生产、经营和管理至关重要。

因此,提供基于火电生产指标管理的数据关联分析方法及系统,来解决上述技术问题,是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了基于火电生产指标管理的数据关联分析方法及系统,将关联挖掘算法Apriori算法应用于火电生产指标管理,利用采集到的数据挖掘出影响火电厂经济指标变化的关联规则,为经济指标的变化提供参考标准。

为了实现上述目的,本发明采用如下技术方案:

基于火电生产指标管理的数据关联分析方法,包括以下步骤:

数据获取步骤:获取火电生产技术指标数据,并进行特征选择,获得待分析的特征数据;

数据预处理步骤:对特征数据进行预处理,得到预处理后的特征数据;

主成分分析步骤:利用预处理后的特征数据进行主成分分析计算,得到预处理后的特征数据的权重值;

相似度计算步骤:计算预处理后的特征数据的相似度,生成特征数据库;

关联性分析步骤:根据生成的特征数据库,基于Apriori算法进行关联性分析。

优选的,数据获取步骤具体内容为:由生产数据采集平台获取火电厂的火电生产技术指标数据,对获取的火电生产技术指标数据进行特征选择,获得待分析的特征数据。

优选的,数据预处理步骤的具体内容为:

采用线性插值法对缺失数据进行处理:针对个别点缺失数据的情况,将原始数据进行插值处理之后,得到矩阵A

优选的,主成分分析步骤的具体内容为:计算相关系数矩阵、计算特征值与特征向量、计算主成分贡献率及累计贡献率、计算主成分负载、确定主成分分析的权重。

优选的,在利用主成分分析的方法确定权重的同时,设置数据变量的权重阈值,当数据的权重低于权重阈值时,认为该数据与整体数据分析关联度低,则删除此数据。

优选的,相似度计算步骤中,计算预处理后的特征数据的相似度包括:时间信息的相似度、主机信息相似度、安防等级相似度、运行服务总数相似度;根据得到的相似度计算特征数据相似度。

优选的,关联性分析步骤的具体内容为:

设置最小支持度阈值min_sup和最小置信度min_conf,最小支持度阈值取25%,最小置信度阈值取75%;

对特征数据库经过迭代生成频繁项集:经过算法的第一次迭代,对特征数据库进行一次扫描,计算出特征数据库中所包含的每个项目出现的次数,生成候选1-项集的集合C1;

根据设定的最小支持度,从C1中确定频繁1-项集L1,从此类推得到频繁集Lk,这里k取值为7;

在频繁项集的基础上生成满足最小置信度的规则,产生的规则称为强关联规则,从而获得火电厂的火电生产技术指标数据的相关性。

基于火电生产指标管理的数据关联分析系统,

包括:数据获取模块、预处理模块、主成分分析模块、特征数据库生成模块和关联分析模块;

数据获取模块,与预处理模块的输入端连接,用于获取火电生产技术指标数据,并进行特征选择,获得待分析的特征数据;

预处理模块,与主成分分析模块的输入端连接,用于对特征数据进行预处理,得到预处理后的特征数据;

主成分分析模块,与特征数据库生成模块的输入端连接,用于利用预处理后的特征数据进行主成分分析计算,得到预处理后的特征数据的权重值;

特征数据库生成模块,与关联分析模块的输入端连接,用于计算预处理后的特征数据的相似度,生成特征数据库;

关联分析模块,用于根据生成的特征数据库,基于Apriori算法进行关联性分析。

一种终端,包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行基于火电生产指标管理的数据关联分析方法。

一种计算机可读存储介质,

计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行基于火电生产指标管理的数据关联分析方法。

经由上述的技术方案可知,与现有技术相比,本发明提供了基于火电生产指标管理的数据关联分析方法及系统:将关联挖掘算法Apriori算法应用于火电生产指标管理,利用采集到的数据挖掘出影响火电厂经济指标变化的关联规则,为经济指标的变化提供参考标准。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明基于火电生产指标管理的数据关联分析方法的流程图;

图2为本发明基于火电生产指标管理的数据关联分析系统的结构框图;

图3为本发明基于火电生产指标管理的数据关联分析系统统的终端一个具体示例的组成图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参照图1所示,本实发明公开了基于火电生产指标管理的数据关联分析方法,包括以下步骤:

数据获取步骤:获取火电生产技术指标数据,并进行特征选择,获得待分析的特征数据;

数据预处理步骤:对特征数据进行预处理,得到预处理后的特征数据;

主成分分析步骤:利用预处理后的特征数据进行主成分分析计算,得到预处理后的特征数据的权重值;

相似度计算步骤:计算预处理后的特征数据的相似度,生成特征数据库;

关联性分析步骤:根据生成的特征数据库,基于Apriori算法进行关联性分析。

在一个具体实施例中,数据获取步骤具体内容为:由生产数据采集平台获取火电厂的火电生产技术指标数据,对获取的火电生产技术指标数据进行特征选择,获得待分析的特征数据。

在一个具体实施例中,数据预处理步骤的具体内容为:

采用线性插值法对缺失数据进行处理:针对个别点缺失数据的情况,将原始数据进行插值处理之后,得到矩阵A

在一个具体实施例中,线性插值法对缺失数据进行处理的步骤如下:

设有数据(x

此时的插值多项式为

在一个具体实施例中,主成分分析步骤的具体内容为:计算相关系数矩阵、计算特征值与特征向量、计算主成分贡献率及累计贡献率、计算主成分负载、确定主成分分析的权重ω,上述计算为常规主成分分析方法。

在一个具体实施例中,在利用主成分分析的方法确定权重的同时,设置数据变量的权重阈值,当数据的权重低于权重阈值时,认为该数据与整体数据分析关联度低,则删除此数据。

在一个具体实施例中,在利用主成分分析的方法确定权重的同时,设置数据变量的权重阈值,为0.05,当数据变量的权重低于权重阈值时,认为该数据变量与异常流量数据分析关联度低,则删除此数据变量。

在一个具体实施例中,相似度计算步骤中,计算预处理后的特征数据的相似度包括:时间信息的相似度、主机信息相似度、安防等级相似度、运行服务总数相似度;根据得到的相似度计算特征数据相似度;

根据特征数据相似度生成特征数据库:根据计算得到的特征数据相似度,设置相似度阈值;根据实验得到的结果进行分析,设置相似度阈值分别为最大阈值0.5,最小阈值0.1和丢弃阈值0.05;其中,当相似度低于0.05时,认为特征数据之间的相似度过低,不存在可能的关联度;当两者相似度高于0.5时,认为关联度较高,作为2个特征数据的特征数据项。

在一个具体实施例中,相似度计算的具体内容为:

时间信息的相似度计算公式如下:

其中,t

主机相关信息的相似度计算公式如下:

其中,s

主机安防等级的相似度计算公式如下:

其中,f

运行服务总数的相似度计算公式如下:

其中,l

特征数据相似度计算公式如下:

在一个具体实施例中,关联性分析步骤的具体内容为:

设置最小支持度阈值min_sup和最小置信度min_conf,最小支持度阈值取25%,最小置信度阈值取75%;

对特征数据库经过迭代生成频繁项集:经过算法的第一次迭代,对特征数据库进行一次扫描,计算出特征数据库中所包含的每个项目出现的次数,生成候选1-项集的集合C1;

根据设定的最小支持度,从C1中确定频繁1-项集L1,从此类推得到频繁集Lk,这里k取值为7;

在频繁项集的基础上生成满足最小置信度的规则,产生的规则称为强关联规则,从而获得火电厂的火电生产技术指标数据的相关性。

参照图2所示,本发明公开了基于火电生产指标管理的数据关联分析系统,

包括:数据获取模块、预处理模块、主成分分析模块、特征数据库生成模块和关联分析模块;

数据获取模块,与预处理模块的输入端连接,用于获取火电生产技术指标数据,并进行特征选择,获得待分析的特征数据;

预处理模块,与主成分分析模块的输入端连接,用于对特征数据进行预处理,得到预处理后的特征数据;

主成分分析模块,与特征数据库生成模块的输入端连接,用于利用预处理后的特征数据进行主成分分析计算,得到预处理后的特征数据的权重值;

特征数据库生成模块,与关联分析模块的输入端连接,用于计算预处理后的特征数据的相似度,生成特征数据库;

关联分析模块,用于根据生成的特征数据库,基于Apriori算法进行关联性分析。

一种终端,包括:至少一个处理器,以及与至少一个处理器通信连接的存储器,其中,存储器存储有被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行基于火电生产指标管理的数据关联分析方法。

参照图3所示,在一个具体实施例中,一种终端,包括:至少一个处理器101,例如CPU(Central Processing Unit,中央处理器),至少一个通信接口103,存储器104,至少一个通信总线102。其中,通信总线102用于实现这些组件之间的连接通信。其中,通信接口103可以包括显示屏(Display)、键盘(Keyboard),可选通信接口103还可以包括标准的有线接口、无线接口。存储器104可以是高速RAM存储器(Ramdom Access Memory,易挥发性随机存取存储器),也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器104可选的还可以是至少一个位于远离前述处理器101的存储装置。其中处理器101可以执行基于火电生产指标管理的数据关联分析方法。存储器104中存储一组程序代码,且处理器101调用存储器104中存储的程序代码,以用于执行基于火电生产指标管理的数据关联分析方法。

其中,通信总线102可以是外设部件互连标准(peripheralcomponentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standard

architecture,简称EISA)总线等。通信总线102可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条线表示,但并不表示仅有一根总线或一种类型的总线。其中,存储器104可以包括易失性存储器(英文:volatile memory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard diskdrive,缩写:HDD)或固降硬盘(英文:solid-state drive,缩写:SSD);存储器104还可以包括上述种类的存储器的组合。其中,处理器101可以是中央处理器(英文:centralprocessing unit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。

在一个具体实施例周公,存储器104可以包括易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-access memory,缩写:RAM);存储器也可以包括非易失性存储器(英文:non-volatile memory),例如快闪存储器(英文:flash memory),硬盘(英文:hard disk drive,缩写:HDD)或固态硬盘(英文:solid-state drive,缩写:SSD);存储器104还可以包括上述种类的存储器的组合。

在一个具体实施例中,处理器101可以是中央处理器(英文:central processingunit,缩写:CPU),网络处理器(英文:network processor,缩写:NP)或者CPU和NP的组合。

在一个具体实施例中,处理器101还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文:application-specific integrated circuit,缩写:ASIC),可编程逻辑器件(英文:programmable logic device,缩写:PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文:complexprogrammable logic device,缩写:CPLD),现场可编程逻辑门阵列(英文:field-programmable gate array,缩写:FPGA),通用阵列逻辑(英文:generic array logic,缩写:GAL)或其任意组合。

一种计算机可读存储介质,

计算机可读存储介质存储有计算机指令,计算机指令用于使计算机执行基于火电生产指标管理的数据关联分析方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。

对所公开的实施例的上述说明,按照递进的方式进行,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种火电厂高温高压管道检测数据管理系统与应用方法
  • 一种数据关联分析系统及数据关联分析方法
  • 跨媒体数据关联分析模型训练、数据关联分析方法及系统
技术分类

06120115918687