掌桥专利:专业的专利平台
掌桥专利
首页

基于三层数据挖掘的电力系统故障类型分析方法及装置

文献发布时间:2023-06-19 10:08:35


基于三层数据挖掘的电力系统故障类型分析方法及装置

技术领域

本发明涉及电力分析的技术领域,尤其是涉及一种基于三层数据挖掘的电力系统故障类型分析方法及装置。

背景技术

随着电力系统的不断扩展,其安全性牵系着整个国民经济的发展,为了保证电力系统的可靠性和稳定性,对即将发生的电力故障,提前预测并做出相应的预防措施,可以有效防止电力事故的发生,减少经济损失。目前电力故障诊断主要还是利用各级继电保护装置进行工作,通过保护装置的运行状态判断电力系统是否发生故障。并且,工作人员通过对电气设备巡视检查,根据实时的电压电流数据和产生报警装置的各项状态,来找出故障位置所在。但继电保护装置只能根据当前的运行状况,决定是否动作,未能考虑电气量之间的相关性,更不能判断出发生的是哪种类型故障,因此也影响了故障后的及时处理。影响工作人员及时采取合适的故障后补救措施,严重的不但不能及时处理故障,还可能引起更严重的电网故障,扩大故障损失范围。

随着数据库系统的广泛应用和网络技术的高速发展,数据挖掘方法的出现,在很大层面上提升了故障诊断的各项性能,提高了故障诊断与预测的精确度。为了对电力故障类型进行正确判断,预防更严重故障的发生,利用大数据知识和机器学习算法,对故障历史数据进行挖掘,找到其相关性和潜在的规律,并且通过训练数据建立预测模型,成为目前一个重要并且很有价值的研究方向。数据挖掘是数据分析的前沿技术,是统计学、数据库技术和人工智能技术的综合。能从各种各样类型的数据中,快速获得有价值的信息。数据挖掘是从大量的、不完备的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中潜在有用的信息和知识,并且寻找其规律的技术。

发明内容

有鉴于此,本发明的目的在于提供了一种基于三层数据挖掘的电力系统故障类型分析方法及装置,为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。

第一方面,本发明提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:

S1:获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;

S2:对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;

S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;

S4:基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。

优选的,所述获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库的步骤包括;

将所述第一原始数据样本库不同源的数据进行数据融合。

优选的,所述对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库的步骤包括:

采用如下公式获取欧几里得距离:

X=(x

Y

构建如下准则函数:

Y

y

K—簇的个数,X

x

采用如下公式获取轮廓系数:

α

b

优选的,所述S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库的步骤包括:

将所述第一样本库中的样本进行整合,获取依据支持度、置信度、以及提升度对整合后的第一样本库进行筛选。

优选的,所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型包括:

建故障类型预测模型满足线性关系:

f(XII

w—模型参数向量;

b—截距;

w

采用梯度下降法获取故障类型模型的最优解:

采用如下构建SVM型损失函数:

其中,E(w,b)—经验风险(即损失函数的期望);

αR(w)—结构风险;

L(F

F

正则项R(w)可采用如下形式:

优化目标函数如下:

按照如下给出的梯度公式更新迭代模型参数:

η—是控制参数空间中步长的学习率,且η按如下公式递减:

优选的所述步骤基于第二样本库构基于所述第二样本库判断电网发生的故障类型包括的步骤包括:

电网发生的故障类型满足如下模型:

f(a,x)=a

优化目标函数为求取使下列χ2量最小的系数(a

yj—真实值。

第二方面,本发明提供了一种基于三层数据挖掘的电力系统故障类型分析装置,包括:

预处理模块:用于获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;

第一数据挖掘模块:用于对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;

第二数据挖掘模块:用于对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;

故障判断模块:用于基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。

本发明实施例带来了以下有益效果:本发明提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:S1:获取第一原始数据样本库,原始数据样本库用于建立电力系统故障预测模型,对第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;S2:对第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;S3:对第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;S4:基于第二样本库构建电网故障预测模型,以判断电网发生的故障类型。通过本发明提供的方法及装置可以为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。

本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于三层数据挖掘的电力系统故障类型分析方法流程图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前,目前电力故障诊断主要还是利用各级继电保护装置进行工作,通过保护装置的运行状态判断电力系统是否发生故障。并且,工作人员通过对电气设备巡视检查,根据实时的电压电流数据和产生报警装置的各项状态,来找出故障位置所在。但继电保护装置只能根据当前的运行状况,决定是否动作,未能考虑电气量之间的相关性,更不能判断出发生的是哪种类型故障,因此也影响了故障后的及时处理。影响工作人员及时采取合适的故障后补救措施,严重的不但不能及时处理故障,还可能引起更严重的电网故障,扩大故障损失范围,基于此,本发明实施例提供的一种基于三层数据挖掘的电力系统故障类型分析方法及装置,可以为故障提供诊断并为故障后补救措施提供依据,提高电力系统的安全性。

为便于对本实施例进行理解,首先对本发明实施例所公开的一种基于三层数据挖掘的电力系统故障类型分析方法进行详细介绍。

实施例一:

本发明实施例一提供了一种基于三层数据挖掘的电力系统故障类型分析方法,包括:

S1:获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库;

具体的,通过上述数据收集、数据预处理和数据融合完成后,提取出来源数据样本库形式如下:{X,F},其中,X={X

S2:对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库;

具体的,第一层数据挖掘是对收集到源数据样本库中的故障数据{X}进行分类处理,对电力系统故障数据进行收集和预处理后,进行第一层数据挖掘,对源数据进行分类或聚类,对源数据分类或聚类的目的是将源数据分成相互有明显区分的多个簇。分类需要解决以下几个问题:(1)分类方法;(2)怎样判断分类结束;(3)分簇数目怎样确定。数据分类和聚类方法有多种,本发明以k-means聚类方法为实施例通过解决上述问题说明第一层数据挖掘的分类方法,其他分类方法也在该发明方法保护范围:

S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库;

为了提高故障类型判断与预测的精确性,需要将与各故障相关性强的数据挖掘出来,本发明中采用关联规则对所述3.1聚类后的数据样本进行第二层数据挖掘。以挖掘频繁项集的关联规则算法为实施例,其他关联规则方法也在本发明保护范围之内,挖掘方法及规则如下:

3.2.1以挖掘频繁项集的关联规则算法为实施例的第二层数据挖掘处理方法

把第二原始数据样本库中的XI中的元素和F合并为一个整体样本库M:{Z

(1)支持度

支持度表示样本组中Z

(2)置信度

置信度表示样本组Z

(3)提升度

提升度表示样本组Z

1)首先设置最小支持度和置信度,扫描样本库M找到所有的N阶频繁项集(其中,N从1开始递增)。

2)在N阶频繁项集的基础上通过连接和剪枝找到N+1阶候选项集(其中,N+1=(2,3,,,)。

3)扫描样本库M并找出N+1阶候选项集中所有大于最小支持度的非空集合作为N+1阶频繁项集。

4)如果N+1阶频繁项集为空集,则计算所有阶频繁项集组成的规则的置信度,提升度,找出满足最小置信度和提升度大于1的规则作为强关联规则。若为非空集,则返回2)继续寻找更高阶的频繁项集。

满足强关联规则的样本组构成关联库,把和故障类型Fi相关的样本组都提取出来,按照故障类型把样本分类整理出来,记为样本库Ⅱ:{XIIj,F

S4:基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型。

优选的,所述获取第一原始数据样本库,所述原始数据样本库用于建立电力系统故障预测模型,对所述第一原始数据样本库进行预处理和数据融合以获取第二原始数据样本库的步骤包括;

将所述第一原始数据样本库不同源的数据进行数据融合。

进一步的,将目前电力系统已经发展或正在发展的数据采集系统作为获取电力系统故障原始数据的数据源:如(1)物联网技术实时采集系统和数据库系统;(2)电力网信息系统如SCANDA;(3)实际运行系统的仿真运行数据;(4)天气情况数据;(5)市政建设工程情况数据;(5)交通信息数据信息等。

收集上述不同源数据时需要进行数据校验、数据纠错、数据过滤、缺失数据补充等数据预处理。例如奇偶校验、冗余纠错、阈值过滤和加权平均值补充等方法。

对上述收集的不同源数据进行相同属性的数据融合,按照电力系统故障类型诊断与预测目的,按照数据格式、系统归属、时间、位置(如节点和支路等)、故障类型等属性相同的方法对收集的不同源数据进行数据融合,获得原始数据样本库。

在本发明提供的实施例中,为了获得第一次数据挖掘的K-means聚类最优分簇数,采用计算不同分簇数聚类的轮廓系数方法,并通过比较这些轮廓系数,找到轮廓系数最大的分簇数作为最优分簇数。对于簇的每个样本,轮廓系数计算方法如下:对于其中一个样本X:(1)首先计算簇的内聚度α

优选的:所述对所述第二原始数据样本库进行k-means聚类方法以对第二原始数据样本库进行第一层数据挖掘,并获取第一样本库的步骤包括:

采用如下公式获取欧几里得距离:

X=(x

Y

构建如下准则函数:

Y

y

K—簇的个数,X

x

采用如下公式获取轮廓系数:

α

b

优选的,所述S3:对所述第一样本库通过关联规则进行第二层数据挖掘,并获取第二样本库的步骤包括:

将所述第一样本库中的样本进行整合,获取依据支持度、置信度、以及提升度对整合后的第一样本库进行筛选。

实施例二:

本发明实施例二对所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障的步骤进行了阐述:

具体的,故障类型预测模型满足线性关系:

f(XII

w—模型参数向量;

b—截距;

w

采用梯度下降法获取故障类型模型的最优解:

采用如下构建SVM型损失函数:

其中,E(w,b)—经验风险(即损失函数的期望);

αR(w)—结构风险;

L(F

F

正则项R(w)可采用如下形式:

优化目标函数如下:

按照如下给出的梯度公式更新迭代模型参数:

η—是控制参数空间中步长的学习率,且η按如下公式递减:

实施例三:

本发明实施三对所述步骤基于第二样本库构建电网故障类型预测模型,以判断电网发生的故障类型的另一种实施方式进行了阐述,具体的:

电网发生的故障类型满足如下预测模型:

f(a,x)=a

5.2在非线性预测模型(4-2),优化目标函数为求取使下列χ

y

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

相关技术
  • 基于三层数据挖掘的电力系统故障类型分析方法及装置
  • 一种基于监控大数据挖掘的电力CPS安全性分析方法
技术分类

06120112436683