掌桥专利:专业的专利平台
掌桥专利
首页

一种基于多源数据的电力系统安全监测方法及系统

文献发布时间:2024-04-18 20:02:18


一种基于多源数据的电力系统安全监测方法及系统

技术领域

本发明涉及数据处理技术领域。更具体地,本发明涉及一种基于多源数据的电力系统安全监测方法及系统。

背景技术

电力系统安全监测是维护电力系统健康和可靠运行的关键步骤,有助于预防故障、提高运行效率,并确保对用户提供高质量的电力服务。多源数据比单一来源的数据提供更多更准确的信息,因此,通过对电力系统的多种监测参数的数据进行数据分析,根据分析结果判断电力系统是否存在异常,能够实现对电力系统的安全监测。

孤立森林异常检测算法是一种常规的数据分析方法,通过孤立森林异常检测算法对电力系统的多种监测参数的数据进行数据分析时,通过构建的孤立森林计算电力系统的多种监测参数的数据的异常得分,进而判断电力系统是否存在异常;其中,孤立森林中的孤立树是通过阈值构建的,由于不同阈值的划分效果不同,因此,通过等概率随机选取的阈值构建的孤立树性能不稳定,导致通过孤立森林计算的异常得分不准确,无法准确判断电力系统是否存在异常,影响对电力系统的安全监测。

发明内容

为解决上述一个或多个技术问题,本发明在如下的多个方面中提供方案。

在第一方面中,本发明提供了一种基于多源数据的电力系统安全监测方法,包括:

通过传感器采集电力系统的各监测参数的数据,将预设采样周期内采集的各监测参数的所有数据,作为各监测参数的样本;

根据各监测参数的样本与其他监测参数的样本的相关系数,确定模板监测参数;

在模板监测参数的取值范围内等概率随机选取阈值,根据模板监测参数的样本构建模板监测参数的孤立森林,所述孤立森林包括多个孤立树;根据模板监测参数的孤立树上各阈值对应的两个节点包含的所有数据在数量、数值和异常得分上的差异,确定模板监测参数的孤立树上各阈值的划分效果;

通过对模板监测参数的孤立树上所有阈值的划分效果进行拟合,确定模板监测参数的划分效果拟合函数;

根据各监测参数与模板监测参数的相关系数,以及模板监测参数的划分效果拟合函数,确定各监测参数的取值范围内各数据作为阈值的概率;

根据各监测参数的取值范围内各数据作为阈值的概率,在各监测参数的取值范围内不等概率随机选取阈值,根据各监测参数的样本构建各监测参数的孤立森林;

通过各监测参数的孤立森林,确定待监测时刻的各监测参数的数据的异常得分,通过所述异常得分,判断电力系统的安全性。

在一个实施例中,所述根据各监测参数的样本与其他监测参数的样本的相关系数,确定模板监测参数,包括:

将任意一种监测参数作为目标监测参数,将目标监测参数与其他监测参数的相关系数的平均值,作为目标监测参数的综合关联程度;将所述综合关联程度最大的监测参数,作为模板监测参数。

在一个实施例中,所述在模板监测参数的取值范围内等概率随机选取阈值,根据模板监测参数的样本构建模板监测参数的孤立森林,包括:

模板监测参数的孤立森林中包括N个孤立树,N表示预设数量,对于任意一个孤立树,将模板监测参数的样本放入孤立树的根节点,在模板监测参数的取值范围内等概率随机选取阈值,通过阈值将根节点中的所有数据切分为两组,将每组作为根节点的子节点,在各子节点中重复切分操作,直到子节点中的数据不可再分或者孤立树的高度达到了预设高度,停止切分操作,获得孤立树。

在一个实施例中,所述模板监测参数的孤立树上各阈值的划分效果满足关系式:

式中,g表示模板监测参数的孤立树上的阈值的划分效果,s1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的数量,s2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的数量,S表示模板监测参数的样本包含的所有数据的数量,z1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的数值的均值,z2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的数值的均值,Z表示模板监测参数的取值范围的大小,f1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的异常得分的均值,f2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的异常得分的均值,

在一个实施例中,所述阈值对应的第一节点和第二节点是指通过阈值划分的两个子节点中左侧的子节点和右侧的子节点。

在一个实施例中,所述各监测参数的取值范围内各数据作为阈值的概率满足关系式:

式中,p(x)表示监测参数的取值范围内数据x作为阈值的概率,x表示监测参数的取值范围内数据,L表示监测参数与模板监测参数的相关系数,w表示监测参数的取值范围的大小,Z表示模板监测参数的取值范围的大小,H()表示模板监测参数的划分效果拟合函数,

在一个实施例中,通过所述异常得分,判断电力系统的安全性,包括:

若待监测时刻的所有监测参数的数据的异常得分的平均值大于预设阈值,则电力系统存在安全问题,若待监测时刻的所有监测参数的数据的异常得分的平均值小于或者等于预设阈值,则电力系统安全。

在第二方面中,本发明还提供了一种基于多源数据的电力系统安全监测系统,包括:处理器;存储器,所述存储器存储有用于实现一种基于多源数据的电力系统安全监测方法的计算机程序指令,当所述计算机程序指令被所述处理器执行时实现根据前述一个或多个实施例所述的一种基于多源数据的电力系统安全监测方法。

本发明的有益效果在于:本发明根据各监测参数的取值范围内各数据作为阈值的概率,在各监测参数的取值范围内不等概率随机选取阈值,构建各监测参数的孤立森林,以此提高了各监测参数的孤立森林性能的稳定性,使得通过各监测参数的孤立森林计算的异常得分的准确性更高,进而提高了电力系统的安全监测的准确性。

进一步地,本发明选取与其他监测参数的样本的相关系数大的监测参数作为模板监测参数,只通过构建模板监测参数的孤立森林,确定模板监测参数的孤立树上各阈值的划分效果,进而根据各监测参数与模板监测参数的相关系数,以及模板监测参数的划分效果拟合函数,确定各监测参数的取值范围内各数据作为阈值的概率,提高了电力系统安全监测方法的效率。

附图说明

通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:

图1是示意性示出本发明中一种基于多源数据的电力系统安全监测方法的流程图;

图2是示意性示出本发明中一种基于多源数据的电力系统安全监测系统的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

孤立森林异常检测算法是一种常规的数据分析方法,通过孤立森林异常检测算法对电力系统的多种监测参数的数据进行数据分析时,通过构建的孤立森林计算电力系统的多种监测参数的数据的异常得分,进而判断电力系统是否存在异常;其中,孤立森林包括多个孤立树,孤立树的本质是二叉树,孤立树的构建是通过阈值将节点中所有数据切分为两组,将每组作为新的节点,在新的节点重复切分步骤,直到节点中的数据不可再分或者孤立树的高度达到了预设高度;因此,孤立树的结构取决于阈值的选取,由于不同的阈值的划分效果不同,常规的孤立森林异常检测算法中,阈值是在数据的取值范围中等概率随机选取的,所以通过等概率随机选取的阈值构建的孤立树性能不稳定,导致通过孤立森林计算的异常得分不准确,进而导致无法准确地识别真实的异常点,无法准确判断电力系统是否存在异常,影响对电力系统的安全监测。

综上,考虑到电力系统的多种监测参数的数据具有关联性,本发明选取与其他监测参数的样本的相关系数大的监测参数作为模板监测参数,在模板监测参数的取值范围内等概率随机选取阈值,构建模板监测参数的孤立森林,根据模板监测参数的孤立树上各阈值在孤立树上对应的两个节点包含的所有数据在数量、数值和异常得分上的差异,确定模板监测参数的孤立树上各阈值的划分效果;通过对模板监测参数的孤立树上所有阈值的划分效果进行拟合,确定模板监测参数的划分效果拟合函数;根据各监测参数与模板监测参数的相关系数,以及模板监测参数的划分效果拟合函数,确定各监测参数的取值范围内各数据作为阈值的概率;对于各监测参数,则根据各监测参数的取值范围内各数据作为阈值的概率,在各监测参数的取值范围内不等概率随机选取阈值,构建各监测参数的孤立森林,以此提高各监测参数的孤立森林性能的稳定性,提高通过各监测参数的孤立森林计算的异常得分的准确性,进而提高电力系统的安全监测的准确性。

下面结合附图来详细描述本发明的具体实施方式。

本发明实施例公开一种基于多源数据的电力系统安全监测方法,参照图1,包括步骤S1-步骤S7:

S1:采集各监测参数的样本。

需要说明的是,数据的多源化主要指数据来源的多样化,不同来源的数据呈现出不同的模态,不同来源的数据相互之间能够进行支持、补充和修正,多源数据能比单一来源的数据提供更多更准确的信息;因此,本实施例通过对电力系统的电压数据、电流数据、频率数据等进行数据分析,实现对电力系统的安全监测。

可选地,通过传感器采集电力系统的各监测参数的数据,将预设采样周期内采集的各监测参数的所有数据,作为各监测参数的样本。

优选地,按照预设采样频率,通过传感器采集电力系统的各监测参数的数据,将在预设采样周期内采集各监测参数的所有数据,作为各监测参数的样本,所述监测参数包括但不限于电压、电流、频率,其中,电压、电流、频率的数据分别是通过电压传感器、电流传感器、频率传感器采集的。

预设采样频率和预设采样周期的具体数值可以根据实际应用场景和需求来设定,本发明预设采样频率设置为3秒/次,预设采样周期设置为10分钟。

S2:确定模板监测参数。

具体的,对于任意两种监测参数,根据两种监测参数的样本,通过皮尔逊(pearson)相关分析计算两种监测参数的相关系数。

需要说明的是,两种监测参数的相关系数越大,则两种监测参数的数据的关联性越强。

所述根据各监测参数的样本与其他监测参数的样本的相关系数,确定模板监测参数,包括:将任意一种监测参数作为目标监测参数,将目标监测参数与其他监测参数的相关系数的平均值,作为目标监测参数的综合关联程度;将综合关联程度最大的监测参数,作为模板监测参数。

需要说明的是,由于通过等概率随机选取的阈值构建的孤立树性能不稳定,想要构建的孤立森林性能稳定,就需要选取合适的阈值,而选取的阈值是否合适,则是取决于阈值的划分效果,阈值的划分效果则需要通过对构建的孤立森林进行分析确定;其中,由于电力系统具有多种监测参数,如果对各监测参数都进行孤立森林的构建,进而判断阈值的划分效果,该方法效率较低;为了提高效率,考虑到电力系统的多种监测参数的数据具有关联性,本发明从多种监测参数中选取与其他监测参数关联性都较大的监测参数,即与其他监测参数的相关系数都较大的监测参数,作为模板监测参数,后续只需要通过对模板监测参数的孤立森林进行分析确定阈值的划分效果,根据各监测参数与模板监测参数的相关系数,以及模板监测参数的划分效果拟合函数,确定各监测参数的取值范围内各数据作为阈值的概率即可。

S3:构建模板监测参数的孤立森林,确定模板监测参数的孤立树上各阈值的划分效果。

具体的,在模板监测参数的取值范围内等概率随机选取阈值,根据模板监测参数的样本构建模板监测参数的孤立森林,模板监测参数的孤立森林包括预设数量个孤立树;根据模板监测参数的孤立树上各阈值对应的两个节点包含的所有数据在数量、数值和异常得分上的差异,确定模板监测参数的孤立树上各阈值的划分效果。

所述模板监测参数的取值范围是指模板监测参数的样本中的最小值和最大值组成的范围。

所述在模板监测参数的取值范围内等概率随机选取阈值,根据模板监测参数的样本构建模板监测参数的孤立森林,其中,模板监测参数的孤立森林中包括N个孤立树,N表示预设数量,孤立树的本质是二叉树,对于任意一个孤立树,将模板监测参数的样本放入孤立树的根节点,在模板监测参数的取值范围内等概率随机选取阈值,所述等概率随机选取是指取值范围内各数据被选取的概率相等的,通过阈值将根节点中的所有数据切分为两组,将每组作为根节点的子节点,在各子节点中重复切分操作,直到子节点中的数据不可再分或者孤立树的高度达到了预设高度,停止切分操作,获得孤立树,其中,通过阈值划分的两个子节点,作为阈值对应的节点,将通过阈值划分的两个子节点中左侧的子节点,记为阈值对应的第一节点,将通过阈值划分的两个子节点中右侧的子节点,记为阈值对应的第二节点。

需要说明的是,建模板监测参数的孤立森林的具体过程参照孤立森林异常检测算法,孤立森林异常检测算法为公知技术,此处不再进行赘述;通过等概率随机选取阈值生成多个孤立树,为孤立森林异常检测算法中的公知步骤,此处不再进行赘述。

预设数量和预设高度的具体数值可以根据实际应用场景和需求来设定,本发明预设数量设置为100,预设高度设置为30。

所述根据模板监测参数的孤立树上各阈值对应的两个节点包含的所有数据在数量、数值和异常得分上的差异,确定模板监测参数的孤立树上各阈值的划分效果,包括:对于模板监测参数的孤立树上的任意一个阈值,该阈值的划分效果满足关系式:

式中,g表示模板监测参数的孤立树上的阈值的划分效果,s1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的数量,s2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的数量,S表示模板监测参数的样本包含的所有数据的数量,z1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的数值的均值,z2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的数值的均值,Z表示模板监测参数的取值范围的大小,f1表示模板监测参数的孤立树上的阈值对应的第一节点包含的所有数据的异常得分的均值,f2表示模板监测参数的孤立树上的阈值对应的第二节点包含的所有数据的异常得分的均值,

其中,所述数据的异常得分的计算方法为孤立森林异常检测算法中的公知技术,此处不再进行赘述。

需要说明的是,相较于正常数据,异常数据的数量少且异常数据的异常得分大,并且异常数据和正常数据在数据的数量、数值以及异常得分三个方面均存在差异;在构建孤立树时,通过阈值对节点中的所有数据进行切分,其目的是尽可能将异常数据和正常数据分开,因此,在衡量阈值的划分效果时,结合阈值对应的两个节点包含的所有数据在数量、数值和异常得分上的差异,以及两个节点包含的所有数据数量的最小值和异常得分的最小值;其中,

S4:确定模板监测参数的划分效果拟合函数。

具体的,所述对模板监测参数的孤立树上所有阈值的划分效果进行拟合的方法是指最小二乘法,通过最小二乘法对模板监测参数的孤立树上所有阈值的划分效果进行拟合,确定模板监测参数的划分效果拟合函数,所述模板监测参数的划分效果拟合函数用于确定模板监测参数的取值范围内各数据作为阈值的划分效果,包括:将模板监测参数的取值范围内各数据输入划分效果拟合函数,输出的结果为模板监测参数的取值范围内各数据作为阈值的划分效果。

S5:确定各监测参数的取值范围内各数据作为阈值的概率。

具体的,根据各监测参数与模板监测参数的相关系数,以及模板监测参数的划分效果拟合函数,确定各监测参数的取值范围内各数据作为阈值的概率,包括:对于任意一种监测参数,监测参数的取值范围内各数据作为阈值的概率满足关系式:

式中,p(x)表示监测参数的取值范围内数据x作为阈值的概率,x表示监测参数的取值范围内数据,L表示监测参数与模板监测参数的相关系数,w表示监测参数的取值范围的大小,Z表示模板监测参数的取值范围的大小,H()表示模板监测参数的划分效果拟合函数,

需要说明的是,

S6:构建各监测参数的孤立森林。

具体的,根据各监测参数的取值范围内各数据作为阈值的概率,在各监测参数的取值范围内不等概率随机选取阈值,根据各监测参数的样本构建各监测参数的孤立森林,各监测参数的孤立森林包括预设数量个孤立树。

需要说明的是,本发明根据各监测参数的取值范围内各数据作为阈值的概率,在各监测参数的取值范围内不等概率随机选取阈值,构建各监测参数的孤立森林,让划分效果好的阈值被选取的概率更大,让划分效果差的阈值被选取的概率更小,以此提高各监测参数的孤立森林性能的稳定性,使得通过各监测参数的孤立森林计算的异常得分的准确性更高,进而提高了电力系统的安全监测的准确性。

S7:通过待监测时刻的各监测参数的数据的异常得分,判断电力系统的安全性。

具体的,对于待监测时刻的各监测参数的数据,通过各监测参数的孤立森林,确定待监测时刻的各监测参数的数据的异常得分,通过待监测时刻的各监测参数的数据的异常得分,判断电力系统的安全性:若待监测时刻的所有监测参数的数据的异常得分的平均值大于预设阈值,则电力系统存在安全问题,若待监测时刻的所有监测参数的数据的异常得分的平均值小于或者等于预设阈值,则电力系统安全。

预设阈值的具体数值可以根据实际应用场景和需求来设定,本发明预设阈值设置为0.8。

图2是示意性示出本发明中一种基于多源数据的电力系统安全监测系统的结构图。

本发明还提供了一种基于多源数据的电力系统安全监测系统。如图2所示,所述系统包括处理器和存储器,所述存储器存储有计算机程序指令,当所述计算机程序指令被所述处理器执行时实现根据前文中所述的一种基于多源数据的电力系统安全监测方法。

所述系统还包括通信总线和通信接口等本领域技术人员熟知的其他组件,其设置和功能为本领域中已知,因此在此不再赘述。

在本发明中,前述的存储器可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,计算机可读存储介质可以是任何适当的磁存储介质或者磁光存储介质,比如,阻变式存储器RRAM(Resistive RandomAccess Memory)、动态随机存取存储器DRAM(Dynamic Random Access Memory)、静态随机存取存储器SRAM(Static Random-Access Memory)、增强动态随机存取存储器EDRAM(Enhanced Dynamic Random Access Memory)、高带宽内存HBM(High-Bandwidth Memory)、混合存储立方HMC(Hybrid Memory Cube)等等,或者可以用于存储所需信息并且可以由应用程序、模块或两者访问的任何其他介质。任何这样的计算机存储介质可以是设备的一部分或可访问或可连接到设备。本发明描述的任何应用或模块可以使用可以由这样的计算机可读介质存储或以其他方式保持的计算机可读/可执行指令来实现。

在本说明书的描述中,“多个”、“若干个”的含义是至少两个,例如两个,三个或更多个等,除非另有明确具体的限定。

虽然本说明书已经示出和描述了本发明的多个实施例,但对于本领域技术人员显而易见的是,这样的实施例只是以示例的方式提供的。本领域技术人员会在不偏离本发明思想和精神的情况下想到许多更改、改变和替代的方式。应当理解的是在实践本发明的过程中,可以采用对本文所描述的本发明实施例的各替代方案。

相关技术
  • 一种基于电力-微气象特征数据的电力系统安全预警方法
  • 基于多源数据融合的电力设备状态监测方法及系统
技术分类

06120116584951