掌桥专利:专业的专利平台
掌桥专利
首页

一种用于预测继电保护缺陷的方法

文献发布时间:2023-06-19 10:41:48


一种用于预测继电保护缺陷的方法

技术领域

本发明涉及继电保护运行管理技术领域,并且更具体地,涉及一种用于预测继电保护缺陷的方法。

背景技术

逻辑回归(Logistic Regression)是当前比较常用的机器学习算法,用于估计某个事件发生的可能性。逻辑回归基于线性模型,但是为了解决预测问题,需要把线性模型的输出做一个变换,具体地,应用Sigmoid函数把实数域的输出映射到(0,1)区间,这就为输出提供了很好的概率解释。但是从本质上来说,逻辑回归还是一种广义的线性模型。为了求解逻辑回归模型,构造了交叉熵损失函数,并采用梯度下降法进行求解。

首先,假设有一个线性模型,表示为:

其中x

逻辑回归利用Sigmoid函数g(z)=1/[(1+exp(-z)]对线性输出进行变换,构造出预测函数为:

逻辑回归算法的实现经过准备数据、训练模型和应用模型3步,具体如下:

(1)给定训练集X、标签y、终止条件ε、初始参数θ

(2)重复以下步骤:

①计算A=Xθ

②计算误差,E=Sigmoid(A)-y;

③更新θ,θ

④判断|θ

(3)预测,给定一个新样本x

逻辑回归的变量筛选及参数估计都要求各自变量间相互独立,然而,影响因素间常存在多重共线性现象,导致单因素分析与多因素综合分析的结果相悖,并且回归结果不符合实际情况的问题。其中,多重共线性指影响因素之间存在完全的或近似的线性关系。解决多重共线性引起逻辑回归结果不符合实际情况的问题的思路是辨识影响因素间的多重共线性,省去具有很强相关性的任意自变量再进行回归分析。对多重共线性诊断常用统计量主要有方差膨胀因子(Variance Inflation Factor,VIF)、方差比例诊断等。例如,方差膨胀因子的计算公式是:

其中,R

然而,在实际应用中,尤其是继电保护缺陷预测场合,由于保护装置缺陷发生具有一定随机性,客观上数据精度不是足够高以及继电保护运行规律深入、不易挖掘,导致继电保护数据间一方面离散程度、不规则程度增加,影响因素间的相关性规律及未经处理的逻辑回归模型不完全符合实际情况,而另一方面,继电保护数据中仍旧蕴含丰富的规律及关联关系,有待于通过逻辑回归等挖掘手段予以揭示。具体到应用逻辑回归进行缺陷预测的场合,继电保护缺陷的多个影响因素间客观上存在相关性关系,但是,受数据精度及缺陷随机性的掣肘,多个影响因素间隐含的相关性关系难以通过方差膨胀因子等指标反映出来,也就是说,继电保护缺陷的多个影响因素间存在相关性关系,但是由于数据精度等原因,方差膨胀因子等指标未能将这种相关性程度反映出来,从而制约了逐步逻辑回归效果的发挥,导致逻辑回归结果中各影响因素的系数受到其他影响因素的干扰,逻辑回归结果不符合实际。

发明内容

针对上述问题,本发明提出了一种用于预测继电保护缺陷的方法,包括:

选取继电保护可靠运行的影响因素作为缺陷预测模型的自变量;

建立继电保护缺陷预测的逻辑回归模型;

所述逻辑回归模型增加了反映待求逻辑回归系数与单因素逻辑回归系数之间关系的附加条件;

将改进逻辑回归模型转化为求解逻辑回归参数的优化模型;采用粒子群算法及梯度下降法分别作为外循环和内循环对优化模型进行求解;既保留了粒子群算法在全局范围内搜索、跳出局部最优解的特性,又保留了梯度下降法在局部范围内快速搜索自变量参数的局部最优解的特性。

给定梯度下降法的所需数据及粒子群算法的所需数据,作为优化模型的输入数据,并以任意一个粒子所在的位置为初始参数使优化模型进入循环运算;

所述循环运算包括:内循环运算和外循环运算,若外循环迭代步数小于或等于最大迭代步数,则内循环运行算进入迭代计算,否则结束,输出种群的最好解,根据种群的最好解,确定预测模型;

采用逐步逻辑回归方法逐步获得逻辑回归结果;

给定待预测的继电保护缺陷的预测样本,针对预测样本使用预测模型进行预测,输出缺陷预测结果。

可选的,继电保护缺陷包括:继电保护装置硬件板卡缺陷、软件异常、二次回路异常及通道异常。

可选的,继电保护可靠运行的影响因素包括:继电保护装置的通道类型、对应一次设备的电压等级、是否通过六统一专业检测、是否为采用IEC61850通信、装置运行天数及装置距离上次完全检修的天数。

可选的,逻辑回归模型的附加条件是:

θ

θ表示逻辑回归系数,θ

附加条件仅对自变量对应的逻辑回归系数提出附加要求,不对常数项的逻辑回归系数提要求,因此i≥1;

δ为预先设定好的单因素逻辑回归系数的保留比例;

θ

可选的,逻辑回归模型,使用逐步逻辑回归算法,包括:逐个选入法和逐个剔除法。

可选的,逐个选入法,获得继电保护缺陷预测的逻辑回归结果,包括:

将影响因素添加到候选自变量集J中,构建选定变量集T,T初始为常数项1;

将J中编号最小且尚未加入过T中的自变量加入到T中,使用符号x’表示常数项以及T中的各个自变量组成的向量,使用符号θ’表示x’的逻辑回归系数;

构建改进逻辑回归模型如下:

s.t.θ

式中,θ

构建优化模型如下:

s.t.θ

式中,

x’

采用粒子群-梯度下降算法,对优化模型进行求解;

计算逻辑回归模型中x’的系数的t检验量,如果存在x’中除常数项外的自变量,其所对应的t检验量的绝对值≤2,将对应t检验量的绝对值最小的自变量从T中移除,计算与更新的T对应的x’下各个自变量及常数的逻辑回归系数θ’;

如果x’中除常数项外的自变量的系数的t检验量的绝对值均>2,且对应J中各个自变量均加入过T中,则结束;如果x’中除常数项外的自变量的系数的t检验量的绝对值均>2,且对应J中仍有自变量未加入过T中,则进行改进逻辑回归的下一步,即将J中编号最小且尚未加入过T中的自变量加入到T中,重新构建改进逻辑回归模型。

可选的,采用粒子群算法及梯度下降法分别作为外循环和内循环对优化模型进行求解,既保留了粒子群算法在全局范围内搜索、跳出局部最优解的特性,又保留了梯度下降法在局部范围内快速搜索自变量参数的局部最优解的特性。

可选的,梯度下降法的所需数据,包括:训练集、标签、终止条件、初始参数、学习步长和初始参数保留系数。

可选的,粒子群算法的所需数据,包括:惯性权重、速度调节参数、最大迭代次数、初始化粒子组成的种群和外循环迭代步数;

其中,种群中粒子所处的位置表示逻辑回归模型拟合的未知量,即影响因素的逻辑回归系数的一个解。

可选的,内循环运算,具体为,采用梯度下降法更新逻辑回归各影响因素的参数,直到相邻两次优化结果满足预设条件,计算种群中每个粒子适应度值,根据适应度值,记录粒子本身历史上搜索到的最好解及整个种群搜索到的最好解。

可选的,针对预测样本使用预测模型进行预测,输出缺陷预测结果,其特征在于:给定一个新样本x

本发明解决了继电保护缺陷随机性及数据精度不够高等原因,导致的影响因素间多重共线性特征无法被已有指标(如方差膨胀因子)发现的问题,得出了遵循自变量对因变量合理影响方向的回归参数。

附图说明

图1为本发明一种用于预测继电保护缺陷的方法的流程图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

本发明提出了一种用于预测继电保护缺陷的方法,如图1所示,包括:

选取继电保护可靠运行的影响因素作为缺陷预测模型的自变量;

所述逻辑回归模型增加了反映待求逻辑回归系数与单因素逻辑回归系数之间关系的附加条件;

将改进逻辑回归模型转化为求解逻辑回归参数的优化模型;

采用粒子群算法及梯度下降法分别作为外循环和内循环对优化模型进行求解;

给定梯度下降法的所需数据及粒子群算法的所需数据,作为优化模型的输入数据,并以任意一个粒子所在的位置为初始参数使优化模型进入循环运算;

循环运算包括:内循环运算和外循环运算,若外循环迭代步数小于或等于最大迭代步数,则内循环运行算进入迭代计算,否则结束,输出种群的最好解,根据种群的最好解,确定预测模型;

采用逐步逻辑回归方法逐步获得逻辑回归结果;

给定待预测的继电保护缺陷的预测样本,针对预测样本使用预测模型进行预测,输出缺陷预测结果。

其中,继电保护缺陷包括:继电保护装置硬件板卡缺陷、软件异常、二次回路异常及通道异常。

其中,继电保护可靠运行的影响因素包括:继电保护装置的通道类型、对应一次设备的电压等级、是否通过六统一专业检测、是否为采用IEC61850通信、装置运行天数及装置距离上次完全检修的天数。

可选的,逻辑回归模型的附加条件是:

θ

θ表示逻辑回归系数,θ

附加条件仅对自变量对应的逻辑回归系数提出附加要求,不对常数项的逻辑回归系数提要求,因此i≥1;

δ为预先设定好的单因素逻辑回归系数的保留比例。

其中,逻辑回归模型,使用逐步逻辑回归算法,包括:逐个选入法和逐个剔除法。

其中,逐个选入法,获得继电保护缺陷预测的逻辑回归结果,包括:

将影响因素添加到候选自变量集J中,构建选定变量集T,T初始为常数项1;

将J中编号最小且尚未加入过T中的自变量加入到T中,使用符号x’表示常数项以及T中的各个自变量组成的向量,使用符号θ’表示x’的逻辑回归系数;

构建改进逻辑回归模型如下:

s.t.θ

式中,θ

构建优化模型如下:

s.t.θ

式中,

x’

采用粒子群-梯度下降算法,对优化模型进行求解;

计算逻辑回归模型中x’的系数的t检验量,如果存在x’中除常数项外的自变量,其所对应的t检验量的绝对值≤2,将对应t检验量的绝对值最小的自变量从T中移除,计算与更新的T对应的x’下各个自变量及常数的逻辑回归系数θ’;

如果x’中除常数项外的自变量的系数的t检验量的绝对值均>2,且对应J中各个自变量均加入过T中,则结束;如果x’中除常数项外的自变量的系数的t检验量的绝对值均>2,且对应J中仍有自变量未加入过T中,则进行改进逻辑回归的下一步,即将J中编号最小且尚未加入过T中的自变量加入到T中,重新构建改进逻辑回归模型。

其中,采用粒子群算法及梯度下降法分别作为外循环和内循环对优化模型进行求解,既保留了粒子群算法在全局范围内搜索、跳出局部最优解的特性,又保留了梯度下降法在局部范围内快速搜索自变量参数的局部最优解的特性。

其中,梯度下降法的所需数据,包括:训练集、标签、终止条件、初始参数、学习步长和初始参数保留系数。

其中,粒子群算法的所需数据,包括:惯性权重、速度调节参数、最大迭代次数、初始化粒子组成的种群和外循环迭代步数;

其中,种群中粒子所处的位置表示逻辑回归模型拟合的未知量,即影响因素的逻辑回归系数的一个解。

其中,内循环运算,具体为,采用梯度下降法更新逻辑回归各影响因素的参数,直到相邻两次优化结果满足预设条件,计算种群中每个粒子适应度值,根据适应度值,记录粒子本身历史上搜索到的最好解及整个种群搜索到的最好解。

其中,针对预测样本使用预测模型进行预测,输出缺陷预测结果,其特征在于:给定一个新样本x

下面结合实施例对本发明进行进一步的说明:

单因素回归及建模

为了避免单因素分析与多因素综合分析结果相悖,将各影响因素分别引入逻辑回归模型进行参数训练,得到在单一影响因素条件下的逻辑回归参数,据此,在逻辑回归模型公式(2)式基础上,引入附加条件:

θ

式中,θ

采用粒子群-梯度下降方法训练逻辑回归模型,具体步骤是:

(1)给定梯度下降法所需数据,包括训练集X、标签y、终止条件ε、初始参数θ

(2)进入内循环。以m个粒子所处的位置Z

(3)更新粒子的速度及位置。本步参考已有粒子群算法,公式如下:

v

Z

式中,r

(4)若τ≤T则进入步骤(2)迭代计算,否则结束,输出整个种群的最好解θ

模型预测,即给定一个新样本x

继电保护缺陷预测旨在预测不同装备、运行条件下继电保护装置发生缺陷的概率。继电保护缺陷包括装置本体缺陷、软件缺陷、二次回路缺陷、通道缺陷等类型,不失一般性,本发明以相同装置硬件平台的历史数据作为训练样本,建立继电保护缺陷预测的逻辑回归模型。本发明构造算例的基础数据来自于继电保护统计分析系统。具体是国家电网公司所有的某制造厂家所使用相同硬件平台生产的线路继电保护装置的基本数据及运行数据。基本数据具体是指该硬件平台的线路继电保护装置的通道类型、对应一次设备的电压等级、是否通过六统一专业检测、是否为采用IEC 61850通信、装置运行天数、装置距离上次完全检修的天数,运行数据具体是指装置是否在投运日起至统计期止时间跨度范围内发生过缺陷。统计截止时间为2019年12月31日,为了将离散量转换成连续量进行建模,定义了自变量及因变量的取值方法如表1所示。

表1

为了得到改进的逻辑回归模型,以各个影响因素为独立的自变量,训练逻辑回归模型。逻辑回归模型的参数及t检验量如表2所示。表中的t检验量是针对自变量而言的,不是针对常数而言的。

表2

从表2中可以看出,自变量x

采用已有逐步逻辑回归方法建立的模型为:

Logit(y)=-0.2119+0.6002x

模型中,受与因变量具有强线性关系的x

依据表2的计算结果,可以建立改进逐步逻辑回归模型。改进逐步逻辑回归模型中所含变量及约束条件与当前所引入变量有关。不失一般性,当以所有自变量作为改进逻辑回归模型的系数时,构建的模型如下:

s.t.x

接下来,采用改进逐步回归方法训练模型,详细步骤如表3所示。

表3

比较已有方法训练的逻辑回归模型以及本方法训练的逻辑回归模型可见,已有方法训练的逻辑回归模型中,自变量x

最终得到的模型预测函数为:

将该硬件平台的线路继电保护装置按照表1得出x的取值后,代入上面方程,可以得到该装置发生缺陷的概率。例如,一台500kV电压等级、专用光纤通道、运行6年、自上次检修运行3年的智能站继电保护装置,发生缺陷的概率为:

本发明解决了继电保护缺陷随机性及数据精度不够高等原因,导致的影响因素间多重共线性特征无法被已有指标(如方差膨胀因子)发现的问题,得出了遵循自变量对因变量合理影响方向的回归参数。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现,例如,面向对象的程序设计语言Java和直译式脚本语言JavaScript等。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

相关技术
  • 一种用于预测继电保护缺陷的方法
  • 一种用于提取继电保护装置的缺陷模式的方法及系统
技术分类

06120112640404