掌桥专利:专业的专利平台
掌桥专利
首页

一种电力系统运行方式数据特征两阶段选择方法

文献发布时间:2023-06-19 09:58:59



技术领域

本发明属于电力系统运行和控制技术领域,涉及一种电力系统运行方式数据特征两阶段选择方法。

背景技术

我国特高压交直流混联电网规模不断扩大,新能源的广泛接入以及柔性负荷与电网双向互动程度的加大,使得源荷双侧的不确定性加大,电网特性的日益复杂,对调度运行人员监视和调控电网的安全稳定运行提出了巨大的挑战。因此,研究电网潜在的安全稳定问题,提高电力系统的可观性和可控性,实现大电网暂态稳定高效、快速评估,对维持电力系统安全稳定运行具有重要意义。随着广域量测技术的成熟和大数据理论的发展,基于人工智能方法进行在线TSA为大电网的智能控制提供了新的思路。

由于实际大规模交直流混联系统所含变量众多,其数据规模大,维数高,只有少数的特征量会影响系统的稳定水平,且大部分特征都是冗余的,如果作为暂态评估模型的输入,势必会影响计算效率、分类效果及在线应用的要求,因此需要对电力系统中的初始输入特征进行筛选,找到在所研究的安全稳定问题中起关键作用的特征。

发明内容

本发明的目的是提出一种电力系统运行方式数据特征两阶段选择方法,包括基于信息论的Filter阶段特征选择过程和基于改进SVM算法的Wrapper阶段特征选择过程,将已被实践证明的电网运行方式数据特征纳入初始候选特征中,筛选能够提供补充信息的特征,以尽量少的特征提供尽可能多的潮流信息,以便于调度运行人员实施监控。

本发明提出的电力系统运行方式数据特征两阶段选择方法,该方法包括以下步骤:

(1)对电力系统运行方式数据进行基于标准化互信息和交互信息增益的Filter阶段特征选择,包含以下步骤:

(1-1)从电力系统的同步矢量测量单元中获取电力系统运行方式数据,并对数据中的缺失数据进行补充,对重复数据进行删除,得到有效数据,对每一组运行数据构建出一个样本以及样本的特征,按照暂态稳定与否对样本打上0或1的标签,记做样本的类别属性C;

(1-2)构建一个已选特征子集S,初始化S为空集;构建一个备选特征集合US,初始化为空集;分别构建集合S和集合US的分类准确率指标,记做Acc(S)和Acc(US),初始化时将Acc(S)和Acc(US)分别设为0;

上述Acc(US)和Acc(S)分别表示目标最优特征子集S和备选特征集合US的分类准确率,分类准确率的计算公式如下:

式中,TP、FN、FP和TN分别表示在给定的机器学习算法中,二分类问题的样本被正确地划分为正例的样本个数、被错误地划分为负例的样本个数、被错误地划分为正例的样本个数和被正确地划分为负例的样本个数;

(1-3)根据步骤(1-1)的有效数据,构建一个电力系统运行方式数据的初始特征集合,将备选特征集合US更新为该初始特征集合;

(1-4)采用Parzen窗方法,对当前的备选特征集合US中的各个特征进行离散估计和概率密度估计,得到电力系统运行方式数据特征的概率分布,即特征f

(1-5)利用下式,分别计算步骤(1-4)的备选特征集合US中的所有特征f和类别属性C的标准化互信息NMI(f;C):

其中,MI(f;C)表示特征f和特征类别属性C之间的互信息,即:

H(f)表示特征f的信息熵,H(C)表示特征类别属性C的信息熵,对于单个连续变量X,信息熵的计算公式如下:

H(X)=-∫p(x)log

其中p(x)是变量X的概率分布;

将NMI(f;C)中取值为零的相应特征从备选特征集合US中剔除;

(1-6)计算步骤(1-4)的备选特征集合US中任意两个特征之间的NIG指标和Score指标,利用下式形成每个特征的IG-RFE评价标准结果,即对备选特征集合US的每个特征进行计算,得到备选特征集合US中所有特征的权重得分w(f

其中,N为备选特征集合US中的特征数量;

Score指标Score(f

(1-7)对步骤(1-6)中所有特征的权重得分w(f

(1-8)对步骤(1-7)的备选特征集合US中特征的总个数进行判断,若US为空集,则将当前的已选特征子集S输出作为最优特征子集,实现电力系统运行方式数据特征的两阶段选择;若US不为空集,则将当前的备选特征集合US作为步骤(2)的输入,进行第二阶段的筛选;

(2)以步骤(1)所得到的备选特征集合US作为改进混合核函数SVM的输入,进行第二阶段Wrapper特征选择,包含以下步骤:

(2-1)采用改进混合核函数支持向量机算法,以备选特征集合US为输入,根据10折交叉验证方法对备选特征集合US进行分类训练,输出得到当前备选特征集合US的分类准确率Acc(US);

(2-2)将已选特征子集S的分类准确率Acc(S)与步骤(2-1)计算得到的备选子集US分类准确率进行比较,若Acc(US)大于Acc(S),则将S更新为US,并将Acc(S)更新为Acc(US),返回步骤(1-4),若Acc(US)小于或等于Acc(S),则直接返回步骤(1-4)。

上述特征提取方法的步骤(1-1)中,初始特征集合为电力系统中故障前稳态运行数据信息,包括元件特征数据和系统特征数据,所述的元件特征数据包含故障前系统中每台发电机组的有功功率和无功功率、故障前系统中各节点负荷的有功功率和无功功率、输电线路的有功功率和无功功率、故障前系统中各母线的电压和相角;所述的系统特征数据为故障前系统中发电机的总有功出力和总无功出力、故障前系统中全部有功负荷和全部无功负荷、故障前系统中机械输入功率总和、故障前系统中总无功储备容量、故障前电力系统网络拓扑指标。

上述特征提取方法的步骤(1-4)中,所示的Parzen窗方法为非参数估计方法,对步骤(1-1)中数据清洗后的电力系统运行方式数据特征进行空间划分,以频数作为空间中心点坐标对应的概率,获得运行方式数据特征的密度分布。

上述特征提取方法的步骤(1-6)中,所述的NIG指标为标准化信息增益指标NIG(f

其中,IG(f

上述特征提取方法的步骤(1-6)中,单个特征的IG-RFE评价标准是通过对标准化互信息指标衡量之间的相关联程度NMI和交互信息增益计算特征之间的协同程度NIG进行权重匹配得到,对于单个特征的IG-RFE评价标准表达式如下:

其中N是步骤(1-6)中计算的集合US特征总数量。

上述特征提取方法的步骤(2)中,所述的改进混合核函数支持向量机算法,采用选定的映射函数变换作为混合函数,将数据样本映射到高维空间中,通过高维空间中的一个线性超平面来区分两类数据样本,其中改进混合函数的具体表达式如下:

K

式中,K

本发明提出的电力系统运行方式数据特征两阶段选择方法,其优点是:

1、本发明的电力系统运行方式数据特征两阶段选择方法,首先通过基于标准化互信息和交互信息增益的IG-RFE(Interaction Gain-Recursive Feature elimination)特征选择Filter阶段算法,去除相关算法中的先验参数并且正确判断特征之间的复杂依赖关系,从而实现电力系统运行方式数据关键特征的自动搜寻和提取;然后通过改进混合核函数SVM算法协同递归特征消除RFE搜索方法进行不良特征的移除,直到获得结果数量为预设值大小的特征集合,实现了电力系统关键特征高效、准确自动搜寻。

2、本发明方法易于实施,本方法通过引入人工智能领域的数据驱动方法,对其中较为关键的两部分,即基于标准化互信息和交互信息增益特征选择算法和改进混合核函数SVM算法协同递归特征消除(RFE)搜索方法的分类器设计,实现电力系统关键特征的自动搜寻,因此本方法易于实施。

具体实施方式

本发明提出的电力系统运行方式数据特征两阶段选择方法,包括以下步骤:

(1)对电力系统运行方式数据进行基于标准化互信息和交互信息增益的Filter阶段特征选择,包含以下步骤:

(1-1)从电力系统的同步矢量测量单元中获取电力系统运行方式数据,并对数据中的缺失数据进行补充,对重复数据进行删除,得到有效数据,对每一组运行数据构建出一个样本以及样本的特征,按照暂态稳定与否对样本打上0或1的标签,记做样本的类别属性C;

(1-2)构建一个已选特征子集S,初始化S为空集;构建一个备选特征集合US,初始化为空集;分别构建集合S和集合US的分类准确率指标,记做Acc(S)和Acc(US),初始化时将Acc(S)和Acc(US)分别设为0;

上述Acc(US)和Acc(S)分别表示目标最优特征子集S和备选特征集合US的分类准确率,分类准确率的计算公式如下:

式中,TP、FN、FP和TN分别表示在给定的机器学习算法中,二分类问题的样本被正确地划分为正例的样本个数、被错误地划分为负例的样本个数、被错误地划分为正例的样本个数和被正确地划分为负例的样本个数;可以参考下表:

(1-3)根据步骤(1-1)的有效数据,构建一个电力系统运行方式数据的初始特征集合,将备选特征集合US更新为该初始特征集合;

(1-4)采用Parzen窗方法,对当前的备选特征集合US中的各个特征进行离散估计和概率密度估计,得到电力系统运行方式数据特征的概率分布,即特征f

(1-5)利用下式,分别计算步骤(1-4)的备选特征集合US中的所有特征f和类别属性C的标准化互信息NMI(f;C):

其中,MI(f;C)表示特征f和特征类别属性C之间的互信息,即:

H(f)表示特征f的信息熵,H(C)表示特征类别属性C的信息熵,对于单个连续变量X,信息熵的计算公式如下:

H(X)=-∫p(x)log

其中p(x)是变量X的概率分布;

将NMI(f;C)中取值为零的相应特征从备选特征集合US中剔除;

(1-6)计算步骤(1-4)的备选特征集合US中任意两个特征之间的NIG指标和Score指标,利用下式形成每个特征的IG-RFE评价标准结果,即对备选特征集合US的每个特征进行计算,得到备选特征集合US中所有特征的权重得分w(f

其中,N为备选特征集合US中的特征数量。

Score指标Score(f

(1-7)对步骤(1-6)中所有特征的权重得分w(f

(1-8)对步骤(1-7)的备选特征集合US中特征的总个数进行判断,若US为空集,则说明后向剔除的特征子集选择过程已经结束,将当前的已选特征子集S输出作为最优特征子集,实现电力系统运行方式数据特征的两阶段选择;若US不为空集,则将当前的备选特征集合US作为步骤(2)的输入,进行第二阶段的筛选;

(2)以步骤(1)所得到的备选特征集合US作为改进混合核函数SVM的输入,进行第二阶段Wrapper特征选择,包含以下步骤:

(2-1)采用改进混合核函数支持向量机算法,以备选特征集合US为输入,根据10折交叉验证方法对备选特征集合US进行分类训练,输出得到当前备选特征集合US的分类准确率Acc(US);

(2-2)将已选特征子集S的分类准确率Acc(S)与步骤(2-1)计算得到的备选子集US分类准确率进行比较,若Acc(US)大于Acc(S),则说明当前US的特征子集性能优于已选特征子集S,将S更新为US,并将Acc(S)更新为Acc(US),返回步骤(1-4),若Acc(US)小于或等于Acc(S),则说明此时的US不如已选特征集合S的分类性能好,故不做更新,返回步骤(1-4)。

上述特征提取方法的步骤(1-1)中,初始特征集合为电力系统中故障前稳态运行数据信息,包括元件特征数据和系统特征数据,所述的元件特征数据包含故障前系统中每台发电机组的有功功率和无功功率、故障前系统中各节点负荷的有功功率和无功功率、输电线路的有功功率和无功功率、故障前系统中各母线的电压和相角;所述的系统特征数据为故障前系统中发电机的总有功出力和总无功出力、故障前系统中全部有功负荷和全部无功负荷、故障前系统中机械输入功率总和、故障前系统中总无功储备容量、故障前电力系统网络拓扑指标。

上述特征提取方法的步骤(1-4)中,所述的Parzen窗方法为非参数估计方法,对步骤(1-1)中数据清洗后的电力系统运行方式数据特征进行空间划分,以频数作为空间中心点坐标对应的概率,获得运行方式数据特征的密度分布。

上述特征提取方法的步骤(1-6)中,所述的NIG指标为标准化信息增益指标NIG(f

其中,IG(f

上述特征提取方法的步骤(1-6)中,单个特征的IG-RFE评价标准是通过对标准化互信息指标衡量之间的相关联程度NMI和交互信息增益计算特征之间的协同程度NIG进行权重匹配得到,对于单个特征的IG-RFE评价标准表达式如下:

其中N是步骤(1-6)中计算的集合US特征总数量。

上述特征提取方法的步骤(2)中,所述的改进混合核函数支持向量机算法,采用选定的映射函数变换作为混合函数,将数据样本映射到高维空间中,通过高维空间中的一个线性超平面来区分两类数据样本,其中改进混合函数的具体表达式如下:

K

式中,K

本发明的电力系统运行方式数据特征两阶段选择方法,首先基于信息论的Filter阶段特征选择过程,通过该部分所提出的基于标准化互信息和交互信息增益的IG-RFE特征选择Filter阶段算法,去除相关算法中的先验参数并且正确判断特征之间的复杂依赖关系,包括相关性、冗余度以及互补性等,从而实现电力系统关键特征的自动搜寻和提取。随后基于改进SVM算法的Wrapper阶段特征选择过程,通过改进混合核函数SVM算法协同递归特征消除RFE搜索方法不断从当前待处理的特征集合中进行不良特征的移除实现挑选过程,直到获得结果数量为预设值大小的特征集合,将已被实践证明的电网运行方式数据特征纳入初始候选特征中,筛选能够提供补充信息的特征,以尽量少的特征提供尽可能多的潮流信息,以便于调度运行人员实施监控。

本发明方法针对数据规模大且维数高的电力系统运行方式数据,采用基于信息论的Filter阶段特征选择方法和基于改进SVM算法的Wrapper阶段特征选择方法结合的两阶段特征选择方法,用于不同的训练任务,能够有效提高电力系统关键特征的自动搜寻的效率和准确率。

本发明方法主要分为两个阶段:首先基于信息论的Filter阶段特征选择过程,在该阶段通过引入信息论相关概念的定义和基本指标,提出对应的IG-RFE评价标准,该评价标准作为Filter阶段算法的评价指标,对于特征之间的相关关系和组合协同效应都有良好的刻画效果,在很大程度上避免了传统方法的人为先验参数设置而可能导致的相关误差。这是本发明方法的发明点之一。然后进行基于改进SVM算法的Wrapper阶段特征选择过程,通过改进混合核函数SVM算法协同递归特征消除RFE搜索方法不断从当前待处理的特征集合中进行不良特征的移除实现挑选过程,直到获得结果数量为预设值大小的特征集合。这是本发明方法与其他方法的另一个本质的不同,也是本发明的发明点之二。

相关技术
  • 一种电力系统运行方式数据特征两阶段选择方法
  • 一种基于filter–wrapper框架的电子鼻数据特征选择方法
技术分类

06120112377557