掌桥专利:专业的专利平台
掌桥专利
首页

新能源电力系统特征提取模型训练、特征提取方法及系统

文献发布时间:2024-04-18 19:58:53


新能源电力系统特征提取模型训练、特征提取方法及系统

技术领域

本发明属于系统安全关键信息的快速提取领域,具体涉及一种新能源电力系统特征提取模型训练、特征提取方法及系统。

背景技术

高比例新能源大规模并网以及大量电力电子设备广泛加剧了电网运行方式的多变性,海量运行方式造就了电力系统的高维特征,如何有效提取稳定性相关的关键特征,进而快速判断电力系统实时运行状态,是电力系统亟需解决的重要问题。为此,需要在研究分析电力系统的海量运行方式的基础上,统计出能够表征高比例新能源电力系统稳定运行的关键特征组合,实现系统安全关键信息的快速提取。

目前,数据挖掘算法广泛应用于提取电力系统稳定性相关的关键特征,相关研究也取得了一定的成果。常见的特征提取方法主要有过滤式提取、包裹式提取和嵌入式提取。然而,过滤式提取依据相关性评估特征的重要程度,设定相应的阈值抽取特征,没有充分考虑特征间的耦合关系,与判别网络联系性不强;包裹式提取选择特征组合然后根据判别网络评估特征组合提取的有效性,由于存在大量可能的特征组合,因此该方法计算量较大;嵌入式提取在过滤式提取的基础上利用机器学习方法获得特征权重,有效结合特征选择和判别网络进行特征提取;但是以上三种方法均忽略了数据挖掘算法的可解释性,没有对选择的特征的物理意义进行充分分析,在实际应用中的缺乏可信度,从而导致选取的特征有效性差,因此,需要提供一种能够实现电力系统中特征的有效提取的方法。

发明内容

本发明的目的在于提供一种新能源电力系统特征提取模型训练、特征提取方法及系统,以克服现有方法采用人工智能方法实现的特征提取的有效性差的问题。

一种新能源电力系统特征提取模型训练方法,包括以下步骤:

确定训练数据集:所述训练数据集中的训练数据能够体现电力系统稳定性的相关特征;

将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

优选的,将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型之前,对输入特征量进行归一化。

优选的,进行特征提取获得初步特征具体包括:基于SHAP归因理论进行初步特征的提取。

优选的,计算提取的初步特征的shapley值,以初步特征的shapley值表征初步特征的边际贡献,对提取初步特征的shapley值进行排序,将满足贡献度阈值的初步特征设定为初筛集合E,利用初筛集合E计算新能源电力系统特征提取模型的判别准确率。

优选的,采用沙普利加性解释方计算提取的初步特征的shapley值。

优选的,利用极值交叠法提取的特征交叠空间,以最小概率落入特征量的交叠空间为原则,在初筛集合E中获取简化的特征量组合,计算每组特征量组合的平均Shapley值,并计算每组特征量组合在新能源电力系统特征提取模型的判别准确率。

一种新能源电力系统特征提取方法,基于上述新能源电力系统特征提取模型训练方法得到的新能源电力系统特征提取模型,利用训练好的新能源电力系统特征提取模型进行新能源电力系统特征提取,以平均Shapley值最高的特征量组合所对应的初步特征为关键特征,实现关键特征的提取。

一种新能源电力系统特征提取模型训练系统,包括:数据获取模块和训练模块;

数据获取模块:用于获取训练数据集,所获取的训练数据集中的训练数据能够体现电力系统稳定性的相关特征;

训练模块:将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

优选的,将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型之前,对输入特征量进行归一化。

优选的,进行特征提取获得初步特征具体包括:基于SHAP归因理论进行初步特征的提取。

优选的,计算提取的初步特征的shapley值,以初步特征的shapley值表征初步特征的边际贡献,对提取初步特征的shapley值进行排序,将满足贡献度阈值的初步特征设定为初筛集合E,利用初筛集合E计算新能源电力系统特征提取模型的判别准确率。

优选的,采用沙普利加性解释方计算提取的初步特征的shapley值。

优选的,利用极值交叠法提取的特征交叠空间,以最小概率落入特征量的交叠空间为原则,在初筛集合E中获取简化的特征量组合,计算每组特征量组合的平均Shapley值,并计算每组特征量组合在新能源电力系统特征提取模型的判别准确率。

一种新能源电力系统特征提取系统,包括新能源电力系统特征提取模块,所述新能源电力系统特征提取模块用于存储新能源电力系统特征提取模型,所述新能源电力系统特征提取模型基于上述新能源电力系统特征提取模型训练方法训练得到;利用新能源电力系统特征提取模块进行新能源电力系统特征提取,以平均Shapley值最高的特征量组合所对应的初步特征为关键特征,实现关键特征的提取。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述新能源电力系统特征提取模型训练方法的步骤。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述新能源电力系统特征提取模型训练方法的步骤。

与现有技术相比,本发明具有以下有益的技术效果:

本发明一种新能源电力系统特征提取模型训练方法,通过获取能够体现电力系统稳定性的相关特征的训练数据集,将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型,本发明克服了基于变分推理和马尔科夫链蒙特卡洛方法训练的贝叶斯神经网络非常耗时的弊端,应用该方法作为判别网络能够提高判别网络的准确率。

本发明利用新能源电力系统特征提取模型进行新能源电力系统特征提取,采用两阶段特征提取方法在充分降低特征维度的前提下有效保留了关键特征信息,本发明利用SHAP归因理论分析特征对目标的贡献度,剔除贡献度较低的特征,实现特征的初步筛选,同时基于交叠概率对初步筛选的特征进一步提取简化特征组合,结合SHAP理论和判别网络提取最优特征组合,实现关键特征的有效提取;利用SHAP理论计算特征对于结果的边际贡献,提高特征提取的可解释性;利用基于残差的SDE-Net对比采用完整特征和提取的关键特征作为输入时判别的准确率,验证关键特征提取的有效性,两方面提高了特征提取方法的可信度。

附图说明

图1为本发明实施例中新能源电力系统特征提取模型训练流程示意图。

图2为本发明实施例中新能源电力系统特征提取模型训练优化流程示意图示意图。

图3为本发明实施例中基于交叠概率的特征量选择流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示,本发明提供一种新能源电力系统特征提取模型训练方法,适用于高比例新能源海量运行场景下的关键特征提取模型训练,具体包括以下步骤:

确定训练数据集:所述训练数据集中的训练数据能够体现电力系统稳定性的相关特征;

将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

在本发明的一个实施例中,所述训练数据集中的训练数据从电机、负荷、线路和故障中进行收集,收集到的数据特征与电力系统稳定性相关。

具体的,包括电力系统故障前电机功角、电力系统故障后电机功角、电力系统故障前电机有功功率和无功功率、电力系统故障后电机有功功率和无功功率、母线电压幅值和相角、传输线路的有功功率和无功功率、负荷有功功率和无功功率。

设定获取的训练数据为初始输入量,统一设定采样的时间间隔为Δt,设定故障发生的时刻为t

当通过数值模拟获得训练数据集时,可能会伴生其他类型的不稳定性问题,在高比例新能源的电力系统中这种现象尤为明显。为了解决这个问题,需要排除由于发电机功率角振荡引起的振荡中心附近的电压降落。因此,本发明在电力系统扰动后的暂态过程中,如果负载母线电压能够在1s内恢复到大于0.7p.u.,则可以认为系统暂态电压稳定,利用暂态电压稳定性标准可以生成样本集的标签。

此外,由于采用的暂态电压稳定性标准相对严格。当母线电压不能达到上述恢复时间标准时,系统的暂态电压稳定性问题将更加严重。综上,仅需要对上述标准的电压不稳定性问题进行分析。根据稳定性标准,将相应的输出标签添加到数据集,稳定性标签为0,不稳定性标签为1。

如图2所示,在数据输出到所提出的新能源电力系统特征提取模型之前,需要对输入特征量进行归一化,所使用的Z-score标准化公式如下:

在上式中,x是原始输入特征量,μ是样本数据中输入特征量的平均值,而σ是样本数据中输入特征的方差。

本发明新能源电力系统特征提取模型采用基于残差SDE-Net的判别网络:基于残差SDE-Net的判别网络建模时将神经网络的隐含层间传播至输出的过程视为常微分方程控制的动力学系统,在多层神经网络中,相邻隐层之间顺序传播的数学表达式如下式所示:

x

其中,x

考虑对网络的认知不确定性建模,加入布朗运动项,SDE网络用以下公式表示:

dx

前一项f(x

为了提高SDE网络在任务中的高精度和鲁棒性,需要将Res-Net残差块作为暂态时间序列特征提取的基本单元。同时,残差卷积块仅在时间维度卷积,在SDE网络中新增特征一维卷积块,卷积在两个维度上依次序分别进行,进一步增强了模型对时间特征维度输入的提取能力。由单元残差块构成的一维残差SDE-Net结构,分别构成稳定判别的漂移网络f和可输出认知不确定度的扩散网络g;

在基于残差SDE-Net的判别网络中第k个残差块中,f

f

由此可以得到网络训练的目标函数:

目标函数的第一项表示训练过程中需要调整f网络的参数,使稳定/不稳定二元分类输出的损失函数最小化。目标函数的第二项表示扩散网络g参数将被调整,以便在对内分布样本进行训练时扩散网络g输出的不确定性最小。第三项表示在分布外样本上训练时,扩散网络g参数会被调整,使得扩散网络g输出不确定性最大。

为了实现上述目标函数,训练过程首先通过目标函数上的第一项梯度下降更新漂移网络f和外部全连通网络参数,然后通过目标函数上第二项梯度下降的差值更新扩散网络g参数。

考虑到电力系统暂态稳定评价问题中学习样本的代价敏感性问题,本发明采用焦点损失函数:

其中,N是训练样本的总数,y

N

新能源电力系统特征提取模型基于SHAP归因理论进行初步特征的提取,计算提取的初步特征的shapley值,以初步特征的shapley值表征初步特征的边际贡献,从而提高特征提取的可解释性;设定贡献度阈值,对提取初步特征的shapley值进行排序,满足贡献度阈值的初步特征设定为初筛集合E,通过以初步特征的shapley值表征初步特征的边际贡献获取初筛集合E,降低了特征组合数目。

采用沙普利加性解释方法(Shapley additive explations,SHAP)计算提取的初步特征的shapley值。沙普利加性解释方法主要衡量单一特征对目标的贡献程度来实现关键特征的提取;对于有M个样本的预测集M={x

其中G

将样本x

其中M={x

利用极值交叠法提取的特征交叠空间,以最小概率落入特征量的交叠空间为原则,在初筛集合E中获取简化的特征量组合,计算每组特征量组合的平均Shapley值,并计算每组特征量组合在新能源电力系统特征提取模型的判别准确率。通过调整新能源电力系统特征提取模型的训练参数使得获取的特征量组合的平均Shapley值满足设定的准确率,即可得到训练好的新能源电力系统特征提取模型。

利用训练好的新能源电力系统特征提取模型进行新能源电力系统特征提取,以平均Shapley值最高的特征量组合所对应的初步特征为关键特征,实现关键特征的提取。

利用极值交叠法提取的特征交叠空间,以最小概率落入特征量的交叠空间为原则,在初筛集合E中获取简化的特征量组合具体过程为:根据样本设定所需参数距离阈值δ和密度阈值ε

S={O

d

ε=β/I

其中,z为对应操作样本的总数;I

在具有高维特征属性的复杂电力网络中,有效降低其特征属性维度能快速准确分辨电力系统所处状态。以最小概率落入特征量的交叠空间为原则,提取最简的特征量组合,降低电力系统的特征维度。以一维二类问题为例,X={x

交叠概率的计算方法为:

P=p(O|X)p(X)+p(O|Y)p(Y)(18)

其中,p(X)、p(Y)分别代表X、Y两类事件发生的概率;O表示事件的交叠空间;p(O|X)、p(O|Y)分别表示X、Y两类事件的样本落入交叠空间的概率。p(X)、p(Y)、p(O|X)、p(O|Y)的表达式如下:

p(X)=m/(m+n)(19)

p(Y)=n/(m+n)(20)

若是c维k类系统的问题,选择适当特征量组合,使交叠概率P最小,这可作为特征选择的过滤判据,称为交叠概率判据J。在c维k类系统的问题中,设I

基于交叠概率的特征量选择流程如图3所示。

对训练好的新能源电力系统特征提取模型进行评价,评价训练好的新能源电力系统特征提取模型性能时,采用混淆矩阵工具对使用提取的关键特征作为输入的暂态稳定性评价模型的性能进行综合评价,以准确度指标ACC、召回率指标REC和特异性指标TNR为评价的标准。

混淆矩阵如表1所示,其中,TS和FU分别表示正确和不正确评估的系统暂态稳定样本数;FS和TU分别表示被错误预测和正确预测的系统暂态不稳定样本数。

可以根据混淆矩阵计算上述指标。准确度指标ACC表示所有正确判断的测试样本占总样本的比例:

召回率指标表示模型在所有真实标签稳定的样本中预测的正确比例:

特异性指标表示模型在所有真实标签不稳定的样本中预测的正确比例。

表1为混合矩阵

本发明采用两阶段特征提取方法在充分降低特征维度的前提下有效保留了关键特征信息,本发明利用SHAP归因理论分析特征对目标的贡献度,剔除贡献度较低的特征,实现特征的初步筛选,同时基于交叠概率对初步筛选的特征进一步提取简化特征组合,结合SHAP理论和判别网络提取最优特征组合,实现关键特征的有效提取;利用SHAP理论计算特征对于结果的边际贡献,提高特征提取的可解释性;利用基于残差的SDE-Net对比采用完整特征和提取的关键特征作为输入时判别的准确率,验证关键特征提取的有效性,两方面提高了特征提取方法的可信度。

采用基于残差的SDE-Net作为判别网络,考虑高比例新能源的接入容易导致样本分布多样化、不均匀的问题,从而使得稳定判别结果具有不确定性,因而需要引入考虑网络认知不确定性且能够量化此种不确定性的深度学习方法。SDE-Net被证明在多种数据集上相比传统的贝叶斯神经网络等具有更高的准确率,且克服了基于变分推理和马尔科夫链蒙特卡洛方法训练的贝叶斯神经网络非常耗时的弊端,应用该方法作为判别网络能够提高判别网络的准确率。

本发明一个实施例中提供一种新能源电力系统特征提取模型训练系统,包括:数据获取模块和训练模块;

数据获取模块:用于获取训练数据集,所获取的训练数据集中的训练数据能够体现电力系统稳定性的相关特征;

训练模块:将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

优选的,将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型之前,对输入特征量进行归一化。

优选的,进行特征提取获得初步特征具体包括:基于SHAP归因理论进行初步特征的提取。

优选的,计算提取的初步特征的shapley值,以初步特征的shapley值表征初步特征的边际贡献,对提取初步特征的shapley值进行排序,将满足贡献度阈值的初步特征设定为初筛集合E,利用初筛集合E计算新能源电力系统特征提取模型的判别准确率。

优选的,采用沙普利加性解释方计算提取的初步特征的shapley值。

优选的,利用极值交叠法提取的特征交叠空间,以最小概率落入特征量的交叠空间为原则,在初筛集合E中获取简化的特征量组合,计算每组特征量组合的平均Shapley值,并计算每组特征量组合在新能源电力系统特征提取模型的判别准确率。

本发明再一个实施例中,提供了一种新能源电力系统特征提取系统,包括新能源电力系统特征提取模块,所述新能源电力系统特征提取模块用于存储新能源电力系统特征提取模型,所述新能源电力系统特征提取模型基于上述新能源电力系统特征提取模型训练方法训练得到;利用新能源电力系统特征提取模块进行新能源电力系统特征提取,以平均Shapley值最高的特征量组合所对应的初步特征为关键特征,实现关键特征的提取。

本发明再一个实施例中,提供了一种终端设备,该终端设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(Central ProcessingUnit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于新能源电力系统特征提取模型训练方法的操作,包括以下步骤:确定训练数据集:所述训练数据集中的训练数据能够体现电力系统稳定性的相关特征;将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是终端设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括终端设备中的内置存储介质,当然也可以包括终端设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。

可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关新能源电力系统特征提取模型训练方法的相应步骤;计算机可读存储介质中的一条或一条以上指令由处理器加载并执行如下步骤:确定训练数据集:所述训练数据集中的训练数据能够体现电力系统稳定性的相关特征;将所述训练数据集中的训练数据输入至新能源电力系统特征提取模型中进行特征提取获得初步特征,根据获取的初步特征调整新能源电力系统特征提取模型的训练参数,重复上述步骤,优化调整新能源电力系统特征提取模型的训练参数直至新能源电力系统特征提取模型的损失函数收敛,得到训练好的新能源电力系统特征提取模型。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

相关技术
  • 基于信道模型特征提取的小区测量报告定位方法及系统
  • 牛脸特征提取模型训练方法、系统及牛的保险方法、系统
  • 模型训练方法、图像特征提取方法、系统、设备及介质
技术分类

06120116506984