掌桥专利:专业的专利平台
掌桥专利
首页

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统

文献发布时间:2024-04-18 19:59:31


一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统

技术领域

本发明涉及电力市场领域,具体是一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统。

背景技术

电价信号是电力商品属性直接体现,能够准确反映电力的市场真实价值,科学、合理、准确的电价可为电力市场参与者提供良好的经济信号,提高资源分配效率,维持系统安全与经济运行。然而,由于电价受市场供需、线路检修、发电商报价等多方面因素影响,极易出现异常电价,包括尖峰价格、均值异常、区域异常等等。一方面,异常电价的形成必定表明在出清过程中存在异常行为或者存在异常现象,会危害电力系统正常运行,进而损害参与者利益;另一方面,电价的突变会增大电力市场的风险性,阻碍市场主体参与市场的积极性。因此,电力市场异常电价的准确识别对于电力市场的安全稳定有着至关重要的作用。

目前,国内外已经对异常电价识别做了大量研究。绝大部分方法虽然能够对部分异常电价信号类型做出准确识别,但均主要关注电价信号作为典型时序信号在时间尺度上的特征,本质上是同一节点电价信号t时刻和t-1时刻的纵向对比,而忽略了电价信号在空间上的关联特性。通过某省级电网交易中心的实际节点电价数据可以发现,除了上述时间异常电价以外,不同节点之间的价差过大,部分节点偏离整体电价等空间异常情况也时有发生,但针对该类异常的识别方法,现有研究均鲜有涉及。空间异常电价信号本质上作为一类离群异常信号,电力和工业领域其他方向的异常检测方法具有借鉴意义。通常是通过聚类或者分类算法来对异常值进行识别,但在网络拓扑信息未知的情况下,如若采用上述方法对系统节点电价整体进行异常信号识别,将无法判断出电价分区内部的细微异常。

综上可见,现有方法针对空间异常电价的识别存在一定不足。一方面目前异常电价识别方法通常侧重于时间异常电价信号的识别,针对空间异常电价这一大类鲜有涉及;另一方电力和工业领域其他方向的异常检测方法无法在网络拓扑信息位置的情况下,实现空间异常电价信号的精准识别。因此,有必要考虑历史电价数据分布特征,研究从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统。

发明内容

本发明的目的是提供一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,包括历史电价数据降维模块、电价分区模块、异常电价节点及异常电价分区识别模块;

所述历史电价数据降维模块获取历史高维电价数据,并进行降维,得到降维后的低维电价数据集;

所述电价分区模块对低维电价数据集进行特征提取及聚类,获得多个电价分区;

基于电价分区,所述异常电价分区模块对待测电价数据的疏离程度进行刻画,从而识别出异常电价节点和异常电价分区。

进一步,所述历史电价数据降维模块通过t-SNE算法对历史高维电价数据进行降维。

进一步,所述历史电价数据降维模块对历史高维电价数据进行降维的步骤包括:

1)获取历史高维电价数据,记为

2)以数据集X中的任意数据点x

3)基于相似条件概率p

式中:p

4)计算数据点x

式中:P

其中,联合概率分布P

式中:N

5)基于困惑度Perplexity(P

6)假设

其中,低维电价数据中数据点y

式中:q

7)构建优化目标函数minC,即:

式中,KL(P

8)利用梯度下降法迭代求解优化目标函数min C,从而构建低维电价数据集Y;

迭代求解的计算公式如下所示:

式中:Y

进一步,所述电价分区模块对低维电价数据进行特征提取及聚类的方法包括DBSCAN算法。

进一步,对低维电价数据进行特征提取及聚类的步骤包括:

1)导入低维电价数据集Y,并初始化簇类标志Cate;

2)从低维电价数据集Y中任取一数据点y

3)判断数据点y

4)利用式(9)判断数据点y

Core(Y)={y

式中:Core(Y)表示据集Y内所有核心点构成的集合;MinPts是设定的密度阈值参数;N

5)更新簇类标志Cate,并将数据点y

6)按顺序选取待测集合H中的数据点h

7)利用式(9)判断数据点h

8)判断待测集合H中所有数据点是否均完成标记,若是,则进入步骤9);若否,则跳转至步骤6);

9)判断数据集Y中所有数据点是否均完成标记,若是,则完成聚类;若否,则跳转至步骤2)。

进一步,识别异常电价节点和异常电价分区的步骤包括:

1)对各个电价分区内部的异常电价进行识别;

2)剔除识别出的异常电价得到每个区域内部的正常电价数据点,再依据剩余电价数据的数据特征进行电价分区间的异常识别,检测是否存在异常电价区域。

进一步,对各个电价分区内部的异常电价进行识别的步骤包括:

1)对孤立森林进行训练,步骤包括:

1.1)设定超参数,包括iForest内孤立树(iTree)的数量N

1.2)依据电价分区结果

1.3)根据数据集

1.4)iTree标志q初始化;

1.5)iTree标志q更新;

1.6)清空所有的子空间K

1.7)从数据集

1.8)将子空间K

1.9)判断待分割区间R内是否仅包含一个数据节点,若是,则将对应的子空间K

1.10)对待分割区间R内数据进行排序,随机生成一数据点r

1.11)判断当前层的子空间是否均完成了分割,若是,则跳转至步骤1.13);否则进入步骤1.12);

1.12)子空间的标志k更新,跳转至步骤3-8);

1.13)层数标志s更新;

1.14)判断当前iTree是否已达到最大层数,若是,则将目前层的所有子空间K

1.15)判断是否完成了所有iTree的训练,若是,则完成该电价分区训iForest练过程,结束流程;否则跳转至步骤1.15);

2)首先判断第Cate个电价分区待测数据

式中:

其中,函数f

式中:

3)将异常分数大于预设阈值的数据识别为异常电价。

进一步,对电价分区数据进行预处理的步骤包括:判断数据集平均值是否小于10,若是,则将数据四舍五入精确到个位,否则按5的倍数取整。

进一步,进行电价分区间异常识别的步骤包括:

1)计算每个电价分区内正常电价的平均值

式中:

2)将每个电价分区的正常电价平均值组成一个新的数据集Z,得到:

3)将数据集Z视为待测数据集,完成该数据集下iForest的训练,再计算每个电价分区的异常分数,若异常分数大于预设分数阈值,则该分区为异常电价分区。

进一步,还包括出清异常预警模块;

所述出清异常预警模块调取异常电价分区模块的数据,若当前时刻存在异常电价节点和/或异常电价分区,则发出电力系统出清异常警报。

本发明的技术效果是毋庸置疑的,本发明的有益效果如下:

1)本发明提出的将电价信号分区进而辨识空间异常特征的技术思路,可以有效避免某些区域因为线路问题整体陪判定为异常电价后,内部问题被忽略的情况发生,有效提升识别精度。

2)本发明所提的基于数据分布疏密特征的电价异常两步制识别框架能够有效提取空间电价信号这一非时序信号的数据分布疏离特征,并且可以从电价节点和电价分区两个角度,对空间异常电价实现精准识别,为后续异常电价成因溯源提供更加准确的信息。

3)本发明可广泛应用于电力现货市场电价信号监管,快速识别出电价空间异常电价节点和分区,实现空间异常电价信号初步分类,为后续电价异常信号成因溯源提供信息基础,保障电力市场安全与运行。

附图说明

图1为利用DBSCAN算法进行电价聚类的流程图;

图2为孤立森林树训练流程图;

图3为从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别方法流程图;

图4为M1-M3的空间异常电价信号准确识别率;

图5为M1-M3的空间异常电价信号错误识别率;

图6为本发明所提方法异常电价分区识别效果。

具体实施方式

下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。

实施例1:

参见图1至图6,一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,包括历史电价数据降维模块、电价分区模块、异常电价节点及异常电价分区识别模块;

所述历史电价数据降维模块获取历史高维电价数据,并进行降维,得到降维后的低维电价数据集;

所述电价分区模块对低维电价数据集进行特征提取及聚类,获得多个电价分区;

基于电价分区,所述异常电价分区模块对待测电价数据的疏离程度进行刻画,从而识别出异常电价节点和异常电价分区。

实施例2:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1,进一步的,所述历史电价数据降维模块通过t-SNE算法对历史高维电价数据进行降维。

实施例3:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-2任一项,进一步的,所述历史电价数据降维模块对历史高维电价数据进行降维的步骤包括:

1)获取历史高维电价数据,记为

2)以数据集X中的任意数据点x

3)基于相似条件概率p

式中:p

4)计算数据点x

式中:P

其中,联合概率分布P

式中:N

5)基于困惑度Perplexity(P

6)假设

其中,低维电价数据中数据点y

式中:q

7)构建优化目标函数minC,即:

式中,KL(P

8)利用梯度下降法迭代求解优化目标函数minC,从而构建低维电价数据集Y;

迭代求解的计算公式如下所示:

式中:Y

实施例4:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-3任一项,进一步的,所述电价分区模块对低维电价数据进行特征提取及聚类的方法包括DBSCAN算法。

实施例5:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-4任一项,进一步的,对低维电价数据进行特征提取及聚类的步骤包括:

1)导入低维电价数据集Y,并初始化簇类标志Cate;

2)从低维电价数据集Y中任取一数据点y

3)判断数据点y

4)利用式(9)判断数据点y

Core(Y)={y

式中:Core(Y)表示据集Y内所有核心点构成的集合;MinPts是设定的密度阈值参数;N

5)更新簇类标志Cate,并将数据点y

6)按顺序选取待测集合H中的数据点h

7)利用式(9)判断数据点h

8)判断待测集合H中所有数据点是否均完成标记,若是,则进入步骤9);若否,则跳转至步骤6);

9)判断数据集Y中所有数据点是否均完成标记,若是,则完成聚类;若否,则跳转至步骤2)。

实施例6:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-5任一项,进一步的,识别异常电价节点和异常电价分区的步骤包括:

1)对各个电价分区内部的异常电价进行识别;

2)剔除识别出的异常电价得到每个区域内部的正常电价数据点,再依据剩余电价数据的数据特征进行电价分区间的异常识别,检测是否存在异常电价区域。

实施例7:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-6任一项,进一步的,对各个电价分区内部的异常电价进行识别的步骤包括:

1)对孤立森林进行训练,步骤包括:

1.1)设定超参数,包括iForest内孤立树(iTree)的数量N

1.2)依据电价分区结果

1.3)根据数据集

1.4)iTree标志q初始化;

1.5)iTree标志q更新;

1.6)清空所有的子空间K

1.7)从数据集

1.8)将子空间K

1.9)判断待分割区间R内是否仅包含一个数据节点,若是,则将对应的子空间K

1.10)对待分割区间R内数据进行排序,随机生成一数据点r

1.11)判断当前层的子空间是否均完成了分割,若是,则跳转至步骤1.13);否则进入步骤1.12);

1.12)子空间的标志k更新,跳转至步骤3-8);

1.13)层数标志s更新;

1.14)判断当前iTree是否已达到最大层数,若是,则将目前层的所有子空间K

1.15)判断是否完成了所有iTree的训练,若是,则完成该电价分区训iForest练过程,结束流程;否则跳转至步骤1.15);

2)首先判断第Cate个电价分区待测数据

式中:

其中,函数f

式中:

3)将异常分数大于预设阈值的数据识别为异常电价。

实施例8:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-7任一项,进一步的,对电价分区数据进行预处理的步骤包括:判断数据集平均值是否小于10,若是,则将数据四舍五入精确到个位,否则按5的倍数取整。

实施例9:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-8任一项,进一步的,进行电价分区间异常识别的步骤包括:

1)计算每个电价分区内正常电价的平均值

式中:

2)将每个电价分区的正常电价平均值组成一个新的数据集Z,得到:

3)将数据集Z视为待测数据集,完成该数据集下iForest的训练,再计算每个电价分区的异常分数,若异常分数大于预设分数阈值,则该分区为异常电价分区。

实施例10:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,技术内容同实施例1-9任一项,进一步的,还包括出清异常预警模块;

所述出清异常预警模块调取异常电价分区模块的数据,若当前时刻存在异常电价节点和/或异常电价分区,则发出电力系统出清异常警报。

实施例10:

一种从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统,该系统通过对历史高维电价数据的处理,对电价数据分布特征进行分析,提取电价数据信号关键分区特征,进而实现电价信号分区,进一步针对待测电价信号数据的疏密特征,运用孤立森林算法实现空间异常电价的分层次识别,有效辨识电价异常点和电价异常分区,保障电力市场安全与经济运行。

具体的,首先为了避免历史电价数据纬度过高影响电价分区效果,基于t-SNE算法对历史电价数据进行降维;然后,利用DBSCAN算法分析降维后电价数据的分布特征,提取电价数据信号关键分区特征,完成电价分区;最后,利用孤立森铃算法,在电价分区信息的基础之上,对待测电机信号的疏离程度进行刻画,并识别异常电价节点和异常电价分区。此外还通过实际算例仿真,验证了本发明所提方法的有效性和准确性。

其具体工作过程如下:

(1)基于t-SNE算法的电价数据降维方法

首先利用t-SNE算法,通过仿射变换将原始高维数据点映射到概率分布上,再在低维空间中构建新的概率分布,不断优化低维空间数据,使得高、低维数据空间的两个概率分布尽可能保持一致,从而得到可以用于后续电价分区的低维数据。其具体步骤如下:

1)构建高维原始电价数据集,并计算其联合概率概率:

系统各节点电价数据组成高维原始数据集

式中:σ

为了保证条件概率的对称性以简化后续梯度计算,加快优化过程,采用更加通用的联合概率代替原始的条件概率,如式(2)所示:

式中:p

由式(1)和(2)可知,若要获得准确的联合概率p

以数据点x

式中:P

式中:N

由式(3)和(4)可知,通过调节概率分布的困惑度Perplexity(P

2)创建低维目标数据集,并假设其联合概率概率:

完成原始高维数据空间的联合概率分布计算以后,同样需要对降维后目标数据集的联合概率分布进行假设。假设

为了解决数据降维过程中出现的拥挤问题,可以利用自由度为1的t分布来表征低维数据空间的概率分布。低维数据空间中数据点的联合概率q

式中:q

3)计算两个联合概率分布之间KL散度,并不断优化低维目标数据集:

理想情况下,若降维前后数据的联合概率分布P

式中:C为迭代优化的目标函数,是数据集内所有数据点概率分布的KL散度之和。KL(·)表示计算两分布之间的KL散度。

最小化目标函数C,保证降维前后数据的联合概率分布P

式中:Y

(2)基于DBSCAN算法的降维后节点电价分区方法

利用DBSCAN算法对降维后的电价数据Y进行聚类的步骤如图1所示,具体流程如下:

2-1)导入降维后的电价数据集Y,并初始化簇类标志Cate。

2-2)从数据集Y中任取一数据点并y

2-3)利用式(9)判断数据点y

Core(Y)={y

式中:Core(Y)表示据集Y内所有核心点构成的集合;MinPts是设定的密度阈值参数,其表示单个核心点所在的数据集合中数据点的最小数量;N

2-4)簇类标志Cate更新,并将数据点y

2-5)按顺序选取待测集合H中的数据点h

2-6)利用式(11)判断数据点h

2-7)判断待测集合H中所有数据点是否均完成标记,如是继续步骤2-8);若否则跳转至步骤2-5)。

2-8)判断数据集Y中所有数据点是否均完成标记,如是则完成聚类;若否则跳转至步骤2-2)。

(3)基于数据分布疏密特征的电价异常两步制识别框架

在进行空间异常电价的识别过程中,分两步进行,首先对各个电价分区内部的异常点进行识别,剔除异常数据后,得到每个区域内部的正常电价数据点,再依据剩余电价数据的数据特征进行电价分区间的异常识别,检测是否存在异常电价区域。

1)电价分区内部异常电价识别流程

基于电价分区信息,利用孤立森林算法对分区后的电价数据异常进行识别,主要分为两个环节,第一个环节是孤立森林(iForest)的训练;第二个环节是用训练后的孤立森林来计算每个数据点的异常分数,并对异常数据点进行识别。

其中,第一个环节对孤立森林进行训练的流程步骤如图2所示,以任意第Cate个电价分区为例:

3-1)设定超参数:①iForest内孤立树(iTree)的数量N

3-2)依据电价分区结果

3-3)判断数据集

3-4)iTree标志q初始化。

3-5)iTree标志q更新。

3-6)清空所有的子空间K

3-7)从数据集

3-8)将子空间K

3-9)判断待分割区间R内是否仅包含一个数据节点,如是则将对应的子空间K

3-10)对待分割区间R内数据进行排序,随机生成一数据点r

3-11)判断当前层的子空间是否均完成了分割,若是则跳转至步骤3-13);否则继续步骤3-12)。

3-12)子空间的标志k更新,跳转至步骤3-8)。

3-13)层数标志s更新。

3-14)判断当前iTree是否已达到最大层数,若是则将目前层的所有子空间K

3-15)判断是否完成了所有iTree的训练,若是则完成该电价分区训iForest练过程,结束流程;否则跳转至步骤3-5)。

依照上述步骤完成所有电价分区iForest的训练以后,依次对各个电价分区内部的待测数据进行异常信号识别。首先判断第Cate个电价分区待测数据

式中:函数f

式中:

/>

式中:γ为欧拉常数,其值约等于0.5772156649。

异常分数越接近0,则表明将待测数据点从数据集中分离出去所需的路径越长,该数据点越不可能是异常点,反之异常分数越接近1,则该待测数据点越容易被从数据集中分离,该数据点越可能是异常点。依据各电价分区内节点电价异常分数的类别数量确定合理的阈值,完成对每个电价分区内部的异常点识别。

2)异常电价分区识别流程

完成电价分区内部异常电价识别后,利用式(13)计算每个电价分区内正常电价的平均值:

式中:

将每个电价分区的正常电价平均值组成一个新的数据集Z,如式(14)所示:

将数据集Z视为待测数据集,重复步骤3-1)至3-15),完成该数据集下iForest的训练,再利用式(10)-(12)计算每个电价分区的异常分数,从而识别电价分区内的电价是否相较于整个系统存在异常。

综上所述,本发明所提出的从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别方法流程图如图3所示。

实施例12:

一种实施例1-11任一项所述从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别系统的验证实验,内容如下:

(1)运用t-SNE算法构建电价数据降维前后的联合概率分布

首先通过式(1)-(4),构建原始高维电价数据的联合概率分布,再创建低维目标数据集,并通过式(5)假设其联合概率概率分布。

(2)计算两个联合概率分布之间KL散度,并不断优化低维目标数据集

利用式(6)计算数据降维前后两个分布之间KL散度,作为优化的目标函数;

利用式(7)计算优化目标函数关于低维目标数据集的梯度,并通过式(8)不断迭代优化低维目标数据集,直至目标函数符合要求,即数据降维前后两组数据集的相似程度符合要求。

(3)运用DBSCAN算法对降维后的节点电价数据进行分区

按照步骤2-1)至步骤2-8)的方法,利用DBSCAN算法对降维后的电价数据进行聚类,完成电力市场电价分区。

(4)孤立森林(iForest)的训练

基于电价分区信息,依次从待测数据集中取出对应分区的的节点数据,利用步骤3-1)至步骤3-15)的方法,训练该待测数据集中每个电价分区的孤立森林树(iForest)。

(5)用训练后的孤立森林来计算每个数据点的异常分数,并对电价分区内部异常电价节点进行识别

依次判断待测电价数据中各电价分区待测数据极差与平均值的比值是否大于3%,若是,则视该电价分区内所有节点电价正常,无需进行异常识别,否则进行下一步;

若某一电价分区内部的节点电价需要进行空间异常识别,则利用该电价分区所对应的孤立森林树(iForest),按照式(10)-(12)所示方法,求取该电价分区内部各节点电价数据的异常分数;

根据各节点电价数据异常分数的对比,对异常节点进行识别。

(6)剔除异常电价节点后,对异常电价分区进行识别

完成电价分区内部异常电价识别后,利用式(13)-(14),剔除各电价分区中的异常电价数据后,对每个电价分区内的所有电价数据求取平均值,形成新的区域电价数据待测集合;

重复步骤3-1)至步骤3-15)的方法,训练对应的孤立森林树(iForest),并按照式(10)-(12)所示方法,求取每个分区平均正常平均电价所对应的异常分数;

根据各电价分区正常平均电价的异常分数对比,对异常电价分区进行识别。

具体仿真结果如下:

1)电价分区参数选择及分区结果

利用DBSCAN算法对系统节点电价进行分区时,虽然可以避免事先确定分区数量,但算法执行过程中距离参数ε和密度阈值参数MinPts的设定,会影响电价分区结果,表1展示了16种参数组合下的电价分区结果,分别从电价分区个数、未分区节点数量、极差、四分位差和方差五个方面来衡量不同参数组合下的分区效果。

表1不同参数组合下的电价分区效果

从表1中可知,当距离参数ε超过10时,衡量数据分布集中程度的极差、四分位差和方差的数值均明显增大,此时分区结果不满足第一章中所提出的“分区内部所有节点的电价尽可能相似,分布尽可能集中”原则;而当距离参数等于3或5时,分区后的数据集中程度差距不大,但电价分区数量以及未分区节点数量存在明显差异。同时考虑到电价分区应尽可能包含所有节点,同时电价分区不宜过多,导致过度分区,距离参数ε设为5,密度阈值参数ε设为3为宜。在此组超参数设定下,算例测试所用某省级电网交易中心2022年节点电价大致分为29个电价分区。从电价分区结果上看,整体分布仍是基于行政区域划分,同时在经济发达地区,由于电网建设程度更加完善,分区也更加紧密。部分沿海地区受地理环境影响,会形成相对独立的电价分区。由此可以证明,在电网拓扑信息缺失的情况下,通过历史节点电价数据可以还原部分网络信息,所得的电价分区结果,具备一定的真实性和可信任性,可以用于后续空间异常电价信号的识别。

2)空间电价异常点识别效果

对比以下三种方法的识别效果:

M1:本发明所提从电价数据分布疏密特征出发的异常电价节点及异常电价区域识别方法;

M2:利用孤立森林算法进行空间异常电价信号整体识别;

M3:利用K-means算法进行空间异常电价信号整体识别。

需要注意的是,为了方便对比不同异常信号的识别效果,M2中孤立森林算法所有参数设置以及数据预处理流程与M1中保持一致,两者区别仅为不再进行分区识别。M3中K-means算法所需聚类的数量设定为M1中得到的最优分区数量29,聚类后到聚类中心距离超过该簇类平均距离3倍以上的被视为异常点。

对某省级电网交易中心2022年中某一天96时段的节点电价数据分别运用上述三种方法进行识别,以基于人工经验的识别结果为标准,对比三种方法的识别效果。三种方法识别出的异常电价信号点的比例如表2所示,识别准确识别率如图4所示,识别错误率如图5所示。

表2M1-M3的空间异常电价信号点识别比例

从表2中数据可以发现,M3方法识别出的空间异常电价信号最少,约为发明所提M1方法的二分之一,而M2方法识别出的空间异常电价信号最多,是本发明所提方法M1的3倍以上。结合图5中各方法的准确识别率可以发现,相比于M1方法95.09%的平均准确识别率和M2方法93.17%的平均准确识别率,M3方法由于识别出的异常信号数量过少,导致准确识别率较低,平均不到30%。同时,虽然M1方法和M2方法有着相似的识别准确率,但相较于M2,M1的识别效果更加平稳,绝大部分时段识别准确率可以维持在80%以上,没有极端情况出现。

再结合图6中所示的错误识别率可以发现,M3具有最高的错误识别率,平均达到60%以上,由此可见,K-means作为专门的聚类算法,异常识别只是其附属功能,对于节点电价信号这种单维、非时序数据的异常识别,效果并不理想。而M2方法的错误识别率则比本发明所提M1方法高出3倍多,达到38.93%,可见M2方法较高的准确识别率是依靠大量检出异常信号来保证的,虽然准确识别率较高,但同样会错误检测出大量异常信号,造成误报率过高。通过三种方法识别效果的对比,可以发现孤立森林算法在空间异常电价信号的识别上具备一定的优势,但在不分区识别的情况下,会将大量原本在分区内部是正常的电价信号识别为异常,造成后续异常电价信号成因分析的困难。综上所述,本发明所提方法能够保证空间异常电价信号的识别效果。

3)电价异常分区识别效果

本发明所提M1方法除了可以完成对异常电价信号点的识别,还可以从市场整体角度出发辨别电价信号区域异常,以便后续进一步分析电价信号异常成因。对上述算例中所测试的同一天节点电价数据进行区域异常电价检测,检测结果如图6所示。可以发现,本发明所提M1方法在所测试的所有时段中几乎都能够完美识别所有电价信号区域,平均准确率达到99.27%。同时,有60%以上的时段错误识别率在10%以下,整体错误识别率也仅为11.72%。虽然存在电价信号异常区域过量识别的问题,但极端错误识别情况占比极少,且集中区域电价分布较为平均的情况、电价数据疏离特征不明显的时段,此时需要辅助以人工经验加以判别。

技术分类

06120116521365