一种基于ECOD的台区光伏线损率异常检测方法与装置
文献发布时间:2023-06-19 19:30:30
技术领域
本发明涉及一种基于ECOD(Empirical Cumulative distribution basedOutlier Detection,ECOD)的台区光伏线损率异常检测方法与装置,属于计算机、智能电网技术领域。
背景技术
光伏并网发电系统把光伏发电系统与常规电网相连,则容易引起局部的潮流分布变化,从而对配电网线损率造成一定影响。实际使用过程中难免造成配电线路损耗问题,对供电造成明显影响。若能对光伏接入的配电线路的线损率进行有效计算和分析,将对开展光伏产业并网配电研究具有较好的经济价值。但对光伏接入配电线路的线损率进行有效计算和分析,会涉及到以下问题需要解决:
(1)光伏线损率与光伏发电的特征重要性关系分析;
(2)如何通过台区光伏发电和用电数据集,计算光伏线损率的异常分数判定光伏线损率是否异常。
发明内容
本发明的目的在于提供一种基于ECOD的台区光伏线损率异常检测方法与装置,通过台区光伏线损数据集计算光伏线损率的异常分数判定光伏线损率是否异常。
为实现上述目的,本发明采取的技术方案如下:
一种基于ECOD的台区光伏线损率异常检测方法,其包括如下步骤:
步骤一、收集数据:收集的多光伏样本数据集包含n个光伏样本,每个光伏样本包含d个特征;
步骤二、计算相关系数:分别计算光伏线损数据与数据集中特征的相关系数,相关系数计算公式如式(1)所示:
其中X表示某个特征,Y表示光伏线损率,E(X)计算如式(2)所示:
其中n为样本数量,x
步骤三、选择特征:根据相关系数计算结果对特征按照相关性强弱进行排序,选择出与光伏线损率其中相关性较强的特征,用于光伏线损率异常的特征选择;
步骤四、ECOD电力负荷异常检测:通过计算样本的最终异常分数来确定样本是否为异常。
进一步的,所述光伏样本的特征包括时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及供电量。
进一步的,所述步骤四中,首先计算每个特征的左尾经验累积分布函数与右尾经验累积分布函数;之后计算每个特征的样本偏度系数,通过聚合每个样本的左尾经验累积分布函数计算左尾的异常分数,聚合每个样本的右尾经验累积分布函数计算右尾的异常分数;再根据维度的偏度系数自动决定使用左尾经验累积分布函数还是右尾经验累积分布函数,得到聚合后的自动异常分数;最后,从三个异常分数值中选出最大的异常分数。
更进一步的,计算特征的经验累积分布函数过程如下:
输入的光伏发电数据
更进一步的,获得光伏发电数据采样点的特征的左尾经验累积分布函数与右尾经验累积分布函数之后,计算特征的样本偏移系数,第j个特征的样本偏度系数γ
当γ
更进一步的,光伏发电数据采样点X
更进一步的,通过偏移系数计算样本自动异常分数得到光伏发电数据采样点的自动异常分数,光伏发电数据采样点X
更进一步的,对每个光伏发电数据采样点选择其左尾异常分数、右尾异常分数和自动异常分数中最大的值作为采样点的最终异常分数,采样点X
O
最终得到伏发电数据中所有采样点的异常分数O=(O
更进一步的,异常分数越高则所处百分位数越高,越可能是异常值;将异常分数与预设的阀值比较,超过阀值的异常分数的采样点为异常。
一种基于ECOD的台区光伏线损率异常检测装置,其包括:
数据采集模块,用于采集光伏样本数据集;
数据分析模块,用于计算光伏线损数据与数据集中特征的相关系数;
特征选择模块,用于选择合适的特征用于光伏线损率异常检测;
异常检测模块,通过计算样本的最终异常分数来确定样本是否为异常。
本发明的有益效果如下:
(1)使用经验累积分布函数进行光伏线损率离群点检测,使用估计数据的经验累积分布函数,避免了参数调优的问题,并在不做任何参数假设的情况下逼近整个分布;
(2)通过估计数据的经验累积分布函数避免了维数诅咒,即使数据点数量和维度有所增加,也能实现对光伏线损率的有效检测;
(3)ECOD在维度基础上评估光伏线损率离群行为,可以使用ECOD作为维度贡献的可解释检测器。通过绘制光伏线损率异常值图,直观地表示数据点每个维度对异常分数的影响,从而可以直接观察到光伏线损率数据内部的判定状态,具有良好的解释性。
附图说明
图1是本发明基于ECOD的光伏线损率异常检测处理过程示意图。
具体实施方式
下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图1,一种基于ECOD的台区光伏线损率异常检测方法,其包括:
一、收集数据
光伏样本数据集X包含n个光伏样本X
二、计算相关系数
分别计算光伏线损数据与数据集中其它特征的相关系数,相关系数计算公式如式(1)所示:
其中X表示某个特征,Y表示光伏线损率,E(X)计算如式(2)所示:
其中n为样本数量,x
相关系数绝对值越大,该特征与光伏线损率的相关性越高。
三、选择特征
根据相关系数计算结果对特征按照相关性强弱进行排序,从时间、辐照度、温度、湿度、风向、风速、压强、实际辐照度以及供电量这些特征中选择出与光伏线损率其中相关性较强的特征,用于光伏线损率异常的特征选择。
四、ECOD电力负荷异常检测
对于数据来说,异常值可以被视为数据中的罕见事件,罕见事件通常出现在分布的某个尾部。例如,如果数据服从一维高斯采样,那么左尾或右尾的点通常被认为是罕见事件。ECOD是一种利用经验累积分布函数进行离群值检测的方法,离群值通常是指与其他观测值有显著差异的数据点,与发生在概率分布低密度部分的罕见事件相对应,可以视为异常值,对于每个观测值X
本专利把光伏线损率离群的值表征为它们对应于发生在概率分布的低密度部分的罕见事件。ECOD通过计算样本的最终异常分数来确定样本是否为异常,首先计算每个特征的左尾经验累积分布函数(Empirical Cumulative Distribution Function,ECDF)与右尾经验累积分布函数,之后计算每个特征的样本偏度系数,通过聚合每个样本的左尾ECDF计算左尾的异常分数,聚合每个样本的右尾ECDF计算右尾的异常分数。根据维度的偏度系数自动决定使用左尾ECDF还是右尾ECDF,得到聚合后的自动异常分数。最后,从三个异常分数值中选出最大的异常分数。
异常分数不是概率,而是用来衡量数据点之间的差异。异常分数对应概率分布中的一个百分位数,百分位数超过阈值0.99则此样本作为异常。
1、计算特征的ECDF
输入的光伏发电数据
获得光伏发电数据采样点的特征的左尾ECDF与右尾ECDF之后,需要计算特征的样本偏移系数,第j个特征的样本偏度系数γ
/>
当γ
2、聚合多个特征得到异常分数
通过光伏发电数据采样点所有特征的左尾ECDF聚合得到采样点的左尾异常分数,光伏发电数据采样点X
通过偏移系数计算样本自动异常分数得到光伏发电数据采样点的自动异常分数,光伏发电数据采样点X
对每个光伏发电数据采样点选择其左尾异常分数、右尾异常分数和自动异常分数中最大的值作为采样点的最终异常分数,采样点X
O
最终得到伏发电数据中所有采样点的异常分数O=(O
由于ECOD在维度基础上评估离群行为,可以使用ECOD作为维度贡献的可解释检测器。
从公式(9)可以得到:如果样本具有较大的异常分数,则三种异常分数中的至少一个很大。记O
基于上述方法,本实施例还提供了一种可实现上述方法的光伏线损率异常检测装置,其包括:
数据采集模块,用于采集光伏样本数据集;
数据分析模块,用于计算光伏线损数据与数据集中特征的相关系数;
特征选择模块,用于选择合适的特征用于光伏线损率异常检测;
异常检测模块,通过计算样本的最终异常分数来确定样本是否为异常。
以上显示和描述了本发明的基本原理、主要特征和优点。本领域的普通技术人员应该了解,上述实施例不以任何形式限制本发明的保护范围,凡采用等同替换等方式所获得的技术方案,均落于本发明的保护范围内。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。