掌桥专利:专业的专利平台
掌桥专利
首页

一种基于支持向量机的台区线损预测方法

文献发布时间:2023-06-19 19:28:50


一种基于支持向量机的台区线损预测方法

技术领域

本发明属于台区线损预测技术领域,涉及一种台区线损预测方法,尤其是一种基于支持向量机的台区线损预测方法。

背景技术

传统的台区线损计算方法主要采用电力网潮流计算和台区低压侧负荷电量的计算方法。电力潮流计算主要通过构建模型预测台区线损,而台区低压侧负荷电量以用户侧电能表统计损耗电量来计算理论线损。这些计算方法虽然得到了较好的预测效果,但是也存在计算任务繁重、过分依赖线路结构致使其泛化性能差等弊端。

经检索,未发现与本发明相同或相似的现有技术的专利文献。

发明内容

本发明的目的在于克服现有技术中的不足,提出一种基于支持向量机的台区线损预测方法,能够解决传统方法存在的计算量大、泛化性差的技术问题。

本发明解决其现实问题是采取以下技术方案实现的:

一种基于支持向量机的台区线损预测方法,包括以下步骤:

步骤1、根据现有的线损率数据确定可能影响线损的指标,并确定支持向量机所需的训练集和测试集;

步骤2、基于步骤1得到的训练集数据,构建台区线损预测模型,并对其进行训练,得到训练好的台区线损预测模型;

步骤3、基于步骤2训练好的台区线损预测模型,得到台区线损的预测结果。

而且,所述步骤1的具体步骤包括:

(1)分析台区历史线损率,根据线损率的变化情况得到对线损率影响最大的9个指标,分别为:配电变压器更换数量、漏抄电表总电量、错抄电表总电量、用户窃电量、追补电量、临时用电量、表计故障数、三相不平衡变压器数和无功功率异常线路数;

(2)利用某几个台区2021年1月到12月的指标数据共681条,加入台区线损情况,合格/异常,作为SVM分类的标签,并按照7:3的比例划分训练集和测试集,划分完成后训练集有477条样本数据,测试集有204条样本数据。

而且,所述步骤2的具体步骤包括:

(1)引入高斯核函数K(x,z)=exp(-γ||x-z||

(2)最终得到训练好的台区线损预测模型表达式为:

其中x

而且,所述步骤3的具体步骤包括:

(1)将测试集包含9个指标和1个分类标签的204条数据输入训练模型进行预测,得出预测结果为合格/异常。

(2)将模型的预测结果和实际结果进行比对,得到模型在测试集上的分类准确率,用于评估模型的泛化能力。

本发明的优点和有益效果:

1、本发明采用支持向量机对台区线损情况进行预测,软间隔最大化SVM的特点使训练结果不易出现“过拟合”,得到的预测结果更加可靠、泛化能力更强,可根据预测结果对可能存在负损和高损的台区有针对的采取相关措施。

2、本发明采用引入核函数的支持向量机进行模型训练,将低维空间中线性不可分的数据映射到高维空间使其线性可分,避免了因输入空间参数过多引起的维度爆炸问题。相比传统方法,同样处理高维度数据,SVM更具优势。

附图说明

图1为本发明的线损数据的分维可视化图;

图2为本发明的参数选择的等高线图;

图3为本发明的参数选择的3D视图;

图4为本发明的测试集预测结果和实际结果图。

具体实施方式

以下结合附图对本发明实施例作进一步详述:

一种基于支持向量机的台区线损预测方法,包括以下步骤:

步骤1、根据现有的线损率数据确定可能影响线损的指标,并确定支持向量机所需的训练集和测试集;

所述步骤1的具体步骤包括:

(1)分析台区历史线损率,根据线损率的变化情况得到对线损率影响最大的9个指标,分别为:配电变压器更换数量、漏抄电表总电量、错抄电表总电量、用户窃电量、追补电量、临时用电量、表计故障数、三相不平衡变压器数和无功功率异常线路数;

(2)利用某几个台区2021年1月到12月的指标数据共681条,加入台区线损情况(合格/异常,作为SVM分类的标签),并按照7:3的比例划分训练集和测试集,划分完成后训练集有477条样本数据,测试集有204条样本数据。

步骤2、基于步骤1得到的训练集数据,构建台区线损预测模型,并对其进行训练,得到训练好的台区线损预测模型;

所述步骤2的具体步骤包括:

(1)引入高斯核函数K(x,z)=exp(-γ||x-z||

(2)最终得到训练好的台区线损预测模型表达式为:

其中x

支持向量机的目的是求解最佳的核函数参数γ和软间隔最大化引入的惩罚参数c,使模型性能达到最好。

步骤3、基于步骤2训练好的台区线损预测模型,得到台区线损的预测结果;

所述步骤3的具体步骤包括:

(1)将测试集包含9个指标和1个分类标签的204条数据输入训练模型进行预测,得出预测结果为合格/异常。

(2)将模型的预测结果和实际结果进行比对,得到模型在测试集上的分类准确率,用于评估模型的泛化能力。

图1为全部样本线损数据的分维可视化图。如图1所示,给出了样本数据类别标签的分布情况和每个指标属性值的分布情况。

首先需要根据文献调研和对历史数据进行分析,在企业相关领域的专家的指导下,得到对线损率影响最大的9个指标,分别为:配电变压器更换数量、漏抄电表总电量、错抄电表总电量、用户窃电量、追补电量、临时用电量、表计故障数、三相不平衡变压器数和无功功率异常线路数;

由于支持向量机是典型的监督学习方法,需要根据对应台区的实际情况,补充台区当月线损情况(合格/异常)作为SVM分类所需的标签值。最终根据某几个台区2021年1月到12月的线损情况得到681条样本数据。

最后根据得到的数据,得到样本的分维可视化图。所述分维可视化图中,左上角的图形表示不同样本点的分类情况,其中数字“2”表示线损合格的数据,数字“4”表示线损异常的数据。其余图形展示了9个指标属性值的分布情况,每个属性值的取值分布为1-10。

图2为最佳参数选择的寻优等高线图。如图2所示,给出了SVM模型两个重要参数c和g变化时,模型准确率的变化情况。其中c表示软间隔最大化引入的惩罚参数,g为最佳核函数参数γ。进一步的,所述最佳参数选择的寻优等高线图绘制过程如下:

一个支持向量机构造一个超平面,通过使超平面和样本点的几何间隔最大化,可以得到唯一的分离超平面:

ω

其中ω

相应的分类决策函数也能表示为:

f(x)=sign ( ω

sign(x)是符号函数,取值为+1或-1。

求解的问题为:

/>

软间隔最大化SVM通过引入松弛变量ξ

由于本方法解决的问题为线性不可分问题,需要引入核函数。首先需要将线性支持向量机的每个不等式约束引进拉格朗日乘子,转化为拉格朗日函数的最优化问题,求解其对偶问题:

求解上述问题需要将内积x

核函数K(x,z)=φ(x)·φ(z)可以将低维空间线性不可分的数据映射到高维空间使其线性可分。引入核函数后,可以得到非线性支持向量机拉格朗日函数对偶问题的目标函数,如下所示:

对应的分类决策函数表达式为:

其中x

所述方法采用高斯核函数K(x,z)=exp(-γ||x-z||

进行参数选择的做法是,将477例台区线损数据的训练集输入SVM模型中,使c和g的采用相同的步进数,所述方法采用的是0.8,c和g的变化范围都是2^(-10),2^(-9.2),…,2^(10),最终得到最佳参数选择的寻优等高线图。由于c和g的取值都是2的指数级别,为了更清楚地将结果显示出来,横纵坐标都取了以2为底的对数,等高线上的数字表示指定参数c和g对应的分类准确率。

图3为最佳参数选择的3D视图。图3在图2的基础上,进一步提高了结果的直观性。x,y坐标值是c和g取对数的结果,z轴表示交叉验证分类的准确率。由所述图3可以得出,模型最佳参数c=0.43528,最佳参数g=1.3195,此时模型分类准确率为96.2264%。

图4为测试集预测结果和实际结果图。得到两个最佳的参数c和g以后,理论上就得到了非线性SVM的分离超平面和分类决策函数。为了验证模型的可靠性,将204例台区线损数据的测试集带入模型中测试,用模型测试后的得到的结果和实际结果进行比对,结果如所述图4所示。图中的数字“2”表示线损合格的数据,数字“4”表示线损异常的数据;红色点表示测试集预测结果,蓝色点表示测试集实际类别。通过图形可以直观地看出,只有两个样本点被错误的分类,测试集分类准确率为99.0196%。

需要强调的是,本发明所述实施例是说明性的,而不是限定性的,因此本发明包括并不限于具体实施方式中所述实施例,凡是由本领域技术人员根据本发明的技术方案得出的其他实施方式,同样属于本发明保护的范围。

相关技术
  • 一种基于台区识别仪的台区线损消缺方法
  • 一种基于线损预警分析模型的台区线损管理平台
  • 一种基于特征选择和GRU网络的台区线损预测方法
  • 一种基于边缘计算的台区线损率预测方法
技术分类

06120115921601