掌桥专利:专业的专利平台
掌桥专利
首页

一种基于KNN机器学习算法的水电站耗水率计算方法

文献发布时间:2024-04-18 19:58:30


一种基于KNN机器学习算法的水电站耗水率计算方法

技术领域

本发明属于耗水率计算技术领域,尤其是涉及一种基于KNN机器学习算法的水电站耗水率计算方法。

背景技术

耗水率误差预测一直是水电站计算发电流量、水位预测、调度规划中重要的一环,目前所使用的计算方式比较固定,分为两种:一是由各水电站根据往年运行情况,总结出来的耗水率-毛水头曲线,进行插值计算得到;二则是根据NHQ公式、水量平衡公式进行迭代计算。第二种方法能够达到很好的预测精度。然而,该方法所使用的迭代算法会导致预测程序运行速度相对较慢。在计算两个月耗水率进行测试时,以2小时为尺度进行耗水率率定,程序耗时约为4分钟,若将该方法应用在水库调度或水位预测等更复杂程序时,计算耗时会呈倍增趋势。因此本发明旨在找出一种计算速度快且预测精度高的耗水率率定方法。

KNN机器学习算法是一种计算速度最快的算法,其本质为分类,例如对于给定的三个类别A、B、C,他们每个类别都有各自对应的元素,KNN算法则可以通过判断输入对象中所包含元素,与已知类的元素进行距离计算,来划分该对象到最近的一类。将此原理应用在耗水率率定问题上,可以将耗水率作为类别,将其影响因素作为类别对应的元素,那么就可以从大量的样本集中快速找到目标工况下的耗水率值。如果训练集足够,就可以达到足够高的精度。而根据实际经验和水电站发电出力N=KQH的公式,目前基本确定耗水率的影响因素为发电水头、时段初末上下游水位和机组出力。因此,亟需一种基于KNN机器学习算法的水电站耗水率计算方法,为水电站预测能力和规划能力的提升提供方法支撑。

发明内容

本发明的目的是提供一种基于KNN机器学习算法的水电站耗水率计算方法,解决上述技术存在的梯级电站经济运行计算过程中,耗水率计算误差较大,影响电站经济运行规划问题。

为实现上述目的,本发明提供一种基于KNN机器学习算法的水电站耗水率计算方法,包括以下步骤:

步骤1、数据预处理,收集历史运行数据并按对应关系格式构建二维数据集[X

步骤2、构建KNN预测模型,根据输入的电站历史耗水率及对应的历史特征变量数据,根据KNN算法的预测原理构建模型,根据输入的历史特征变量进行特征距离计算,得出最接近该历史特征变量组合的对应的电站历史耗水率耗水率;

步骤3、调整模型参数,模型参数主要包括算法k值、距离计算方法、特征变量权重矩阵、以及条件约束的约束值。

优选的,步骤1的具体过程如下:

S11、确定计算时段;

S12、调整数据格式,将电站历史耗水率对应的历史特征变量构建为二维数据集[X

S13、清除空值,相邻时间步之间的计算无相互影响,剔除检索到的空值。

优选的,features包含时段初电站上游水位

其中,一行数据代表一组历史特征变量组合,Y

优选的,步骤2的具体过程如下:

S21、添加约束条件,根据约束对特征变量及耗水率对应的X

S22、添加特征变量权重,在将特征变量组合成二维矩阵前,对每种特征变量事先赋予一个除数参数,所述除数参数共同构成m行1列的权重矩阵,将特征变量的二维数组与所述权重矩阵进行矩阵法则点乘,对特征变量完成放缩;

S23、假设所需计算特征变量组合为[h

S24、针对k组历史特征变量组合,以及对应的耗水率值,具体如下:

仅保留电站时均毛水头

S25、根据k*2二维矩阵中k种电站时均毛水头与耗水率的对应关系,计算H

Y

优选的,S23中距离计算方法为欧氏距离、曼哈顿距离、切比雪夫距离。

优选的,步骤3中的具体过程如下:

S31、预设参数组合,将步骤2构建为函数,其中需调节的参数有k值、距离计算方法、特征变量权重矩阵、以及根据需求选择的条件约束的约束值;

S32、构建测试集,测试集数据格式与X

S33、设置多重循环对预设参数进行遍历,并使用测试集计算不同参数组合下的耗水率误差,最终导出误差最小的参数组合,将误差最小的参数组合作为模型最终参数。

因此,本发明采用上述一种基于KNN机器学习算法的水电站耗水率计算方法,以KNN算法原理为基础,选取目标参数来构建一种快速且精确的耗水率计算方法,为水电站预测能力和规划能力的提升提供方法支撑,解决梯级电站经济运行计算过程中,耗水率计算误差较大,影响电站经济运行规划的问题。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

图1为本发明一种基于KNN机器学习算法的水电站耗水率计算方法的流程框图;

图2为本发明KNN机器学习算法计算耗水率与实际值拟合图;

图3A为本发明曲线查值法计算耗水率误差分布图;

图3B为本发明KNN原理方法计算耗水率误差分布图。

具体实施方式

实施例

以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-2,一种基于KNN机器学习算法的水电站耗水率计算方法,包括以下步骤:

步骤1、数据预处理,收集历史运行数据并按对应关系格式构建二维数据集[X

S11、确定计算时段;

S12、调整数据格式,将电站历史耗水率对应的历史特征变量构建为二维数据集[X

S13、清除空值,相邻时间步之间的计算无相互影响,剔除检索到的空值。

features包含时段初电站上游水位

其中,一行数据代表一组历史特征变量组合,Y

步骤2、构建KNN预测模型,根据输入的电站历史耗水率及对应的历史特征变量数据,根据KNN算法的预测原理构建模型,根据输入的历史特征变量进行特征距离计算,得出最接近该历史特征变量组合的对应的电站历史耗水率耗水率;具体过程如下:

S21、添加约束条件,根据约束对特征变量及耗水率对应的X

S22、添加特征变量权重,在将特征变量组合成二维矩阵前,对每种特征变量事先赋予一个除数参数,所述除数参数共同构成m行1列的权重矩阵,将特征变量的二维数组与所述权重矩阵进行矩阵法则点乘,对特征变量完成放缩;

S23、假设所需计算特征变量组合为[h

S24、针对k组历史特征变量组合,以及对应的耗水率值,具体如下:

仅保留电站时均毛水头

S25、根据k*2二维矩阵中k种电站时均毛水头与耗水率的对应关系,计算H

Y

步骤3、调整模型参数,模型参数主要包括算法k值、距离计算方法、特征变量权重矩阵、以及条件约束的约束值;具体过程如下:

S31、预设参数组合,将步骤2构建为函数,其中需调节的参数有k值、距离计算方法、特征变量权重矩阵、以及根据需求选择的条件约束的约束值;

S32、构建测试集,测试集数据格式与X

S33、设置多重循环对预设参数进行遍历,并使用测试集计算不同参数组合下的耗水率误差,最终导出误差最小的参数组合,将误差最小的参数组合作为模型最终参数。

以A水电站为算例,数据集采用了2016-2019年的数据作为历史数据集,计算尺度为两小时,数据整编如下,计算2020年1至4月每个两小时的耗水率。

数据中的水位数据均为时刻点对应的整点数据,而出力数据和耗水率数据为该时刻点之后两个小时的平均值。使用基于K值自适应KNN机器学习算法的水电站耗水率计算方法步骤如下:

步骤1:数据预处理。为了保证预测的准确,需将上述整编数据做异常值清洗处理,剔除明显离群值,调整数据为X

[[596.95,597.04,376.32,376.15,220.76,157.13]

[597.04,597.12,376.15,376.14,220.94,157.22]

···

[589.79,589.77,377.81,377.16,212.30,414.23]]

Y的输入格式为:

[5.03,5.02,···,5.19]

步骤2:将整理好的数据输入到模型中,2020年的特征变量数据格式同X

步骤3:设定权重矩阵T:[a,b,c,d,e,f],X

步骤3.1:选取特征变量距离最近的k个历史耗水率及其对应的特征变量组合;

步骤3.2:取得到的k个历史耗水率对应的毛水头,按步骤3的权重计算公式计算权重;

步骤3.3:按权重平均计算即可得到目标特征变量对应耗水率。

步骤4:预设参数k值取1-5,权重矩阵取[0.2,0.2,0.3,0.3,0.5,1]或者[0.2,0.2,0.3,0.3,1,0.2],或者[0.2,0.2,0.3,0.3,0.5,0.2]。约束的η为50,μ为1,距离计算采用欧氏距离,

步骤5:使用不同参数调用函数,计算耗水率,取计算均方误差最小的组合为最终模型参数。

如图3A-3B,通过预测结果和实际值对比图。本例算法预测2020年1至4月耗水率均方误差为0.03,最大误差为0.23,传统查值方法预测均方误差为0.57,最大误差为1.55。可见本方法在保证预测速度的基础上,对预测精度有着较大提升。

因此,本发明采用上述一种基于KNN机器学习算法的水电站耗水率计算方法,以KNN算法原理为基础,构建起以电站时段平均出力、时段初末上下游水位、时段平均毛水头为变量的分类机器学习方法,以此来达到精准快捷地预测水电站耗水率的目的,为水电站预测能力和规划能力的提升提供方法支撑,解决梯级电站经济运行计算过程中,耗水率计算误差较大,影响电站经济运行规划的问题。

最后应说明的是:以上实施例仅用以说明本发明的技术方案而非对其进行限制,尽管参照较佳实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对本发明的技术方案进行修改或者等同替换,而这些修改或者等同替换亦不能使修改后的技术方案脱离本发明技术方案的精神和范围。

相关技术
  • 一种基于遥感图像和地理信息系统的文地率计算方法
  • 一种基于拟合关联的自动化设备故障率计算方法
  • 一种基于变权重离散的γ剂量率计算方法及系统
  • 一种水电站短期耗水率预测方法及系统
  • 一种基于KNN和SVM算法的5G无线信道多径分簇计算方法
技术分类

06120116499887