掌桥专利:专业的专利平台
掌桥专利
首页

模型训练方法、光功率预测方法、装置、设备及存储介质

文献发布时间:2023-06-19 11:14:36


模型训练方法、光功率预测方法、装置、设备及存储介质

技术领域

本申请涉及光伏发电技术领域,特别涉及一种模型训练方法、光功率预测方法、装置、设备及存储介质。

背景技术

光伏发电是指利用半导体表面的光生伏特效应(Photovoltaic effect),将光能转化为电能的一种技术。由于辐照强度(衡量光照强弱的量化值)存在不确定性,导致光伏发电的功率(即光功率)可能出现剧烈变化,从而对电网带来冲击,因此需要预测光功率。

目前,通常由光伏发电厂的工作人员,基于历史天气数据以及该历史天气数据对应的该光伏发电厂或其它光伏发电厂的光功率,结合自身经验,根据需要进行光功率预测的时段对应的天气数据,对光功率进行预测。

由于不同光伏发电厂所处位置的气候不同,以及天气数据中影响光功率的因素较多,在预测光功率的过程中需要人工进行大量计算,导致效率较低。

发明内容

本申请提供了一种模型训练方法、光功率预测方法、装置、设备及存储介质,可以提升预测光功率的效率。所述技术方案如下:

根据本申请的一方面,提供了一种模型训练方法,所述方法包括:

获取历史时刻的历史气象数据以及历史光功率;

对所述历史气象数据进行特征工程处理,得到所述历史气象数据对应的趋势特征,所述趋势特征用于反映所述历史气象数据的变化特性;

根据所述历史气象数据、所述趋势特征以及所述历史光功率训练机器学习模型,所述机器学习模型用于根据预报气象数据预测光功率。

根据本申请的另一方面,提供了一种光功率预测方法,所述方法包括:

获取第一预测时段内预测时刻的预报气象数据;

对所述预报气象数据进行特征工程处理,得到所述预报气象数据对应的趋势特征,所述趋势特征用于反映所述预报气象数据的变化特性;

将所述预报气象数据以及所述趋势特征输入机器学习模型,输出预测光功率,所述机器学习模型是通过历史气象数据、所述历史气象数据对应的历史趋势特征以及历史光功率训练得到的。

根据本申请的另一方面,提供了一种模型训练装置,所述装置包括:

获取模块,用于获取历史时刻的历史气象数据以及历史光功率;

处理模块,用于对所述历史气象数据进行特征工程处理,得到所述历史气象数据对应的趋势特征,所述趋势特征用于反映所述历史气象数据的变化特性;

训练模块,用于根据所述历史气象数据、所述趋势特征以及所述历史光功率训练机器学习模型,所述机器学习模型用于根据预报气象数据预测光功率。

在一个可选的设计中,所述趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种;

其中,所述多次特征用于反映所述历史气象数据在不同指数下的特征,所述时序特征用于反映所述历史气象数据对应的时间段,所述离散化特征用于反映所述历史气象数据的阶段变化特性,所述气象滞后特征用于反映所述历史气象数据之前的气象数据的特征,所述气象未来特征用于反映所述历史气象数据之后的气象数据的特征,所述气象变化率特征用于反映所述历史气象数据的变化速率,所述气象变化趋势特征用于反映所述历史气象数据的变化幅度,所述动态辐照特征用于反映不同来源的历史气象数据的差异。

在一个可选的设计中,所述历史气象数据包括辐照强度数据,所述趋势特征包括多次特征;所述处理模块,用于:

对所述辐照强度数据进行增大指数处理以及减小指数处理中的至少一种,得到所述多次特征。

在一个可选的设计中,所述趋势特征包括时序特征;所述处理模块,用于:

将所述历史气象数据对应的所述历史时刻所处的时间段,确定为所述时序特征。

在一个可选的设计中,所述历史气象数据包括辐照强度数据,所述趋势特征包括离散化特征;所述处理模块,用于:

对所述辐照强度数据进行离散化处理,得到所述离散化特征。

在一个可选的设计中,所述趋势特征包括气象滞后特征;所述处理模块,用于:

将第一历史时刻的第一历史气象数据,确定为第二历史气象数据对应的所述气象滞后特征;

其中,所述第二历史气象数据对应的第二历史时刻在所述第一历史时刻之后。

在一个可选的设计中,所述趋势特征包括气象未来特征;所述处理模块,用于:

将第三历史时刻的第三历史气象数据,确定为第四历史气象数据对应的所述气象滞后特征;

其中,所述第四历史气象数据对应的第四历史时刻在所述第三历史时刻之前。

在一个可选的设计中,所述历史气象数据包括辐照强度数据,所述趋势特征包括气象变化率特征;所述处理模块,用于:

将第五历史时刻的辐照强度数据和第六历史时刻的辐照强度数据的差,与所述第六历史时刻的辐照强度数据之间的商确定为所述第五历史时刻的历史气象数据对应的所述气象变化率特征;

其中,所述第五历史时刻在所述第六历史时刻之后。

在一个可选的设计中,所述历史气象数据包括辐照强度数据,所述趋势特征包括气象变化趋势特征;所述处理模块,用于:

将第七历史时刻的辐照强度数据和目标历史时段对应的辐照强度的平均值之间的差,确定为所述第七历史时刻的历史气象数据对应的所述气象变化趋势特征;

其中,所述第七历史时刻在所述目标历史时段之后。

在一个可选的设计中,所述历史气象数据属于至少两个来源,所述历史气象数据包括辐照强度数据,所述趋势特征包括动态辐照强度特征;所述处理模块,用于:

将同一所述历史时刻的不同来源的至少两个辐照强度数据的平均值,与所述至少两个辐照强度数据的标准差之间的和以及差中的至少一种,确定为所述历史时刻的所述历史气象数据对应的所述动态辐照强度特征。

在一个可选的设计中,所述机器学习模型包括至少两个子机器学习模型,所述装置还包括:

划分模块,用于对数据集按照所述历史时刻进行划分,得到训练集和验证集,所述数据集包括所述历史气象数据、所述趋势特征以及所述历史光功率;

所述训练模块,用于根据所述训练集以及所述验证集采用交叉验证的方式对所述至少两个子机器模型进行训练。

根据本申请的另一方面,提供了一种光功率预测装置,所述装置包括:

获取模块,用于获取第一预测时段内预测时刻的预报气象数据;

处理模块,用于对所述预报气象数据进行特征工程处理,得到所述预报气象数据对应的趋势特征,所述趋势特征用于反映所述预报气象数据的变化特性;

预测模块,用于将所述预报气象数据以及所述趋势特征输入机器学习模型,输出预测光功率,所述机器学习模型是通过历史气象数据、所述历史气象数据对应的历史趋势特征以及历史光功率训练得到的。

在一个可选的设计中,所述机器学习模型包括至少两个子机器学习模型;所述预测模块,用于:

将所述预报气象数据以及所述趋势特征输入所述子机器学习模型,输出至少两个预测光功率;

将所述至少两个预测光功率的算术平均值确定为输出的所述预测光功率;或,将所述至少两个预测光功率的加权平均值确定为输出的所述预测光功率。

在一个可选的设计中,所述获取模块,用于:

获取第二预测时段内预测时刻的预报气象数据,所述第二预测时段包括所述第一预测时段;

所述预测模块,用于:

将所述第二预测时段对应的预报气象数据以及趋势特征输入所述机器学习模型,输出所述第二预测时段的预测光功率;

将所述第二预测时段的预测光功率中,属于所述第一预测时段的预测光功率进行输出。

根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的模型训练方法或光功率预测方法。

根据本申请的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述程序代码由处理器加载并执行以实现如上方面所述的模型训练方法或光功率预测方法。

根据本申请的另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述方面的各种可选实现方式中提供的模型训练方法或光功率预测方法。

本申请提供的技术方案带来的有益效果至少包括:

通过根据历史时刻的历史气象数据以及历史光功率对机器学习模型进行训练,该机器学习模型能够根据预报气象数据预测光功率。在通过该机器学习模型预测光功率时,无需人工进行计算,从而提升了预测光功率的效率。并且,对历史气象数据进行特征工程处理,能够使机器学习模型学习到历史气象数据的短期变化特性,从而能够提升预测光功率的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的实现预测光功率的过程的示意图;

图2是本申请一个示例性实施例提供的模型训练方法的流程示意图;

图3是本申请一个示例性实施例提供的光功率预测方法的流程示意图;

图4是本申请另一个示例性实施例提供的光功率预测方法的流程示意图;

图5是本申请实施例提供的预测光功率的实现过程的示意图;

图6是本申请一个示例性实施例提供的模型训练装置的结构示意图;

图7是本申请另一个示例性实施例提供的模型训练装置的结构示意图;

图8是本申请一个示例性实施例提供的光功率预测装置的结构示意图;

图9是本申请一个示例性实施例提供的服务器的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请一个示例性实施例提供的实现预测光功率的过程的示意图。如图1所示,在训练机器学习模型的阶段101中,计算机设备获取历史时刻的历史气象数据以及历史光功率,并对获取到的历史气象数据以及历史光功率进行数据清洗。之后计算机设备对历史气象数据进行特征工程处理,得到历史气象数据对应的趋势特征。该趋势特征用于反映历史气象数据的变化特性。该趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。之后计算机设备根据历史气象数据、趋势特征以及历史光功率训练机器学习模型。该机器学习模型用于根据预报气象数据预测光功率。该机器学习模型包括至少两个子机器学习模型,计算机设备在训练该机器学习模型时,会将历史气象数据、趋势特征以及历史光功率组成的数据集划分为训练集和验证集,并基于该测试集和验证集采用交叉验证的方式对机器学习进行训练。

在使用机器学习模型预测光功率的阶段102中,计算机设备获取第一预测时段内预测时刻的预报气象数据,并对获取到的数据进行数据清洗。之后计算机设备对第一预测时段内的预报气象数据进行特征工程处理,得到该预报气象数据对应的趋势特征。该趋势特征用于反映预报气象数据的变化特性。计算机设备对该预报气象数据进行数据清洗的过程以及进行特征工程处理的过程,与训练机器模型时对历史气象数据进行的数据清洗的过程以及进行特征工程处理的过程相同。之后计算机设备将预报气象数据以及趋势特征输入完成训练的机器学习模型,输出预测光功率。该机器学习模型是通过上述历史气象数据、历史气象数据对应的历史趋势特征以及历史光功率训练得到的。该机器学习模型包括至少两个子机器学习模型,计算机设备通过该机器学习模型预测光功率时,会将每个子机器学习模型预测的光功率的算术平均值或加权平均值,确定为最终输出的预测光功率。可选地,计算机设备还能够获取第二预测时段内预测时刻的预报气象数据,该第二预测时段包括第一预测时段。之后将第二预测时段对应的预报气象数据以及趋势特征输入机器学习模型,输出第二预测时段的预测光功率。并对第二预测时段的预测光功率中,属于第一预测时段的预测光功率进行输出。

在通过上述方式预测光功率时,无需人工进行计算,从而提升了预测光功率的效率。并且,对历史气象数据进行特征工程处理,能够使机器学习模型学习到历史气象数据的短期变化特性,从而能够提升预测光功率的准确度。

图2是本申请一个示例性实施例提供的模型训练方法的流程示意图。该方法可以用于计算机设备或计算机设备上的客户端。如图2所示,该方法包括:

步骤201:获取历史时刻的历史气象数据以及历史光功率。

该历史气象数据包括辐照强度数据,辐照强度数据用于量化光照的强弱。该历史气象数据还能够包括温度、湿度、风速以及气压等。该历史时刻属于历史时段,该历史时段为过去的任一时段。对于每个历史时刻,该历史气象数据对应有历史光功率。该历史光功率为光伏发电厂在该历史光功率对应的历史时刻通过光伏进行发电的功率。该历史气象数据为该发电厂所在区域的气象数据。

可选地,历史气象数据包括多个来源,例如为不同气象预报服务商提供的,即在同一历史时刻,历史光功率对应多个历史气象数据。并且,该历史气象数据以及对应的历史光功率属于不同光伏发电厂,即在同一历史时刻,存在多组对应的历史气象数据以及历史光功率。

计算机设备获取的历史气象数据以及历史光功率,是由光伏发电厂的管理人员上传的,或者,是计算机设备从提供气象预报服务的服务器获取的。

步骤202:对历史气象数据进行特征工程处理,得到历史气象数据对应的趋势特征。

该趋势特征用于反映历史气象数据的变化特性。可选地,该趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。该趋势特征能够反映历史气象数据在短期内的变化特性。

其中,多次特征用于反映历史气象数据在不同指数下的特征。时序特征用于反映历史气象数据对应的时间段。离散化特征用于反映历史气象数据的阶段变化特性。气象滞后特征用于反映历史气象数据之前的气象数据的特征。气象未来特征用于反映历史气象数据之后的气象数据的特征。气象变化率特征用于反映历史气象数据的变化速率。气象变化趋势特征用于反映历史气象数据的变化幅度。动态辐照特征用于反映不同来源的历史气象数据的差异。

步骤203:根据历史气象数据、趋势特征以及历史光功率训练机器学习模型。

该机器学习模型用于根据预报气象数据预测光功率。可选地,该机器学习模型包括线性回归模型、随机森林模型以及梯度提升模型(Extreme Gradient Boosting,XGBoost)中的至少一种。计算机设备根据属于同一历史时刻的历史气象数据、趋势特征以及历史光功率所组成的数据序列,对该机器学习模型进行训练。

综上所述,本实施例提供的方法,根据历史时刻的历史气象数据以及历史光功率对机器学习模型进行训练,该机器学习模型能够根据预报气象数据预测光功率。在通过该机器学习模型预测光功率时,无需人工进行计算,从而提升了预测光功率的效率。并且,对历史气象数据进行特征工程处理,能够使机器学习模型学习到历史气象数据的短期变化特性,从而能够提升预测光功率的准确度。

图3是本申请一个示例性实施例提供的光功率预测方法的流程示意图。该方法可以用于计算机设备或计算机设备上的客户端。如图3所示,该方法包括:

步骤301:获取第一预测时段内预测时刻的预报气象数据。

该第一预测时段为需要进行光功率预测的时段。例如需要预测明日的光功率,则第一预测时段为明日的00:00至24:00。该预报气象数据包括辐照强度数据,还能够包括温度、湿度、风速以及气压等。该预报气象数据为需要进行光功率预测的光伏发电厂所在区域的数据。

计算机设备获取的第一预测时段内预测时刻的预报气象数据,是由光伏发电厂的管理人员上传的,或者,是计算机设备从提供气象预报服务的服务器根据光伏发电厂的管理人员选择的第一预测时段获取的。

步骤302:对预报气象数据进行特征工程处理,得到预报气象数据对应的趋势特征。

该趋势特征用于反映预报气象数据的变化特性。可选地,该趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。该趋势特征能够反映预报气象数据在短期内的变化特性。计算机设备对该预报气象数据进行特征工程处理的过程,与训练用于预测光功率的机器模型时,对历史气象数据进行特征工程处理的过程相同。

步骤303:将预报气象数据以及趋势特征输入机器学习模型,输出预测光功率。

该机器学习模型是通过历史气象数据、历史气象数据对应的历史趋势特征以及历史光功率训练得到的。在根据预报气象数据预测光功率时,计算机设备对预报气象数据也进行了特征工程处理。并且,预报气象数据包括的数据的维度与历史气象数据相同。因此能够保证输入数据的数据对齐。

可选地,该机器学习模型包括线性回归模型、随机森林模型以及梯度提升模型(Extreme Gradient Boosting,XGBoost)中的至少一种。计算机设备基于属于同一预测时刻的预报气象数据以及趋势特征,通过该机器学习模型能够预测出该预测时刻的预测光功率,从而最终能够得到第一预测时段内的预测光功率。

综上所述,本实施例提供的方法,对预报气象数据进行特征工程处理,并基于预报气象数据以及趋势特征通过机器学习模型预测光功率。在通过该机器学习模型预测光功率时,无需人工进行计算,从而提升了预测光功率的效率。

图4是本申请另一个示例性实施例提供的光功率预测方法的流程示意图。该方法可以用于计算机设备或计算机设备上的客户端。如图4所示,该方法包括:

步骤401:获取历史时刻的历史气象数据以及历史光功率。

该历史气象数据包括辐照强度数据,辐照强度数据用于量化光照的强弱。该历史气象数据还能够包括温度、湿度、风速以及气压等。其中,辐照强度数据对光功率的影响程度大于其他维度的气象数据对光功率的影响程度。该历史时刻属于历史时段,该历史时段为过去的任一时段。对于每个历史时刻,该历史气象数据对应有历史光功率。该历史光功率为光伏发电厂在该历史光功率对应的历史时刻通过光伏进行发电的功率。该历史气象数据为该发电厂所在区域的气象数据。

计算机设备在获取到历史气象数据以及历史光功率时,还会对历史气象数据以及历史光功率进行数据清洗。例如计算机设备会对历史气象数据中不满足一致性的数据,无效的数据以及缺失数值的数据进行处理。以及,计算机设备会根据获取到的历史气象数据,基于多项式回归的方式粗略估计光功率,并通过该光功率与获取到的历史光功率进行对比,从而实现对历史光功率进行数据清洗。

步骤402:对历史气象数据进行特征工程处理,得到历史气象数据对应的趋势特征。

该趋势特征用于反映历史气象数据的变化特性。可选地,该趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。

其中,多次特征用于反映历史气象数据在不同指数下的特征。时序特征用于反映历史气象数据对应的时间段。离散化特征用于反映历史气象数据的阶段变化特性。气象滞后特征用于反映历史气象数据之前的气象数据的特征。气象未来特征用于反映历史气象数据之后的气象数据的特征。气象变化率特征用于反映历史气象数据的变化速率。气象变化趋势特征用于反映历史气象数据的变化幅度。动态辐照特征用于反映不同来源的历史气象数据的差异。

可选地,历史气象数据包括辐照强度数据,趋势特征包括多次特征。计算机设备对辐照强度数据进行增大指数处理以及减小指数处理中的至少一种,得到多次特征。示例地,某一历史时刻的辐照强度数据为a,则计算机设备将a

可选地,趋势特征包括时序特征。计算机设备将历史气象数据对应的历史时刻所处的时间段,确定为时序特征。示例地,历史时刻1为2020年8月1日15:00,历史时刻2为2020年8月2日15:00。计算机设备确定2020年8月1日15:00属于年度第31周,确定2020年8月2日15:00属于年度第32周。计算机设备将年度第31周确定为历史时刻1对应的历史气象数据的时序特征,将年度第32周确定为历史时刻2对应的历史气象数据的时序特征。

可选地,历史气象数据包括辐照强度数据,趋势特征包括离散化特征。计算机设备对辐照强度数据进行离散化处理,得到离散化特征。示例地,计算机设备根据预设区间确定历史时刻的辐照强度所属的预设区间,并将预设区间对应的取值确定为历史气象数据的离散化特征。该预设区间是计算机设备确定的。例如预设区间包括[0,30)、[30,100)以及[100,∞),分别对应的取值为1、2和3。当辐照强度数据为15时,则对应的离散化特征为1。当辐照强度为50时,则对应的离散化特征为2。当辐照强度为150时,则对应的离散化特征为3。计算机设备还能够对历史气象数据中其他维度的数据进行离散化处理,从而得到离散化特征。

可选地,趋势特征包括气象滞后特征。计算机设备将第一历史时刻的第一历史气象数据,确定为第二历史气象数据对应的气象滞后特征。其中,第二历史气象数据对应的第二历史时刻在第一历史时刻之后。示例地,计算机设备按照第一预设间隔,确定气象滞后特征。该第一预设间隔是计算机设备确定的,例如为30分钟。计算机设备根据该第一预设间隔,从而确定第二历史时刻之前30分钟的第一历史时刻,并将第一历史时刻的第一历史气象数据,确定为第二历史气象数据对应的气象滞后特征。在确定气象滞后特征时,计算机设备只使用历史气象数据中的辐照强度数据。

可选地,趋势特征包括气象未来特征。计算机设备将第三历史时刻的第三历史气象数据,确定为第四历史气象数据对应的气象滞后特征。其中,第四历史气象数据对应的第四历史时刻在第三历史时刻之前。示例地,计算机设备按照第二预设间隔,确定气象未来特征。该第二预设间隔是计算机设备确定的,例如为30分钟。计算机设备根据该第二预设间隔,从而确定第四历史时刻之后30分钟的第三历史时刻,并将第三历史时刻的第三历史气象数据,确定为第四历史气象数据对应的气象未来特征。在确定气象未来特征时,计算机设备只使用历史气象数据中的辐照强度数据。

可选地,历史气象数据包括辐照强度数据,趋势特征包括气象变化率特征。计算机设备将第五历史时刻的辐照强度数据和第六历史时刻的辐照强度数据的差,与第六历史时刻的辐照强度数据之间的商确定为第五历史时刻的历史气象数据对应的气象变化率特征。其中,第五历史时刻在第六历史时刻之后。示例地,第五历史时刻的历史气象数据对应的气象变化率特征Rd

其中,R

可选地,历史气象数据包括辐照强度数据,趋势特征包括气象变化趋势特征。计算机设备将第七历史时刻的辐照强度数据和目标历史时段对应的辐照强度的平均值之间的差,确定为第七历史时刻的历史气象数据对应的气象变化趋势特征。其中,第七历史时刻在目标历史时段之后。该目标历史时段是计算机设备确定的。示例地,第七历史时刻的历史气象数据对应的气象变化趋势特征Rt

其中,R

可选地,历史气象数据属于至少两个来源,历史气象数据包括辐照强度数据,趋势特征包括动态辐照强度特征。计算机设备将同一历史时刻的不同来源的至少两个辐照强度数据的平均值,与至少两个辐照强度数据的标准差之间的和以及差中的至少一种,确定为历史时刻的历史气象数据对应的动态辐照强度特征。示例地,某一个历史时刻的历史气象数据对应的动态辐照强度特征Ry

其中,

步骤403:根据历史气象数据、趋势特征以及历史光功率训练机器学习模型。

该机器学习模型用于根据预报气象数据预测光功率。可选地,该机器学习模型包括线性回归模型、随机森林模型以及梯度提升模型(Extreme Gradient Boosting,XGBoost)中的至少一种。示例地,计算机设备根据全部历史时刻的历史气象数据、历史气象数据对应的趋势特征所组成的数组,以及该数组对应的历史光功率,对机器学习模型进行训练。例如,任一历史时刻对应的该数组为[历史气象数据,多次特征,时序特征,离散化特征,气象滞后特征,气象未来特征,气象变化率特征,气象变化趋势特征以及动态辐照强度特征]。

可选地,机器学习模型包括至少两个子机器学习模型。其中,子机器学习模型完全相同、部分相同或者各不相同。计算机设备对数据集按照历史时刻进行划分,得到训练集和验证集。该数据集包括历史气象数据、趋势特征以及历史光功率。其中,划分的规则是计算机设备确定的。例如计算机设备将全部历史时刻中在时间上属于前90%的历史时刻的数据划分为训练集,将属于后10%的历史时刻的数据划分为验证集。之后计算机设备根据训练集以及验证集采用交叉验证的方式对至少两个子机器模型进行训练。计算机设备采用训练某一个子机器学习模型的训练集对应的验证集,对另一个子机器学习模型进行验证。并且,计算机设备能根据不同的规则划分出不同的训练集和验证集,来对子机器学习模型进行训练,并通过人工的方式或基于是否满足计算机设备设定的性能参数,确定子机器学习模型最终的模型参数,从而完成对机器学习模型的训练。

步骤404:获取第一预测时段内预测时刻的预报气象数据。

该第一预测时段为需要进行光功率预测的时段。该预报气象数据包括辐照强度数据,还能够包括温度、湿度、风速以及气压等。该预报气象数据为需要进行光功率预测的光伏发电厂所在区域的数据。

步骤405:对预报气象数据进行特征工程处理,得到预报气象数据对应的趋势特征。

该趋势特征用于反映预报气象数据的变化特性。可选地,该趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。计算机设备对该预报气象数据进行特征工程处理的过程,与训练用于预测光功率的机器模型时,对历史气象数据进行特征工程处理的过程相同。并且,预报气象数据包括的数据的维度与历史气象数据相同。从而能够保证输入机器学习模型的数据的数据对齐。

步骤406:将预报气象数据以及趋势特征输入机器学习模型,输出预测光功率。

该机器学习模型是通过历史气象数据、历史气象数据对应的历史趋势特征以及历史光功率训练得到的。可选地,该机器学习模型包括线性回归模型、随机森林模型以及梯度提升模型(Extreme Gradient Boosting,XGBoost)中的至少一种。

可选地,机器学习模型包括至少两个子机器学习模型。其中,子机器学习模型完全相同、部分相同或者各不相同。计算机设备将预报气象数据以及趋势特征输入子机器学习模型,从而输出至少两个预测光功率。之后计算机设备将至少两个预测光功率的算术平均值确定为输出的预测光功率,或,将至少两个预测光功率的加权平均值确定为输出的预测光功率。其中,至少两个预测光功率中每个预测光功率对应的权重,是计算机设备确定的。例如光伏发电厂的工作人员根据训练的子机器学习模型的准确度,在计算机设备中手工标记每个子机器学习模型输出的预测光功率的权重。

示例地,图5是本申请实施例提供的预测光功率的实现过程的示意图。如图5所示,计算机设备对获取的预报气象数据进行特征工程处理,得到预报气象数据对应的趋势特征。之后将预报气象数据以及趋势特征分别输入机器学习模型的子模型1、子模型2、子模型3、子模型4以及子模型5,从而得到预测结果1、预测结果2、预测结果3、预测结果4以及预测结果5。其中,输入子模型1的数据为数据1,输入子模型2的数据为数据2,输入子模型3的数据为数据3,输入子模型4的数据为数据4,输入子模型5的数据为数据5,数据1、数据2、数据3、数据4以及数据5相同。之后计算机设备将全部预测结果的平均值,作为最终输出的预测光功率。

可选地,计算机设备还能够获取第二预测时段内预测时刻的预报气象数据。该第二预测时段包括第一预测时段。例如第一预测时段为明天12:00至24:00,第二预测时段为明天00:00至后天12:00。计算机设备将第二预测时段对应的预报气象数据以及趋势特征输入机器学习模型,输出第二预测时段的预测光功率。之后将第二预测时段的预测光功率中,属于第一预测时段的预测光功率进行输出。

需要说明的是,上述计算机设备能够为服务器,例如为一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心中的虚拟服务器等等,在此不做限定。该服务器用于实现上述预测光功率的服务。上述计算机设备还能够为智能手机、平板电脑、台式电脑和笔记本电脑等,此时计算机设备通过安装能够实现上述预测光功率的服务的客户端实现预测光功率。

综上所述,本实施例提供的方法,根据历史时刻的历史气象数据以及历史光功率对机器学习模型进行训练,该机器学习模型能够根据预报气象数据预测光功率。在通过该机器学习模型预测光功率时,无需人工进行计算,从而提升了预测光功率的效率。

另外,对历史气象数据进行特征工程处理,能够使机器学习模型学习到历史气象数据的在不同维度下的变化特性,从而能够提升预测光功率的准确度。通过交叉验证的方式训练至少两个子机器模型,能够提升训练机器学习模型的效率,以及提升训练出的机器学习模型预测光功率的准确度。将子机器学习模型输出的至少两个预测光功率的算术平均值或加权平均值确定为输出的预测光功率,能够考虑到不同子机器学习模型学习到的特征,从而增强了输出的光功率的可靠性。采用第二预测时段内预测时刻的预报气象数据预测第一预测时段的光功率,能够使用到第一预测时段前后的气象预报数据,增加机器学习模型预测时使用的特征,由于气象变化存在逻辑关系,因此能够提升预测光功率的准确度。

需要说明的是,本申请实施例提供的方法步骤的先后顺序可以进行适当调整,步骤也可以根据情况进行相应增减,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化的方法,都应涵盖在本申请的保护范围之内,因此不再赘述。

图6是本申请一个示例性实施例提供的模型训练装置的结构示意图。该装置可以用于计算机设备或计算机设备上的客户端。如图6所示,该装置60包括:

获取模块601,用于获取历史时刻的历史气象数据以及历史光功率。

处理模块602,用于对历史气象数据进行特征工程处理,得到历史气象数据对应的趋势特征,趋势特征用于反映历史气象数据的变化特性。

训练模块603,用于根据历史气象数据、趋势特征以及历史光功率训练机器学习模型,机器学习模型用于根据预报气象数据预测光功率。

在一个可选的设计中,趋势特征包括多次特征、时序特征、离散化特征、气象滞后特征、气象未来特征、气象变化率特征、气象变化趋势特征以及动态辐照强度特征中的至少一种。其中,多次特征用于反映历史气象数据在不同指数下的特征,时序特征用于反映历史气象数据对应的时间段,离散化特征用于反映历史气象数据的阶段变化特性,气象滞后特征用于反映历史气象数据之前的气象数据的特征,气象未来特征用于反映历史气象数据之后的气象数据的特征,气象变化率特征用于反映历史气象数据的变化速率,气象变化趋势特征用于反映历史气象数据的变化幅度,动态辐照特征用于反映不同来源的历史气象数据的差异。

在一个可选的设计中,历史气象数据包括辐照强度数据,趋势特征包括多次特征。处理模块602,用于:

对辐照强度数据进行增大指数处理以及减小指数处理中的至少一种,得到多次特征。

在一个可选的设计中,趋势特征包括时序特征。处理模块602,用于:

将历史气象数据对应的历史时刻所处的时间段,确定为时序特征。

在一个可选的设计中,历史气象数据包括辐照强度数据,趋势特征包括离散化特征。处理模块602,用于:

对辐照强度数据进行离散化处理,得到离散化特征。

在一个可选的设计中,趋势特征包括气象滞后特征。处理模块602,用于:

将第一历史时刻的第一历史气象数据,确定为第二历史气象数据对应的气象滞后特征。其中,第二历史气象数据对应的第二历史时刻在第一历史时刻之后。

在一个可选的设计中,趋势特征包括气象未来特征。处理模块602,用于:

将第三历史时刻的第三历史气象数据,确定为第四历史气象数据对应的气象滞后特征。其中,第四历史气象数据对应的第四历史时刻在第三历史时刻之前。

在一个可选的设计中,历史气象数据包括辐照强度数据,趋势特征包括气象变化率特征。处理模块602,用于:

将第五历史时刻的辐照强度数据和第六历史时刻的辐照强度数据的差,与第六历史时刻的辐照强度数据之间的商确定为第五历史时刻的历史气象数据对应的气象变化率特征。其中,第五历史时刻在第六历史时刻之后。

在一个可选的设计中,历史气象数据包括辐照强度数据,趋势特征包括气象变化趋势特征。处理模块602,用于:

将第七历史时刻的辐照强度数据和目标历史时段对应的辐照强度的平均值之间的差,确定为第七历史时刻的历史气象数据对应的气象变化趋势特征。其中,第七历史时刻在目标历史时段之后。

在一个可选的设计中,历史气象数据属于至少两个来源,历史气象数据包括辐照强度数据,趋势特征包括动态辐照强度特征。处理模块602,用于:

将同一历史时刻的不同来源的至少两个辐照强度数据的平均值,与至少两个辐照强度数据的标准差之间的和以及差中的至少一种,确定为历史时刻的历史气象数据对应的动态辐照强度特征。

在一个可选的设计中,机器学习模型包括至少两个子机器学习模型,如图7所示,装置60还包括:

划分模块604,用于对数据集按照历史时刻进行划分,得到训练集和验证集,数据集包括历史气象数据、趋势特征以及历史光功率。

训练模块603,用于根据训练集以及验证集采用交叉验证的方式对至少两个子机器模型进行训练。

图8是本申请一个示例性实施例提供的光功率预测装置的结构示意图。该装置可以用于计算机设备或计算机设备上的客户端。如图8所示,该装置80包括:

获取模块801,用于获取第一预测时段内预测时刻的预报气象数据。

处理模块802,用于对预报气象数据进行特征工程处理,得到预报气象数据对应的趋势特征,趋势特征用于反映预报气象数据的变化特性。

预测模块803,用于将预报气象数据以及趋势特征输入机器学习模型,输出预测光功率,机器学习模型是通过历史气象数据、历史气象数据对应的历史趋势特征以及历史光功率训练得到的。

在一个可选的设计中,机器学习模型包括至少两个子机器学习模型。预测模块803,用于:

将预报气象数据以及趋势特征输入子机器学习模型,输出至少两个预测光功率。将至少两个预测光功率的算术平均值确定为输出的预测光功率,或,将至少两个预测光功率的加权平均值确定为输出的预测光功率。

在一个可选的设计中,获取模块801,用于:

获取第二预测时段内预测时刻的预报气象数据,第二预测时段包括第一预测时段。

预测模块803,用于:

将第二预测时段对应的预报气象数据以及趋势特征输入机器学习模型,输出第二预测时段的预测光功率。将第二预测时段的预测光功率中,属于第一预测时段的预测光功率进行输出。

需要说明的是:上述实施例提供的模型训练装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的模型训练装置与模型训练方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

同理,上述实施例提供的光功率预测装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的光功率预测装置与光功率预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本申请的实施例还提供了一种计算机设备,该计算机设备包括:处理器和存储器,存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的模型训练方法或光功率预测方法。

可选地,该计算机设备为服务器。示例地,图9是本申请一个示例性实施例提供的服务器的结构示意图。

所述服务器900包括中央处理单元(Central Processing Unit,CPU)901、包括随机存取存储器(Random Access Memory,RAM)902和只读存储器(Read-Only Memory,ROM)903的系统存储器904,以及连接系统存储器904和中央处理单元901的系统总线905。所述计算机设备900还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出系统(Input/Output系统,I/O系统)906,和用于存储操作系统913、应用程序914和其他程序模块915的大容量存储设备907。

所述基本输入/输出系统906包括有用于显示信息的显示器908和用于用户输入信息的诸如鼠标、键盘之类的输入设备909。其中所述显示器908和输入设备909都通过连接到系统总线905的输入输出控制器910连接到中央处理单元901。所述基本输入/输出系统906还可以包括输入输出控制器910以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器910还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备907通过连接到系统总线905的大容量存储控制器(未示出)连接到中央处理单元901。所述大容量存储设备907及其相关联的计算机可读存储介质为服务器900提供非易失性存储。也就是说,所述大容量存储设备907可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory,CD-ROM)驱动器之类的计算机可读存储介质(未示出)。

不失一般性,所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读存储指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read OnlyMemory,EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable ProgrammableRead-Only Memory,EEPROM)、闪存或其他固态存储设备,CD-ROM、数字多功能光盘(DigitalVersatile Disc,DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器904和大容量存储设备907可以统称为存储器。

存储器存储有一个或多个程序,一个或多个程序被配置成由一个或多个中央处理单元901执行,一个或多个程序包含用于实现上述方法实施例的指令,中央处理单元901执行该一个或多个程序实现上述各个方法实施例提供的方法。

根据本申请的各种实施例,所述服务器900还可以通过诸如因特网等网络连接到网络上的远程服务器运行。也即服务器900可以通过连接在所述系统总线905上的网络接口单911连接到网络912,或者说,也可以使用网络接口单元911来连接到其他类型的网络或远程服务器系统(未示出)。

所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由服务器所执行的步骤。

本申请实施例中还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条程序代码,当该程序代码由计算机设备的处理器加载并执行时,实现上述各方法实施例提供的模型训练方法或光功率预测方法。

本申请还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例提供的模型训练方法或光功率预测方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的可读存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同切换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 模型训练方法、光功率预测方法、装置、设备及存储介质
  • 模型训练方法、姿态预测方法、装置、设备及存储介质
技术分类

06120112858553