掌桥专利:专业的专利平台
掌桥专利
首页

风电联轴器打滑诊断方法、装置、电子设备及存储介质

文献发布时间:2024-01-17 01:13:28


风电联轴器打滑诊断方法、装置、电子设备及存储介质

技术领域

本发明涉及风力发电机异常诊断技术领域,尤其涉及一种风电联轴器打滑诊断方法、装置、电子设备及存储介质。

背景技术

风力发电系统是将风的动能转换为电能的系统,亦称为风力发电机组(下面简称为风电机组),风电机组主要包括风轮、发电机,其中,风电齿轮箱是风力发电机的核心部件之一,其作用是将风轮产生的低速旋转转换为高速旋转,以便驱动发电机发电。联轴器是风电机组高速旋转齿轮箱和发电机之间的唯一机械连接件,其主要作用包括:传递扭矩和转速、弥补齿轮箱输出轴和发电机输入轴之间的不对中量、缓解振动对齿轮箱和发电机的影响、对风电机组进行漏电保护,以及在异常过载情况下,联轴器的扭矩限制器可以有效保护风电机组的传动链。

在实际情况中,由于外界风场中风速是频繁变化的,从而使得联轴器受到叶轮转动中传递的随机变载,容易造成联轴器的打滑,对风电机组带来重大影响和经济损失,因此为了保证风电机组的正常运行,需要对风电机组进行异常诊断。而在相关技术中,对于风电机组的异常诊断,当前采用的方式为当风电机组出现异常问题之后通过人工排查方式进行调整,或者对整个风电机组的故障运行情况进行检测告警,不仅检测效率低下,而且容易出现错检误检的问题。

发明内容

本发明提供了一种风电联轴器打滑诊断方法、装置、电子设备及存储介质,用于解决或部分解决现有的风电机组故障检测方法中检测效率低下,且容易出现错检误检等的技术问题。

本发明提供的一种风电联轴器打滑诊断方法,应用于风电联轴器打滑诊断系统,所述风电联轴器打滑诊断系统包括多线程日志文件提取模块以及基于随机森林算法的打滑预测模型,所述多线程日志文件提取模块设有消息队列,所述方法包括:

接收来自第一用户写入所述消息队列的文件路径,所述文件路径对应待测风电机组的日志文件;

响应于第二用户针对所述文件路径的提取操作,将所述日志文件解析成结构化数据;

通过所述打滑预测模型从所述结构化数据中提取第一原始特征,根据所述第一原始特征构建对应的第一衍生特征,并将所述第一原始特征与所述第一衍生特征进行融合,获得待测特征,基于所述待测特征对所述待测风电机组的联轴器打滑情况进行诊断;

根据诊断结果确定所述待测风电机组中出现联轴器打滑的目标风电机组。

可选地,所述第一原始特征包括所述待测风电机组的转子转速、发电机转速以及发电功率,所述通过所述打滑预测模型从所述结构化数据中提取第一原始特征,根据所述第一原始特征构建对应的第一衍生特征,包括:

步骤S1:通过所述打滑预测模型从所述结构化数据中提取所述待测风电机组的转子转速、发电机转速以及发电功率;

步骤S2:计算所述转子转速、所述发电机转速以及所述发电功率各自对应的原始统计量;

步骤S3:采用所述转子转速对应的原始统计量以及所述发电机转速对应的原始统计量先进行归一化处理,再进行做差计算,获得差值统计量;

步骤S4:从所述日志文件中提取所述第一原始特征对应的时间长度,按照所述时间长度将所述第一原始特征平均划分为4个区间数据段,并分别计算各个所述区间数据段对应的转子转速统计量、发电机转速统计量以及发电功率统计量;

步骤S5:采用所述区间数据段对应的转子转速统计量以及发电机转速统计量先进行归一化处理,再进行做差计算,获得所述区间数据段的区间差值统计量;

步骤S6:重复步骤S5,获得各个所述区间数据段对应的区间差值统计量;

步骤S7:将所述差值统计量、所述转子转速统计量、所述发电机转速统计量、所述发电功率统计量、各个所述区间数据段对应的区间差值统计量,以及所述转子转速、所述发电机转速、所述发电功率各自对应的原始统计量一并作为所述第一原始特征对应的第一衍生特征;

其中,统计量中的数据包括均值、标准差、最大值以及最小值。

可选地,所述风电联轴器打滑诊断系统还包括线上环境,所述方法还包括:

构建基于随机森林算法的初始打滑预测模型,获取风电机组的样本集,将所述样本集按照3:1:1比例,以及采用分层抽样方式划分为训练集、验证集以及测试集,并根据所述训练集、所述验证集以及所述测试集对所述初始打滑预测模型进行训练;

基于训练结果确定用于联轴器打滑诊断的打滑预测模型,将所述打滑预测模型部署至线上环境,同时融合进多线程日志文件提取模块;

响应于消息队列创建操作,在所述多线程日志文件提取模块中设置消息队列。

可选地,所述根据所述训练集、所述验证集以及所述测试集对所述初始打滑预测模型进行训练,包括:

结合网格搜索确定优化模型参数,采用所述训练集、所述验证集以及所述测试集通过3折交叉验证方式对所述初始打滑预测模型进行训练以及验证;

基于交叉验证结果,对应生成3个不同的模型权重。

可选地,所述基于训练结果确定用于联轴器打滑诊断的打滑预测模型,包括:

从3个所述模型权重中选出得分最高的目标模型权重,并基于所述目标模型权重确定用于联轴器打滑诊断的打滑预测模型。

可选地,在所述获取风电机组的样本集之前,所述方法还包括:

获取风电机组的历史检测数据以及多个历史日志文件,根据所述历史检测数据对各个所述历史日志文件进行打滑标注,获得各自对应的初始标注样本;

提取各个所述初始标注样本的第二原始特征,根据各个所述第二原始特征构建对应的第二衍生特征,并将各个所述第二原始特征与各自对应的所述第二衍生特征进行融合,获得各个所述第二原始特征各自对应的样本特征;

将各个所述样本特征对应的初始标注样本均更新为目标标注样本,所述目标标注样本为打滑样本或非打滑样本;

若所述目标标注样本为打滑样本,则对所述打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本;

将各个所述扩充打滑样本与各个所述非打滑样本存储为所述风电机组的样本集。

可选地,所述对所述打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本,包括:

从所述样本集中不放回地抽取一个打滑样本作为第一目标打滑样本、有放回地抽取一个目标标注样本作为随机样本;

采用所述随机样本替换所述第一目标打滑样本的前后20%区间内的数据,获得第一替换打滑样本;

通过滑动窗口法对所述第一替换打滑样本进行数据平滑处理,获得所述第一目标打滑样本对应的扩充打滑样本。

可选地,所述对所述打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本,包括:

从所述样本集中抽取一个打滑样本作为第二目标打滑样本;

对所述第二目标打滑样本加入预设量的均值为0的随机白噪声,形成第二替换打滑样本;

通过滑动窗口法对所述第二替换打滑样本进行数据平滑处理,获得所述第二目标打滑样本对应的扩充打滑样本。

可选地,所述风电联轴器打滑诊断系统还包括数据库,所述方法还包括:

将所述诊断结果写入所述数据库;

当所述打滑预测模型运行完成后,从所述数据库提取所述诊断结果,并根据所述诊断结果对所述打滑预测模型进行复盘分析,筛选出错检样本;

对所述错检样本进行错检标注,获得对应的错检标注样本,并将所述错检标注样本添加至风电机组的样本集,获得增量样本集;

采用所述增量样本集对所述打滑预测模型进行增量训练,并基于增量训练结果对所述打滑预测模型进行更新。

本发明还提供了一种风电联轴器打滑诊断装置,应用于风电联轴器打滑诊断系统,所述风电联轴器打滑诊断系统包括多线程日志文件提取模块以及基于随机森林算法的打滑预测模型,所述多线程日志文件提取模块设有消息队列,所述装置包括:

文件路径接收模块,用于接收来自第一用户写入所述消息队列的文件路径,所述文件路径对应待测风电机组的日志文件;

结构化数据解析模块,用于响应于第二用户针对所述文件路径的提取操作,将所述日志文件解析成结构化数据;

打滑诊断处理模块,用于通过所述打滑预测模型从所述结构化数据中提取第一原始特征,根据所述第一原始特征构建对应的第一衍生特征,并将所述第一原始特征与所述第一衍生特征进行融合,获得待测特征,基于所述待测特征对所述待测风电机组的联轴器打滑情况进行诊断;

目标风电机组确定模块,用于根据诊断结果确定所述待测风电机组中出现联轴器打滑的目标风电机组。

本发明还提供了一种电子设备,所述设备包括处理器以及存储器:

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行如上任一项所述的风电联轴器打滑诊断方法。

本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行如上任一项所述的风电联轴器打滑诊断方法。

从以上技术方案可以看出,本发明具有以下优点:提供了一种风电联轴器打滑诊断方法,以及对应的风电联轴器打滑诊断系统,首先构建风电机组的样本集并对样本集进行数据处理以及样本训练集划分,接着构建基于随机森林算法的打滑预测模型并通过训练模块采用样本训练集进行模型训练,将进行训练后的模型部署至线上环境,同时融合进多线程日志文件提取模块,第一用户可以上传待测风电机组日志文件对应的文件路径至多线程日志文件提取模块的消息队列,第二用户可以从消息队列中提取文件路径,将文件路径对应的日志文件解析成结构化数据并导入打滑预测模型的预测模块进行联轴器打滑异常诊断,从而实现了通过风电机组的日志文件,快速确定出现联轴器打滑的机组,提高了检测效率以及诊断准确性,接着可以将诊断结果输入至数据库,打滑预测模型的训练模块可以从数据库中获取诊断结果,并基于诊断结果进行模型优化的增量训练,从而形成“模型训练→模型使用→模型优化训练→模型使用”的良性闭环,不断提高联轴器打滑异常诊断的准确度,以及降低检测时间,提高响应速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例提供的一种风电联轴器打滑诊断方法的步骤流程图;

图2为本发明实施例提供的一种风电联轴器打滑诊断系统的结构示意图;

图3为本发明实施例提供的一种构建衍生特征的步骤流程图;

图4为本发明实施例提供的一种待检测特征的特征工程示意图;

图5为本发明实施例提供的一种构建风电机组样本集的步骤流程图;

图6为本发明实施例提供的一种构建与训练打滑预测模型的步骤流程图;

图7为本发明实施例提供的一种风电联轴器打滑诊断方法的整体过程示意图;

图8为本发明实施例提供的一种风电联轴器打滑诊断装置的结构框图。

具体实施方式

本发明实施例提供了一种风电联轴器打滑诊断方法、装置、电子设备及存储介质,用于解决或部分解决现有的风电机组故障检测方法中检测效率低下,且容易出现错检误检等的技术问题。

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

作为一种示例,随着各项技术的不断发展,以及人们生活水平的不断提高,人们对于电力的需求也不断增大,从而对于电力系统的要求也越来越高,风电机组是当前电力系统中非常重要的一种形式,为人们日常生活以及工作需要提供电力保证。风电机组主要包括风轮、发电机,其中,风电齿轮箱是风力发电机的核心部件之一,其作用是将风轮产生的低速旋转转换为高速旋转,以便驱动发电机发电。联轴器是风电机组高速旋转齿轮箱和发电机之间的唯一机械连接件,承担着非常重要的作用。而在实际情况中,由于外界风场中风速是频繁变化的,从而使得联轴器受到叶轮转动中传递的随机变载,容易造成联轴器的打滑,对风电机组带来重大影响和经济损失,因此为了保证风电机组的正常运行,需要对风电机组进行异常诊断。在相关技术中,对于风电机组的异常诊断,当前采用的方式为当风电机组出现异常问题之后通过人工排查方式进行调整,或者对整个风电机组的故障运行情况进行检测告警,不仅检测效率低下,而且容易出现错检误检的问题。

因此,本发明实施例的核心发明点之一在于:提供一种风电联轴器打滑诊断方法,以及对应的风电联轴器打滑诊断系统,首先构建风电机组的样本集并对样本集进行数据处理以及样本训练集划分,接着构建基于随机森林算法的打滑预测模型并通过训练模块采用样本训练集进行模型训练,将进行训练后的模型部署至线上环境,同时融合进多线程日志文件提取模块,第一用户可以上传待测风电机组日志文件对应的文件路径至多线程日志文件提取模块的消息队列,第二用户可以从消息队列中提取文件路径,将文件路径对应的日志文件解析成结构化数据并导入打滑预测模型的预测模块进行联轴器打滑异常诊断,从而可以实现通过风电机组的日志文件,快速确定出现联轴器打滑的机组,提高检测效率以及诊断准确性,接着可以将诊断结果输入至数据库,打滑预测模型的训练模块可以从数据库中获取诊断结果,并基于诊断结果进行模型优化的增量训练,从而形成“模型训练→模型使用→模型优化训练→模型使用”的良性闭环,不断提高联轴器打滑异常诊断的准确度,以及降低检测时间,提高响应速度。

参照图1,示出了本发明实施例提供的一种风电联轴器打滑诊断方法的步骤流程图,应用于风电联轴器打滑诊断系统,风电联轴器打滑诊断系统可以包括多线程日志文件提取模块以及基于随机森林算法的打滑预测模型,多线程日志文件提取模块设有消息队列,所述方法具体可以包括以下步骤:

步骤101,接收来自第一用户写入所述消息队列的文件路径,所述文件路径对应待测风电机组的日志文件;

联轴器是风电机组中非常重要的一个机械连接件,在风电机组的运行过程中,如果联轴器出现打滑情况,则非常容易对风电机组的正常运行带来重大影响,继而造成不必要的经济损失。因此在对风电机组进行异常诊断时,可以将通过检测联轴器是否发生打滑作为其中一个异常诊断因素,则负责数据收集的用户可以将风电机组日志文件的文件路径上传至风电联轴器打滑诊断系统,以便想要获知异常诊断结果的用户进行文件提取,并利用风电联轴器打滑诊断系统中的打滑预测模型进行数据解析,输出诊断结果。

具体地,风电联轴器打滑诊断系统可以接收来自第一用户写入消息队列的文件路径,其中,文件路径对应待测风电机组的日志文件,第一用户可以表示为上传文件路径的用户。

为更好地进行说明,示例性地,参照图2,示出了本发明实施例提供的一种风电联轴器打滑诊断系统的结构示意图。

由图中可知,风电联轴器打滑诊断系统200中主要可以包括多线程日志文件提取模块201、基于随机森林算法的打滑预测模型202、线上环境203以及数据库204。

其中,多线程日志文件提取模块201中可以包括生产者模块2011以及消费者模块2012,生产者模块2011与消费者模块2012之间通过消息队列产生通信连接,因此,生产者模块可以理解为接收上传文件路径的用户所对应的接收模块,消费者模块可以理解为对文件路径进行提取的用户所对应的提取模块,为便于区分以及说明,将生产者模块对应的用户设定为第一用户,将消费者模块对应的用户设定为第二用户。

打滑预测模型202中可以包括用于模型训练优化的训练模块2021,以及用于异常诊断的预测模块2022。

线上环境203为发布环境,即真实用户访问的环境,可以将通过训练模块2021进行训练后选出的打滑预测模型部署至线上环境203,同时融合进多线程日志文件提取模块201,供用户使用。

数据库204则可以用于存储进行异常诊断后输出的诊断结果,也可以用于存储其他相关数据,如用于存储随机森林模型预测的结果及相关输出指标。

在风电联轴器打滑诊断系统200中,可以构建基于随机森林算法的打滑预测模型并通过训练模块2021进行模型训练,将进行训练后的模型部署至线上环境203,同时融合进多线程日志文件提取模块201,第一用户可以通过生产者模块2011上传待测风电机组日志文件对应的文件路径至消息队列,第二用户可以通过消费者模块2012从消息队列中提取文件路径,并将文件路径对应的日志文件解析成结构化数据,接着导入打滑预测模型202的预测模块2022进行联轴器打滑异常诊断,将诊断结果输入至数据库204,打滑预测模型202的训练模块2021可以从数据库204中获取诊断结果,并基于诊断结果进行模型优化训练,并对打滑预测模型进行更新,从而形成“模型训练→模型使用→模型优化训练→模型使用”的良性闭环,不断提高联轴器打滑异常诊断的准确度,以及降低检测时间,提高响应速度。

步骤102,响应于第二用户针对所述文件路径的提取操作,将所述日志文件解析成结构化数据;

接着可以响应于第二用户针对文件路径的提取操作,将文件路径对应的日志文件解析成可被打滑预测模型使用的结构化数据。

步骤103,通过所述打滑预测模型从所述结构化数据中提取第一原始特征,根据所述第一原始特征构建对应的第一衍生特征,并将所述第一原始特征与所述第一衍生特征进行融合,获得待测特征,基于所述待测特征对所述待测风电机组的联轴器打滑情况进行诊断;

在对结构化数据进行数据处理时,可以参照在进行模型训练时的相关数据处理流向,具体地,可以通过打滑预测模型从结构化数据中提取第一原始特征,接着根据第一原始特征构建对应的第一衍生特征,并将第一原始特征与第一衍生特征进行融合,获得待测特征,接着基于待测特征对待测风电机组的联轴器打滑情况进行诊断。

作为一种可选实施例,第一原始特征可以包括待测风电机组的转子转速、发电机转速以及发电功率,为更好地进行说明,参照图3,示出了本发明实施例提供的一种构建衍生特征的步骤流程图,则通过打滑预测模型从结构化数据中提取第一原始特征,根据第一原始特征构建对应的第一衍生特征的步骤,具体可以包括:

步骤S1:通过所述打滑预测模型从所述结构化数据中提取所述待测风电机组的转子转速、发电机转速以及发电功率;

步骤S2:计算所述转子转速、所述发电机转速以及所述发电功率各自对应的原始统计量;

步骤S3:采用所述转子转速对应的原始统计量以及所述发电机转速对应的原始统计量先进行归一化处理,再进行做差计算,获得差值统计量;

步骤S4:从所述日志文件中提取所述第一原始特征对应的时间长度,按照所述时间长度将所述第一原始特征平均划分为4个区间数据段,并分别计算各个所述区间数据段对应的转子转速统计量、发电机转速统计量以及发电功率统计量;

具体地,将第一原始特征按照时间长度平均划分为原始特征段1、原始特征段2、原始特征段3以及原始特征段4,分别计算原始特征段1至4对应的转子转速统计量、发电机转速统计量以及发电功率统计量,则总共可以获得4个不同区间数据段各自对应的转子转速统计量、发电机转速统计量以及发电功率统计量,共计12个区间统计量。

步骤S5:采用所述区间数据段对应的转子转速统计量以及发电机转速统计量先进行归一化处理,再进行做差计算,获得所述区间数据段的区间差值统计量;

步骤S6:重复步骤S5,获得各个所述区间数据段对应的区间差值统计量;

同理,经过该步骤,可以获得4个不同区间数据段对应的区间差值统计量,共计4个区间差值统计量。

步骤S7:将所述差值统计量、所述转子转速统计量、所述发电机转速统计量、所述发电功率统计量、各个所述区间数据段对应的区间差值统计量,以及所述转子转速、所述发电机转速、所述发电功率各自对应的原始统计量一并作为所述第一原始特征对应的第一衍生特征;

经过上述步骤的处理之后,第一衍生特征中总共包括20个统计量,即步骤S1中获得的3个原始统计量、步骤S2中获得的1个差值统计量、步骤S4中获得的12个区间统计量,以及通过步骤S5至S6中获得的4个区间差值统计量,其中,统计量中的数据可以包括均值、标准差、最大值以及最小值。

示例性地,参照图4,示出了本发明实施例提供的一种待检测特征的特征工程示意图。

由图中可以看出,整个特征工程主要可以包括原始特征的提取,以及通过原始特征构建衍生特征这两部分,其中,原始特征中包括待测风电机组的转子转速、发电机转速以及发电功率等数据。衍生特征主要可以包括五部分,分别是对原始特征进行相应处理之后获得的原始的转子转速统计量、发电机转速统计量、发电功率统计量、发电机转速与转子转速归一化差值统计量,以及进行分段处理之后得出的分段特征,而分段特征又可以包含进行数据分段处理之后的转子转速统计量、发电机转速统计量、发电功率统计量,以及发电机转速与转子转速归一化后差值统计量。

当获得第一衍生特征之后,可以将第一原始特征与第一衍生特征进行融合,获得待测特征,接着可以基于待测特征对待测风电机组的联轴器打滑情况进行诊断,并生成对应的诊断结果。

作为一种示例,假设有多个需要进行打滑诊断的待测风电机组,每一待测风电机组对应一个待测特征,将某个待测特征输入至打滑预测模型中各棵决策树中分别进行打滑判断,确定该待测特征属于打滑还是非打滑类,并基于各棵决策树的判断结果确定是打滑类被选择最多还是非打滑类被选择最多,接着最终确定该待测特征属于哪一类,如大多数决策树经过判断之后认为该待测特征属于发生打滑类,则可以确定该待测特征对应的类为打滑,该待测特征对应的待测风电机组发生了打滑现象,并生成对应的诊断结果。

步骤104,根据诊断结果确定所述待测风电机组中出现联轴器打滑的目标风电机组。

接着可以根据输出的诊断结果确定待测风电机组中出现联轴器打滑的目标风电机组,实现联轴器打滑的快速诊断,迅速排查出现联轴器打滑的风电机组,并及时进行维护或者调整,保证了风电机组的正常运行,也避免了造成更大损失。

由前述实施例可知,风电联轴器打滑诊断系统中还可以包括用于存储数据的数据库,则在通过打滑预测模型输出诊断结果之后,还可以将诊断结果写入数据库,并在每次运行模型进行打滑诊断之后,将诊断结果输入至打滑预测模型的训练模块,当诊断结果中存在错检或者漏检的异常数据时,将这些异常数据确定为错检样本,接着基于错检验本建立对应的增量样本集对打滑预测模型进行优化训练。

在具体的实现中,当打滑预测模型运行完成后,可以从数据库提取诊断结果,并根据诊断结果对打滑预测模型进行复盘分析,筛选出错检样本,接着对错检样本进行错检标注,获得对应的错检标注样本,并将错检标注样本添加至风电机组的样本集,获得增量样本集,然后采用增量样本集对打滑预测模型进行增量训练,并基于增量训练结果对打滑预测模型进行更新,从而通过打滑诊断对应的诊断结果对打滑预测模型进行优化训练,增强了风电联轴器打滑诊断系统的鲁棒性,使得经过优化训练的打滑预测模型在进行下一次的打滑诊断时,准确度更高,诊断速度更快。

作为一种可选实施例,在获取风电机组的样本集之前,可以基于风电机组的历史检测数据构建风电机组的样本集,并用于对构建的基于随机森林算法的打滑预测模型进行初步的训练。

参照图5,示出了本发明实施例提供的一种构建风电机组样本集的步骤流程图,具体可以包括如下步骤:

步骤501,获取风电机组的历史检测数据以及多个历史日志文件,根据所述历史检测数据对各个所述历史日志文件进行打滑标注,获得各自对应的初始标注样本;

日志文件是用于记录系统操作事件的记录文件或文件集合,具有处理历史数据、诊断问题的追踪以及理解系统的活动等重要作用,因此在进行数据处理前,可以提取风电机组的历史检测数据以及多个历史日志文件,并根据历史检测数据对各个历史日志文件进行打滑标注,获得各自对应的初始标注样本,如将发生了联轴器打滑的当日的日志文件标注为1,否则标注为0,从而通过对初步收集的日志文件进行打滑标注处理,便于对联轴器是否发生打滑更好地进行区分,以在后续进行模型训练时提高打滑诊断准确性。

步骤502,提取各个所述初始标注样本的第二原始特征,根据各个所述第二原始特征构建对应的第二衍生特征,并将各个所述第二原始特征与各自对应的所述第二衍生特征进行融合,获得各个所述第二原始特征各自对应的样本特征;

接着可以提取各个初始标注样本的第二原始特征,根据各个第二原始特征构建对应的第二衍生特征,并将各个第二原始特征与各自对应的第二衍生特征进行融合,获得各个第二原始特征各自对应的样本特征。

与第一原始特征类似,第二原始特征可以包括历史检测数据中风电机组的转子转速、发电机转速以及发电功率,根据第二原始特征构建第二衍生特征的步骤与前述实施例中根据第一原始特征构建第一衍生特征的步骤类似,此处不再赘述,本领域技术人员参照前述实施例中相关步骤即可。

接着可以将各个第二原始特征与各自对应的第二衍生特征进行融合,获得各个第二原始特征各自对应的样本特征;

步骤503,将各个所述样本特征对应的初始标注样本均更新为目标标注样本,所述目标标注样本为打滑样本或非打滑样本;

当目标标注样本对应的日志标注为1时,该目标标注样本为打滑样本,也可以称为正样本,表示联轴器发生了打滑的样本,相对地,当目标标注样本对应的日志标注为0时,该目标标注样本为非打滑样本,也可以称为负样本,表示联轴器并未发生打滑的样本。

步骤504,若所述目标标注样本为打滑样本,则对所述打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本;

由实际情况可知,为确保正常发电以及供电,大部分时间风电机组处于正常工作状态,相较于正常运行情形,联轴器发生打滑的情形是比较少见的,从而使得打滑样本会比非打滑样本少得多,即正负样本数量不平衡,此时需要对正样本(也即打滑样本)进行样本扩充处理,并使用窗口滑动法进行数据平滑处理,实现对于目标标注样本的进一步处理,使得用于训练的数据更具有参考性。

作为一种可选实施例,对打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本的步骤,可以为:首先从样本集中不放回地抽取一个打滑样本作为第一目标打滑样本、有放回地抽取一个目标标注样本作为随机样本,接着采用随机样本替换第一目标打滑样本的前后20%区间内的数据,获得第一替换打滑样本,然后通过滑动窗口法对第一替换打滑样本进行数据平滑处理,获得第一目标打滑样本对应的扩充打滑样本。

作为另一种可选实施例,对打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本的步骤,可以包括:首先从样本集中抽取一个打滑样本作为第二目标打滑样本,接着对第二目标打滑样本加入预设量的均值为0的随机白噪声,形成第二替换打滑样本,然后通过滑动窗口法对第二替换打滑样本进行数据平滑处理,获得第二目标打滑样本对应的扩充打滑样本。

从而通过对打滑样本进行样本扩充处理,并使用窗口滑动法进行数据平滑处理,平衡了打滑样本与非打滑样本之间存在的数量差异,进一步实现对于目标标注样本的数据平滑处理,使得用于训练的数据更具有参考性。

步骤505,将各个所述扩充打滑样本与各个所述非打滑样本存储为所述风电机组的样本集。

接着可以将各个扩充打滑样本与各个非打滑样本存储为风电机组的样本集,以便用于后续进行模型训练。

参照图6,示出了本发明实施例提供的一种构建与训练打滑预测模型的步骤流程图,具体可以包括如下步骤:

步骤601,构建基于随机森林算法的初始打滑预测模型,获取风电机组的样本集,将所述样本集按照3:1:1比例,以及采用分层抽样方式划分为训练集、验证集以及测试集,并根据所述训练集、所述验证集以及所述测试集对所述初始打滑预测模型进行训练;

通俗地讲,随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。随机森林是指用随机的方式建立一个算法森林,该森林由诸多决策树组成,随机森林的每一棵决策树之间并不存在关联,在建立随机森林之后,每当输入一个新的样本,随机森林中每一棵决策树会分别对该样本进行判断,确定该样本应该属于哪一类,并确定哪一类被选择最多,则预测该样本为对应的那一类,如输入一个检测样本,大多数决策树经过判断之后认为该检测样本属于发生打滑类,则可以确定该检测样本对应的类为打滑。

因此,本发明实施例构建了一种基于随机森林算法的初始打滑预测模型,并可以根据实际情况确定初始打滑预测模型的模型参数,如模型的决策树个数n_estimators、决策树最大深度max_depth以及节点的划分标准criterion等。

接着可以获取前面实施例中构建的风电机组的样本集,并将样本集按照3:1:1比例,以及采用分层抽样方式划分为训练集、验证集以及测试集。

然后可以根据训练集、验证集以及测试集对初始打滑预测模型进行训练,具体为:结合网格搜索确定优化模型参数,采用训练集、验证集以及测试集通过3折交叉验证方式对初始打滑预测模型进行训练以及验证,接着基于交叉验证结果,如通过交叉验证可以输出不同的模型评价指标结果,对应生成3个不同的模型权重。

本发明实施例中所采用的模型评价指标为F1-score(统计学中用于衡量二分类模型精确度的一种指标),计算公式为:F1=2TP/(2TP+FN+FP),其中,TP为样本集中联轴器打滑样本被诊断为打滑的数目,FN为样本集中诊断结果为正常但实际打滑的样本数目,FP为样本集中诊断为联轴器打滑但实际正常的样本数目。

进一步地,通过3折交叉验证方式对初始打滑预测模型进行训练以及验证,可以为:

采用训练集、验证集对初始打滑预测模型进行训练,并采用测试集对训练后初始打滑预测模型进行验证,生成第一模型权重;

采用训练集、测试集对初始打滑预测模型进行训练,并采用验证集对训练后初始打滑预测模型进行验证,生成第二模型权重;

采用验证集、测试集对初始打滑预测模型进行训练,并采用训练集对训练后初始打滑预测模型进行验证,生成第三模型权重。

步骤602,基于训练结果确定用于联轴器打滑诊断的打滑预测模型,将所述打滑预测模型部署至线上环境,同时融合进多线程日志文件提取模块;

在具体的实现中,基于训练结果确定用于联轴器打滑诊断的打滑预测模型,可以为:从3个模型权重中选出得分最高的目标模型权重,并基于目标模型权重确定用于联轴器打滑诊断的打滑预测模型,从而可以通过模型训练选出打滑诊断效果最好的模型作为风电机组联轴器的打滑预测模型,最大化地提高打滑诊断准确性。

由前述内容可知,风电联轴器打滑诊断系统还包括线上环境,则当确定用于联轴器打滑预测的打滑预测模型之后,可以将其部署至线上环境,同时融合进多线程日志文件提取模块,便于后续用户通过多线程日志文件提取模块,利用打滑预测模型进行风电机组的联轴器打滑诊断。

步骤603,响应于消息队列创建操作,在所述多线程日志文件提取模块中设置消息队列。

在风电联轴器打滑诊断系统投入使用前,可以在多线程日志文件提取模块中设置消息队列,用于缓存风电机组日志文件的文件路径,也可以作为第一用户(上传文件路径的用户)与第二用户(提取文件路径的用户)之间的通信中转站。

在本发明实施例中,提供了一种风电联轴器打滑诊断方法,以及对应的风电联轴器打滑诊断系统,首先构建风电机组的样本集并对样本集进行数据处理以及样本训练集划分,接着构建基于随机森林算法的打滑预测模型并通过训练模块采用样本训练集进行模型训练,将进行训练后的模型部署至线上环境,同时融合进多线程日志文件提取模块,第一用户可以上传待测风电机组日志文件对应的文件路径至多线程日志文件提取模块的消息队列,第二用户可以从消息队列中提取文件路径,将文件路径对应的日志文件解析成结构化数据并导入打滑预测模型的预测模块进行联轴器打滑异常诊断,从而实现了通过风电机组的日志文件,快速确定出现联轴器打滑的机组,提高了检测效率以及诊断准确性,接着可以将诊断结果输入至数据库,打滑预测模型的训练模块可以从数据库中获取诊断结果,并基于诊断结果进行模型优化的增量训练,从而形成“模型训练→模型使用→模型优化训练→模型使用”的良性闭环,不断提高联轴器打滑异常诊断的准确度,以及降低检测时间,提高响应速度。

为了便于理解,以下通过具体示例对本发明实施例进行描述。

参照图7,示出了本发明实施例提供的一种风电联轴器打滑诊断方法的整体过程示意图,需要说明的是,该风电联轴器打滑诊断方法应用于风电联轴器打滑诊断系统,本示例中仅以从构建数据集到基于诊断结果对模型进行优化训练的整体流程进行简单说明,各个步骤中涉及到的细节可以参照前述实施例中相关部分,此处不再赘述,可以理解的是,本发明对此不作限制。

1、获取风电机组的历史检测数据并构建风电机组样本集;

2、对风电机组样本集进行数据处理以及划分,获得用于训练模型的训练集(训练集/验证集/测试集);

3、构建基于随机森林算法的打滑预测模型,并采用步骤2中获得的训练集对打滑预测模型进行3折交叉验证模型训练;

4、获取待检测风电机组的日志文件并将其解析成能够被模型识别处理的结构化数据;

5、采用打滑预测模型对结构化数据进行线上预测,输出诊断结果并将诊断结果存至数据库;

6、若诊断结果表征本次线上预测存在错检样本,则对错检验本进行标注并添加至风电机组样本集获得增量样本集,基于增量样本集对打滑预测模型进行增量训练,增强风电联轴器打滑诊断系统的鲁棒性。

参照图8,示出了本发明实施例提供的一种风电联轴器打滑诊断装置的结构框图,其中,所述装置应用于风电联轴器打滑诊断系统,所述风电联轴器打滑诊断系统包括多线程日志文件提取模块以及基于随机森林算法的打滑预测模型,所述多线程日志文件提取模块设有消息队列,所述装置具体可以包括:

文件路径接收模块801,用于接收来自第一用户写入所述消息队列的文件路径,所述文件路径对应待测风电机组的日志文件;

结构化数据解析模块802,用于响应于第二用户针对所述文件路径的提取操作,将所述日志文件解析成结构化数据;

打滑诊断处理模块803,用于通过所述打滑预测模型从所述结构化数据中提取第一原始特征,根据所述第一原始特征构建对应的第一衍生特征,并将所述第一原始特征与所述第一衍生特征进行融合,获得待测特征,基于所述待测特征对所述待测风电机组的联轴器打滑情况进行诊断;

目标风电机组确定模块804,用于根据诊断结果确定所述待测风电机组中出现联轴器打滑的目标风电机组。

在一种可选实施例中,所述第一原始特征包括所述待测风电机组的转子转速、发电机转速以及发电功率,所述打滑诊断处理模块803包括:

待测风电机组数据提取模块,用于执行步骤S1:通过所述打滑预测模型从所述结构化数据中提取所述待测风电机组的转子转速、发电机转速以及发电功率;

原始统计量计算模块,用于执行步骤S2:计算所述转子转速、所述发电机转速以及所述发电功率各自对应的原始统计量;

差值统计量计算模块,用于执行步骤S3:采用所述转子转速对应的原始统计量以及所述发电机转速对应的原始统计量先进行归一化处理,再进行做差计算,获得差值统计量;

区间数据段计算模块,用于执行步骤S4:从所述日志文件中提取所述第一原始特征对应的时间长度,按照所述时间长度将所述第一原始特征平均划分为4个区间数据段,并分别计算各个所述区间数据段对应的转子转速统计量、发电机转速统计量以及发电功率统计量;

区间差值统计量计算模块,用于执行步骤S5:采用所述区间数据段对应的转子转速统计量以及发电机转速统计量先进行归一化处理,再进行做差计算,获得所述区间数据段的区间差值统计量;

区间差值统计量重复处理模块,用于执行步骤S6:重复步骤S5,获得各个所述区间数据段对应的区间差值统计量;

第一衍生特征构建模块,用于执行步骤S7:将所述差值统计量、所述转子转速统计量、所述发电机转速统计量、所述发电功率统计量、各个所述区间数据段对应的区间差值统计量,以及所述转子转速、所述发电机转速、所述发电功率各自对应的原始统计量一并作为所述第一原始特征对应的第一衍生特征;

其中,统计量中的数据包括均值、标准差、最大值以及最小值。

在一种可选实施例中,所述风电联轴器打滑诊断系统还包括线上环境,所述装置还包括:

初始打滑预测模型训练模块,用于构建基于随机森林算法的初始打滑预测模型,获取风电机组的样本集,将所述样本集按照3:1:1比例,以及采用分层抽样方式划分为训练集、验证集以及测试集,并根据所述训练集、所述验证集以及所述测试集对所述初始打滑预测模型进行训练;

打滑预测模型部署模块,用于基于训练结果确定用于联轴器打滑诊断的打滑预测模型,将所述打滑预测模型部署至线上环境,同时融合进多线程日志文件提取模块;

消息队列设置模块,用于响应于消息队列创建操作,在所述多线程日志文件提取模块中设置消息队列。

在一种可选实施例中,所述初始打滑预测模型训练模块包括:

3折交叉验证方式执行模块,用于结合网格搜索确定优化模型参数,采用所述训练集、所述验证集以及所述测试集通过3折交叉验证方式对所述初始打滑预测模型进行训练以及验证;

模型权重生成模块,用于基于交叉验证结果,对应生成3个不同的模型权重。

在一种可选实施例中,所述打滑预测模型部署模块包具体用于:

从3个所述模型权重中选出得分最高的目标模型权重,并基于所述目标模型权重确定用于联轴器打滑诊断的打滑预测模型。

在一种可选实施例中,所述装置还包括:

初始标注样本生成模块,用于获取风电机组的历史检测数据以及多个历史日志文件,根据所述历史检测数据对各个所述历史日志文件进行打滑标注,获得各自对应的初始标注样本;

样本特征生成模块,用于提取各个所述初始标注样本的第二原始特征,根据各个所述第二原始特征构建对应的第二衍生特征,并将各个所述第二原始特征与各自对应的所述第二衍生特征进行融合,获得各个所述第二原始特征各自对应的样本特征;

目标标注样本更新模块,用于将各个所述样本特征对应的初始标注样本均更新为目标标注样本,所述目标标注样本为打滑样本或非打滑样本;

扩充打滑样本生成模块,用于若所述目标标注样本为打滑样本,则对所述打滑样本进行样本扩充处理,再通过滑动窗口法进行数据平滑处理,获得对应的扩充打滑样本;

样本集存储模块,用于将各个所述扩充打滑样本与各个所述非打滑样本存储为所述风电机组的样本集。

在一种可选实施例中,所述扩充打滑样本生成模块包括:

第一目标打滑样本抽取模块,用于从所述样本集中不放回地抽取一个打滑样本作为第一目标打滑样本、有放回地抽取一个目标标注样本作为随机样本;

第一替换打滑样本生成模块,用于采用所述随机样本替换所述第一目标打滑样本的前后20%区间内的数据,获得第一替换打滑样本;

第一数据平滑处理模块,用于通过滑动窗口法对所述第一替换打滑样本进行数据平滑处理,获得所述第一目标打滑样本对应的扩充打滑样本。

在一种可选实施例中,所述扩充打滑样本生成模块包括:

第二目标打滑样本抽取模块,用于从所述样本集中抽取一个打滑样本作为第二目标打滑样本;

第二替换打滑样本生成模块,用于对所述第二目标打滑样本加入预设量的均值为0的随机白噪声,形成第二替换打滑样本;

第二数据平滑处理模块,用于通过滑动窗口法对所述第二替换打滑样本进行数据平滑处理,获得所述第二目标打滑样本对应的扩充打滑样本。

在一种可选实施例中,所述风电联轴器打滑诊断系统还包括数据库,所述装置还包括:

数据库写入模块,用于将所述诊断结果写入所述数据库;

错检样本筛选模块,用于当所述打滑预测模型运行完成后,从所述数据库提取所述诊断结果,并根据所述诊断结果对所述打滑预测模型进行复盘分析,筛选出错检样本;

增量样本集获取模块,用于对所述错检样本进行错检标注,获得对应的错检标注样本,并将所述错检标注样本添加至风电机组的样本集,获得增量样本集;

增量训练模块,用于采用所述增量样本集对所述打滑预测模型进行增量训练,并基于增量训练结果对所述打滑预测模型进行更新。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见前述方法实施例的部分说明即可。

本发明实施例还提供了一种电子设备,设备包括处理器以及存储器:

存储器用于存储程序代码,并将程序代码传输给处理器;

处理器用于根据程序代码中的指令执行本发明任一实施例的风电联轴器打滑诊断方法。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行本发明任一实施例的风电联轴器打滑诊断方法。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

相关技术
  • 内核故障诊断信息处理方法、装置、存储介质及电子设备
  • 电子设备的显示控制方法、装置、电子设备和存储介质
  • 电子设备控制方法及装置、电子设备及存储介质
  • 数据分布存储方法、装置、存储介质及电子设备
  • 存储清理方法、装置、电子设备及存储介质
  • 一种风电联轴器打滑保护装置
  • 一种基于大数据分析的风电联轴器打滑故障预警方法
技术分类

06120116066005