掌桥专利:专业的专利平台
掌桥专利
首页

基于多源数据融合的电力设备状态监测方法及系统

文献发布时间:2024-04-18 20:02:40


基于多源数据融合的电力设备状态监测方法及系统

技术领域

本发明属于设备监测技术领域,具体涉及一种基于多源数据融合的电力设备状态监测方法及系统。

背景技术

风力发电是一种利用风能转化为电能的可再生能源技术,具有清洁、低碳、经济、可持续等优点,是我国能源转型的重要组成部分。然而,风力发电设备也面临着运行环境恶劣、结构复杂、故障多样、维护困难等问题,如何有效地监测和评估风力发电设备的运行状态和故障风险,是保障风力发电设备安全可靠运行的关键技术之一。

目前,常用的风力发电设备状态监测方法主要有两类:基于模型的方法和基于数据的方法;基于模型的方法是根据风力发电设备的物理原理和数学模型,建立设备的状态方程和故障方程,通过观测设备的输入输出信号,进行状态估计和故障诊断;这类方法的优点是具有较强的物理解释性和理论依据,但也存在以下不足:一是需要准确的设备模型和参数,而实际上设备的模型和参数往往难以获得或存在不确定性;二是需要大量的计算资源和时间,而实际上设备的状态和故障往往需要快速响应;三是难以处理非线性、非平稳、多变量、多故障等复杂情况,而实际上设备的运行数据往往具有这些特征;基于数据的方法是根据风力发电设备的运行数据,利用数据挖掘、机器学习、人工智能等技术,提取数据的特征和规律,进行状态评估和故障预警;这类方法的优点是不依赖于设备的模型和参数,能够适应设备的动态变化,能够处理复杂的数据特征,能够实现快速的数据分析和决策,但也存在以下不足:一是需要大量的高质量的数据,而实际上设备的数据往往存在缺失、噪声、异常等问题;二是需要合理的数据预处理、特征提取、数据分析、数据融合等方法,而实际上这些方法的选择和优化往往难以确定;三是缺乏物理解释性和可信度,而实际上设备的状态和故障往往需要有明确的原因和依据。因此,需要一种全面性、准确性和智能化状态监测方法。

发明内容

基于上述技术问题,本发明提出了一种基于多源数据融合的风力发电设备状态监测方法及系统,该方法及系统能够有效地利用多源数据的信息,提高风力发电设备状态监测的精度和可靠性,实现对设备的全面、准确、及时的状态监测和故障预警。

本发明提供基于多源数据融合的电力设备状态监测方法,所述方法包括:

步骤S1:采集风力发电设备的运行数据,对所述运行数据进行预处理,得到预处理运行数据;

步骤S2:对所述预处理运行数据进行特征提取,得到风力发电设备状态的特征矩阵;

步骤S3:根据所述特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果;

步骤S4:根据所述状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果;使用数据挖掘算法对所述故障预警结果进行优化;

步骤S5:将所述故障预警结果进行反馈,并根据反馈结果对风力发电设备进行调整。

可选地,所述采集风力发电设备的运行数据,对所述运行数据进行预处理,得到预处理运行数据,具体包括:

采集风力发电设备的运行数据,输出信号a(t);

式中,a

对运行数据进行清洗、校正、归一化和降噪得到预处理运行数据。

可选地,所述对所述预处理运行数据进行特征提取,得到风力发电设备状态的特征矩阵,具体包括:

对原始信号x(t)进行快速傅里叶变换,将时域信号分解为不同频率的正弦波的叠加,得到其频谱X(f);所述原始信号为预处理运行数据;

根据信号的频谱分布,选择不同的噪声频率范围[f

在每个噪声频率范围内,随机生成n个高斯白噪声w

式中,w

对每个含噪信号进行经验模态分解,得到m个本征模态函数和一个残余信号,表示为:

式中,c

对每个本征模态函数进行平均,得到最终的本征模态函数,表示为:

式中,c

对c

z

式中,c

将z

式中,a

构建信号的时频谱,表示为:

式中,S

对变换后的运行数据进行数据分析,具体包括:

计算时频谱的平均能量水平,表示为:

式中,T为信号的总时长;μ

计算时频谱的能量波动程度,表示为:

式中,

计算时频谱的能量分布的不对称性,表示为:

式中,

根据数据分析的结果,使用主成分分析法选择最能够反映风力发电设备状态的特征参数,形成特征矩阵,具体包括:

将时频图转换为一维向量,和其他信号的特征向量拼接在一起,形成多源数据矩阵;

将多源数据矩阵进行主成分分析,得到特征矩阵。

可选地,所述根据所述特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果,具体包括:

将特征矩阵与历史数据中的设备状态标签进行匹配,构建有监督的数据集,具体包括:

输入特征矩阵X∈R

对于特征矩阵X中的每个样本x

基于时间戳的匹配是一种利用时间信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,t

基于相似度的匹配是一种利用特征信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,x

输出匹配后的数据集D={x

利用机器学习算法,对匹配后的数据集进行训练,建立一个状态评估模型;使用状态评估模型对新特征矩阵进行预测,得到相应的状态标签作为状态评估模型的输出;所述新特征矩阵是指在训练和测试集之外的设备的运行数据。

可选地,所述根据所述状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果,使用数据挖掘算法对所述故障预警结果进行优化,具体包括:

将状态评估结果作为故障预警模型的输入,使用自回归移动平均模型、对设备的状态变化趋势进行预测,得到设备的未来状态;

将设备的未来状态与预设的故障阈值进行比较,若超过阈值,则触发故障预警信号,使用关联规则挖掘对历史数据中的故障进行分析,优化故障预警模型。

本发明还提供基于多源数据融合的电力设备状态监测系统,所述系统包括:

运行数据处理模块,用于采集风力发电设备的运行数据,对所述运行数据进行预处理,得到预处理运行数据;

特征矩阵构建模块,用于对所述预处理运行数据进行特征提取,得到风力发电设备状态的特征矩阵;

设备状态分析模块,用于根据所述特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果;

设备故障诊断模块,用于根据所述状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果;使用数据挖掘算法对所述故障预警结果进行优化;

故障结果反馈模块,用于将所述故障预警结果进行反馈,并根据反馈结果对风力发电设备进行调整。

可选地,所述运行数据处理模块,具体包括:

运行数据采集子模块,用于采集风力发电设备的运行数据,输出信号a(t);

式中,a

运行数据预处理子模块,用于对运行数据进行清洗、校正、归一化和降噪得到预处理运行数据。

可选地,所述特征矩阵构建模块,具体包括:

信号频谱构建子模块,用于对原始信号x(t)进行快速傅里叶变换,将时域信号分解为不同频率的正弦波的叠加,得到其频谱X(f);所述原始信号为预处理运行数据;

噪声范围选择子模块,用于根据信号的频谱分布,选择不同的噪声频率范围[f

噪声随机生成子模块,用于在每个噪声频率范围内,随机生成n个高斯白噪声w

式中,w

经验模态分解子模块,用于对每个含噪信号进行经验模态分解,得到m个本征模态函数和一个残余信号,表示为:

式中,c

本征模态函数确定子模块,用于对每个本征模态函数进行平均,得到最终的本征模态函数,表示为:

式中,c

希尔伯特变换子模块,用于对c

z

式中,c

将z

式中,a

时频谱构建子模块,用于构建信号的时频谱,表示为:

式中,S

数据分析子模块,用于对变换后的运行数据进行数据分析,具体包括:

计算时频谱的平均能量水平,表示为:

式中,T为信号的总时长;μ

计算时频谱的能量波动程度,表示为:

式中,

计算时频谱的能量分布的不对称性,表示为:

式中,

主成分分析子模块,用于根据数据分析的结果,使用主成分分析法选择最能够反映风力发电设备状态的特征参数,形成特征矩阵,具体包括:

将时频图转换为一维向量,和其他信号的特征向量拼接在一起,形成多源数据矩阵;

将多源数据矩阵进行主成分分析,得到特征矩阵。

可选地,所述设备状态分析模块,具体包括:

数据集构建子模块,用于将特征矩阵与历史数据中的设备状态标签进行匹配,构建有监督的数据集,具体包括:

输入特征矩阵X∈R

对于特征矩阵X中的每个样本x

基于时间戳的匹配是一种利用时间信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,t

基于相似度的匹配是一种利用特征信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,x

输出匹配后的数据集D={x

状态评估模型子模块,利用机器学习算法,对匹配后的数据集进行训练,建立一个状态评估模型;使用状态评估模型对新特征矩阵进行预测,得到相应的状态标签作为状态评估模型的输出;所述新特征矩阵是指在训练和测试集之外的设备的运行数据。

可选地,所述设备故障诊断模块,具体包括:

状态变化趋势预测子模块,用于将状态评估结果作为故障预警模型的输入,使用自回归移动平均模型、对设备的状态变化趋势进行预测,得到设备的未来状态;

数据挖掘子模块,用于将设备的未来状态与预设的故障阈值进行比较,若超过阈值,则触发故障预警信号,使用关联规则挖掘对历史数据中的故障进行分析,优化故障预警模型。

本发明与现有技术相比,具有以下有益效果:

本发明采用了多源数据融合的思想,综合利用风力发电设备的运行数据、历史数据、故障数据等多种数据,提高了数据的信息量和可用性,提高了设备状态监测的全面性和准确性;采用了多种数据预处理、特征提取、数据分析、数据融合等方法,针对风力发电设备的运行数据的特点,进行了有效的数据处理和优化,提高了数据的质量和可信度,提高了设备状态监测的效率和效果;采用了多种数据分析算法和机器学习模型,对风力发电设备的状态进行了评估和预测,提高了数据的泛化能力和表示能力,提高了设备状态监测的智能化和自适应性;采用了故障预警模型和数据挖掘算法,对风力发电设备的故障进行了预警和分析,提高了故障预警的准确性和及时性,为设备的维护和修复提供了有效的指导和支持。

附图说明

图1为本发明的基于多源数据融合的电力设备状态监测方法流程图;

图2为本发明的基于多源数据融合的电力设备状态监测系统结构图。

具体实施方式

下面结合具体实施案例和附图对本发明作进一步说明,但本发明并不局限于这些实施例。

实施例1

如图1所示,本发明公开基于多源数据融合的电力设备状态监测方法,方法包括:

步骤S1:采集风力发电设备的运行数据,对运行数据进行预处理,得到预处理运行数据。

步骤S2:对预处理运行数据进行特征提取,得到风力发电设备状态的特征矩阵。

步骤S3:根据特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果。

步骤S4:根据状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果;使用数据挖掘算法对故障预警结果进行优化。

步骤S5:将故障预警结果进行反馈,并根据反馈结果对风力发电设备进行调整。

下面对各个步骤进行详细论述:

步骤S1:采集风力发电设备的运行数据,对运行数据进行预处理,得到预处理运行数据。

步骤S1具体包括:

风力发电设备包括风力发电机组和升压站等部件,每个部件都有多个子系统和关键部位,需要根据设备的结构和工作原理,确定数据采集的对象和范围。例如,风力发电机组的主要子系统包括风轮、变桨系统、偏航系统、齿轮箱、发电机、变流器、塔筒、塔基、箱变等,每个子系统都有可能发生故障,因此需要对每个子系统的关键部位进行数据采集。

根据数据采集的对象,需要选择合适的数据采集参数,这些参数应能反映设备的运行状况和故障特征;采集的数据包括物理量和状态量,物理量包括风速、风向、风轮转速、发电机转速、发电机温度、齿轮箱温度、齿轮箱振动、轴承温度、轴承振动、电压、电流、有功功率、无功功率、功率因数等数据,这些数据可以反映风力发电设备的风能利用效率、机械负荷、电气负荷、温度变化、振动特征等信息;状态量包括变桨角度、偏航角度、制动状态、故障码等;物理量可以直接通过传感器测量,状态量可以通过设备的主控系统获取,需要根据实际情况选取运行数据。

数据采集的方式可以分为定期采集和按需采集,定期采集是指按照一定的时间间隔或周期对数据进行采集,这种方式适用于设备的常规监测和维护,可以保证数据的连续性和完整性;按需采集是指根据设备的运行状况或用户的需求对数据进行采集,这种方式适用于设备的异常监测和故障诊断,可以保证数据的及时性和有效性,需要根据实际情况选取采集方式。

数据采集的通信可以分为有线通信和无线通信,有线通信是指通过电缆、光纤等有线介质将数据从设备传输到数据采集仪或数据中心,这种方式具有通信稳定、速度快、干扰小的优点,但也存在布线复杂、成本高、维护难的缺点。无线通信是指通过无线电波、卫星信号等无线介质将数据从设备传输到数据采集仪或数据中心,这种方式具有布线简单、成本低、维护易的优点,但也存在通信不稳、速度慢、干扰大的缺点。根据设备的位置和环境,需要根据实际情况选择合适的数据采集通信方式。

为了采集风力发电设备的运行数据,需要在风力发电设备的关键部件上安装相应的传感器,传感器的输出信号可以是模拟量或数字量,根据不同的信号类型,需要采用不同的数据采集仪进行信号的采集和转换;以风力发电机组的齿轮箱振动数据为例进行说明,齿轮箱的振动数据是反映齿轮箱的工作状态和故障特征的重要数据,可以用于齿轮箱的故障诊断和寿命预测;齿轮箱的振动数据可以通过在齿轮箱的表面或内部安装振动传感器来采集,振动传感器的类型可以是加速度传感器、速度传感器或位移传感器,振动传感器的安装位置应根据齿轮箱的结构和故障模式进行合理选择,以保证振动信号的敏感性和代表性。振动传感器的输出信号一般是模拟量,需要通过数据采集仪进行信号的转换和处理,以便进行后续的数据传输和存储。数据采集仪的功能是将振动传感器的模拟信号转换为数字信号,并进行必要的滤波、放大、采样、量化等处理,以保证数据的完整性和可靠性。

齿轮箱的振动信号由加速度传感器采集,其输出信号为a(t),单位为m/s

式中,a

同理,其他运行数据也同样需要进行上述操作,例如风速是反映风能资源的重要数据,可以用于风能利用效率的评估和风力发电机组的控制,风速通过在风力发电机组的叶轮前方或塔筒顶部安装风速传感器来采集,风速传感器的类型可以是风杯式、超声波式或激光式,风速传感器的安装位置应根据风力发电机组的结构和风场的地形进行合理选择,以保证风速信号的准确性和有效性;风速传感器的输出信号一般是模拟量,需要通过数据采集仪进行信号的转换和处理,以便进行后续的数据传输和存储;电压是反映风力发电机组的电气状态和电网质量的重要数据,用于风力发电机组的保护和调节;电压通过在风力发电机组的出口或变电站的入口安装电压传感器来采集,电压传感器的类型是电压互感器或电压采样器,电压传感器的安装位置应根据风力发电机组的结构和电网的连接方式进行合理选择,以保证电压信号的准确性和有效性。

对运行数据进行预处理,得到预处理运行数据,具体包括:

数据清洗,数据清洗是指去除数据中的无效数据和噪声数据,如缺失值、异常值、重复值、无效值等;这些数据可能是由于传感器的故障、通信的干扰、人为的误操作等原因造成的,会影响数据的真实性和一致性,导致分析和处理的结果不准确或不可靠,具体包括:

缺失值是指数据中的未采集或丢失的值,如由于传感器故障或通信中断导致的数据丢失,缺失值可以通过插值或估计方法来补充或替换;无效值是指数据中的非数值或超出范围的值,如空值、字母、符号等。无效值可以直接删除或替换为默认值;异常值是指数据中的偏离正常范围或分布的值,如过大或过小的值,或与其他值不一致的值。异常值可以通过统计分析或机器学习方法来检测和剔除;重复值是指数据中的相同或相似的值,如多次采集的相同数据,或由于传感器故障导致的重复数据。重复值可以通过比较或聚类方法来识别和删除。

数据校正,数据校正是指对数据进行校准或修正,以消除数据的偏差或误差,具体包括:

校准是指对传感器进行标定或校准,以保证传感器的准确性和一致性。校准可以通过使用标准信号或参考信号来进行;修正是指对数据进行修正或校正,以消除数据的系统误差或随机误差,修正可以通过使用数学模型或统计模型来进行。

数据归一化,数据归一化是指对数据进行归一化或标准化,以消除数据的量纲或尺度的影响,具体包括:

式中,x为原始数据;x′为归一化后的数据;min(x)和max(x)分别为原始数据的最小值和最大值;a和b是目标区间的下限和上限。

数据降噪,数据降噪是指去除数据中的随机或周期性的干扰信号,如电磁干扰、机械振动、环境噪声等;这些干扰信号可能是由于设备的运行、传输的过程、周围的环境等原因造成的,会影响数据的平滑性和稳定性,导致分析和处理的结果不敏感或不稳定;数据降噪的方法根据数据的特征和需求选择,具体包括:

对数据进行滤波或平滑,如移动平均、加权平均、中值滤波、卡尔曼滤波等;滤波器的类型和参数可以根据噪声的特性和信号的要求进行选择,常见的滤波器有低通、高通、带通、带阻等。

本实施例中,如果没有太多的干扰信号,那么可以直接使用后续变换来分解信号,得到不同的本征模态函数(IMF);如果信号本身就比较复杂,有很多的干扰信号,那么可以先对信号进行数据预处理的降噪,然后再使用变换来分解信号,得到更准确的IMF,根据信号的特点进行选择。

步骤S2:对预处理运行数据进行特征提取,得到风力发电设备状态的特征参数。

步骤S2具体包括:

这一步的目的是对预处理后的运行数据进行信号处理和数据挖掘,以提取出能够反映风力发电设备状态的特征参数,以便于后续的状态评估和故障预警,运行数据的特征提取可以包括以下几个方面的操作:

将信号分解为多个本征模态函数(IMF),每个IMF代表了信号的不同时间尺度和频率范围的特征;这种方法可以用于变换操作,以提取信号的有用信息,去除信号的噪声和冗余成分,具体包括:

对原始信号(预处理运行数据x(t))进行快速傅里叶变换,将时域信号分解为不同频率的正弦波的叠加,得到其频谱X(f)。

这一步的目的是将信号从时域转换到频域,以便分析信号的频率成分。FFT是一种快速计算离散傅里叶变换(DFT)的算法,它可以将一个时域信号分解为一系列正弦波的叠加,每个正弦波的幅度和相位可以用一个复数表示;X(f)为频域信号(其快速傅里叶变换得到的频谱),它是一个复数序列,表示信号在不同频率上的幅度和相位;f为频率变量,信号的实际频率参数,用于表示信号的频域波形取值范围是从0到采样频率的一半。

根据信号的频谱分布,选择不同的噪声频率范围[f

这一步的目的是根据信号的频谱特征,选择合适的噪声频率范围,以便在后面的步骤中加入噪声;噪声是一种随机的、无规律的信号,它可以用来改变信号的极值点特性,从而使经验模态分解(EMD)分解更容易分离不同的模态分量;[f

在每个噪声频率范围内,随机生成n个高斯白噪声w

这一步的目的是在每个噪声频率范围内,生成多个不同的噪声序列,并将它们分别加到原始信号上,形成多个含噪信号;高斯白噪声是一种服从正态分布的、均值为0、方差为常数的、各个时刻之间相互独立的随机信号;w

对每个含噪信号进行EMD分解,得到m个IMF和一个残余信号,表示为:

这一步的目的是对每个含噪信号进行EMD分解,得到多个本征模态函数(IMF)和一个残余信号;EMD分解是一种自适应的、数据驱动的信号分解方法,它可以将一个非线性非平稳的信号分解为有限个本征模态函数(IMF)的叠加,每个IMF代表了信号的不同时间尺度和频率范围的特征;c

对每个IMF进行平均,得到最终的IMF,表示为:

这一步的目的是对每个IMF进行平均,得到最终的IMF;由于每个含噪信号的IMF都是在加入不同的噪声后得到的,所以它们之间会有一些差异,但是它们的平均值可以抵消噪声的影响,从而得到更准确的IMF;c

对每个残余信号进行平均,得到最终的残余信号,表示为:

这一步的目的是对每个残余信号进行平均,得到最终的残余信号;由于每个含噪信号的残余信号都是在加入不同的噪声后得到的,所以它们之间也会有一些差异,但是它们的平均值也可以抵消噪声的影响,从而得到更准确的残余信号;r(t)为最终的残余信号,它是所有含噪信号的残余信号的平均值,它的幅值和频率都是确定的,而且它的频率范围比原始信号的更宽,从而实现了信号的分解。

将最终的IMF和残余信号相加,得到原始信号的分解结果,表示为:

这一步的目的是将最终的IMF和残余信号相加,得到原始信号的分解结果;由于每个IMF和残余信号都是从原始信号中分解出来的,所以它们的相加结果就是原始信号本身,这就保证了信号的分解是完整的,没有信息的丢失或增加;x(t)为原始信号,它是所有最终的IMF和残余信号的相加结果,它的幅值和频率都是与原始信号相同的,而且它的频率范围是最宽的,从而实现了信号的分解。

对c

z

式中,c

将z

式中,a

构建信号的时频谱,表示为:

式中,S

本实施例中,将运行数据从时域转换到频域、小波域、经验模态域等其他域,以便于分析数据的周期性、频率分布、模态分解等特征。数据变换的方法可以有傅里叶变换、小波变换、经验模态分解等。例如,对于齿轮箱振动和轴承振动这两个监测参数,可以用小波变换将其从时域转换到时频域,得到其时频谱,反映其在不同时间和频率下的能量变化。

对变换后的运行数据进行数据分析,具体包括:

计算时频谱的平均能量水平,表示为:

式中,T为信号的总时长;μ

计算时频谱的能量波动程度,表示为:

式中,

计算时频谱的能量分布的不对称性,表示为:

式中,

计算时频谱的能量分布的尖峭程度,表示为:

式中,

计算时频谱之间的能量分布的相似性,表示为:

式中,ρ

计算时频谱的最大能量水平,表示为:

式中,P

计算时频谱的周期性能量分布,表示为:

式中,H

计算时频谱的能量集中的频率范围,表示为:

B

式中,B

计算时频谱的能量在不同频率上的比例,表示为:

式中,D

计算时频谱的能量随时间变化的幅度,表示为:

式中,E

计算时频谱的能量随频率变化的幅度,表示为:

/>

式中,M

本实施例中,对变换后的运行数据进行统计分析、频谱分析、模态分析、相关分析、聚类分析等方法,以便于发现数据的规律、异常、关联、分类等特征。数据分析的方法可以有均值、方差、峰值、能量、频率、相关系数等。例如,对于风轮转速和发电机转速,可以用峰值和能量来判断其是否存在异常或故障,如风轮转速的时频图中出现与风速无关的高频峰值,可能是叶片受到冲击或损伤的信号;对于齿轮箱振动和轴承振动的时频图,可以用相关系数来判断其是否存在异常或故障,如齿轮箱振动的时频图中出现与齿轮啮合频率或其倍频相对应的高能量区域,可能是齿轮磨损或断裂的信号。

根据数据分析的结果,使用主成分分析法选择最能够反映风力发电设备状态的特征参数,形成特征矩阵,具体包括:

将时频图转换为一维向量,和其他信号的特征向量拼接在一起,形成多源数据矩阵。

本实施例中,转换方法可以采用以下方法:将时频图的矩阵按照行或列展开为一个向量;将时频图的矩阵进行降维,提取时频图的主要特征,然后将这些特征组成一个向量;将时频图的矩阵进行分块,例如将时频图划分为若干个小的子矩阵,然后对每个子矩阵计算一些统计量,例如均值、方差、熵等,然后将这些统计量组成一个向量。

将多源数据矩阵进行主成分分析,得到特征矩阵,具体包括:

输入多源数据矩阵C∈R

本实施例中,主成分分析法是一种基于统计学的数据提取方法,它根据时频谱中的数据协方差矩阵来提取信号的主要成分,从而降低数据的维度和冗余,反映设备的运行状态。例如,对于风轮转速、发电机转速、齿轮箱振动、轴承振动、电压波形、电流波形、有功功率曲线、无功功率曲线、功率因数曲线等多个信号的时频图,用主成分分析法来提取其前几个主成分作为特征参数,形成特征矩阵;PCA是一种无监督的降维方法,它可以将高维的数据投影到低维的空间中,保留数据的最大方差,减少数据的冗余和噪声。PCA的基本原理是通过奇异值分解(SVD)或特征值分解(EVD)求解数据的协方差矩阵或相关系数矩阵的特征向量和特征值,然后按照特征值的大小排序,选择前几个最大的特征值对应的特征向量作为主成分,将数据投影到这些主成分上,得到降维后的数据。

步骤S3:根据特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果。

步骤S3具体包括:

将特征矩阵与历史数据中的设备状态标签进行匹配,构建有监督的数据集,具体包括:

输入特征矩阵X∈R

对于特征矩阵X中的每个样本x

若已有特征矩阵和对应的标签,无需进行匹配,直接构建有监督的数据集,用于模型训练。但是,上述情况并不总是成立的,有时候只有特征矩阵(设备的信号数据),而没有对应的标签(设备的运行情况和故障记录等信息),或者标签是不完整或不准确的,需要用以下方法来匹配特征矩阵和设备状态标签,从而得到一个可靠的有监督的数据集。

基于时间戳的匹配是一种利用时间信息来确定特征矩阵和设备状态标签之间的对应关系的方法。它的基本思想是如果两个数据来源于同一时刻或相近的时刻,即特征矩阵的时间戳与某个设备状态标签的时间戳的差值小于一个阈值,那么它们就有很大的可能性是匹配的,表示为:

式中,t

基于相似度的匹配是一种利用特征信息来确定特征矩阵和设备状态标签之间的对应关系的方法。它的基本思想是是如果两个数据的特征向量足够相似,即特征矩阵与某个设备状态标签对应的特征矩阵的欧氏距离小于一个阈值那么它们就有很大的可能性是匹配的,表示为:

式中,x

输出匹配后的数据集D={x

利用机器学习算法,对匹配后的数据集进行训练,建立一个状态评估模型,具体包括:

首先需要将匹配后的数据集按照一定的比例划分为训练集、验证集和测试集。训练集用于训练模型的参数,验证集用于调整模型的超参数,测试集用于评估模型的泛化能力;数据划分的目的是为了防止模型过拟合或欠拟合,提高模型的性能。数据划分的比例和方式取决于数据的类型、规模、分布和应用场景,具体的划分步骤如下:

输入匹配后的数据集D={(x

对于匹配后的数据集D中的每个数据对(x

输出训练集Train={(x

其次需要选择机器学习算法,利用训练集和验证集的数据,训练一个状态评估模型;机器学习算法的选择取决于数据的类型、规模、分布和应用场景,模型训练的目的是为了找到一个能够最大化训练集和验证集的准确率,最小化训练集和验证集的损失函数的模型,具体的训练步骤如下:

输入训练集Train={(x

根据机器学习算法A的要求,初始化模型Model的参数,例如权重、偏置、核函数、树的数量、层数、节点数等;对于训练集Train中的每个数据对(x

计算总的损失函数J(Model)对模型Model的参数的梯度,表示为:

根据训练方法,更新模型Model的参数,使得总的损失函数J(Model)的值减小,例如使用梯度下降法,

使用测试集的数据评估模型Model的泛化能力,即模型Model在未知数据上的表现;模型评估的目的是为了验证模型Model是否能够准确地对风电机组的状态进行评估以及模型Model的优劣,具体的评估步骤如下:

输入测试集Test={(x

使用模型Model对测试集Test中的每个数据对进行预测,得到预测标签,并将预测标签和真实标签进行比较,统计模型Model的预测结果,例如正确分类的个数、错误分类的个数、每个类别的真正例、假正例、真反例、假反例等;根据模型Model的预测结果,计算模型Model的泛化能力指标G(Model),例如准确率=正确分类的个数/总样本数,召回率=真正例/(真正例+假反例),F1值=2×准确率×召回率/(准确率+召回率)等;根据模型Model的泛化能力指标G(Model)的值,评价模型Model的优劣。

输出模型Model的泛化能力指标G(Model),是一个数值,反映模型Model在未知数据上的表现,例如准确率、召回率、F1值等。

使用状态评估模型Model对新的特征矩阵进行预测,就是将新的特征矩阵作为状态评估模型的输入,然后得到相应的状态标签作为状态评估模型的输出;新的特征矩阵是指在训练和测试集之外的设备的运行数据,它们是未知的数据,需要用状态评估模型来预测它们的状态。

步骤S4:根据状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果;使用数据挖掘算法对故障预警结果进行优化。

步骤S4具体包括:

将状态评估结果Y

建立自回归移动平均模型(ARMA),将状态评估结果Y

将设备的未来状态Z

建立关联规则挖掘算法(Apriori),将设备的历史数据作为输入,根据设备的故障类型,确定Apriori算法的参数,如最小支持度minsup,最小置信度minconf等;使用Apriori算法对设备的历史数据进行分析,找出频繁故障项集,即在历史数据中出现次数超过minsup的故障类型的集合;根据频繁故障项集,生成关联规则,即满足minconf的故障类型之间的蕴含关系,如

本实施例中,通过故障预警信号,触发数据挖掘的执行,即当设备有发生故障的风险时,调用数据挖掘的算法,对历史数据进行分析,找出与当前故障相关的关联规则,从而为故障诊断提供参考;通过关联规则,可以优化故障预警的参数,即根据数据挖掘的结果,调整故障预警的阈值,使之更符合设备的实际情况,从而提高故障预警的准确性和敏感性。

步骤S5:将故障预警结果进行反馈,并根据反馈结果对风力发电设备进行调整。

步骤S5具体包括:

将故障预警结果和数据挖掘结果进行反馈,即将设备的风险状态、故障类型、关联规则等信息发送给运维人员和业务用户,以便于他们及时了解设备的运行状况和故障情况,具体包括:

将故障预警结果和数据挖掘结果通过邮件、短信、电话、微信等多种方式进行反馈,确保运维人员和业务用户能够及时收到信息,并根据不同的反馈方式,选择合适的信息展示形式,如表格、图表、文本等;将故障预警结果和数据挖掘结果中的关键信息进行提炼和归纳,包括设备的风险等级、故障类型、故障原因、故障影响、故障解决方案、故障关联规则等,以便于运维人员和业务用户快速了解设备的运行状况和故障情况,以及采取相应的措施;对反馈结果进行跟踪和评估,收集运维人员和业务用户的反馈意见和建议,分析反馈信息的准确性、及时性、有效性等,不断优化反馈方式和内容,提高反馈效果。

根据反馈结果,对风力发电设备进行优化调整,即根据设备的风险等级和故障原因,采取相应的措施,如调整风轮的转速和桨距角、更换或修复损坏的部件、改进润滑和冷却系统等,以提高设备的性能和可靠性,具体的优化调整方法如下:

调整风轮的转速和桨距角,根据风速和风向的变化,动态调整风轮的转速和桨距角,使风轮能够在最佳的工作状态下运行,提高风能利用率,减少风轮的磨损和损耗。

更换或修复损坏的部件,根据故障类型和原因,及时更换或修复损坏的部件,如轴承、齿轮、传感器等,恢复设备的正常功能,避免故障的扩散和恶化。

改进润滑和冷却系统,根据设备的运行温度和摩擦情况,选择合适的润滑油和冷却液,定期更换和清洗,保持润滑和冷却系统的良好状态,降低设备的温升和磨损,延长设备的寿命。

本实施例中,根据实际情况对风力发电设备进行及时调整。

实施例2

如图2所示,本发明公开基于多源数据融合的电力设备状态监测系统,系统包括:

运行数据处理模块10,用于采集风力发电设备的运行数据,对运行数据进行预处理,得到预处理运行数据。

特征矩阵构建模块20,用于对预处理运行数据进行特征提取,得到风力发电设备状态的特征矩阵。

设备状态分析模块30,用于根据特征矩阵和历史数据,采用多源数据分析算法,对风力发电设备的状态进行评估,得到状态评估结果。

设备故障诊断模块40,用于根据状态评估结果,使用故障预警模型对风力发电设备的故障进行预警,得到故障预警结果;使用数据挖掘算法对故障预警结果进行优化。

故障结果反馈模块50,用于将故障预警结果进行反馈,并根据反馈结果对风力发电设备进行调整。

作为一种可选地实施方式,本发明运行数据处理模块10,具体包括:

运行数据采集子模块,用于采集风力发电设备的运行数据,输出信号a(t)。

式中,a

运行数据预处理子模块,用于对运行数据进行清洗、校正、归一化和降噪得到预处理运行数据。

作为一种可选地实施方式,本发明特征矩阵构建模块20,具体包括:

信号频谱构建子模块,用于对原始信号x(t)进行快速傅里叶变换,将时域信号分解为不同频率的正弦波的叠加,得到其频谱X(f);原始信号为预处理运行数据。

噪声范围选择子模块,用于根据信号的频谱分布,选择不同的噪声频率范围[f

噪声随机生成子模块,用于在每个噪声频率范围内,随机生成n个高斯白噪声w

式中,w

经验模态分解子模块,用于对每个含噪信号进行经验模态分解,得到m个本征模态函数和一个残余信号,表示为。

式中,c

本征模态函数确定子模块,用于对每个本征模态函数进行平均,得到最终的本征模态函数,表示为:

式中,c

希尔伯特变换子模块,用于对c

z

式中,c

将z

式中,a

时频谱构建子模块,用于构建信号的时频谱,表示为:

式中,S

数据分析子模块,用于对变换后的运行数据进行数据分析,具体包括:

计算时频谱的平均能量水平,表示为:

式中,T为信号的总时长;μ

计算时频谱的能量波动程度,表示为:

式中,

计算时频谱的能量分布的不对称性,表示为:

式中,

主成分分析子模块,用于根据数据分析的结果,使用主成分分析法选择最能够反映风力发电设备状态的特征参数,形成特征矩阵,具体包括:

将时频图转换为一维向量,和其他信号的特征向量拼接在一起,形成多源数据矩阵。

将多源数据矩阵进行主成分分析,得到特征矩阵。

作为一种可选地实施方式,本发明设备状态分析模块30,具体包括:

数据集构建子模块,用于将特征矩阵与历史数据中的设备状态标签进行匹配,构建有监督的数据集,具体包括:

输入特征矩阵X∈R

对于特征矩阵X中的每个样本x

基于时间戳的匹配是一种利用时间信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,t

基于相似度的匹配是一种利用特征信息来确定特征矩阵和设备状态标签之间的对应关系的方法,表示为:

式中,x

输出匹配后的数据集D={x

状态评估模型子模块,利用机器学习算法,对匹配后的数据集进行训练,建立一个状态评估模型;使用状态评估模型对新特征矩阵进行预测,得到相应的状态标签作为状态评估模型的输出;新特征矩阵是指在训练和测试集之外的设备的运行数据。

作为一种可选地实施方式,本发明设备故障诊断模块40,具体包括:

状态变化趋势预测子模块,用于将状态评估结果作为故障预警模型的输入,使用自回归移动平均模型、对设备的状态变化趋势进行预测,得到设备的未来状态。

数据挖掘子模块,用于将设备的未来状态与预设的故障阈值进行比较,若超过阈值,则触发故障预警信号,使用关联规则挖掘对历史数据中的故障进行分析,优化故障预警模型。

以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于多源数据融合的电力设备状态检测方法
  • 一种基于多源信息融合的电力设备运行状态评估方法及系统
技术分类

06120116586743