掌桥专利:专业的专利平台
掌桥专利
首页

基于多参量在运油色谱装置监测数据质量的分析方法

文献发布时间:2023-06-19 18:46:07


基于多参量在运油色谱装置监测数据质量的分析方法

技术领域

本发明涉及电力技术领域,具体为基于多参量在运油色谱装置监测数据质量的分析方法。

背景技术

目前,电力系统综合评价的研究主要集中于变电设备、输电线路和二次系统。在变电在线监测数据源健康度评价研究中,李继攀、韩岩在《变电设备在线监测装置运行质量评价系统的设计与开发》文中将装置在线率、误差合格率、误告警率和装置故障率的评分加和进行油中溶解气体在线监测数据源健康综合评价;李峰、王红斌、吴昊等在《变压器油中溶解气体在线监测装置运行评价方法及指标体系》文中提出以装置在线率、误差合格率和趋势合格率作为运行评价指标,应用层次分析法确定各指标的权重,实现对油中溶解气体在线监测数据源健康度的综合评价。刘慧鑫、连鸿松、张江龙、赖永华、郑良栋等在《变压器油中溶解气体在线监测装置运行质量指标及评价体系》文中首先统计了分析了大型数据集中在线监测装置的厂家分布、运行年限分布、数据质量等重要信息;然后从评价指标的选择、指标权重的确定以及模糊层次综合评价模型的建立这3个方面展开深入研究,建立了油中溶解气体在线监测数据源健康的评价体系;最后对数据集内的11275条数据进行评价结果分析统计。

但上述工作存在以下问题:

①数据规模小,无法判断评价方法是否具有普遍的适用性;

②评价指标有限,未直接全方位的综合评价数据源各项健康因子;③评价指标中经验指标(例如使用年限)占比较大,评价重心更应落脚于实际的在线监测数据。

综上所述,目前国内外在油色谱在线数据源健康度评估技术研究仍存在较大的提升空间,亟待解决以下关键问题:

(1)现有的评价模型无法满足特高压监测平台的海量数据规模,目前特高压平台统计平均每年产生数千万条数据,该规模下对数据源健康度评价的可靠性要求更高;

(2)现有的模糊评价方法无法满足精确评价的需求,评价指标应基于实际监测数据,而不应以经验指标作为评价依据;

(3)现有的评价方法不具备实时评价能力,均为事后分析,无法为装置故障提供预警决策。

基于以上的原因,本发明提出基于多参量在运油色谱装置监测数据质量的分析方法。

发明内容

本发明解决的技术问题在于克服现有技术的缺陷,提供基于多参量在运油色谱装置监测数据质量的分析方法。

为实现上述目的,本发明提供如下技术方案:基于多参量在运油色谱装置监测数据质量的分析方法,包括以下步骤:

S1:数据获取,收集特高压油色谱在线监测数据、同时段的离线校验数据;

S2:数据分析,定位在线监测有价值数据的窗口范围,并判断数据与窗口范围值合理性和数据类型均衡性,获取标准训练样本集数据;

S3:评价指标确定,对比主设备运行特性油色谱在线监测数据和离线校验数据的相似性、差异性关系,依靠设备个性化健康标准和行业通用指标,开展数据可靠性、准确性、在线率映射关系研究,确定油色谱在线监测数据源健康评价指标;

S4:模型训练与构建,根据已有样本数据和评价指标,针对样本数据进行模型训练、参数调整、效果评估,根据评估效果和实际情况分析进行模型优化、迭代、更新,完善油色谱在线监测数据源健康评价模型。

优选地,所述步骤1中通过数据清洗保证数据的合理性与一致性。

优选地,所述步骤2中采用的数据聚类分析、关联分析方法开展离线校验数据和在线监测数据分析。

优选地,所述步骤3中的评价指标包括数据有效性、数据完整性、数据稳定性和数据准确性。

优选地,所述步骤4中采用到回归、多分类、聚类机器学习算法。

优选地,所述数据清洗是利用在运超、特高压设备在线监测、离线试验等数据,分析油色谱特点,构建油色谱信号特征集,利用信号分类算法挖掘特高压交流设备油色谱数据关联规则,对特征量进行优选排序,其次,利用基于时间序列的数据清洗方法,分析得到具有强、弱关联的时间序列;并利用聚类算法检测时间序列中的异常数据,利用神经网络手段进行缺失数据预测和错误数据的修正,进而,对于清洗后的价值数据,对比不同场景下的典型在线监测数据在不同时间尺度下的发展规律,提出不同时间尺度下的在线监测信号特征参数自动提取技术。

优选地,所述数据有效性的公式为定义样本中单台设备的数据总组数为N,清洗后有效数据组数为n,则数据有效率T=n/N×100%,所述数据完整性的公式为每个时间段内若有大于或等于1组数据反馈,则认为本次数据完整有反馈,计数为1,否则认为本次数据缺失,计数为0,定义样本中装置测量目标时间段内应反馈的总次数为N,实际反馈数据的时间段次数为n,则数据完整性计算结果为C=n/N×100%,所述数据完整性的公式为以测量数据的相对标准偏差RSD表示,取装置48h内连续6组的监测数据,按下式计算相对标准偏差。

与现有技术相比,本发明的有益效果是:

1、本发明提出了基于时间序列与维度信息分析的在线监测数据清洗方法,提出了从监测数据中有效提取有价值数据的成套技术,解决了在线监测数据的清洗及健康度提升难题,实现有效数据提取准确率≥95%,构建了在线装置数据分析评估模型和评价体系,提出了有效表征在线监测数据有效性、完整性,数据测量的稳定性、准确性等关键参数的评价指标。

2、本发明基于数据清洗提取方法以及油色谱数据基本特性对数据进行清洗,得到油色谱价值数据,形成了能用于有效数据健康评价的样本集,其次,利用主设备运行特性与油色谱数据的特征,建立油色谱在线数据源健康评价模型,实现数据有效性、可靠性、准确性、稳定性等多维度评价,基于评价结果,开展基于全量指标的油色谱在线数据源健康评价模型反馈改进方法研究,优化影响健康度的指标权重,利用数据分析与现场校验结果,形成全量数据多维度评估方法并实现生产应用,最终实现指导现场装置改造升级。

附图说明

图1为本发明步骤流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供一种基于多参量在运油色谱装置监测数据质量的分析方法,包括以下步骤:

S1:数据获取,收集特高压油色谱在线监测数据、同时段的离线校验数据,通过数据清洗保证数据的合理性与一致性,结合实时与历史数据,从测量对象对某1000kV站、±800kV换流站开展运行数据特性差异化分析;

S2:数据分析,利用数据聚类分析、关联分析等方法开展离线校验数据和在线监测数据分析,定位在线监测有价值数据的窗口范围,并判断数据与窗口范围值合理性和数据类型均衡性,获取标准训练样本集数据

S3:评价指标确定,对比主设备运行特性油色谱在线监测数据和离线校验数据的相似性、差异性关系,依靠设备个性化健康标准和行业通用指标,开展数据可靠性、准确性、在线率等映射关系研究,确定油色谱在线监测数据源健康评价指标;

S4:模型训练与构建,根据已有样本数据和评价指标,利用回归、多分类、聚类等机器学习算法,针对样本数据进行模型训练、参数调整、效果评估,根据评估效果和实际情况分析进行模型优化、迭代、更新,完善油色谱在线监测数据源健康评价模型,所述数据有效性的公式为定义样本中单台设备的数据总组数为N,清洗后有效数据组数为n,则数据有效率T=n/N×100%,所述数据完整性的公式为每个时间段内若有大于或等于1组数据反馈,则认为本次数据完整有反馈,计数为1,否则认为本次数据缺失,计数为0,定义样本中装置测量目标时间段内应反馈的总次数为N,实际反馈数据的时间段次数为n,则数据完整性计算结果为C=n/N×100%,所述数据完整性的公式为以测量数据的相对标准偏差RSD表示,取装置48h内连续6组的监测数据,按下式计算相对标准偏差。

一、对于某1000kV交流站近一年数据

(1)有效性水平

特高压站整体设备及变压器、高抗的数据采集有效性水平如表1所示:

表1近一年某特高压交流站不同主设备类型数据有效性统计

(2)完整性水平

1000kV某特高压交流站整体设备及变压器、高抗的数据采集完整性水平如表2所示:

表2近一年某特高压交流站不同主设备类型数据完整性统计

(3)稳定性水平

1000kV某特高压交流站整体设备及变压器、高抗的数据运行稳定性水平如表3所示,其中高浓度指H2、总烃浓度大于20μL/L,低浓度指H2、总烃浓度小于等于20μL/L:

表3近一年某特高压交流站不同主设备类型数据稳定性统计

(4)准确性水平

1000kV某特高压交流站整体设备及变压器、高抗的数据运行准确性水平如表4所示:

表4近一年某特高压交流站不同主设备类型数据准确性统计

1000kV某特高压交流站结论:

①1000kV某特高压交流站整体设备数据采集有效性水平较高,数据有效率达到92.13%,其中高抗(96.64%)的数据采集有效率相比变压器(88.07%)更高;

②1000kV某特高压交流站整体设备数据采集完整性水平较高,数据完整率达到86.48%,其中高抗(86.13%)的数据采集完整率与变压器(86.65%)相似;

③1000kV某特高压交流站整体设备数据运行稳定性差异较大,H2的RSD合格率较高,高低浓度分别为95.21%、97.38%,其中高浓度变压器(95.28%)与高抗(94.95%)的RSD合格率相似,低浓度高抗(98.22%)的RSD合格率高于变压器

(96.80%);

总烃的RSD合格率较低,高低浓度分别为72.48%、58.86%,其中高浓度高抗(76.79%)的RSD合格率高于变压器(70.13%),低浓度高抗(67.45%)的RSD合格率高于变压器(54.69%);

④1000kV某特高压交流站近一年整体设备数据运行准确性水平较高,H2准确分为86.3,其中高抗(98.1)的H2准确分明显高于变压器(80.4);总烃准确分为89.6,其中高抗(100)的总烃准确分明显高于变压器(84.5)。

二、对于±800kV某换流站近一年数据

(1)有效性水平

±800kV某换流站主设备仅有变压器,其数据采集有效性水平如表5所示:

表5近一年某站不同主设备类型数据有效性统计

(2)完整性水平

±800kV某换流站主设备仅有变压器,其数据采集完整性水平如表6所示:

表6近一年某站不同主设备类型数据完整性统计

(3)稳定性水平

±800kV某换流站主设备仅有变压器,其数据运行稳定性水平如表7所示,其中高浓度指H2、总烃浓度大于20μL/L,低浓度指H2、总烃浓度小于等于20μL/L:

表7近一年某站不同主设备类型数据稳定性统计

(4)准确性水平

±800kV某换流站主设备仅有变压器,其数据运行准确性水平如表8所示:

表8近一年某站不同主设备类型数据准确性统计

±800kV某换流站结论:

①±800kV某换流站整体设备数据采集有效性水平较高,数据有效率为83.68%;

②±800kV某换流站整体设备数据采集完整性水平一般,数据完整率为78.67%;

③±800kV某换流站整体设备数据运行稳定性差异较大,H2的RSD合格率很高,为99.07%,总烃的RSD合格率高低浓度分别为0%、89.72%,差异较大;

④±800kV某换流站近一年整体设备数据运行准确性水平一般,H2准确分较高为93.6,但总烃准确分较低为76.6。

区别于实施一对1000kV某特高压交流站、±800kV某换流站进行近一年的运行数据来分析,本实施例从环境温度的影响对1000kV某特高压交流站、±800kV某换流站开展运行数据特性差异化分析。一、从环境温度的影响对1000kV某特高压交流站的数据分析

(1)有效性水平

1000kV某特高压交流站夏冬两季数据采集有效性水平如表9所示:

表9夏冬季某特高压交流站数据有效性统计

(2)完整性水平

1000kV某特高压交流站夏冬两季数据采集完整性水平如表10所示:

表10夏冬季某特高压交流站数据完整性统计

(3)稳定性水平

1000kV某特高压交流站夏冬两季数据运行稳定性水平如表11所示,其中高浓度指H2、总烃浓度大于20μL/L,低浓度指H2、总烃浓度小于等于20μL/L。

表11夏冬季某特高压交流站数据稳定性统计

(4)准确性水平

1000kV某特高压交流站夏冬两季数据运行准确性水平如表12所示:

表12夏冬季某特高压交流站数据准确性统计

1000kV某特高压交流站结论:

①1000kV某特高压交流站在夏冬两季整体设备数据采集有效性水平很高,分别为99.42%和99.89%,结果相近;

②1000kV某特高压交流站夏季整体设备数据采集完整性水平不高,数据完整率为70.86%,冬季整体设备数据采集完整性水平很高,数据完整率为94.09%,经查明原因为2022年6月17日至27日期间因服务器维护原因数据缺失较多;

③1000kV某特高压交流站整体设备数据运行稳定性差异较大,H2高浓度夏季(91.87%)的RSD合格率低于高抗(98.33%),

低浓度夏季(93.57%)的RSD合格率低于冬季(98.51%);

总烃的RSD合格率较低,高浓度夏季(83.84%)的RSD合格率高于冬季(77.27%),低浓度夏季(44.10%)的RSD合格率低于冬季(88.37%);

④1000kV某特高压交流站H2夏季(75)准确分低于冬季(100),总烃夏季准确分(74.2)低于冬季(93.3)。

二、从环境温度的影响对±800kV某换流站的数据分析

(1)有效性水平

±800kV某换流站夏冬两季数据采集有效性水平如表13所示:

表13夏冬季某站数据有效性统计

(2)完整性水平

±800kV某换流站夏冬两季数据采集完整性水平如表14所示:

表14夏冬季某站数据完整性统计

(3)稳定性水平

±800kV某换流站夏冬两季数据运行稳定性水平如表15所示,其中高浓度指H2、总烃浓度大于20μL/L,低浓度指H2、总烃浓度小于等于20μL/L:

表15夏冬季某站数据稳定性统计

(4)准确性水平

±800kV某换流站夏冬两季数据运行准确性水平如表16所示:

表16夏冬季某站数据准确性统计

±800kV某换流站结论:

①±800kV某换流站在夏季整体设备数据采集有效性水平很高,为99.14%但在冬季仅为69.87%;

②±800kV某换流站夏季整体设备数据采集完整率为80.54%,低于冬季的87.17%;

③±800kV某换流站整体设备数据运行稳定性较好,H2低浓度夏季(97.95%)的RSD合格率低于冬季(100%);

总烃高浓度夏季的RSD合格率为0,低浓度夏季(90.34%)的RSD合格率接近冬季(90.69%);

④±800kV某换流站H2夏季(99.2)准确分接近冬季(100),总烃夏季(66.2)准确分低于冬季(82.1)。

综上所述,基于本发明的分析方法,可以更好的指导实际工作的开展,所涉及的分析方法具有以下特点:

①在数据采集有效性方面,夏季的数据质量更优于冬季;

②在数据采集完整性方面,夏冬两季水平无明显规律;

③在数据运行稳定性方面,冬季H2的RSD合格率明显优于夏季,总烃则未呈现明显规律;

④在数据运行准确性方面,冬季准确性明显优于夏季。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术分类

06120115687338