掌桥专利:专业的专利平台
掌桥专利
首页

一种变电站机器人巡检数据质量评价方法、系统及设备

文献发布时间:2024-04-18 20:00:50


一种变电站机器人巡检数据质量评价方法、系统及设备

技术领域

本发明涉及机器人电力巡检技术领域,特别是涉及一种变电站机器人巡检数据质量评价方法、系统及设备。

背景技术

巡检是目前变电站常用的及时排查变电设备故障、找出潜在安全隐患的重要方式。随着人工智能的快速发展,机器人巡检因其操作灵活、不受天气影响等优点,成为了变电站最为重要的巡检方式。虽然机器人巡检使得巡检工作变得愈发简易,给电网发展带来了机遇,但其获得的巨量、多类型、质量参差不齐的巡检数据也大幅增加了巡检机器人与变电站监控后台的数据传输压力以及监控后台的数据处理压力,使得监控后台不堪重负。

作为巡检数据传输前端的巡检机器人,其更多是被作为日常监测、收集数据的单一性工具,承担的巡检数据分析任务比较有限。探究如何提升巡检机器人的巡检数据分析能力,是减轻监控后台的数据传输和处理压力的一条有效途径。

发明内容

本发明的目的是提供一种变电站机器人巡检数据质量评价方法、系统及设备,在巡检机器人端实现了对巡检数据进行综合质量评价。

为实现上述目的,本发明提供了如下方案:

第一方面,本发明提供一种变电站机器人巡检数据质量评价方法,应用于巡检机器人,方法包括:

获取所述巡检机器人单次巡检变电站得到的巡检数据集;

针对所述巡检数据集中任一巡检数据,基于第一预设决策树,确定对应的第一参数属性;所述第一参数属性为数据及时或数据不及时;

基于第二预设决策树,确定对应的第二参数属性;所述第二参数属性为数据完整或数据不完整;

基于第三预设决策树,确定对应的第三参数属性;所述第三参数属性为数据重复或数据不重复;

基于第四预设决策树,确定对应的第四参数属性;所述第四参数属性为数据准确或数据不准确;

基于第五预设决策树,根据所述第一参数属性、所述第二参数属性、所述第三参数属性及所述第四参数属性,确定对应的数据质量评分;

根据所述巡检数据集中每一巡检数据对应的数据质量评分,确定所述巡检数据集对应的数据质量综合评分,并在所述数据质量综合评分满足预设质量要求时,将所述巡检数据集发送至变电站监控后台。

第二方面,本发明提供一种变电站机器人巡检数据质量评价系统,应用于巡检机器人,系统包括:

数据获取模块,用于获取所述巡检机器人单次巡检变电站得到的巡检数据集;

第一评价模块,用于针对所述巡检数据集中任一巡检数据,基于第一预设决策树,确定对应的第一参数属性;所述第一参数属性为数据及时或数据不及时;

第二评价模块,用于基于第二预设决策树,确定对应的第二参数属性;所述第二参数属性为数据完整或数据不完整;

第三评价模块,用于基于第三预设决策树,确定对应的第三参数属性;所述第三参数属性为数据重复或数据不重复;

第四评价模块,用于基于第四预设决策树,确定对应的第四参数属性;所述第四参数属性为数据准确或数据不准确;

第五评价模块,用于基于第五预设决策树,根据所述第一参数属性、所述第二参数属性、所述第三参数属性及所述第四参数属性,确定对应的数据质量评分;

综合评价模块,用于根据所述巡检数据集中每一巡检数据对应的数据质量评分,确定所述巡检数据集对应的数据质量综合评分,并在所述数据质量综合评分满足预设质量要求时,将所述巡检数据集发送至变电站监控后台。

第三方面,本发明提供一种电子设备,包括存储器及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行变电站机器人巡检数据质量评价方法。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明公开一种变电站机器人巡检数据质量评价方法、系统及设备,建立多个决策树,在巡检机器人端,对巡检机器人单次巡检变电站得到的巡检数据集中的巡检数据进行属性决策,以得到第一参数属性、第二参数属性、第三参数属性及第四参数属性,从而对该数据的数据完整性、数据准确性、数据重复性、数据时效性进行确定。然后依据第五预设决策树确定数据质量评分,进而确定巡检数据集对应的数据质量综合评分。本发明考虑到了数据的重复性、完整性、准确性及及时性这四个方面,采用预设的决策树进行综合质量评价,不仅效率更高,准确性更高,依据得到的数据质量综合评分,将符合要求的巡检数据集发送至变电站监控后台,进而对变电设备的故障识别、健康管理等,可在一定程度上减轻监控后台的数据传输和处理压力。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明变电站机器人巡检数据质量评价方法的流程示意图;

图2为本发明实例中#1变压器避雷器上节A相温度的数据及时性决策树图;

图3为本发明实例中#1变压器避雷器上节A相温度的数据完整性决策树图;

图4为本发明实例中#1变压器避雷器上节A相温度的数据重复性决策树图;

图5为本发明实例中#1变压器避雷器上节A相温度的数据准确性决策树图;

图6为本发明实例中#1变压器避雷器上节A相温度的数据质量评分决策树图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供了一种变电站机器人巡检数据质量评价方法、系统及设备,通过决策树对变电设备机器人巡检数据的数据完整性、数据准确性、数据重复性、数据时效性进行评价,并结合这4个指标的评价结果,利用决策树确定各巡检数据的质量评分,而后通过对各巡检数据质量评分的累加,得到巡检机器人所采集巡检数据的数据质量综合评分,且评价后符合要求的巡检数据可应用于变电站监控后台对变电设备的故障识别、健康管理等,以减轻后台数据传输和处理的压力。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

实施例一

如图1所示,本发明提供一种变电站机器人巡检数据质量评价方法,应用于巡检机器人,方法包括:

步骤100,获取所述巡检机器人单次巡检变电站得到的巡检数据集,以便于后续在巡检机器人端自动化分析单次巡检所采集的数据。具体的分析指标包括数据及时性、数据完整性、数据重复性、数据准确性。

步骤200,针对所述巡检数据集中任一巡检数据,基于第一预设决策树,确定对应的第一参数属性;所述第一参数属性为数据及时或数据不及时。

具体来说,第一预设决策树的构建规则为:巡检数据的实际采集时刻与预设采集时刻的差值是否大于时间差阈值。当所述巡检数据的实际采集时刻与预设采集时刻的差值大于时间差阈值时,对应的第一参数属性为数据不及时,即该数据不是及时数据;当所述巡检数据的实际采集时刻与预设采集时刻的差值小于或等于时间差阈值时,对应的第一参数属性为数据及时,即该数据是及时数据。

当巡检数据为及时数据时,采用如下公式计算数据及时度:

其中,

步骤300,基于第二预设决策树,确定对应的第二参数属性;所述第二参数属性为数据完整或数据不完整。

具体来说,第二预设决策树的构建规则为:是否是空(φ)数据、是否是乱码数据、是否是无效(null)数据。当所述巡检数据是无效数据时,对应的第二参数属性为数据不完整,即该数据不是完整数据;当所述巡检数据不是无效数据、是空数据(或者说空值)时,对应的第二参数属性为数据不完整,即该数据不是完整数据;当所述巡检数据不是无效数据、不是空数据、是乱码数据时,对应的第二参数属性为数据不完整,即该数据不是完整数据;当所述巡检数据不是无效数据、不是空数据、不是乱码数据时,对应的第二参数属性为数据完整,即该数据为完整数据。

步骤400,基于第三预设决策树,确定对应的第三参数属性;所述第三参数属性为数据重复或数据不重复。

具体来说,所述第三预设决策树为:当所述巡检数据为数值型数据且满足第一重复性评价规则时,对应的第三参数属性为数据重复;当所述巡检数据为数值型数据且未满足第一重复性评价规则时,对应的第三参数属性为数据不重复;当所述巡检数据为文本型数据且满足第二重复性评价规则时,对应的第三参数属性为数据重复;当所述巡检数据为文本型数据且未满足第二重复性评价规则时,对应的第三参数属性为数据不重复。所述第一重复性评价规则为所述巡检数据与上次巡检数据的差值为零;所述第二重复性评价规则为所述巡检数据与上次巡检数据的文本相似度大于预设相似阈值。

所述文本相似度的计算步骤包括:

(1)针对所述巡检数据(即第k次巡检)及上次巡检数据(即第k-1次巡检),分别依次进行分词处理、去停用词处理,以得到巡检有效特征单词集合及上次巡检有效特征单词集合。

(2)对所述巡检有效特征单词集合及所述上次巡检有效特征单词集合,分别进行合并去重处理,以得到巡检词集合;第j个巡检参数在第k次和k-1次巡检时对应的巡检词集合为

(3)计算所述巡检数据及所述上次巡检数据在所述巡检词集合中每个单词的词频,以得到巡检词频向量

(4)利用L2-norm对所述巡检词频向量及所述上次巡检词频向量分别进行归一化处理后,采用余弦相似度计算文本相似度

其中,

步骤500,基于第四预设决策树,确定对应的第四参数属性;所述第四参数属性为数据准确或数据不准确。

具体来说,当所述巡检数据为数值型数据时,第四预设决策树的构建规则为:数据精度是否足够、数据是否在规定范围内;当巡检数据为文本型数据时,第四预设决策树的构建规则为:数据是否在规定语集内、数据长度是否符合要求。以数值型数据为例,当所述巡检数据在规定范围内、数据精度足够时,第四参数属性为数据准确;当所述巡检数据在规定范围内、数据精度不足够时,第四参数属性为数据不准确;所述巡检数据不在规定范围内时,第四参数属性为数据不准确,即数据不是准确数据。

步骤600,基于第五预设决策树,根据所述第一参数属性、所述第二参数属性、所述第三参数属性及所述第四参数属性,确定对应的数据质量评分。

所述第五预设决策树为:

(1)当所述第一参数属性为数据及时、所述第二参数属性为数据完整、所述第三参数属性为数据重复、所述第四参数属性为数据不准确时,将第一数值标记为对应的数据质量评分。

(2)当所述第一参数属性为数据及时、所述第二参数属性为数据完整、所述第三参数属性为数据不重复、所述第四参数属性为数据不准确时,将第二数值标记为对应的数据质量评分。

(3)当所述第一参数属性为数据及时、所述第二参数属性为数据不完整时,将第三数值标记为对应的数据质量评分;需知,若数据不完整,则数据一定不准确,此时无需进一步评价其数据重复性和数据准确性,可将其统一判定为数据重复、数据不准确,对应数据质量评分为

(4)当所述第一参数属性为数据及时、所述第二参数属性为数据完整、所述第三参数属性为数据重复、所述第四参数属性为数据准确时,将第四数值标记为对应的数据质量评分。

(5)当所述第一参数属性为数据及时、所述第二参数属性为数据完整、所述第三参数属性为数据不重复、所述第四参数属性为数据准确时,将第五数值标记为对应的数据质量评分;

(6)当所述第一参数属性为数据不及时时,将0值标记为对应的数据质量评分;换而言之,巡检数据不是及时数据时,无论其数据完整性、数据重复性和数据准确性的评价结果如何,其数据质量评分均为0。

其中,所述第一数值、所述第二数值、所述第三数值、所述第四数值及所述第五数值均依据所述巡检数据的数据及时度确定。所述第一数值为数据及时度+1;所述第二数值为数据及时度+2;所述第三数值为数据及时度;所述第四数值为数据及时度+2;所述第五数值为数据及时度+3。

所述第一预设决策树、所述第二预设决策树、所述第三预设决策树、所述第四预设决策树及所述第五预设决策树均由ID3算法生成;

采用ID3算法生成决策树的步骤,具体包括:

1)将目标巡检样本集划分为多个类,并计算每个类的信息熵Info(D),计算公式为:

其中,p

2)基于所述目标巡检样本集中各样本的属性,计算对应属性的信息熵Info(D,E

其中,D

3)基于所述每个类的信息熵及所述属性的信息熵,计算所述属性相对于所述目标巡检样本集的信息增益Gain(D,E

Gain(D,E

4)依次选取属性中信息增益最大的属性作为分支节点,来完成每一级决策树的构建。

步骤700,根据所述巡检数据集中每一巡检数据对应的数据质量评分,确定所述巡检数据集对应的数据质量综合评分,并在所述数据质量综合评分满足预设质量要求时,将所述巡检数据集发送至变电站监控后台。假设巡检数据

在一个实例中,还可将数据质量综合评分设定为:优,则大于等于90;良,则大于等于75分小于90分;中,则大于等于60分小于75分;差,则小于60分。然后可将评定为优(即预设质量要求)的巡检数据集发送至变电站监控后台,使得变电站监控后台可直接采用该巡检数据集进行后续的处理。

在另一个具体实例中,采用某变电站内巡检机器人A的25组巡检数据来验证上文所述方法的有效性。表1给出了某变电站内巡检机器人A的25组巡检数据,其中23组为训练样本,剩余2组为测试样本。

表1某变电站内巡检机器人A的巡检数据表

对于数据及时性,以#1变压器避雷器上节A相温度为例,表2给出了其数据及时性的基础数据。然后,结合表2中的前23组训练样本,利用ID3算法生成#1变压器避雷器上节A相温度这一巡检参数的数据及时性决策树,具体如图2所示。最后,利用图2中的数据及时性决策树,确定其剩余2组数据都是及时数据。

表2#1变电站避雷器上节A相温度的数据及时性专家评议结果表

对于数据完整性,表3给出了#1变压器避雷器上节A相温度的数据完整性基础数据。然后,结合表3中的前23组训练样本,利用ID3算法生成其数据完整性决策树,具体如图3所示。最后,利用图3中的数据完整性决策树,确定其剩余2组数据都是完整数据。

表3#1变压器避雷器上节A相温度的数据完整性专家评议结果表

对于数据重复性,#1变压器避雷器上节A相温度是数值型数据,因此其数据重复性的评价规则为与上次巡检数据的差是否为零。表4给出了其数据重复性的基础数据。然后,结合表4中的前23组训练样本,利用ID3算法生成其数据重复性决策树,具体如图4所示。最后,利用图4中的数据重复性决策树,确定其剩余2组数据分别为重复数据和非重复数据。

表4#1变压器避雷器上节A相温度的数据重复性专家评议结果表

/>

对于数据准确性,#1变压器避雷器上节A相温度是数值型数据,因此其数据准确性的评价规则包括数据精度是否足够、数据是否在规定范围内。表5给出了其数据准确性的基础数据。然后,结合表5中的前23组训练样本,利用ID3算法生成其数据准确性决策树,具体如图5所示。最后,利用图5中的数据准确性决策树,确定其剩余2组数据都是准确数据。

表5#1变压器避雷器上节A相温度的数据准确性专家评议结果表

/>

对于数据质量评分,表6给出了#1变压器避雷器上节A相温度的数据质量评分基础数据。然后,结合表6中的前23组训练样本,利用ID3算法生成其数据质量评分决策树,具体如图6所示。最后,利用图6中的数据质量评分决策树,确定其剩余2组数据的数据质量评分分别为Timeliness+2和Timeliness+3。另外,由表1可知,剩余2组数据的Timeliness都是1,因此剩余2组数据的数据质量评分分别为3和4。

表6#1变压器避雷器上节A相温度的数据质量评分专家评议结果表

/>

同理,可得其余67个检测参数的2组训练样本的数据质量评分,并通过对这68个检测参数的数据质量评分的累加,可得剩余2组训练样本的数据质量综合评分。表7给出了剩余2组训练样本的数据质量评分结果。

表7 2组训练样本的数据质量评分结果表

/>

现有技术申请号为:CN201510200863.8,申请日为:2015-04-23的中国专利“一种变电站数据质量评价及方法”;申请号为:CN201811543208.2,申请日为:2018-12-17的中国专利“输变电设备数据质量评价方法及系统”,这两个专利虽然都是针对变电设备,但是针对变电设备的状态监测数据,且这些数据均是数值型数据。而本发明方法是针对变电设备的机器人巡检数据,其中包含变压器温度等数值型数据,也包括有无异响、指示灯状态等文本型数据。因此,本发明与上述两种技术的研究对象及技术方案都是不同的。

综上,本发明通过决策树对变电设备机器人巡检数据的数据完整性、数据准确性、数据重复性、数据时效性进行评价,并结合这4个指标的评价结果,利用决策树确定各巡检数据的质量评分,而后通过对各巡检数据质量评分的累加,得到巡检机器人所采集巡检数据的数据质量综合评分。本发明方法可用于评价巡检机器人所采集的各类变电设备巡检数据质量,评价结果对利用巡检机器人的变电设备基础数据收集以及所收集数据的针对性质量提升均具有指导作用,同时评价后符合要求的巡检数据可应用于变电站监控后台对变电设备的故障识别、健康管理等。

实施例二

为了实现实施例一中的技术方案,以达到相应的功能和技术效果,本实施例还提供了一种变电站机器人巡检数据质量评价系统,应用于巡检机器人,系统包括:

数据获取模块,用于获取所述巡检机器人单次巡检变电站得到的巡检数据集。

第一评价模块,用于针对所述巡检数据集中任一巡检数据,基于第一预设决策树,确定对应的第一参数属性;所述第一参数属性为数据及时或数据不及时。

第二评价模块,用于基于第二预设决策树,确定对应的第二参数属性;所述第二参数属性为数据完整或数据不完整。

第三评价模块,用于基于第三预设决策树,确定对应的第三参数属性;所述第三参数属性为数据重复或数据不重复。

第四评价模块,用于基于第四预设决策树,确定对应的第四参数属性;所述第四参数属性为数据准确或数据不准确。

第五评价模块,用于基于第五预设决策树,根据所述第一参数属性、所述第二参数属性、所述第三参数属性及所述第四参数属性,确定对应的数据质量评分。

综合评价模块,用于根据所述巡检数据集中每一巡检数据对应的数据质量评分,确定所述巡检数据集对应的数据质量综合评分,并在所述数据质量综合评分满足预设质量要求时,将所述巡检数据集发送至变电站监控后台。

实施例三

本实施例提供一种电子设备,包括存储器及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行实施例一的变电站机器人巡检数据质量评价方法。可选地,上述电子设备可以是服务器。

另外,本发明实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的变电站机器人巡检数据质量评价方法。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术分类

06120116541376