掌桥专利:专业的专利平台
掌桥专利
首页

电力图像异常检测方法、装置、计算机设备和存储介质

文献发布时间:2024-04-18 19:58:21


电力图像异常检测方法、装置、计算机设备和存储介质

技术领域

本申请涉及电力技术领域,特别是涉及一种电力图像异常检测方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

随着电力技术的发展,为保障电力的正常供应,需要保障电力设备的安全运行。通常情况下,实时对电力图像进行异常检测,能够及时发现潜在的电力问题。因此,如何高效地对电力图像进行异常检测,成为了重要的研究方向。

传统技术通常是通过人工逐一检测的方式对电力图像进行异常检测;但是,在面对如电力图像的数量较多的情况时,通过该方式进行电力图像异常检测需要耗费较多的人工检测时间,导致电力图像异常检测的效率较低。

发明内容

基于此,有必要针对上述技术问题,提供一种能够提高电力图像异常检测的效率的电力图像异常检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面,本申请提供了一种电力图像异常检测方法。所述方法包括:

获取电力图像;

通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;

通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;

通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;

将所述异常标识电力图像,作为所述电力图像的异常检测结果。

在其中一个实施例中,所述预先训练的电力图像异常检测模型通过下述方式训练得到:

获取第一样本电力图像和所述第一样本电力图像对应的真实异常检测结果;

将所述第一样本电力图像输入至待训练的电力图像异常检测模型中,得到所述第一样本电力图像的预测异常检测结果;

根据所述预测异常检测结果和所述真实异常检测结果之间的差异,对所述待训练的电力图像异常检测模型进行训练,得到所述预先训练的电力图像异常检测模型。

在其中一个实施例中,所述根据所述预测异常检测结果和所述真实异常检测结果之间的差异,对所述待训练的电力图像异常检测模型进行训练,得到所述预先训练的电力图像异常检测模型,包括:

根据所述预测异常检测结果和所述真实异常检测结果之间的差异,对所述待训练的电力图像异常检测模型进行训练,得到基础电力图像异常检测模型;

根据所述基础电力图像异常检测模型的模型参数和模型结构,确定出与所述基础电力图像异常检测模型对应的第一电力图像异常检测模型和第二电力图像异常检测模型;

将无标签的第二样本电力图像输入至所述第一电力图像异常检测模型中,得到所述第二样本电力图像的伪标签;

利用所述第二样本电力图像和所述第二样本电力图像的伪标签,对所述第二电力图像异常检测模型进行训练,得到所述预先训练的电力图像异常检测模型。

在其中一个实施例中,所述获取第一样本电力图像,包括:

获取变电站区域内的电力设备异常图像和人员行为异常图像;

将所述电力设备异常图像和所述人员行为异常图像进行组合,得到第一样本电力图像。

在其中一个实施例中,所述获取电力图像,包括:

获取变电站区域内的原始电力图像;所述原始电力图像包括电力设备图像和人员行为图像;

对所述原始电力图像进行图像预处理,得到电力图像。

在其中一个实施例中,在通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果之前,还包括:

对所述变电站区域内的历史异常信息进行识别,得到所述变电站区域内的历史异常类型;

对所述历史异常类型进行识别,得到所述变电站区域内的历史异常描述文本;

将所述历史异常描述文本,作为预存的异常描述文本。

第二方面,本申请还提供了一种电力图像异常检测装置。所述装置包括:

图像获取模块,用于获取电力图像;

图像识别模块,用于通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;

文本识别模块,用于通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

文本选取模块,用于根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;

区域标识模块,用于通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;

结果确定模块,用于将所述异常标识电力图像,作为所述电力图像的异常检测结果。

第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取电力图像;

通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;

通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;

通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;

将所述异常标识电力图像,作为所述电力图像的异常检测结果。

第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取电力图像;

通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;

通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;

通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;

将所述异常标识电力图像,作为所述电力图像的异常检测结果。

第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

获取电力图像;

通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;

通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;

通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;

将所述异常标识电力图像,作为所述电力图像的异常检测结果。

上述电力图像异常检测方法、装置、计算机设备、存储介质和计算机程序产品,获取电力图像;通过预先训练的电力图像异常检测模型,对所述电力图像进行异常识别,识别出所述电力图像中的异常图像区域;通过所述预先训练的电力图像异常检测模型,对所述异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;根据所述匹配度识别结果,从所述预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为所述异常图像区域的目标异常描述文本;通过所述预先训练的电力图像异常检测模型,利用所述目标异常描述文本对所述电力图像中的所述异常图像区域进行标识处理,得到异常标识电力图像;将所述异常标识电力图像,作为所述电力图像的异常检测结果。该方案通过获取电力图像,从而获取到待异常检测的图像;通过预先训练的电力图像异常检测模型,对电力图像进行异常识别,识别出电力图像中的异常图像区域,从而识别出待异常检测的图像中的存在异常的图像区域;通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果,从而快速和准确地得到异常图像区域与异常描述文本之间的匹配度识别结果;根据匹配度识别结果,从预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本,从而快速和准确地确定出异常图像区域对应的异常描述文本;通过预先训练的电力图像异常检测模型,利用目标异常描述文本对电力图像中的异常图像区域进行标识处理,得到异常标识电力图像,从而快速和准确地确定出电力图像对应的异常标识电力图像;将异常标识电力图像,作为电力图像的异常检测结果,从而有利于提高电力图像异常检测的效率和准确率。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为一个实施例中电力图像异常检测方法的流程示意图;

图2为一个实施例中确定预先训练的电力图像异常检测模型的步骤的流程示意图;

图3为另一个实施例中确定预先训练的电力图像异常检测模型的步骤的流程示意图;

图4为一个实施例中电力图像异常检测装置的结构框图;

图5为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。

在一个实施例中,如图1所示,提供了一种电力图像异常检测方法,本实施例以该方法应用于终端进行举例说明;可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器之间的交互实现。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑等;服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该方法包括以下步骤:

步骤S101,获取电力图像。

本步骤中,电力图像可以是待异常检测的电力区域内的图像,例如变电站区域内的电力设备的图像和该变电站区域内的人员行为的图像。

具体的,终端获取图像拍摄设备拍摄得到的电力图像。

步骤S102,通过预先训练的电力图像异常检测模型,对电力图像进行异常识别,识别出电力图像中的异常图像区域。

本步骤中,预先训练的电力图像异常检测模型可以是经过训练的用于对电力图像进行异常检测的模型,其中,电力图像异常检测模型可以是多模态模型,例如GLIP模型(Generative Latent Image Prior,基于生成对抗网络的多模态模型);电力图像中的异常图像区域可以是在电力图像中的预测的存在异常的图像区域。

具体的,终端将电力图像输入至预先训练的电力图像异常检测模型中,通过预先训练的电力图像异常检测模型对电力图像进行异常识别,识别出电力图像中的异常图像区域。

步骤S103,通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果。

本步骤中,预存的异常描述文本可以是预先存储或预先设置的用于描述异常内容的文本,例如预存的异常描述文本可以包括呼吸器油封破损、表盘模糊、表盘破损、绝缘子破损、地面油污、硅胶筒破损、箱门闭合异常、挂空悬浮物、鸟巢、盖板破损、未戴安全帽、未穿工装、人员吸烟、呼吸器油封油位异常和/或硅胶变色;匹配度识别结果可以用于表示异常图像区域与各个预存的异常描述文本之间的匹配度。

具体的,终端将异常图像区域与预存的异常描述文本输入至预先训练的电力图像异常检测模型中,通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果。

步骤S104,根据匹配度识别结果,从预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本。

本步骤中,对应的匹配度最高的异常描述文本可以是与异常图像区域之间的匹配度最高的异常描述文本;异常图像区域的目标异常描述文本可以是用于描述异常图像区域的异常内容(异常信息/异常类型)的文本。

具体的,终端根据匹配度识别结果,从预存的异常描述文本中,选取出对应的与异常图像区域之间的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本。

步骤S105,通过预先训练的电力图像异常检测模型,利用目标异常描述文本对电力图像中的异常图像区域进行标识处理,得到异常标识电力图像。

本步骤中,异常标识电力图像可以是经过异常标识处理的电力图像。

具体的,终端通过预先训练的电力图像异常检测模型,将目标异常描述文本标识在电力图像中的异常图像区域对应的标识区域中,得到异常标识电力图像。

步骤S106,将异常标识电力图像,作为电力图像的异常检测结果。

具体的,终端将异常标识电力图像,作为电力图像的异常检测结果。

上述电力图像异常检测方法中,获取电力图像;通过预先训练的电力图像异常检测模型,对电力图像进行异常识别,识别出电力图像中的异常图像区域;通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;根据匹配度识别结果,从预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本;通过预先训练的电力图像异常检测模型,利用目标异常描述文本对电力图像中的异常图像区域进行标识处理,得到异常标识电力图像;将异常标识电力图像,作为电力图像的异常检测结果。该方案通过获取电力图像,从而获取到待异常检测的图像;通过预先训练的电力图像异常检测模型,对电力图像进行异常识别,识别出电力图像中的异常图像区域,从而识别出待异常检测的图像中的存在异常的图像区域;通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果,从而快速和准确地得到异常图像区域与异常描述文本之间的匹配度识别结果;根据匹配度识别结果,从预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本,从而快速和准确地确定出异常图像区域对应的异常描述文本;通过预先训练的电力图像异常检测模型,利用目标异常描述文本对电力图像中的异常图像区域进行标识处理,得到异常标识电力图像,从而快速和准确地确定出电力图像对应的异常标识电力图像;将异常标识电力图像,作为电力图像的异常检测结果,从而有利于提高电力图像异常检测的效率和准确率。

在一个实施例中,如图2所示,预先训练的电力图像异常检测模型通过下述方式训练得到,具体包括如下内容:

步骤S201,获取第一样本电力图像和第一样本电力图像对应的真实异常检测结果;

步骤S202,将第一样本电力图像输入至待训练的电力图像异常检测模型中,得到第一样本电力图像的预测异常检测结果;

步骤S203,根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型。

本实施例中,第一样本电力图像可以是作为第一样本的历史电力图像,可以是有标签的样本电力图像,其中,标签可以是指样本电力图像对应的真实异常检测结果;待训练的电力图像异常检测模型可以是未训练的电力图像异常检测模型。

具体的,终端获取第一样本电力图像和第一样本电力图像对应的真实异常检测结果;将第一样本电力图像输入至待训练的电力图像异常检测模型中,得到待训练的电力图像异常检测模型输出的第一样本电力图像的预测异常检测结果;根据预测异常检测结果和真实异常检测结果之间的差异,确定出差异信息,利用差异信息对待训练的电力图像异常检测模型进行训练,得到训练后的电力图像异常检测模型,将训练后的电力图像异常检测模型作为预先训练的电力图像异常检测模型。

本实施例提供的技术方案,通过根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型,有利于得到更高效和更准确的预先训练的电力图像异常检测模型,从而有利于提高电力图像异常检测的效率和准确率。

在一个实施例中,如图3所示,上述步骤中,根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型,具体包括如下内容:

步骤S301,根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到基础电力图像异常检测模型;

步骤S302,根据基础电力图像异常检测模型的模型参数和模型结构,确定出与基础电力图像异常检测模型对应的第一电力图像异常检测模型和第二电力图像异常检测模型;

步骤S303,将无标签的第二样本电力图像输入至第一电力图像异常检测模型中,得到第二样本电力图像的伪标签;

步骤S304,利用第二样本电力图像和第二样本电力图像的伪标签,对第二电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型。

本实施例中,基础电力图像异常检测模型可以是训练后的电力图像异常检测模型;第一电力图像异常检测模型和第二电力图像异常检测模型可以分别是基础电力图像异常检测模型对应的教师模型和学生模型,其中,第一电力图像异常检测模型的模型参数和模型结构可以与基础电力图像异常检测模型的模型参数和模型结构相同,第二电力图像异常检测模型的模型参数和模型结构可以与基础电力图像异常检测模型的模型参数和模型结构相同;无标签的第二样本电力图像可以是无对应的真实异常检测结果的历史电力图像;第二样本电力图像的伪标签可以是第一电力图像异常检测模型输出的第二样本电力图像的预测异常检测结果。

具体的,终端根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到基础电力图像异常检测模型;根据基础电力图像异常检测模型的模型参数和模型结构,确定出与基础电力图像异常检测模型对应的第一电力图像异常检测模型和第二电力图像异常检测模型;将无标签的第二样本电力图像输入至第一电力图像异常检测模型中,得到第一电力图像异常检测模型输出的第二样本电力图像的伪标签;利用第二样本电力图像和第二样本电力图像的伪标签,对第二电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型。

本实施例提供的技术方案,通过基于半监督学习的方式,对电力图像异常检测模型进行训练,有利于得到更高效和更准确的预先训练的电力图像异常检测模型,从而有利于提高电力图像异常检测的效率和准确率。

在一个实施例中,在上述步骤中,获取第一样本电力图像,具体包括如下内容:获取变电站区域内的电力设备异常图像和人员行为异常图像;将电力设备异常图像和人员行为异常图像进行组合,得到第一样本电力图像。

本实施例中,人员行为异常图像可以是变电站区域内的人员行为异常的图像。

具体的,终端获取变电站区域内的电力设备异常图像和变电站区域内的人员行为异常图像;将电力设备异常图像和人员行为异常图像,均作为第一样本电力图像。

本实施例提供的技术方案,通过将电力设备异常图像和人员行为异常图像进行组合,得到第一样本电力图像,有利于得到更丰富、更多样化的第一样本电力图像,从而有利于得到更高效和更准确的预先训练的电力图像异常检测模型,从而有利于提高电力图像异常检测的效率和准确率。

在一个实施例中,在步骤S101中,获取电力图像,具体包括如下内容:获取变电站区域内的原始电力图像;原始电力图像包括电力设备图像和人员行为图像;对原始电力图像进行图像预处理,得到电力图像。

本实施例中,原始电力图像包括变电站区域内的电力设备图像和变电站区域内的人员行为图像;图像预处理可以包括图像尺寸处理、图像亮度及对比度处理和/或图像平滑及锐化处理。

具体的,终端获取变电站区域内的电力设备图像和人员行为图像,作为变电站区域内的原始电力图像,对原始电力图像进行图像预处理,得到电力图像。

本实施例提供的技术方案,通过对原始电力图像进行图像预处理,有利于得到更清晰、更易于被模型处理的电力图像,从而有利于提高电力图像异常检测的效率和准确率。

在一个实施例中,上述步骤S103,在通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果之前,还包括确定预存的异常描述文本的步骤,具体包括如下内容:对变电站区域内的历史异常信息进行识别,得到变电站区域内的历史异常类型;对历史异常类型进行识别,得到变电站区域内的历史异常描述文本;将历史异常描述文本,作为预存的异常描述文本。

本实施例中,历史异常信息可以是变电站区域内的历史的异常信息;历史异常类型可以是变电站区域内的历史的异常信息的异常类型,例如历史异常类型可以包括表盘破损、盖板破损、鸟巢、表盘模糊、地面油污、挂空悬浮物、硅胶筒破损、呼吸器油封破损和/或人员吸烟;历史异常描述文本可以是异常描述文本。

具体的,终端对变电站区域内的历史异常信息(历史异常内容)进行识别,得到变电站区域内的历史异常信息对应的历史异常类型;对历史异常类型进行识别,得到变电站区域内的历史异常描述文本;将历史异常描述文本,作为预存的异常描述文本。

本实施例提供的技术方案,通过对变电站区域内的历史异常信息进行识别,确定出预存的异常描述文本,有利于得到更准确的预存的异常描述文本,从而有利于提高电力图像异常检测的准确率。

以下以一个应用实例说明本申请提供的电力图像异常检测方法,本应用实例以该方法应用于终端进行举例说明,主要步骤包括:

第一步,终端采集变电站的缺陷及异常图像,可以包含15类缺陷、2674张图片。除去电力缺陷场景图像数据外,还采集了包括有变电站人员异常的训练数据,整理形成数据集。

其中,可将数据按8:2随机划分为训练集和测试集。

第二步,终端将第一步中的数据集输入语言-图像匹配预训练GLIP模型中进行电力缺陷检测。

其中,(2.1)GLIP的检测模型将输入图像送入视觉编码器,该编码器一般使用CNN(卷积神经网络)或者Transformer(转换器)为主干,从而提取出区域/框特征。每个区域/框特征被送到两个检测头部,即分类器C和回归器R,它们分别用分类损失和定位损失进行训练。(2.2)在两阶段式的检测器中,常用具有损失的区域建议网络(RPN)来区分前景和背景,并细化锚点。由于不使用对象所属类别的语义信息,因此,GLIP模型将其合并到定位损失中。在单阶段式的检测器中,定位损失也可能包含中心度损失。分类器C通常是一个简单的线性层,分类损失可通过输入图像的对象/区域/框特征、分类器C的权重矩阵、输出分类逻辑、根据经典的多对一匹配计算的区域和类之间的目标匹配程度、对于两阶段检测器通常是交叉熵损失和单阶段检测器则是焦点损失来共同表示。(2.3)在短语匹配模型中,需计算图像区域和提示词中单词之间的匹配分数,可通过来自语言编码器的上下文单词/标记特征(其作用类似于步骤2.2分类损失中的权重矩阵)来表示,由图像编码器和语言编码器组成的匹配模型,通过最小化步骤2.1)和2.2)中定义的损失来进行端到端训练,在训练中用区域词对齐分数替换分类逻辑。(2.4)采用的GLIP模型使用了Swin—T(Swin Transformer,摆动变压器)作为图像编码器主干网络,搭配DyHead(Dynamic Head,动压头)为检测头。在图像和文本编码器最后几个层级引入深度融合,使用DyHead为图像编码器时,其可通过DyHead模块的个数等信息来表达。跨模态交流通过跨模态多头自注意力模块完成。DyHead通过将骨干网络的输出,也即检测头的输入改写为一种水平×空间×通道的三维张量,在两两组成的平面上分别部署完全自注意力机制。

第三步,终端将半监督学习方式使用在GLIP模型上,从而仅需要极少的标记数据即可实现对大量未标记样本的训练识别;将训练后的模型用于电力图像异常检测。

其中,半监督学习方法具体实施方法如下:(3.1)在完全监督训练阶段,使用已有的标注数据对模型进行训练以初始化检测模型。(3.2)在教师-学生模型相互学习阶段,将模型参数同时复制到教师和学生模型,由教师模型对于输入的无标签数据生成伪标签,再使用伪标签数据训练学生模型。当输入教师模型和学生模型的图片有所区别时,教师模型使用弱增强数据而学生模型使用强增强数据。可以采用的增强方法包括随机模糊、翻转、灰度调整等。为了防止教师模型在生成伪标签时引入过多噪声,确保生成的伪标签满足置信阈值的要求,可在对于学生模型进行训练后,通过应用指数移动平均方式来逐步更新教师模型。

其中,(1)完全有监督实验,模型迭代轮次为30。(2)文本提示实验。训练后的GLIP模型在对于图像进行测试时,类别名称以及文本提示将被输入模型。本处将通过调整的方式探究文本提示对于检测的影响。(3)半监督实验。对于特定类别,取10张图片进行5轮次完全有监督训练,后使用全部图片进行5轮次半监督训练。半监督训练时的置信阈值依据有监督训练结果进行动态选择。置信阈值越低越能学习到未见过的内容,而置信度越高则会偏向于使用曾学习到的内容进行反复训练。首先进行的是零样本与有监督定量实验。GLIP模型能较好的将故障文本对应至图像对应区域,如果图像中存在两个及以上的故障,也能很好的将其分别标记出来。训练后的识别率有非常大的提升,模型对于电力缺陷有良好的识别能力。模型在零样本时对于单个类别内具有一定的识别能力。然后进行的是文本提示定量实验。最后进行的是半监督实验。综上,半监督的训练方法在合适轮次的有监督训练,以及合适的置信阈值选择情况下能较好的提升较少样本下的识别情况,能较好的服务于可用训练样本较少的场景。

其中,GLIP模型统一了短语匹配和目标检测任务。此时的目标检测模型不仅仅输入图像,还输入描述检测任务中所有候选物体类别的文本描述。通过使用性能优秀的教师模型,结合网络提取的图像-文本对,可以预训练出性能卓越的学生模型,该学生模型对于罕见样本的识别能力也很出色。GLIP模型还具有着较强的迁移学习能力。将GLIP模型迁移到下游任务时,仅需要很少量的标注数据,而且仅需调整部分模型,即可实现良好的学习性能,降低了缺陷检测时的部署成本。模型对电力缺陷描述文本提示进行了调整实验,结果表明所提模型具备良好的零样本识别能力以及适应能力。在GLIP模型上采用了半监督学习方法,因此仅需要极少的标记数据即可实现对大量未标记样本的训练识别。半监督方法利用大量未标注数据和少量标注数据一起训练目标检测模型,以此来解决已有标记数据较少的问题。采用的无偏教师方式由两阶段组成:完全监督的训练阶段以及教师-学生模型相互学习阶段。首先,在完全监督训练阶段,使用已有的标注数据对模型进行训练以初始化检测模型。其次,在教师-学生模型相互学习阶段,将模型参数同时复制到教师和学生模型,由教师模型对于输入的无标签数据生成伪标签,再使用伪标签数据训练学生模型。当输入教师模型和学生模型的图片有所区别时,教师模型使用弱增强数据而学生模型使用强增强数据。可以采用的增强方法包括随机模糊、翻转、灰度调整等。

本应用实例提供的技术方案,实现通过优秀的预训练模型以及电力缺陷提示文本和缺陷图片的深度融合训练,以应对各类情况下的缺陷识别;采用半监督学习方式,通过将大量未标记数据输入训练后的教师模型,生成伪标签训练学生模型,从而提升缺陷识别效果,增强电力缺陷的检测能力;在电力领域具有良好的迁移能力,并为跨领域检测任务提供了解决方式;通过引入GLIP模型,基于跨模态预训练数据与识别模型,通过训练后能在现有缺陷图像上实现出色的检测效果;基于GLIP模型的设备缺陷与目标检测方式,以电力缺陷图像数据为训练对象,分析了文本提示与图像模型识别性能间的关系,针对标注数据稀缺的问题,采用半监督学习方法,提升缺陷识别效果,从而增强电力缺陷的检测能力;提高电力图像异常检测的效率和准确率。

应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电力图像异常检测方法的电力图像异常检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电力图像异常检测装置实施例中的具体限定可以参见上文中对于电力图像异常检测方法的限定,在此不再赘述。

在一个实施例中,如图4所示,提供了一种电力图像异常检测装置,该装置400可以包括:

图像获取模块401,用于获取电力图像;

图像识别模块402,用于通过预先训练的电力图像异常检测模型,对电力图像进行异常识别,识别出电力图像中的异常图像区域;

文本识别模块403,用于通过预先训练的电力图像异常检测模型,对异常图像区域与预存的异常描述文本之间的匹配度进行识别,得到匹配度识别结果;

文本选取模块404,用于根据匹配度识别结果,从预存的异常描述文本中,选取出对应的匹配度最高的异常描述文本,作为异常图像区域的目标异常描述文本;

区域标识模块405,用于通过预先训练的电力图像异常检测模型,利用目标异常描述文本对电力图像中的异常图像区域进行标识处理,得到异常标识电力图像;

结果确定模块406,用于将异常标识电力图像,作为电力图像的异常检测结果。

在一个实施例中,在一个实施例中,该装置400还包括:模型训练模块,用于获取第一样本电力图像和第一样本电力图像对应的真实异常检测结果;将第一样本电力图像输入至待训练的电力图像异常检测模型中,得到第一样本电力图像的预测异常检测结果;根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型。

在一个实施例中,模型训练模块,还用于根据预测异常检测结果和真实异常检测结果之间的差异,对待训练的电力图像异常检测模型进行训练,得到基础电力图像异常检测模型;根据基础电力图像异常检测模型的模型参数和模型结构,确定出与基础电力图像异常检测模型对应的第一电力图像异常检测模型和第二电力图像异常检测模型;将无标签的第二样本电力图像输入至第一电力图像异常检测模型中,得到第二样本电力图像的伪标签;利用第二样本电力图像和第二样本电力图像的伪标签,对第二电力图像异常检测模型进行训练,得到预先训练的电力图像异常检测模型。

在一个实施例中,模型训练模块,还用于获取变电站区域内的电力设备异常图像和人员行为异常图像;将电力设备异常图像和人员行为异常图像进行组合,得到第一样本电力图像。

在一个实施例中,图像获取模块401,还用于获取变电站区域内的原始电力图像;原始电力图像包括电力设备图像和人员行为图像;对原始电力图像进行图像预处理,得到电力图像。

在一个实施例中,该装置400还包括:文本确定模块,用于对变电站区域内的历史异常信息进行识别,得到变电站区域内的历史异常类型;对历史异常类型进行识别,得到变电站区域内的历史异常描述文本;将历史异常描述文本,作为预存的异常描述文本。

上述电力图像异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种电力图像异常检测方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

相关技术
  • 医保报销异常检测方法、装置、计算机设备和存储介质
  • 图像分割方法、装置、计算机设备及计算机存储介质
  • 图像生成方法和装置、计算机设备和计算机存储介质
  • 图像降噪方法、装置、电子设备及计算机可读存储介质
  • 图像处理方法、装置、计算机设备及存储介质
  • 电力监控图像异常检测方法和装置、电子设备及存储介质
  • 图像异常检测方法、装置、设备及计算机可读存储介质
技术分类

06120116485613