掌桥专利:专业的专利平台
掌桥专利
首页

一种电力SCADA告警界面文字分割及处理方法

文献发布时间:2023-06-19 10:43:23


一种电力SCADA告警界面文字分割及处理方法

技术领域

本发明属于中文训练模型训练方法技术领域,具体涉及一种电力SCADA告警界面文字分割及处理方法。

背景技术

随着社会对电力系统的需求越来越大,电力调度主站系统投入数量也日益增长,同时,为确保电力调度更好的运作,需要人工确认电力调度主站系统各站点设备状态与人工采集的设备实际状态是否一致,由于调度系统产生的数据量较大,对每个站点的核对需要花费较多时间,因此,针对调度主站信号对点的人工及时间投入大等现状,提出采用一种多技术融合的调度主站自动对点验收机器人提高对点效率。自动对点机器人需解决的难点之一为:如何识别前置图像的文字及颜色并与实际输出进行对比。本发明为对点机器人提取前置界面、分割文字、识别颜色提供算法支撑。

发明内容

本发明要解决的技术问题是:提供一种电力SCADA告警界面文字分割及处理方法,以解决现有技术中存在的问题。

本发明采取的技术方案为:一种电力SCADA告警界面文字分割及处理方法,该方法包括以下步骤:

1)读取电力调度系统应用的桌面截图文件,调用OpenCV中的cvtColor函数将图片转为灰度图,并将二值化阈值设为250,调用OpenCV的threshold函数将灰度图转为二值图,将图像中像素灰度值大于250像素的像素值置为1,小于250的像素值置为0,获得一张二值化图像;本步骤通过二值化滤除了图像中的干扰区域,增强了文字和背景之间的对比度,使文字区域更明显。

2)设置腐蚀核大小为2*2,调用OpenCV的erode函数对二值化处理的图片进行腐蚀运算,腐蚀运算能消除物体边界点,使边界向内部收缩,可以把图片中小于腐蚀核大小的元素去除,消除图片中的小干扰区域,从而减小了对下述步骤轮廓查找的干扰,提高图片轮廓处理和寻找的速度;

3)对步骤2)中腐蚀运算后生成的图片进行轮廓检测及查找运算,通过findContours函数查找所有的连通域轮廓。检测完毕后,保留面积最大和次大的两个轮廓,使用OpenCV的boundingRect函数计算出这两个轮廓的最小外接矩形,并得到两个矩形的左上角顶点(x,y)和矩形长宽;

4)根据步骤3)中将最小外接矩形位置对应到图片中,将两个矩形范围内的图片作为两个待识别的上下区域,左上角顶点y值小的作为上部分区域,y值大的矩形作为下部分区域;本步骤通过轮廓检测和面积过滤获得文字区域,使下述步骤进行准确的文字纵向投影和分割称为可能。

5)分别对确定后的上下两部分区域的二值化图像逐行进行黑色像素纵向投影,将每一行的黑色像素数量作为纵向数值,形成纵向投影像素数量曲线;

6)由于图像无文字部分的行像素都为白色,因此,无文字部分行在纵向投影后数值为0,形成纵向投影像素数量曲线的波谷,将纵向投影像素数量曲线图的波谷位置作为文字分割位置;本步骤通过投影波谷位置获得行文字的分割位置,提高行文字的分割准确度。

7)按照文字分割位置对上下区域进行行文字分割;

8)由于调度主站系统截图特性,各行文字颜色一致,因此在分割后行文字图片的中线位置进行颜色取色,分割后的行文字图片中主要存在白色背景色及文字颜色,设置白颜色的阈值范围,并取中线上不在白色阈值范围内的颜色作为该行文字的颜色;本步骤通过颜色过滤和读取准确获取各行文字颜色。

9)调用tesseract的识别接口对区域文字进行识别;

10)由于电力主站调度系统词语的特殊性,设置文字误识别调整列表,将容易误识别的词组形成调整列表保存在一个文本文件中,每一行的格式如下:

错误词组正确词组

11)根据调整列表的内容,将识别后的文字内容中包含错误词组的文字替换为正确词组,提升文字识别准确率;

12)将步骤8)和9)识别的文字及颜色组合成列表进行输出,完成前置图片的分割及处理。

本发明的有益效果:与现有技术相比,本发明的效果如下:

1)本发明解决了如何提取前置界面用户关注区域,通过图像预处理技术、阈值化技术、连通域检测技术、二值化图像投影技术等,实现区域的自动分割调整;

2)本发明解决了提取关注区域后的文字行分割及颜色识别方法,通过二值化文字纵向投影分割技术保证了文字行分割的准确性,并通过对分割区域的颜色阈值过滤和读取实现颜色识别的准确性。

附图说明

图1为告警界面文字分割及处理方法流程图。

具体实施方式

下面结合具体的附图和实施例对本发明进行进一步介绍。

实施例1:如图1所示,一种电力SCADA告警界面文字分割及处理方法,该方法包括以下步骤:

1)读取电力调度系统应用的桌面截图文件,调用OpenCV中的cvtColor函数将图片转为灰度图,并将二值化阈值设为250,调用OpenCV的threshold函数将灰度图转为二值图,将图像中像素灰度值大于250像素的像素值置为1,小于250的像素值置为0,获得一张二值化图像;本步骤通过二值化滤除了图像中的干扰区域,增强了文字和背景之间的对比度,使文字区域更明显;

2)设置腐蚀核大小为2*2,调用OpenCV的erode函数对二值化处理的图片进行腐蚀运算,腐蚀运算能消除物体边界点,使边界向内部收缩,可以把图片中小于腐蚀核大小的元素去除,消除图片中的小干扰区域,从而减小了对下述步骤轮廓查找的干扰,提高图片轮廓处理和寻找的速度;

3)对步骤2)中腐蚀运算后生成的图片进行轮廓检测及查找运算,通过findContours函数查找所有的连通域轮廓,检测完毕后,保留面积最大和次大的两个轮廓,使用OpenCV的boundingRect函数计算出这两个轮廓的最小外接矩形,并得到两个矩形的左上角顶点(x,y)和矩形长宽;

4)根据步骤3)中将最小外接矩形位置对应到图片中,将两个矩形范围内的图片作为两个待识别的上下区域,左上角顶点y值小的作为上部分区域,y值大的矩形作为下部分区域;通过轮廓检测和面积过滤获得文字区域,使下述步骤进行准确的文字纵向投影和分割称为可能;

5)分别对确定后的上下两部分区域的二值化图像进行黑色像素纵向投影,得到每一行的黑色像素数量,形成纵向投影像素数量曲线;

6)由于图像无文字部分的行像素都为白色,因此,无文字部分行在纵向投影后数值为0,形成纵向投影像素数量曲线的波谷,将纵向投影像素数量曲线图的波谷位置作为文字分割位置;本步骤通过投影波谷位置获得行文字的分割位置,提高行文字的分割准确度;

7)按照文字分割位置对上下区域进行行文字分割;

8)计算分割后行文字图片的中线位置,设置白颜色的阈值范围,并取中线上不在白色阈值范围内的颜色作为该行文字的颜色;由于调度主站系统截图特性,各行文字颜色一致,因此在分割后行文字图片的中线位置进行颜色取色,分割后的行文字图片中主要存在白色背景色及文字颜色,设置白颜色的阈值范围,并取中线上不在白色阈值范围内的颜色作为该行文字的颜色;本步骤通过颜色过滤和读取准确获取各行文字颜色;

9)调用tesseract的识别接口对区域文字进行识别;

10)设置文字误识别调整列表,调整列表保存在一个文本文件中,每一行的格式如下:

错误词组正确词组

11)根据调整列表的内容,将错误词组替换为正确词组,提升文字识别准确率;

12)将步骤8)和9)识别的文字及颜色组合成列表进行输出,完成前置图片的分割及处理。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种电力SCADA告警界面文字分割及处理方法
  • 一种基于知识库的电力监控系统告警智能处理方法及其装置
技术分类

06120112656018