掌桥专利:专业的专利平台
掌桥专利
首页

数字表读数的识别方法、识别设备以及计算机可读存储介质

文献发布时间:2023-06-19 09:24:30


数字表读数的识别方法、识别设备以及计算机可读存储介质

技术领域

本发明涉及图像识别技术领域,具体地说,是涉及一种数字表读数的识别方法、数字表读数的识别设备以及计算机可读存储介质。

背景技术

目前同类水表识别技术还仅仅专注于拍摄图像的数字解构,但是比对的标准往往都是单一的一套数字标准结构。通过这类型的识别技术虽然经过漫长的学习过程和图像积累最终都能达到一定的识别准确率并投入到使用当中,但是不同型号、品牌、大小和使用年限的水表表现出来的图像差异的多样性明显局限了该类技术的应用。由于同类水表识别技术使用单一的识别方法无法应对水表的多样性问题,容易出现识别盲区,从而导致读数出现一定概率的错误。更重要的是识别结果无法校验,往往需用户发现后上报,才能进行人工修正,不但增加了人工审查的时间,而且沉积下来未发现的识别错误结果将长久影响用户的正常用水。而水表抄读应用场景中,需抄读的数据量是非常庞大的,缺乏平行纠错机制的其它水表抄表识别方法需要每个抄读识别值都要进行人工审核,才能判断数据对错,其工作量是非常巨大的。

另外,现有的识别方法将所有不同型号水表,不同磨损程度的水表都用一套固定的数字形象结构来识别,往往因为不同水表的差异较大存在较长的学习过程和识别难以达到很高的准确率。

发明内容

本发明的第一目的是提供一种能够大幅提高数字表图片识别准确率的数字表读数的识别方法。

本发明的第二目的是提供一种能够大幅提高数字表图片识别准确率的数字表读数的识别设备。

本发明的第三目的是提供一种能够大幅提高数字表图片识别准确率的计算机可读存储介质。

为实现上述第一目的,本发明提供一种数字表读数的识别方法,包括获取包含数字表盘的字码图片;第一识别引擎存储有第一图像识别模型,所述第一图像识别模型识别所述字码图片并输出第一识别结果;第二识别引擎存储有第二图像识别模型,所述第二图像识别模型识别所述字码图片并输出第二识别结果;判断所述第一识别结果与所述第二识别结果是否一致,若是,输出所述数字表盘的读数,若否,将人工修正值输入所述第一识别引擎和所述第二识别引擎。

由上述方案可见,通过搭建两个不同图片识别方法的第一识别引擎和第二识别引擎同时进行识别,再对两个引擎的输出结果进行对比,一旦两个识别结果不一致将进行深度学习纠错。本发明的数字表读数的识别方法采用双识别引擎来进行双通道平行识别,从而减少各自的识别盲区,提高识别准确率。

另外,将经结果比对一致后输出唯一结果,将识别对比不一致的读数自动统计并纳入人工纠正和深度学习环节。通过自动比对结果发现识别错误,进入深度学习和人工纠错环节,从而大大提高过往技术中识别错误沉积下来的数据发现率,并且节省了人工校核的庞大工作量。此方法不仅能够大大提高识别准确率,并且不会输出识别错误的数据,节省了人工查错的工作量,解决识别读数需要人工校验的问题,并且能够自动刷选出错误数据。

同时,该识别方法对不同种类的数字表的兼容性强,现有的数字表识别技术大多应用于已安装的传统数字表之上,数字表会由不同厂商提供不同的型号和尺寸,并且数字表安装的时间都不尽相同,会存在不同的磨损程度。对于数字表的这种不可抹平的差异性,本发明通过采用两种不同的图像识别方法大大减少了单一方法的识别盲区,有利于识别。

一个优选的方案是,数字表读数的识别方法还包括搭建第一识别引擎步骤;搭建第一识别引擎的步骤包括:收集已赋予身份编码的字码图片,身份编码为字码图片对应的数字;对已赋予身份编码的字码图片进行网格化定位;采用深度神经网络对已赋予身份编码的字码图片进行分类建模,形成第一图像识别模型;以已赋予身份编码的字码图片作为训练样本进行深度神经网络模型训练。

由此可见,第一识别引擎在文件服务中收存海量的数字表的字码图片,并配置每张字码图片相应的读数作为身份编码放入大数据资源池中,将输入的数字表的字码图片通过与大数据资源池中的数据比对进行自动识别。

进一步的方案是,第一识别引擎和所述第二识别引擎均按数字所占面积输出占面积大的数字。

再进一步的方案是,搭建第一识别引擎的步骤还包括:获取包含数字表盘的原始图像;将原始图像的人工标注值输入第一识别引擎,对原始图像进行旋转、拉伸和平移操作;输入经操作后的原始图像并输出规范的数字表图像;将规范的数字表图像与第一图像识别模型的字码图片进行身份匹配,若匹配成功,第一识别引擎输出字码图片对应的身份编码,若匹配失败,将人工修正值输入第一识别引擎。

由此可见,通过对原始图像进行人工标注来初始化资源池,若一开始就用自动识别错误率会非常高,然后再慢慢学习修正,学时间也非常漫长。而通过先进行人工标注基本能确保初始资源池中数据的准确率,这样后续的错误率基本就来源于图像拍摄的多样性问题,这样可以提高识别效率。

进一步的方案是,原始图像中数字表盘占原始图像面积的三分之二以上。

一个优选的方案是,数字表读数的识别方法还包括搭建第二识别引擎步骤;搭建第二识别引擎的步骤包括:获取包含数字表盘的图像;将图像的字码图片拆分成0至9十张单个字码的图片;搭建单个字码图片对应数字的第二图像识别模型。

一个优选的方案是,数字表包括数字燃气表、数字电表或者数字水表。

一个优选的方案是,获取包含数字表的图像的步骤中,通过图像采集设备拍摄包含数字表的照片,或者拍摄包含数字表的视频,并截取包含数字表的照片。

为实现上述第二目的,本发明提供一种数字表读数的识别设备,包括处理器以及存储器,存储器存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的数字表读数的识别方法的步骤。

为实现上述第三目的,本发明提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被控制器执行时实现上述任意一项的数字表读数的识别方法的步骤。

附图说明

图1是本发明数字表读数的识别方法实施例的流程图。

图2是本发明数字表读数的识别方法实施例中数字表图像的示意图。

图3是本发明数字表读数的识别方法实施例中字码图片及其对应的身份编码的示意图。

图4是本发明数字表读数的识别方法实施例中字码图片网格化定位的示意图。

图5是本发明数字表读数的识别方法实施例中调用大数据资源池中图片资源的示意图。

图6是本发明数字表读数的识别方法实施例中十张单个字码的图片的示意图。

图7是本发明数字表读数的识别方法实施例中特征点标注的示意图。

图8是本发明数字表读数的识别方法实施例中字码图片的示意图。

图9是本发明数字表读数的识别方法实施例中进行特征匹配的示意图。

图10是本发明数字表读数的识别方法实施例中纠错与深度学习步骤中人工赋值界面的示意图。

以下结合附图及实施例对本发明作进一步说明。

具体实施方式

本发明的数字表读数的识别方法是应用在数字表读数的识别设备的计算机程序,用于实现对数字表读数的识别。本发明还提供一种数字表读数的识别设备,该数字表读数的识别设备包括控制器,控制器用于执行存储器中存储的计算机程序时实现上述的数字表读数的识别方法的步骤。本发明还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被控制器执行时实现上述的数字表读数的识别方法的步骤。

数字表即为在表盘上通过数字来显示读数的表。例如,水表、电表、燃气表等。本实施例中数字表为水表。

数字表读数的识别方法实施例

参见图1,一种数字表读数的识别方法包括如下步骤。

S1,搭建第一识别引擎步骤,第一识别引擎作为主要的识别引擎。

通过图像采集设备拍摄包含数字表盘的照片,或者拍摄包含数字表盘的视频,并截取包含数字表盘的照片,参见图2,在照片中,数字表盘用于显示数字读数。共采集约10万张照片。

参见图3,将水表图片剪裁成字码图片,并为每张字码图片赋予身份编码,身份编码为字码图片对应的数字,将每张字码图片对应的身份编码人工录入。

参见图4,对已赋予身份编码的字码图片进行网格化定位,针对过渡数字的情况,按数字所占面积输出占面积大的数字。

采用深度神经网络(Deep Neural Networks,DNN)对已赋予身份编码的字码图片进行分类建模,形成第一图像识别模型,并将所有的模型数据整合到大数据资源池内。以已赋予身份编码的字码图片作为训练样本进行深度神经网络模型训练。

S14,初始化资源池步骤。

获取包含数字表的原始图像,原始图像中数字表盘占原始图像面积的三分之二以上。

将原始图像的人工标注值输入第一识别引擎。

对原始图像进行旋转、拉伸和平移操作。

输入经操作后的原始图像并输出规范的数字表图像。

将规范的数字表图像与大数据资源池中的字码图片进行身份匹配,参见图5,若匹配成功,通过身份编码调用大数据资源池中的字码图片,并输出相对应的数字表读数,若匹配失败,人工手动输入规范的数字表图像对应的读数。

S2,搭建第二识别引擎步骤。

获取包含数字表盘的图像。

参见图6,将水表字码图片拆分成0至9十张单个字码的图片。十张单个字码的图片通过采集不同型号的数字表得到。

搭建单个字码图片对应数字的第二图像识别模型。参见图7,将0至9十张单个字码的图片进行特征标记。基于SIFT算法,即尺度不变特征变换(Scale-invariant featuretransform,SIFT),首先构建尺度空间,检测极值点,获得尺度不变性。接着,特征点过滤并进行精确定位。然后,为特征点分配方向值。最终,生成特征描述子,并对每个特征点对应的图片赋予识别值,通过特征点的匹配作为图片识别的唯一依据。

S3,识别对比步骤。

获取包含数字表盘的图像。

将水表图片剪裁成包含数字表盘的字码图片。

第一识别引擎识别字码图片,第一识别引擎以字码图片作为输入,通过预先训练得到的第一图像识别模型对字码图片进行识别,输出第一识别结果。

第二识别引擎识别字码图片,第二识别引擎以字码图片作为输入,参见图8,利用网格定位工具进行自动图片剪裁,将图片剪裁成单独字码图片。参见图9,通过第二图像识别模型对字码图片进行识别,输出第二识别结果。

判断第一识别结果与第二识别结果是否一致,若是,输出数字表读数的识别结果,若否,则不输出读数,第一识别引擎和第二识别引擎分别进入深度学习纠错步骤。

S4,深度学习纠错步骤。

参见图10,对识别结果不一致的字码图片,经过人工修正后,将修正值归入第一识别引擎和第二识别引擎各自的大数据资源池,第一识别引擎和第二识别引擎分别进行深度学习后,再输出识别读数。人工修正即人工将字码图片对应的读数输入第一识别引擎和第二识别引擎。

基于初次识别值和人工纠错值更新大数据资源池的数据,进行资源准确性的强化训练和资源量的扩展,反复进行训练使得识别更加精准高效。

由上可见,通过搭建两个不同图片识别方法的第一识别引擎和第二识别引擎同时进行识别,再对两个引擎的输出结果进行对比,一旦两个识别结果不一致将进行深度学习纠错。本发明的数字表读数的识别方法采用双识别引擎来进行双通道平行识别,从而减少各自的识别盲区,提高识别准确率。另外,将经结果比对一致后输出唯一结果,将识别对比不一致的读数自动统计并纳入人工纠正和深度学习环节。通过自动比对结果发现识别错误,进入深度学习和人工纠错环节,从而大大提高过往技术中识别错误沉积下来的数据发现率,并且节省了人工校核的庞大工作量。此方法不仅能够大大提高识别准确率,并且不会输出识别错误的数据,节省了人工查错的工作量,解决识别读数需要人工校验的问题,并且能够自动刷选出错误数据。同时,该识别方法对不同种类的数字表的兼容性强,现有的数字表识别技术大多应用于已安装的传统数字表之上,数字表会由不同厂商提供不同的型号和尺寸,并且数字表安装的时间都不尽相同,会存在不同的磨损程度。对于数字表的这种不可抹平的差异性,本发明通过采用两种不同的图像识别方法大大减少了单一方法的识别盲区,有利于识别。

数字表读数的识别设备实施例:

本实施例的数字表读数的识别设备包括控制器,控制器执行计算机程序时实现上述数字表读数的识别方法实施例中的步骤。

例如,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由控制器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在数字表读数的识别设备中的执行过程。

数字表读数的识别设备可包括,但不仅限于,控制器、存储器。本领域技术人员可以理解,数字表读数的识别设备可以包括更多或更少的部件,或者组合某些部件,或者不同的部件,例如数字表读数的识别设备还可以包括输入输出设备、网络接入设备、总线等。

例如,控制器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用控制器、数字信号控制器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用控制器可以是微控制器或者该控制器也可以是任何常规的控制器等。控制器是数字表读数的识别设备的控制中心,利用各种接口和线路连接整个数字表读数的识别设备的各个部分。

存储器可用于存储计算机程序和/或模块,控制器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现数字表读数的识别设备的各种功能。例如,存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(例如声音接收功能、声音转换成文字功能等)等;存储数据区可存储根据手机的使用所创建的数据(例如音频数据、文本数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

计算机可读存储介质实施例:

数字表读数的识别设备的存储器所存储的计算机程序如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,实现上述数字表读数的识别方法实施例中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被控制器执行时,可实现上述数字表读数的识别方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

最后需要强调的是,以上仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种变化和更改,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 数字表读数的识别方法、识别设备以及计算机可读存储介质
  • 数字式仪表读数的自动识别方法、计算机可读存储介质
技术分类

06120112151186