掌桥专利:专业的专利平台
掌桥专利
首页

一种信息识别码的识别方法及装置

文献发布时间:2023-06-19 18:37:28


一种信息识别码的识别方法及装置

技术领域

本申请涉及图像处理技术领域,尤其涉及一种信息识别码的识别方法及装置。

背景技术

随着信息技术的发展与移动智能终端的普及,二维码、条形码等信息识别码的应用越来越广泛。其在日常消费、商品流通、图书管理、邮政管理、银行系统等许多领域都得到广泛的应用。

条形码(barcode)是指将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符。常见的条形码是由反射率相差很大的黑条(简称条)和白条(简称空)排成的平行线图案。二维码(QR Code),主要是通过某种特定的几何图形按照一定规律对信息进行编码,承载信息量大。在信息识别码的使用过程中,通常需要扫码识别相应的图像或图案,以解码获取信息识别码中的信息。

但是,在信息识别码的实际读码过程中,由于扫码器的扫码角度、距离、环境光线、外部遮挡、背景遮挡、打码故障等情况,均有可能导致扫码器读取的图像或图案与信息识别码有偏差,从而读码失败。

发明内容

本申请提供一种信息识别码的识别方法及装置,用于提升信息识别码的识别效率。

第一方面,本申请提供一种信息识别码的识别方法,该方法具体包括:首先获取信息识别码的拍摄图像和拍摄图像的图像类别;根据拍摄图像的图像类别与预设对应关系,确定与拍摄图像的图像类别相对应的目标识别模型;其中,预设对应关系用于指示至少一个图像类别与至少一个识别模型之间的对应关系,目标识别模型属于至少一个识别模型;将拍摄图像输入目标识别模型中,以解析拍摄图像中的所述信息识别码。

基于本申请提供的技术方案至少可以产生以下有益效果:预先训练有多个识别模型,一个识别模型对应一个类别,识别装置可以根据拍摄图像的图像类别,在预设对应关系中确定出该图像类别对应的目标识别模型,进而将拍摄图像输入目标识别模型中以解析拍摄图像中的信息识别码。其中,由于目标识别模型为与该拍摄图像的图像类别对应的识别模型。也即,目标识别模型识别该拍摄图像中的信息识别码的识别准确率更高。这样一来,识别装置可以基于拍摄图像的图像类别为其分配合适的识别模型,从而可以提高信息识别码的识别效率以及识别的准确率。

在一种可能的实现方式中,上述获取信息识别码的拍摄图像和拍摄图像的图像类别,包括:获取信息识别码的拍摄图像;将拍摄图像输入预先训练好的图像分类器中,确定拍摄图像的图像类别;其中,图像类别用于反映信息识别码的读码场景。

可以理解,基于该实现方式,可以在信息识别码的识别过程中,首先确定获取到的信息识别码的拍摄图像的图像类别,进而基于该拍摄图像的图像类别,为该拍摄图像分配合适的识别模型(该图像类别对应的目标识别模型),如此,提升信息识别码的识别效率。

在另一种可能的实现方式中,上述确定拍摄图像的图像类别,包括:获取图像分类器输出的拍摄图像对于各个图像类别的置信度,置信度用于指示拍摄图像属于图像类别的概率;获取所述图像分类器输出的所述拍摄图像对于至少一个图像类别中各个图像类别的置信度,所述置信度用于指示所述拍摄图像属于所述图像类别的概率;根据各个图像类别的置信度的大小,将至少一个图像类别中的N个图像类别确定为拍摄图像的图像类别,N为正整数。

在又一种可能的实现方式中,上述根据各个图像类别的置信度的大小,将至少一个图像类别中的N个图像类别确定为拍摄图像的图像类别,包括:将图像类别按照置信度的大小降序排列,得到图像类别的排列结果;将排列结果中的前N个图像类别确定为拍摄图像的图像类别。

可以理解,确定多个可能的图像类别,进而可以基于多个图像类别确定多个识别模型,如此,在一个识别模型未成功识别该信息识别码时,还可以选择另一个识别模型,可以提升识别准确率。

在又一种可能的实现方式中,若目标识别模型无法解析拍摄图像中的信息识别码,则将拍摄图像输入全类型识别模型,以解析拍摄图像中的信息识别码;其中,全类型识别模型能够识别至少一个图像类别中所有图像类别的拍摄图像。

在又一种可能的实现方式中,至少一个图像类别包括正常、模糊,畸变,浓墨,欠墨,污损,低对比度,扭曲、缺失以及静区干扰中的一项或多项。

在又一种可能的实现方式中,在获取信息识别码的拍摄图像和拍摄图像的图像类别之前,方法还包括:获取第一识别模型,第一识别模型为至少一个识别模型中的其中一个。

在又一种可能的实现方式中,上述获取第一识别模型,包括:获取第一训练样本集,第一训练样本集中包括多张信息识别码的拍摄图像,拍摄图像的图像类别为第一图像类别,第一图像类别为至少一个图像类别中的其中一个;根据第一训练样本集,对初始识别模型进行训练,以获得第一识别模型。

可以理解,该实现方式中,可以利用各个图像类别对应的训练样本集分别训练得到识别模型,进而得到适用于各个图像类别的识别模型,并且,基于训练好的识别模型识别其对应的拍摄图像,识别准确率较高。

在又一种可能的显示方式中,在获取所述拍摄图像的图像类别之前,方法还包括:获取图像分类器,该图像分类器用于确定拍摄图像的图像类别。

在又一种可能的显示方式中,上述获取图像分类器,包括:获取分类训练样本集,分类训练样本集中包括多张信息识别码拍摄图像以及每一张拍摄图像对应的图像类别;根据分类训练样本集,对初始分类器进行训练。

第二方面,本申请提供一种信息识别码的识别装置,该装置包括:获取模块,用于获取信息识别码的拍摄图像和拍摄图像的图像类别;处理模块,用于根据拍摄图像的图像类别与预设对应关系,确定与拍摄图像的图像类别相对应的目标识别模型;其中,预设对应关系用于指示至少一个图像类别与至少一个识别模型之间的对应关系,目标识别模型属于至少一个识别模型;处理模块,还用于将拍摄图像输入目标识别模型中,以解析拍摄图像中的信息识别码。

在一种可能的实现方式中,上述获取模块,具体用于获取信息识别码的拍摄图像;处理模块,还用于将拍摄图像输入预先训练好的图像分类器中,确定拍摄图像的图像类别;其中,图像类别用于反映信息识别码的读码场景。

在另一种可能的实现方式中,上述处理模块,具体用于:获取图像分类器输出的拍摄图像对于至少一个图像类别中各个图像类别的置信度,置信度用于指示拍摄图像属于图像类别的概率;根据各个图像类别的置信度的大小,将至少一个图像类别中的N个图像类别确定为拍摄图像的图像类别,N为正整数。

在又一种可能的实现方式中,上述处理模块具体用于:将图像类别按照置信度的大小降序排列,得到图像类别的排列结果;将排列结果中的前N个图像类别确定为拍摄图像的图像类别。

在又一种可能的实现方式中,若目标识别模型无法解析拍摄图像中的信息识别码,则处理模块,还用于将拍摄图像输入全类型识别模型,以解析拍摄图像中的信息识别码;其中,全类型识别模型能够识别至少一个图像类别中所有图像类别的拍摄图像。

在又一种可能的实现方式中,至少一个图像类别包括正常、模糊,畸变,浓墨,欠墨,污损,低对比度,扭曲、缺失以及静区干扰中的一项或多项。

在又一种可能的实现方式中,在获取信息识别码的拍摄图像和拍摄图像的图像类别之前,获取模块还用于获取第一识别模型,第一识别模型为至少一个识别模型中的其中一个。

在又一种可能的实现方式中,该装置还包括训练模块,获取模块还用于获取第一训练样本集,第一训练样本集中包括多张信息识别码的拍摄图像,拍摄图像的图像类别为第一图像类别,第一图像类别为至少一个图像类别中的其中一个;训练模块,用于根据第一训练样本集,对初始识别模型进行训练,以获得第一识别模型。

在又一种可能的实现方式中,在获取拍摄图像的图像类别之前,获取模块,还用于获取图像分类器,该图像分类器用于确定拍摄图像的图像类别。

在又一种可能的实现方式中,获取模块,还用于获取分类训练样本集,分类训练样本集中包括多张信息识别码拍摄图像以及每一张拍摄图像对应的图像类别;训练模块,还用于根据分类训练样本集,对初始分类器进行训练。

第三方面,本申请提供一种电子设备,该电子设备包括存储器和处理器。上述存储器和处理器耦合。该存储器用于存储计算机程序代码,该计算机程序代码包括计算机指令。当处理器执行该计算机指令时,使得电子设备执行如第一方面及其任一种可能的实现方式所述的信息识别码的识别方法。

第四方面,本申请提供一种芯片系统,该芯片系统应用于信息识别码的识别装置;芯片系统包括一个或多个接口电路,以及一个或多个处理器。接口电路和处理器通过线路互联;接口电路用于从信息识别码的识别装置的存储器接收信号,并向处理器发送信号,信号包括存储器中存储的计算机指令。当处理器执行计算机指令时,使得电子设备执行如第一方面及其任一种可能的实现方式所述的信息识别码的识别方法。

第五方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当所述计算机指令在电子设备上运行时,使得电子设备执行如第一方面及其任一种可能的实现方式所述的信息识别码的识别方法。

第六方面,本申请提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在电子设备上运行时,使得电子设备执行如第一方面及其任一种可能的实现方式所述的信息识别码的识别方法。

本申请中第二方面到第六方面及其各种实现方式的具体描述,可以参考第一方面及其各种实现方式中的详细描述;并且,第二方面到第六方面及其各种实现方式的有益效果,可以参考第一方面及其各种实现方式中的有益效果分析,此处不再赘述。

附图说明

图1为本申请实施例提供的一种电子设备的通用架构示意图;

图2为本申请实施例提供的一种信息识别码的识别方法流程图;

图3为本申请实施例提供的一种信息识别码的拍摄向的示意图;

图4为本申请实施例提供的另一种信息识别码的识别方法流程图;

图5为本申请实施例提供的另一种信息识别码的识别方法流程图;

图6为本申请实施例提供的另一种信息识别码的识别装置的组成示意图;

图7为本申请实施例提供的一种信息识别码的识别装置的硬件组成示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本申请的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”是指一个或多个,“多个”是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。

需要说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

为了提升信息识别码的识别效率,本申请实施例提供了一种信息识别码的识别方法,该方法包括:获取信息识别码的拍摄图像和拍摄图像的图像类别;根据拍摄图像的图像类别与预设对应关系,确定与拍摄图像的图像类别相对应的目标识别模型;其中,预设对应关系用于指示至少一个图像类别与至少一个识别模型之间的对应关系,目标识别模型属于至少一个识别模型;将拍摄图像输入目标识别模型中,以解析拍摄图像中的所述信息识别码。如此,识别装置可以基于拍摄图像的图像类别为其分配合适的识别模型,从而可以提高信息识别码的识别效率以及识别的准确率。

本申请实施例还提供一种信息识别码的识别装置,该信息识别码的识别装置可以用于执行上述信息识别码的识别的方法。可选的,该信息识别码的识别装置可为具有数据处理能力的电子设备,或者是该电子设备中的功能模块,对此不作限定。例如,该电子设备可以是手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本,以及蜂窝电话、个人数字助理(personal digital assistant,PDA)、增强现实(augmented reality,AR)\虚拟现实(virtual reality,VR)设备等终端设备。

以下电子设备为手机为例,结合图1对手机100的通用硬件架构进行说明。

如图1所示,手机具体可以包括:处理器101、射频(RF)电路102、存储器103、触摸屏104、蓝牙装置105、一个或多个传感器106、Wi-Fi装置107、定位装置108、音频电路109、外设接口110以及电源装置111等部件。这些部件可通过一根或多根通信总线或信号线(图1中未示出)进行通信。本领域技术人员可以理解,图1中示出的硬件结构并不构成对手机的限定,手机可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

处理器101是手机的控制中心,利用各种接口和线路连接手机的各个部分,通过运行或执行存储在存储器103内的应用程序(以下可以简称App),以及调用存储在存储器103内的数据,执行手机的各种功能和处理数据。在一些实施例中,处理器101可包括一个或多个处理单元。

射频电路102可用于在收发信息或通话过程中,无线信号的接收和发送。特别地,射频电路102可以将基站的下行数据接收后,给处理器101处理;另外,将涉及上行的数据发送给基站。通常,射频电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频电路102还可以通过无线通信和其他设备通信。所述无线通信可以使用任一种通信标准或协议,包括但不限于全球移动通讯系统、通用分组无线服务、码分多址、宽带码分多址、长期演进、电子邮件、短消息服务等。

存储器103用于存储应用程序以及数据,处理器101通过运行存储在存储器103的应用程序以及数据,执行手机的各种功能以及数据处理。存储器103主要包括存储程序区以及存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等);存储数据区可以存储根据使用手机时所创建的数据(比如音频数据、电话本等)。此外,存储器103可以包括高速随机存取存储器,还可以包括非易失存储器,例如磁盘存储器件、闪存器件或其他易失性固态存储器件等。存储器103可以存储各种操作系统,例如,苹果公司所开发的IOS操作系统,谷歌公司所开发的Android操作系统等。

触摸屏104可以包括触控板104-1和显示器104-2。其中,触控板104-1可采集手机的用户在其上或附近的触摸事件(比如用户使用手指、触控笔等任何适合的物体在触控板104-1上或在触控板104-1附近的操作),并将采集到的触摸信息发送给其他器件例如处理器101。

其中,触摸屏104可以为能够伸缩或扩展的屏幕。例如触摸屏104可以采用由OLED(Organic Light-Emitting Diode,有机发光二极管)材料制成的柔性屏,其具有可弯曲、可扭转、可折叠的特性,从而触摸屏104能够通过基于柔性屏的特性,改变屏幕面积。

在本申请实施例中,手机还可以具有指纹识别功能。例如,可以在手机的背面(例如后置摄像头的下方)配置指纹采集器件112,或者在手机的正面(例如触摸屏104的下方)配置指纹采集器件112。又例如,可以在触摸屏104中配置指纹采集器件112来实现指纹识别功能,即指纹采集器件112可以与触摸屏104集成在一起来实现手机的指纹识别功能。在这种情况下,该指纹采集器件112配置在触摸屏104中,可以是触摸屏104的一部分,也可以以其他方式配置在触摸屏104中。本申请实施例中的指纹采集器件112的主要部件是指纹传感器,该指纹传感器可以采用任何类型的感测技术,包括但不限于光学式、电容式、压电式或超声波传感技术等。

在本申请实施例中,手机还可以包括蓝牙装置105,用于实现手机与其他短距离的终端(例如手机、智能手表等)之间的数据交换。本申请实施例中的蓝牙装置可以是集成电路或者蓝牙芯片等。

手机还可以包括至少一种传感器106,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节触摸屏104的显示器的亮度,接近传感器可在手机移动到耳边时,关闭显示器的电源。作为运动传感器的一种,加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

Wi-Fi装置107,用于为手机提供遵循Wi-Fi相关标准协议的网络接入,手机可以通过Wi-Fi装置107接入到Wi-Fi接入点,进而帮助用户收发电子邮件、浏览网页和访问流媒体等,它为用户提供了无线的宽带互联网访问。在其他一些实施例中,该Wi-Fi装置107也可以作为Wi-Fi无线接入点,可以为其他终端提供Wi-Fi网络接入。

定位装置108,用于为手机提供地理位置。可以理解的是,该定位装置108具体可以是全球定位系统(GPS)或北斗卫星导航系统、俄罗斯GLONASS等定位系统的接收器。定位装置108在接收到上述定位系统发送的地理位置后,将该信息发送给处理器101进行处理,或者发送给存储器103进行保存。在另外的一些实施例中,该定位装置108还可以是辅助全球卫星定位系统(AGPS)的接收器,AGPS系统通过作为辅助服务器来协助定位装置108完成测距和定位服务,在这种情况下,辅助定位服务器通过无线通信网络与终端例如手机的定位装置108(即GPS接收器)通信而提供定位协助。在另外的一些实施例中,该定位装置108也可以是基于Wi-Fi接入点的定位技术。由于每一个Wi-Fi接入点都有一个全球唯一的MAC地址,终端在开启Wi-Fi的情况下即可扫描并收集周围的Wi-Fi接入点的广播信号,因此可以获取到Wi-Fi接入点广播出来的MAC地址;终端将这些能够标示Wi-Fi接入点的数据(例如MAC地址)通过无线通信网络发送给位置服务器,由位置服务器检索出每一个Wi-Fi接入点的地理位置,并结合Wi-Fi广播信号的强弱程度,计算出该终端的地理位置并发送到该终端的定位装置108中。

音频电路109、扬声器113、麦克风114可提供用户与手机之间的音频接口。音频电路109可将接收到的音频数据转换后的电信号,传输到扬声器113,由扬声器113转换为声音信号输出;另一方面,麦克风114将收集的声音信号转换为电信号,由音频电路109接收后转换为音频数据,再将音频数据输出至RF电路102以发送给比如另一手机,或者将音频数据输出至存储器103以便进一步处理。

通信接口110,用于为外部的输入/输出设备(例如键盘、鼠标、外接显示器、外部存储器、用户识别模块卡等)提供各种接口。例如通过通用串行总线(USB)接口与鼠标或显示器连接,通过用户识别模块卡的卡槽上的金属触点与电信运营商提供的用户识别模块卡(SIM)进行连接,通过Wi-Fi装置107的接口、近场通信(NFC)装置的接口、蓝牙模块的接口等与其他终端实现通信功能。通信接口110可以被用来将上述外部的输入/输出外围设备耦接到处理器101和存储器103。

手机还可以包括给各个部件供电的电源装置111(比如电池和电源管理芯片),电池可以通过电源管理芯片与处理器101逻辑相连,从而通过电源装置111实现管理充电、放电、以及功耗管理等功能。

尽管图1未示出,手机还可以包括摄像头(前置摄像头和/或后置摄像头)、闪光灯、微型投影装置、近场通信(NFC)装置等,在此不再赘述。

此外,对于上述识别模型,本申请实施例还提供一种识别模型的训练装置(为简单描述,下文中简称训练装置),该训练装置可用于训练该识别模型,提供训练完成的适用于一个图像类别的识别模型。并且,该训练装置同样可为具有数据处理能力的电子设备模块,或者是该电子设备中的功能模块,对此不作限定。可选的,该训练装置的结构也可以如图1所示。

在一些实施例中,上述信息识别码的识别装置和上述训练装置可以集成为一个设备;或者,上述信息识别码的识别装置和上述训练装置可以为独立的两个设备。

可选的,该训练装置还可以用于训练本申请实施例中的图像分类器。或者,本申请实施例还可以提供另一训练装置,以训练该图像分类器。

下面结合说明书附图,对本申请提供的实施例进行具体介绍。

本申请实施例提供了一种信息识别码的识别方法,如图2所示,该方法应用于上述信息识别码的识别装置(为便于描述,以下简称为识别装置),该方法具体包括以下步骤:

S101、识别装置获取信息识别码的拍摄图像和拍摄图像的图像类别。

其中,信息识别码是指通过特定规则生成的符号或图案,可以表示一定的信息。用户可以利用光电设备识读该符号或图案,以识别解码出其表示的信息。

此外,上述拍摄图像为包含信息识别码的待识别图像。

示例性的,商品的信息识别码(例如条形码)通常印刷于包装物的自然底部或下部,在需要识别时,用户可以首先对准信息识别码所在的位置,获取包含信息识别码的拍摄图像,进而通过识别该拍摄图像,以完成信息识别码中所包含信息的获取。应理解,除印刷出的信息识别码外,需要识别的信息识别码还可以是在电子设备的显示器展示出的信息识别码、在纸张上印刷出的信息识别码等,本申请对信息识别码的展示形式不作具体限定。

需要说明的是,以上述商品包装上印刷出的信息识别码为例,由于在获取信息识别码的拍摄图像的过程中,由于读码场景的不同,受到拍摄角度、环境光线等影响,拍摄出的图像中可能会出现信息识别码模糊、畸变等情况。或者,在信息识别码的印刷过程中,可能会出现印刷的信息识别码浓墨、欠墨等情况。又或者,由于印刷信息识别的外包装的扭曲、缺失,可能会导致拍摄图像中的识别信息的,从而导致印刷出信息识别码不便于识别。

其中,上述图像类别用于反映信息识别码的读码场景。

可选的,图像类别包括正常、模糊,畸变,浓墨,欠墨,污损,低对比度,扭曲、缺失、静区干扰或其他可能的图像类别。示例性的,图3依次示出了图像类别为正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失以及欠墨的包含信息识别码的拍摄图像。

其中,以条形码为例,静区也叫空白区,是指条形码前后两端外侧与空的反射率相同的限定区域。一个完整的条行码的组成次序依次为:静区(前)、起始符、数据符、(中间分割符)、(校验符)、终止符、静区(后)。静区能使条形码的阅读器进入准备阅读的状态,当两个条码相距距离较近时,静区则有助于对它们加以区分,静区的宽度通常应不小于6mm(或10倍模块宽度)。从而,静区干扰则是指印刷时,在条形码标记或符号的前后缺乏留白空间。

示例性的,在步骤S101中,识别装置可以获取信息识别码1的拍摄图像A,以及拍摄图像A的图像类别“模糊”。

在一种实现方式中,识别装置可以直接获取带有图像类别标签的拍摄图像。

其中,拍摄图像中包含信息识别码。类别标签即为正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失、欠墨或其他可能的类别标签。

可选的,一张拍摄图像可以对应一个类别标签。或者,一张拍摄图像也可以对应多个类别标签。也即,一张拍摄图像可以对应一个或多个上述图像类别。

在另一种实现方式中,识别装置可以获取信息识别码的拍摄图像,进而确定该拍摄图像对应的图像类别。

其中,一张拍摄图像可以对应一个或多个上述图像类别。也即,识别装置可以确定该拍摄图像的一个或多个图像类别。

可选的,识别装置可以将获取到的拍摄图像输入预先训练好的图像分类器中,以确定该拍摄图像对应的图像类别。

其中,预先训练好的图像分类器可以输出该拍摄图像对于上述至少一个图像中各个图像类别的置信度。拍摄图像对应其中一个图像类别的置信度用于指示拍摄图像属于该图像类别的概率。置信度可以以0-1之间例如0.1、0.55等数据表示。

可选的,识别装置可以根据各个图像类别的置信度的大小,将至少一个图像类别中的N个图像类别确定为拍摄图像的图像类别,N为正整数。

例如,识别装置可以将图像类别按照所述置信度的大小降序排列,得到该拍摄图像对应的图像类别的排列结果。进而,识别装置可以将排列结果中的前N个图像类别确定为拍摄图像的图像类别。或者,识别装置可以将图像类别按照所述置信度的大小升序排列,得到该拍摄图像对应的图像类别的排列结果。进而,识别装置可以将排列结果中的后N个图像类别确定为拍摄图像的图像类别。

应理解,当N的取值为1时,识别装置可以确定出置信度最高,也即拍摄图像对应的概率最高的图像类别。

可选的,在获取拍摄图像的图像类别之前,识别装置可以获取图像分类器。其中,图像分类器可以用于确定拍摄图像的图像类别。

示例性的,识别装置可以从其他设备,如图5所示方法中的训练装置处获取图像分类器。例如,训练装置训练好图像分类器后,向识别装置发送图像分类器的信息。相应的,识别装置接收图像分类器的信息,根据图像分类器的信息得到图像分类器。或者,识别装置通过图5所示的方法获取图像分类器,即识别装置为图5所示方法中的训练装置。

S102、识别装置根据拍摄图像的图像类别与预设对应关系,确定与拍摄图像的图像类别相对应的目标识别模型。

其中,预设对应关系用于指示至少一个图像类别与至少一个识别模型之间的对应关系(例如,可以是一一对应关系),目标识别模型属于至少一个识别模型。

可选的,识别装置可以获取至少一个识别模型。其中,至少一个识别模型用于识别拍摄图像中的信息识别码。

示例性的,识别装置可以从其他设备,如图4所示方法中的训练装置处至少一个识别模型。例如,训练装置分别训练好上述至少一个图像类别对应的识别模型后,向识别装置发送至少一个识别模型的信息。相应的,识别装置接至少一个识别模型的信息,根据至少一个识别模型的信息得到至少一个识别模型。或者,识别装置通过图4所示的方法获取至少一个识别模型,即识别装置为图4所示方法中的训练装置。

在一些实施例中,识别装置可以将拍摄图像的图像类别作为待查找标识,遍历预设对应关系中每个图像类别,并确定出该图像类别对应的目标识别模型。

可选的,上述预设对应关系可以为预设的对应关系表。该对应关系表中每一行包括一个图像类别以及该图像类别对应的一个识别模型。

示例性的,上述对应关系表可以如表1所示,其中,每一行包括一个图像类别以及该图像类别对应的一个识别模型。以该拍摄图像的图像类别为“模糊”为例,则识别装置可以将表1中的识别模型02确定为上述目标识别模型。

表1

此外,若该拍摄图像包括一个图像类别,则识别装置可以确定将一个识别模型确定为上述目标模型。

或者,若给拍摄图像包括多个图像类别,则识别装置可以依次查找出每一个图像类别对应的识别模型,并将查找出的多个识别模型确定为上述目标模型。例如,若一个拍摄图像的图像类别为“模糊”和“低对比度”,则识别装置可以基于表1所示的对应关系表,依次查找出“模糊”对应的识别模型02以及“低对比度”对应的识别模型03,进而该拍摄图像对应的目标识别模型为识别模型02以及识别模型03。

可选的,一个识别模型可以由该识别模型对应的图像类别的多个拍摄图像训练得到。

需要说明的是,以上述表1中的识别模型02为例,若识别模型02由图像类别均为“模糊”的多张拍摄图像训练得到,则训练完成的识别模型02对于图像类别为“模糊”的拍摄图像中的信息识别码的识别准确率更高。

S103、识别装置将拍摄图像输入目标识别模型中,以解析拍摄图像中的信息识别码。

具体的,解析拍摄图像中的信息识别码的过程即为基于该信息识别码图案或形状,确定编码格式,进而根据该编码格式对该信息识别码的数据进行解读后得到解码结果。

可选的,若识别装置确定的目标识别模型为一个识别模型,则识别装置可以基于将该拍摄图像输入该目标识别模型中,以解析拍摄图像中的信息识别码。

或者,若识别装置确定的目标识别模型为多个识别模型,则识别装置可以依次将该拍摄图像输入确定个各个目标识别模型中,直至解析出拍摄图像中的信息识别码中包含的信息。可选的,识别装置可以按照图像类别的置信度大小,按照由大到小的顺序,将该拍摄图像依次输入各个图像类别对应的目标识别模型中。

在一些实施例中,若目标识别模型无法解析拍摄图像中的信息识别码,则将拍摄图像输入全类型识别模型,以解析拍摄图像中的信息识别码。

其中,上述全类型识别模型能够识别所有图像类别的拍摄图像。

基于本申请提供的技术方案至少可以产生以下有益效果:预先训练有多个识别模型,一个识别模型对应一个类别,识别装置可以根据拍摄图像的图像类别,在预设对应关系中确定出该图像类别对应的目标识别模型,进而将拍摄图像输入目标识别模型中以解析拍摄图像中的信息识别码。其中,由于目标识别模型为与该拍摄图像的图像类别对应的识别模型。也即,目标识别模型识别该拍摄图像中的信息识别码的识别准确率更高。这样一来,识别装置可以基于拍摄图像的图像类别为其分配合适的识别模型,从而可以提高信息识别码的识别效率以及识别的准确率。

在示例性的实施例中,本申请实施例还提供一种识别模型的训练方法。图4为本申请实施例提供的识别模型的训练方法的流程示意图。如图4所示,该方法包括S201至S202。

S201、训练装置获取第一训练样本集,第一训练样本集中包括多张信息识别码的拍摄图像。

其中,拍摄图像的图像类别为第一图像类别,第一图像类别为本申请实施例提供的至少一个图像类别中的其中一个。

此外,第一图像类别可以为正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失、欠墨或其他可能的类别。

可选的,训练装置可以依次获取图像类别为正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失或者欠墨的多张信息识别码的拍摄图像作为训练样本集,进而基于各个训练样本集分别训练出正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失或者欠墨对应的识别模型。

S202、训练装置根据第一训练样本集,对初始识别模型进行训练,以获得第一识别模型。

其中,第一识别模型为本申请实施例提供的至少一个识别模型中的其中一个。

在一些实施例中,若本申请提供的训练装置与上述识别装置为独立的两个设备,则在训练装置获得第一识别模型时,还可以向识别装置发送该第一识别模型。

基于上述实施例,可以利用各个图像类别对应的训练样本集分别训练得到识别模型,进而得到适用于各个图像类别的识别模型,并且,基于训练好的识别模型识别其对应的拍摄图像,识别准确率较高。

在示例性的实施例中,本申请实施例还提供一种图像分类器的训练方法。图5为本申请实施例提供的图像分类器的训练方法的流程示意图。如图5所示,该方法包括S301至S302。

S301、训练装置获取分类训练样本集,该分类训练样本集中包括多张信息识别码拍摄图像以及每一张拍摄图像对应的图像类别。

其中,图像类别可以为正常、模糊、低对比度、静区干扰、畸变、扭曲、污损、浓墨、缺失、欠墨或其他可能的类别。

可选的,为了便于区分拍摄图像对应的图像类别,该拍摄图像可以对应一个或多个子图像类别。

其中,子图像类别可以为例如重度模糊、轻微模糊、轻微扭曲等。

可选的,可以采用二分类和三分类混合的方式确定上述图像类别的多个子图像类别。其中,将图像分为正常或模糊即为二分类非分类方式。此外,将图像分为重度模糊、轻微模糊或者正常即为三分类的分类方式。

需要说明的是,采用二分类和三分类混合的方式,可以提升图像分类器的细粒度,以便于区分相近的图像类别。

此外,以图像类别“模糊”为例,若将“轻微模糊”的拍摄图像样本分为“正常”,“正常”对应的识别模型可能会对该样本中的信息识别码识码失败,因此“轻微模糊”与“重度模糊”的样本均可采用“模糊”对应的识别样本。

S302、训练装置根据分类训练样本集,对初始分类器进行训练,以获得图像分类器。

其中,图像分类器用于确定拍摄图像的图像类别。

在一些实施例中,根据分类训练样本集,对初始分类器进行训练过程包括:

S1、训练装置获取初始分类器和分类训练样本集。

S2、训练装置将分类训练样本集中第一图像输入待训练的初始分类器,得到第一图像的初始图像类别。第一图像为分类训练样本集中的任意一张信息识别码的拍摄图像。

S3、训练装置对比初始分类器输出的第一图像的初始图像类别和分类训练样本集中第一图像的图像类别,确定图像损失(loss)值。

S4、训练装置根据上述损失值调整初始分类器的模型参数。

S5、训练装置将分类训练样本集的另一张图像作为新的第一图像,并重复执行S1-S5,直到收敛为止。

其中,该另一张图像可以是上述的第一图像,也可以是分类训练样本集中除上述第一图像之外的任一图像,对此不作限定。

其中,训练装置可以基于初始分类器过程中每次输出的损失值确定模型是否收敛,或者基于训练次数确定是否收敛,本申请实施例对此不作限定。

例如,当损失值小于损失值阈值时,训练装置可以确定该分类器收敛。

再例如,训练次数超过次数阈值时,训练装置可以确定该分类器收敛。

这样,训练装置可以将收敛的分类器确定为训练完成的图像分类器。

在一些实施例中,若本申请提供的训练装置与上述识别装置为独立的两个设备,则在训练装置获得训练完成的图像分类器时,还可以向识别装置发送该图像分类器。

可选的,该图像分类器可以采用残差网络(residual neural network,ResNet)来实现。例如该图像分类器可以为ResNet50。

一般而言,卷积神经网络可以一般包括输入层、隐含层和输出层。其中,卷积神经网络的输入层可以处理多维数据。以图像处理为例,输入层可以接收图像的像素值(三维数组),即平面上的二维像素点和RGB通道的数值。卷积神经网络的隐含层包括一个或多个卷积层(convolutional layer)、一个或多个池化层(pooling layer),以及一个或多个全连接层(fully-connected layer)。其中,卷积层的功能是对输入数据进行特征提取。卷积层之后一般会连接池化层,从而在卷积层进行特征提取后,输出的数据被传递到池化层进行选择和信息过滤。全连接层的每一个结点都与上一层的所有结点相连,用于将获取到的特征综合起来,全连接层在整个卷积神经网络中起到“分类器”的作用。卷积神经网络的输出层,其结构和工作原理与传统前馈神经网络的输出相同。

残差网络是卷积神经网络中的一种,残差网络中包含有跳跃连接或者捷径连接(Short-cut Connection),即在神经网络中加入直连通道,将输入的原始图像信息直接传送到在后的网络层,如此,在后的网络层可以不用学习在前网络层输出的整个图像信息,直接学习在前网络层输出的残差即可。这样一来,残差网络连接的引入能够避免网络中的梯度消失现象,并且可以加速训练。

从而,在实际实现中,训练完成的图像分类器可以首先提取图片纹理、形状等图像特征,再将提取出的图像特征分别经过单层和双层空间金字塔池化,以获得较低维和较高维的特征。最终不同尺寸的全连接层处理,得到各个图像类别对应的置信度。

基于上述实施例,在信息识别码的识别过程中,首先确定获取到的信息识别码的拍摄图像的图像类别,进而基于该拍摄图像的图像类别,为该拍摄图像分配合适的识别模型(该图像类别对应的目标识别模型)。

基于本申请提供的技术方案,至少可以产生以下有益效果:本申请在安时积分法估计电池剩余电量的基础上,查找电池充电过程中,当前电流倍率下的容量增量曲线,获取该曲线上电池的当前容量增量对应的理论剩余电量(也即本申请中的第一剩余电量);然后再确定第一剩余电量和该电池的当前计算的剩余电量是否需要修正。在需要修正时,持续对后续确定出来的剩余电量进行修正,直至修正完成。相比较于开路电压曲线,容量增量曲线的峰值点较为明显,该曲线斜率较大,在曲线上查找得出的理论剩余电量更加准确,并且,无需长时间静置,更具实用性。此外,本申请提供的修正方法是在确定需要修正时,持续对确定出的电池剩余电量进行修正直至修正完成。如此,可以在修正过程中保持电池的剩余电量单调稳定变化,以实现平滑修正,不会出现电池的剩余电量跳变的情况。

上述主要从方法的角度对本申请实施例提供的方案进行了介绍。为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术目标应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术目标可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

如图6所示,为本申请实施例还提供的一种信息识别码的识别装置200的结构示意图。该装置200可以包括:获取模块201、处理模块202、训练模块203。

其中,获取模块201,用于获取信息识别码的拍摄图像和拍摄图像的图像类别。

处理模块202,用于根据拍摄图像的图像类别与预设对应关系,确定与拍摄图像的图像类别相对应的目标识别模型;其中,预设对应关系用于指示至少一个图像类别与至少一个识别模型之间的对应关系,目标识别模型属于至少一个识别模型。处理模块202,还用于将拍摄图像输入目标识别模型中,以解析拍摄图像中的信息识别码。

在一种可能的实现方式中,上述获取模块201,具体用于获取信息识别码的拍摄图像;处理模块,还用于将拍摄图像输入预先训练好的图像分类器中,确定拍摄图像的图像类别;其中,图像类别用于反映信息识别码的读码场景。

在另一种可能的实现方式中,上述处理模块202,具体用于:获取图像分类器输出的拍摄图像对于至少一个图像类别中各个图像类别的置信度,置信度用于指示拍摄图像属于图像类别的概率;根据各个图像类别的置信度的大小,将至少一个图像类别中的N个图像类别确定为拍摄图像的图像类别,N为正整数。

在又一种可能的实现方式中,上述处理模块202,具体用于:将图像类别按照置信度的大小降序排列,得到图像类别的排列结果;将排列结果中的前N个图像类别确定为拍摄图像的图像类别。

在又一种可能的实现方式中,若目标识别模型无法解析拍摄图像中的信息识别码,则处理模块202,还用于将拍摄图像输入全类型识别模型,以解析拍摄图像中的信息识别码;其中,全类型识别模型能够识别至少一个图像类别中所有图像类别的拍摄图像。

在又一种可能的实现方式中,至少一个图像类别包括正常、模糊,畸变,浓墨,欠墨,污损,低对比度,扭曲、缺失以及静区干扰中的一项或多项。

在又一种可能的实现方式中,在获取信息识别码的拍摄图像和拍摄图像的图像类别之前,获取模块201还用于获取第一识别模型,第一识别模型为至少一个识别模型中的其中一个。

在又一种可能的实现方式中,该装置还包括训练模块203,获取模块201还用于获取第一训练样本集,第一训练样本集中包括多张信息识别码的拍摄图像,拍摄图像的图像类别为第一图像类别,第一图像类别为至少一个图像类别中的其中一个;训练模块203,用于根据第一训练样本集,对初始识别模型进行训练,以获得第一识别模型。

在又一种可能的实现方式中,在获取拍摄图像的图像类别之前,获取模块201,还用于获取图像分类器,该图像分类器用于确定拍摄图像的图像类别。

在又一种可能的实现方式中,获取模块201,还用于获取分类训练样本集,分类训练样本集中包括多张信息识别码拍摄图像以及每一张拍摄图像对应的图像类别;训练模块203,还用于根据分类训练样本集,对初始分类器进行训练。

关于上述可选方式的具体描述可以参见前述的方法实施例,此处不再赘述。此外,上述提供的任一种信息识别码的识别装置200的解释以及有益效果的描述均可参考上述对应的方法实施例,不再赘述。

本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

需要说明的是,图6中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如,还可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

本申请还提供一种电子设备,用于执行上述提供的任意方法的实施例。如图7所示,该信息识别码的识别装置300包括处理器310,通信线路320以及通信接口330。

可选的,该信息识别码的识别装置300还可以包括存储器340。其中,处理器310,存储器340以及通信接口330之间可以通过通信线路320连接。

其中,处理器310可以是中央处理器(central processing unit,CPU)、通用处理器网络处理器(network processor,NP)、数字信号处理器(digital signal processing,DSP)、微处理器、微控制器、可编程逻辑器件(programmable logic device,PLD)或它们的任意组合。处理器310还可以是其它任意具有处理功能的装置,例如电路、器件或软件模块,不做限制。

在一种示例中,处理器310可以包括一个或多个CPU,例如图3中的CPU0和CPU1。

作为一种可选的实现方式,信息识别码的识别装置300包括多个处理器,例如,除处理器310之外,还可以包括处理器370。通信线路320,用于在信息识别码的识别装置300所包括的各部件之间传送信息。

通信接口330,用于与其他设备或其它通信网络进行通信。该其它通信网络可以为以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。通信接口330可以是模块、电路、收发器或者任何能够实现通信的装置。

存储器340,用于存储指令。其中,指令可以是计算机程序。

其中,存储器340可以是只读存储器(read-only memory,ROM)或可存储静态信息和/或指令的其他类型的静态存储设备,也可以是存取存储器(random access memory,RAM)或者可存储信息和/或指令的其他类型的动态存储设备,还可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备等,不予限制。

需要指出的是,存储器340可以独立于处理器310存在,也可以和处理器310集成在一起。存储器340可以用于存储指令或者程序代码或者一些数据等。存储器340可以位于信息识别码的识别装置300内,也可以位于信息识别码的识别装置300外,不做限制。

处理器310,用于执行存储器340中存储的指令,以实现本申请下述实施例提供的通信方法。例如,当信息识别码的识别装置300为终端或者终端中的芯片或者片上系统时,处理器310可以执行存储器340中存储的指令,以实现本申请提供的服务提供装置。

作为一种可选的实现方式,信息识别码的识别装置300还包括输出器件350和输入器件360。其中,输出器件350可以是显示屏、扬声器等能够将信息识别码的识别装置300的数据输出给用户的器件。

输入器件360可以是键盘、鼠标、麦克风或操作杆等能够向信息识别码的识别装置300输入数据的器件。

需要指出的是,图7中示出的结构并不构成对该计算装置的限定,除图7所示部件之外,该计算装置可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

本申请实施例还提供了一种计算机可读存储介质,包括计算机执行指令,当其在计算机上运行时,使得计算机执行上述实施例提供的任意一种方法。例如,图2中S101~S103的一个或多个特征可以由该计算机可读存储介质中储存的一个或多个计算机执行指令来承担。

本申请实施例还提供了一种包含计算机执行指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例提供的任意一种方法。

本申请实施例还提供了一种芯片,包括:处理器和接口,处理器通过接口与存储器耦合,当处理器执行存储器中的计算机程序或计算机执行指令时,使得上述实施例提供的任意一种方法被执行。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。

尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

技术分类

06120115635828