导航：首页> 机床；其他类目中不包括的金属加工>图像识别方法、图像识别装置、电子装置与图像识别平台

图像识别方法、图像识别装置、电子装置与图像识别平台

文献发布时间：2024-01-17 01:26:37

技术领域

本申请涉及图像识别技术领域，具体而言，涉及一种图像识别方法、图像识别装置、计算机可读存储介质、电子装置和图像识别平台。

背景技术

近年来，随着人工智能技术的发展与普及，智能字符识别(IntelligentCharacter Recognition，简称ICR)被大量用于银行各项业务的各类证件、票据影像的结构化文本数据提取。随着票据识别应用场景的不断激增，需要一种能够对票据识别模型快速部署的方法，以对不同的票据进行识别，进而实现票据识别技术规模化应用的目标。

现有的票据识别模型图像识别方法，主要分为两种：

第一种，根据票据识别模型所依赖的基础环境信息，在服务器上安装及配置相应的图形计算加速卡驱动、并行计算框架以及深度神经网络加速库等众多依赖项，再进行票据识别模型的部署及调试，从而用于对不同的票据进行识别。此类票据识别模型的部署方法，无需对票据识别模型进行封装，也无需规范票据识别模型的运行环境。但在每次部署时，需根据票据识别模型所需的版本信息，对运行环境中的依赖项(即图形计算加速卡驱动、并行计算框架以及深度神经网络加速库)进行安装和配置。

第二种，基于Kubernetes技术，搭建Kubernetes集群，并完成图形计算加速卡驱动、并行计算框架及深度神经网络加速库等依赖项的安装及配置。再将票据识别模型所依赖的基础环境信息(即模型环境文件以及基础配置文件)封装到容器中。在每次需部署票据识别模型时，便无需再次重新安装及配置众多的依赖项。该票据识别模型的部署方法，当Kubernetes集群基础环境及依赖项版本与票据识别模型所需的依赖项版本信息不匹配，若当前版本高于已安装版本则需要更新依赖项版本；若当前版本低于已安装版本则需要更新基础镜像。

上述所提及的票据识别模型的部署方法均存在着部署效率较低，时间成本以及人力成本较大的问题。

发明内容

本申请的主要目的在于提供一种图像识别方法、图像识别装置、计算机可读存储介质、电子装置和图像识别平台，以至少解决现有技术中票据识别模型的部署效率较低的问题。

为了实现上述目的，根据本申请的一个方面，提供了一种图像识别方法，接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；采用所述目标镜像服务对所述目标图像进行识别。

可选地，所述基础配置文件至少包括：图形加速卡驱动、并行计算框架以及深度神经网络加速库，所述图形加速卡驱动为图像加速卡的驱动。

可选地，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，包括：创建Docker文件，并将所述基础配置文件的存储位置以及版本信息写入所述Docker文件中，得到更新后的所述Docker文件；读取更新后的所述Docker文件，以对所述模型环境文件的存储位置进行映射，得到所述基础服务镜像。

可选地，基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，包括：基于所述目标深度学习模型文件的标签信息，从所述基础服务镜像中加载与所述目标深度学习模型文件相匹配的所述模型环境文件；基于与所述目标深度学习模型文件相匹配的所述模型环境文件以及所述基础配置文件，启动所述目标深度学习模型文件，得到所述目标镜像服务。

可选地，采用所述目标镜像服务对所述目标图像进行识别，包括：接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到目标字符串，所述JSON格式数据报文包含请求标识符及对所述目标图像采用Base64编码方式进行编码得到的所述目标字符串；根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果，字符串格式的所述识别结果至少包括所述目标图像上的文字信息。

可选地，接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到目标字符串，包括：基于RESTful接口接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到所述目标字符串。

可选地，根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果之后，所述图像识别方法还包括以下之一：通过RESTful接口，将字符串格式的识别结果发送至对应的可视化界面上，以在所述可视化界面上显示字符串格式的识别结果；将字符串格式的识别结果存储至目标介质中，所述目标介质包括以下至少之一：EXCEL文本、数据库。

根据本申请的另一方面，提供了一种图像识别装置，第一接收单元，用于接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；构建单元，用于基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；第二接收单元，用于接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；识别单元，用于采用所述目标镜像服务对所述目标图像进行识别。

根据本申请的再一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的图像识别方法。

根据本申请的又一方面，提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行任意一种所述的图像识别方法。

根据本申请的一方面，提供了一种电子装置，所述图像识别平台是基于Kubernetes集群构建的，所述图像识别平台包括：可视化界面；图像识别装置，所述图像识别装置与所述可视化界面通信，所述图像识别装置用于执行任意一种所述的图像识别方法。

应用本申请的技术方案，首先，基于接收到的模型环境文件以及基础配置文件构建基础服务镜像；然后，在接收到目标深度学习模型文件的情况下，基于接收到的目标深度学习模型文件以及基础服务镜像，构建目标镜像服务。本申请的图像识别方法中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。再基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1示出了本申请的实施例中提供的一种执行图像识别方法的移动终端的硬件结构框图；

图2示出了本申请的实施例提供的一种图像识别方法的流程图；

图3示出了本申请的实施例提供的一种构建基础服务镜像的流程图；

图4示出了本申请的实施例提供的一种构建目标镜像服务的流程图；

图5示出了本申请的实施例提供的一种目标镜像服务部署的流程图；

图6示出了本申请的实施例提供的一种图像识别装置的结构示意图。

其中，上述附图包括以下附图标记：

102、处理器；104、存储器；106、传输设备；108、输入输出设备；100、服务接口层；200、模型适配层；300、深度学习模型层。

具体实施方式

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了便于描述，以下对本申请实施例涉及的部分名词或术语进行说明：

智能字符识别(Intelligent Character Recognition，简称ICR)：在光学字符识别(Optical Character Recognition，简称OCR)的基础上，引入计算机深度学习的人工智能技术。采用语义推理和语义分析，并根据字符上下文的语句信息，进行未识别部分的字符信息补全，为光学字符识别的改进技术。

容器化部署：将软件代码和所需的所有组件(例如库、框架和其他依赖项)封装在一起。让它们隔离在对应的容器中，使得容器具备程序运行的基础依赖项。

Kubernetes：一种开源的容器编排引擎技术，具备自动化部署、规模化应用、服务可伸缩以及容器管理等优势特征。

Pod：Kubernetes集群服务器中能够创建、调度、管理的最小部署单元，其通常是一组容器的集合。

正如背景技术中所介绍的，现有技术中票据识别模型的部署效率较低，为解决所述的问题，本申请的实施例提供了一种图像识别方法、图像识别装置、计算机可读存储介质、电子装置和图像识别平台。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例，图1是本发明实施例的一种图像识别方法的移动终端的硬件结构框图。如图1所示，移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104，其中，所述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对所述移动终端的结构造成限定。例如，移动终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。

存储器104可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的图像识别方法对应的计算机程序，处理器102通过运行存储在存储器104内的计算机程序，从而执行各种功能应用以及数据处理，即实现所述的方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至移动终端。所述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输设备106用于经由一个网络接收或者发送数据。所述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中，传输设备106包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备106可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。

在本实施例中提供了一种运行于移动终端、计算机终端或者类似的运算装置的图像识别方法，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图2是根据本申请实施例的图像识别方法的流程图。如图2所示，该图像识别方法包括以下步骤：

步骤S201，接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；

具体地，TensorFlow文件为TensorFlow的文件，而TensorFlow是一个基于数据流编程(Dataflow Programming)的符号数学系统，被广泛应用于各类机器学习(MachineLearning)算法的编程实现，其前身是神经网络算法库。Pytorch文件为Pytorch的文件，而Pytorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。MXNet文件为MXNet的文件，而MXNet为一个灵活且可扩展的深度学习框架。

在实际的应用过程中，基础配置文件也可以目标深度学习模型文件运行所需的依赖项。

所述步骤S201中，可以通过对作用在可视化界面上的第一预定操作进行响应，接收模型环境文件以及基础配置文件，即用户可以点击可视化界面上对应的上传控件，将模型环境文件以及基础配置文件上传至图像识别平台。

步骤S202，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；

具体地，基础服务镜像为包括模型环境文件以及基础配置文件的镜像(Mirroring)。镜像是一种文件存储形式，是冗余的一种类型，一个磁盘上的数据在另一个磁盘上存在一个完全相同的副本即为镜像。可以把许多文件做成一个镜像文件，与GHOST等程序放在一个盘里用GHOST等软件打开后，又恢复成许多文件。

步骤S203，接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；

在所述步骤S203中，目标深度学习模型文件可以为身份证识别模型文件、营业执照识别模型文件、机动车驾驶证识别模型文件、机动车行驶证识别模型文件、不动产权证书识别模型文件、不动产登记证明识别模型文件等等。当然，所述目标深度学习模型文件并不限于所述所提及的各个场景的模型文件，还可以为其他的模型文件。

具体地，通过对作用在可视化界面上的第二预定操作进行响应，接收目标深度学习模型文件。

步骤S204，采用所述目标镜像服务对所述目标图像进行识别。

通过本实施例，首先，基于接收到的模型环境文件以及基础配置文件构建基础服务镜像；然后，在接收到目标深度学习模型文件的情况下，基于接收到的目标深度学习模型文件以及基础服务镜像，构建目标镜像服务。本申请的图像识别方法中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。再基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

具体实现过程中，为了进一步地保证目标镜像服务在对目标图像进行识别的过程中，计算量较大导致的识别效率较差的问题，所述步骤S201的所述基础配置文件至少包括：图形加速卡驱动、并行计算框架以及深度神经网络加速库，所述图形加速卡驱动为图像加速卡的驱动。

当然，在实际的应用过程中，所述基础配置文件并不限于包括图形加速卡驱动、并行计算框架以及深度神经网络加速库，还可以为其他的基础配置文件，例如，GPU(图形处理器，Graphics Processing Unit，简称GPU)驱动程序、CUDA(Compute Unified DeviceArchitecture)工具包等等。

为了较为简单地构建出基础服务镜像，本申请的所述步骤S202可以通过步骤S2021以及步骤S2022来实现。具体地：

步骤S2021，创建Docker文件，并将所述基础配置文件的存储位置以及版本信息写入所述Docker文件中，得到更新后的所述Docker文件；

步骤S2022，读取更新后的所述Docker文件，以对所述模型环境文件的存储位置进行映射，得到所述基础服务镜像。

本申请的一种具体的实施例中，如图3所示，基础服务镜像的构建过程是基于Kubernetes的Docker文件(Dockerfile)来实现的，Dockerfile是一个包含用于组合映像的命令的文本文档，Kubernetes通过读取Dockerfile中的指令自动生成映像。具体过程为：1、创建Dockerfile；2、指定基础配置文件的存储位置(存储路径)以及版本信息；3、挂载TensorFlow文件、Pytorch文件以及MXNet文件的存储位置(存储路径)。其中，指定基础配置文件的存储位置(存储路径)以及版本信息，即将基础配置文件的存储位置以及版本信息写入Dockerfile中，得到更新后的Dockerfile。而挂载TensorFlow文件、Pytorch文件以及MXNet文件的存储位置(存储路径)，即为通过对更新后的Dockerfile进行读取，将对模型环境文件(TensorFlow文件、Pytorch文件以及MXNet文件)的存储位置进行映射，作为镜像的存储卷，以便于后续能够访问到模型文件。

本申请所涉及的Kubernetes技术，其调度的最基本单位Pod，而本申请中的基础服务镜像则是运行于Pod上，这也是实现票据识别模型快速部署的关键之一。

步骤S2031，基于所述目标深度学习模型文件的标签信息，从所述基础服务镜像中加载与所述目标深度学习模型文件相匹配的所述模型环境文件；

步骤S2032，基于与所述目标深度学习模型文件相匹配的所述模型环境文件以及所述基础配置文件，启动所述目标深度学习模型文件，得到所述目标镜像服务。

本申请的一种具体的实施例中，在完成基础服务镜像的构建后，若要启动图像识别服务(目标镜像服务)，则需要创建一个新服务。在创建该新服务的过程中，首先需使用Kubernetes技术创建容器，之后加载所述已构建完成的基础服务镜像，以完成目标镜像服务的启动。具体过程如图4所示。1、执行镜像启动命令，即在图像识别平台的可视化操作界面发起，再由Kubernetes集群进行调度，加载已构建完成的基础服务镜像，执行启动命令。2、加载启动脚本，即在启动图像识别服务(目标镜像服务)时，还需要配置服务端口、服务线程数等信息。3、确定目标深度学习模型文件的标签信息，在启动图像识别服务时，根据目标深度学习模型文件的标签信息，判断确定对应的框架文件。4、启动目标镜像服务，在完成模型框架判断后，启动相应的模型服务。

在实际的应用过程中，所述的标签信息用于表示对对应的目标深度学习模型文件进行标记，以标记出对应的目标深度学习模型文件对应的框架文件。当然，在本申请中，并不对标签信息具体的表现形式进行限制，所述的标签信息可以采用现有技术中任何可行的表现形式。

在一些实际的应用过程中，所述步骤S204还可以通过如下步骤来实现：接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到目标字符串，所述JSON格式数据报文包含请求标识符及对所述目标图像采用Base64编码方式进行编码得到的所述目标字符串；根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果，字符串格式的所述识别结果至少包括所述目标图像上的文字信息，这样进一步地实现了较为高效地对目标图像进行识别。

具体地，可以通过对作用在可视化界面的第三预定操作进行响应，接收目标图像，即用户可以点击可视化界面上对应的上传控件，将目标图像(待识别的图像)上传至图像识别平台。

本申请的一种具体的实施例中，如图5所示，在构建目标镜像服务为的票据识别服务时，自顶向下依次可以包括：服务接口层100、模型适配层200、深度学习模型层300。其中，服务接口层提供遵循RESTful设计规范的统一票据识别服务，将深度学习模型推理服务转换成RESTful API。模型适配层提供异构深度学习框架模型加载能力，实现TensorFlow文件、Pytorch文件、MXNet文件的加载。深度学习模型层提供TensorFlow文件、Pytorch文件、MXNet文件的等深度学习模型框架运行环境的支持，支撑TensorFlow文件、Pytorch文件、MXNet文件等深度学习模型推理服务的运行。

为了能够进一步地提供统一的票据识别服务，在一种具体的实施例中，接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到目标字符串，包括：基于RESTful接口接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到所述目标字符串。也就是说，该实施例通过RESTful接口，接收目标图像的JSON格式数据报文，再对JSON格式数据报文进行识别，得到目标字符串，这样使得后续目标镜像服务可以较好以及较为准确地对目标图像进行识别，进一步地保证后续得到的识别结果较为准确。

本申请的一种具体的实施例中，所述的JSON格式数据报文的具体表现形式可以为：{“requestSn”:“00001”,“image_base64”:“\9j……”}。

在一些实现过程中，根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果之后，所述图像识别方法还包括以下之一：通过RESTful接口，将字符串格式的识别结果发送至对应的可视化界面上，以在所述可视化界面上显示字符串格式的识别结果；将字符串格式的识别结果存储至目标介质中，所述目标介质包括以下至少之一：EXCEL文本、数据库。在该实施例中，为了进一步地保证用户的使用体验较好，以及可读性较高，在得到识别结果后，还可以通过RESTful接口，将识别结果发送至对应的可视化界面上，以使得可视化界面对识别结果进行显示。另外，为了方便后续进行查询，还可以将字符串格式的识别结果存储至目标介质中。

本申请的一种具体的实施例中，字符串格式的识别结果的具体表现形式可以为{name:XXX；birthday:XXX；}。

本申请实施例还提供了一种图像识别方法装置，需要说明的是，本申请实施例的图像识别方法装置可以用于执行本申请实施例所提供的用于图像识别方法。该装置用于实现所述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

以下对本申请实施例提供的图像识别方法装置进行介绍。

图6是根据本申请实施例的图像识别方法装置的结构示意图。如图6所示，该图像识别装置包括：

第一接收单元10，用于接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；

在实际的应用过程中，基础配置文件也可以目标深度学习模型文件运行所需的依赖项。

具体地，可以通过对作用在可视化界面上的第一预定操作进行响应，接收模型环境文件以及基础配置文件，即用户可以点击可视化界面上对应的上传控件，将模型环境文件以及基础配置文件上传至图像识别平台。

构建单元20，用于基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；

第二接收单元30，用于接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；

具体地，目标深度学习模型文件可以为身份证识别模型文件、营业执照识别模型文件、机动车驾驶证识别模型文件、机动车行驶证识别模型文件、不动产权证书识别模型文件、不动产登记证明识别模型文件等等。当然，所述目标深度学习模型文件并不限于所述所提及的各个场景的模型文件，还可以为其他的模型文件。

具体地，通过对作用在可视化界面上的第二预定操作进行响应，接收目标深度学习模型文件。

识别单元40，用于采用所述目标镜像服务对所述目标图像进行识别。

通过本实施例，首先，构建单元用于基于接收到的模型环境文件以及基础配置文件构建基础服务镜像；第二接收单元用于在接收到目标深度学习模型文件的情况下，基于接收到的目标深度学习模型文件以及基础服务镜像，构建目标镜像服务。本申请的图像识别装置中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。识别单元用于基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

具体实现过程中，为了进一步地保证目标镜像服务在对目标图像进行识别的过程中，计算量较大导致的识别效率较差的问题，所述基础配置文件至少包括：图形加速卡驱动、并行计算框架以及深度神经网络加速库，所述图形加速卡驱动为图像加速卡的驱动。

为了较为简单地构建出基础服务镜像，本申请的构建单元包括创建模块和读取模块，其中，创建模块用于创建Docker文件，并将所述基础配置文件的存储位置以及版本信息写入所述Docker文件中，得到更新后的所述Docker文件；读取模块用于读取更新后的所述Docker文件，以对所述模型环境文件的存储位置进行映射，得到所述基础服务镜像。

本申请所涉及的Kubernetes技术，其调度的最基本单位Pod，而本申请中的基础服务镜像则是运行于Pod上，这也是实现票据识别模型快速部署的关键之一。

在一些实施例上，在创建基础服务镜像之后，若要启动一个新服务，则需要基于对应的目标深度学习模型文件，创造目标镜像服务。由于在基础服务镜像中已包括了TensorFlow文件、Pytorch文件以及MXNet文件这三种深度学习模型的框架文件(或者称之为环境文件)，而在创件目标镜像服务时，则可能只需要使用其中一种框架文件即可，故为了较为简单地实现创建目标镜像服务，所述第二接收单元包括加载模块和启动模块，其中，加载模块用于基于所述目标深度学习模型文件的标签信息，从所述基础服务镜像中加载与所述目标深度学习模型文件相匹配的所述模型环境文件；启动模块用于基于与所述目标深度学习模型文件相匹配的所述模型环境文件以及所述基础配置文件，启动所述目标深度学习模型文件，得到所述目标镜像服务。

在一些实际的应用过程中，所述识别单元包括接收模块和识别模块，其中，接收模块用于接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到目标字符串，所述JSON格式数据报文包含请求标识符及对所述目标图像采用Base64编码方式进行编码得到的所述目标字符串；识别模块用于根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果，字符串格式的所述识别结果至少包括所述目标图像上的文字信息，这样进一步地实现了较为高效地对目标图像进行识别。

为了能够进一步地提供统一的票据识别服务，在一种具体的实施例中，所述接收模块包括构建子模块，用于基于RESTful接口接收所述目标图像的JSON格式数据报文，并对所述JSON格式数据报文进行识别，得到所述目标字符串。也就是说，该实施例通过RESTful接口，接收目标图像的JSON格式数据报文，再对JSON格式数据报文进行识别，得到目标字符串，这样使得后续目标镜像服务可以较好以及较为准确地对目标图像进行识别，进一步地保证后续得到的识别结果较为准确。

本申请的一种具体的实施例中，所述的JSON格式数据报文的具体表现形式可以为：{“requestSn”:“00001”,“image_base64”:“\9j……”}。

在一些实现过程中，所述图像识别装置还包括以下之一：发送单元和存储单元。其中，发送单元用于根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串进行识别，得到字符串格式的识别结果之后，通过RESTful接口，将字符串格式的识别结果发送至对应的可视化界面上，以在所述可视化界面上显示字符串格式的识别结果；所述存储单元用于将字符串格式的识别结果存储至目标介质中，所述目标介质包括以下至少之一：EXCEL文本、数据库。在该实施例中，为了进一步地保证用户的使用体验较好，以及可读性较高，在得到识别结果后，还可以通过RESTful接口，将识别结果发送至对应的可视化界面上，以使得可视化界面对识别结果进行显示。另外，为了方便后续进行查询，还可以将字符串格式的识别结果存储至目标介质中。

本申请的一种具体的实施例中，字符串格式的识别结果的具体表现形式可以为{name:XXX；birthday:XXX；}。

所述图像识别方法装置包括处理器和存储器，所述第一接收单元、构建单元、第二接收单元以及识别单元等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的所述程序单元来实现相应的功能。所述模块均位于同一处理器中；或者，所述各个模块以任意组合的形式分别位于不同的处理器中。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来解决现有技术中票据识别模型的部署效率较低的问题。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行所述图像识别方法。

具体地，图像识别方法包括：

在实际的应用过程中，基础配置文件也可以目标深度学习模型文件运行所需的依赖项。

步骤S202，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；

具体地，通过对作用在可视化界面上的第二预定操作进行响应，接收目标深度学习模型文件。

步骤S204，采用所述目标镜像服务对所述目标图像进行识别。

可选地，所述基础配置文件至少包括：图形加速卡驱动、并行计算框架以及深度神经网络加速库，所述图形加速卡驱动为图像加速卡的驱动。

可选地，根据运行在Kubernetes集群上的所述目标镜像服务，对所述目标字符串信息进行识别，得到字符串格式的识别结果之后，所述图像识别方法还包括以下之一：通过RESTful接口，将字符串格式的识别结果发送至对应的可视化界面上，以在所述可视化界面上显示字符串格式的识别结果；将字符串格式的识别结果存储至目标介质中，所述目标介质包括以下至少之一：EXCEL文本、数据库。

本发明实施例提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述的图像识别方法。

具体地，图像识别方法包括：

在实际的应用过程中，基础配置文件也可以目标深度学习模型文件运行所需的依赖项。

步骤S202，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；

具体地，通过对作用在可视化界面上的第二预定操作进行响应，接收目标深度学习模型文件。

步骤S204，采用所述目标镜像服务对所述目标图像进行识别。

本申请的一种典型的实施例中，还提供了一种图像识别平台，所述图像识别平台是基于Kubernetes集群构建的，所述图像识别平台包括：可视化界面；图像识别装置，所述图像识别装置与所述可视化界面通信，所述图像识别装置用于执行任意一种所述的图像识别方法。

所述的图像识别平台包括可视化界面和图像识别装置，其中，所述图像识别装置与所述可视化界面通信，所述图像识别装置用于执行任意一种所述的图像识别方法。所述图像识别方法中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。再基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

为了使得本领域技术人员能够更加清楚地了解本申请的技术方案，以下将结合具体的实施例对本申请的图像识别平台的实现过程进行详细说明。

本实施例涉及一种具体的图像识别平台，包括如下步骤：

步骤S1：通过对作用在可视化界面上的第一预定操作进行响应，接收模型环境文件以及基础配置文件。

步骤S2：基于模型环境文件以及基础配置文件，构建基础服务镜像。

步骤S3：通过对作用在可视化界面上的第二预定操作进行响应，接收目标深度学习模型文件。

步骤S4：基于目标深度学习模型文件以及基础服务镜像，构建目标镜像服务。构建目标镜像服务的具体过程包括：基于目标深度学习模型文件的标签信息，从基础服务镜像中加载与目标深度学习模型文件相匹配的模型环境文件(即TensorFlow文件、Pytorch文件以及MXNet文件中的一个或者多个)；基于与目标深度学习模型文件相匹配的模型环境文件以及基础配置文件，启动目标深度学习模型文件，得到目标镜像服务。

步骤S5：通过对作用在可视化界面上的第三预定操作进行响应，基于RESTful接口接收目标图像(待识别图像)。

步骤S6：采用目标镜像服务，对目标字符串信息(通过RESTful接口，对目标图像转换后得到的)进行识别，得到识别结果，并通过RESTful接口，将字符串格式的识别结果发送至对应的可视化界面上，以在可视化界面上显示字符串格式的识别结果；和/或，将字符串格式的识别结果存储至目标介质中。

本申请通过构建基础服务镜像及目标镜像服务(票据识别服务)，统一了票据识别服务运行所需的基础环境，实现票据识别服务的一键部署、开箱即用，有效降低票据识别模型应用的门槛，减少深度学习专业技术人员的依赖；以及构建基础服务镜像，适配异构深度学习框架模型，实现TensorFlow、Pytorch、MXNet多种深度学习框架模型的支持，从而有效解决了票据识别模型部署过程中，票据识别模型部署工作量大、时间长的问题，票据识别模型涉及的深度学习框架多样，模型复用难、规模化应用难；以及票据识别模型应用对专业人员技术要求较高的问题。

本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行程序时实现至少以下步骤：步骤S201，接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；步骤S202，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；步骤S203，接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；步骤S204，采用所述目标镜像服务对所述目标图像进行识别。

本文中的设备可以是服务器、PC、PAD、手机等。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有至少如下方法步骤的程序：步骤S201，接收模型环境文件以及基础配置文件，所述模型环境文件至少包括TensorFlow文件、Pytorch文件以及MXNet文件，所述基础配置文件为深度学习模型运行所需的环境相关的配置文件，所述模型环境文件的版本信息与所述基础配置文件的版本信息相匹配；步骤S202，基于所述模型环境文件以及所述基础配置文件，构建基础服务镜像，所述基础服务镜像为所述模型环境文件与所述基础配置文件的冗余备份；步骤S203，接收目标深度学习模型文件，并基于所述目标深度学习模型文件以及所述基础服务镜像，构建目标镜像服务，所述目标深度学习模型文件为用于对目标图像进行识别的深度学习模型文件；步骤S204，采用所述目标镜像服务对所述目标图像进行识别。

显然，本领域的技术人员应该明白，所述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

从以上的描述中，可以看出，本申请所述的实施例实现了如下技术效果：

1)、本申请的图像识别方法中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。再基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

2)、本申请的图像识别装置中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。识别单元用于基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

3)、本申请的图像识别平台包括可视化界面和图像识别装置，其中，所述图像识别装置与所述可视化界面通信，所述图像识别装置用于执行任意一种所述的图像识别方法。所述图像识别方法中，基于接收到的模型环境文件以及基础配置文件，构建得到基础服务镜像，且模型环境文件的版本信息与基础配置文件的版本信息相匹配，这样在构建目标镜像服务时便无需安装对应的模型环境文件以及对应的基础配置文件，且也可以保证目标深度学习模型文件所需的基础配置文件与目标深度学习模型文件版本相兼容，这样保证了得到目标镜像服务的效率较高，降低了票据识别模型应用的门槛，减少深度学习专业技术人员的依赖，从而解决了现有技术中对票据识别模型的部署方法均存在着部署效率较低。再基于构建的目标镜像服务对目标图像进行识别，这样保证了对目标图像的识别效率较高。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：朱峰;洪文焕;陆俊;高丽伟;李浚昱;陈嘉远;刘俊丽;
专利申请人：中国邮政储蓄银行股份有限公司;

上一篇：一种汽车座椅骨架焊接装置
下一篇：一种过量空气系数变化对锅炉热效率影响的定量计算方法