导航：首页> 炉；窑；烘烤炉；蒸馏炉〔4〕>一种基于PaddleOCR的图像识别模型训练及分析方法

一种基于PaddleOCR的图像识别模型训练及分析方法

文献发布时间：2023-06-19 16:09:34

技术领域

本发明涉及OCR识别技术领域，具体涉及一种基于PaddleOCR的图像识别模型训练及分析方法。

背景技术

近年来计算机视觉技术快速发展，图片文字的OCR识别成为热门方向，目前常规文本识别，自然场景下文本识别，安防领域中的身份证识别，金融领域中票据银行卡识别等背景下的OCR识别研究较多，并且已经有成熟的应用。OCR识别技术的实现主要依赖于深度学习框架，如TensorFlow，caffe和Paddle等框架，在框架中搭建识别的网络模型，通过大量数据对模型进行优化训练，进而实现通过模型识别文字。

已有OCR识别方法针对不同应用场景的兼容性不高，且在需要进行文本校验与信息提取工作时还需人工进行检验与提取工作，人工成本高、效率低下。

发明内容

本发明的目的在于克服现有技术的不足，提供一种基于PaddleOCR的图像识别模型训练及分析方法，可实现对政税终端用户、智能柜台用户、互联网用户的OCR识别功能，该方法统一、便捷、高效，无需人工操作。

本发明的技术方案如下：

一种基于PaddleOCR的图像识别模型训练及分析方法，包括以下步骤：

a、外部用户接入深度学习OCR系统；

b、深度学习OCR系统获取模型配置，根据外部用户传入的参数配置数据；

c、根据类型代码获取配置数据对象列表；

d、根据配置数据对象个数，循环调用OCR识别，获取识别结果；

e、将识别结果汇总，并筛选出最优结果；

f、然后根据需求进行后处理操作；

g、最后统一封装返回对象进行返回处理。

所述外部用户包括政税终端用户、智能柜台用户、互联网用户。

步骤a中，深度学习OCR系统通过OCR识别接口接入外部用户。

所述深度学习OCR系统包括Java端和Python端，Java端负责步骤b、步骤c，Python端负责步骤d。

步骤d中，OCR识别调用流程包括以下步骤：

d1、对待训练数据进行数据标注操作；

d2、根据实际情况修改训练配置并开始训练模型；

d3、最后进行模型转换。

相对于现有技术，本发明的有益效果在于：

本发明可广泛用于政务、税务、金融等各个领域，通过统一的标准化接口，实现对政务材料的鉴别、税务票号的识别以及金融银行卡的识别等功能，最终达成产品的AI赋能目标。

本发明可实现对政税终端用户、智能柜台用户、互联网用户的OCR识别功能，该方法统一、便捷、高效，无需人工操作。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种基于PaddleOCR的图像识别模型训练及分析方法的流程示意图；

图2为本发明OCR识别调用的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例

请参阅图1，本实施例提供一种基于PaddleOCR的图像识别模型训练及分析方法，包括以下步骤：

a、深度学习OCR系统通过OCR识别接口接入外部用户；

所述外部用户包括政税终端用户、智能柜台用户、互联网用户；

所述深度学习OCR系统包括Java端和Python端；

b、Java端获取模型配置，根据外部用户传入的参数配置数据；

c、Java端根据类型代码获取配置数据对象列表；

d、Python端根据配置数据对象个数，循环调用OCR识别，获取识别结果；

e、将识别结果汇总，并筛选出最优结果；

f、然后根据需求进行后处理操作；

g、最后统一封装返回对象进行返回处理。

如图2所示，OCR识别调用流程具体包括以下步骤：

d1、对待训练数据进行数据标注操作；

d2、根据实际情况修改训练配置并开始训练模型；

d3、最后进行模型转换。

该方法通过OCR识别接口予政税终端用户、智能柜台用户及互联网用户实现OCR识别能力，整个过程统一、便捷、高效，无需人工操作。

以上仅为本发明的较佳实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：梁沛森;陈锦锋;钟建琛;李文浩;陈武聪;邓耀隆;
专利申请人：广东金赋科技股份有限公司;

上一篇：一种利用冶炼棕刚玉的余热进行烘包的方法
下一篇：基于低频次谐波补偿的单相级联H桥光伏逆变器控制策略