导航：首页> 水利工程；基础；疏浚>一种基于OCR的云手机文字内容监管方法和系统和系统

一种基于OCR的云手机文字内容监管方法和系统和系统

文献发布时间：2023-06-19 12:07:15

技术领域

本发明涉及图像文字内容监管技术领域，特别涉及一种基于OCR的云手机文字内容监管方法和系统。

背景技术

随着5G通信技术的迅猛发展和普及的背景下，云手机技术得到迅猛发展，云手机也越来越走向实用，随之而来的是云手机文字内容监管问题有待解决。如何有效且实时的对云手机文字内容进行监管对于避免网络暴力、淫秽信息等不良信息在网上泛滥，营造良好的网络环境变得越发重要。

目前，在云手机文字内容监管方面还存在空白。在一般文字内容监管方面，目前存在以下几种实现方案：

(1)基于传统机器学习方法实现的文字内容监管，其主要缺点是时效性差，不能做到对文字内容的实时监测；

(2)基于深度学习方法实现的文字内容监管，其主要实现流程为检测出单个字符并进行识别，不能应付文字量较大的情形。

现有的文字内容监管方法主要有两种，第一种基于传统计算机视觉方法实现，其主要针对小数据量场景，适用于字库量小的场景，在数据量较大的时候效果较差。第二种基于深度学习方法实现，其基于单个字符的检测和识别，检测识别效率低，不适用于大规模文字内容监管场景。

因此，现有技术存在问题，需要进一步改进。

发明内容

针对现有技术存在的问题，本发明提供一种基于OCR的云手机文字内容监管方法和系统。

为实现上述目的，本发明的具体方案如下：

提供一种基于OCR的云手机文字内容监管方法，包括如下步骤：

S1，输入截屏图片；

S2，OCR文本行检测；

S3，OCR文本行识别；

S4，违规信息检索和判断；

S5，处理下一帧。

进一步地，步骤S4还包括，判断到有违规信息，警告或报警处理；判断没有违规信息，直接进入下一帧。

进一步地，步骤S2，OCR文本行检测采用DBNet文本行检测算法，该算法包括如下步骤：

S21，输入截屏图片；

S22，提取图片金字塔特征；

S23，特征图上采样和特征融合；

S24，生成概率图和阈值图；

S25，由概率图和阈值图生成二值图；

S26，生成预测结果。

进一步地，步骤S3，OCR文本行识别采用CRNN算法，包括如下步骤：

S31，输入文本行图像；

S32，CNN提取特征；

S33，LSTM级联特征；

S34，输出识别文本行。

进一步地，步骤S4违规信息检索采用为敏感信息比对流程，包括如下步骤：S41，输入文本信息；

S42，提取关键词信息；

S43，关键词信息比对；

S44，输出是否包含敏感词信息。

进一步地，步骤S41提取关键词信息采用NLP算法提取关键词信息，包括如下步骤：

S421，构建敏感信息词库；

S422，训练NLP关键词提取模型；

S423，使用训练好的关键词提取模型处理输入图片中的所有文本信息；

S424，判断是否有敏感信息词库中的关键词出现在文本信息中，若有则输出文本信息中包含的关键词，若无则输出“None”。

提供一种基于OCR的云手机文字内容监管系统，包括文本信息处理模块、文本信息比对模块和敏感信息词库；

文本信息处理处理模块由文本行检测模块和文本行识别模块组成，其功能为处理云手机截屏图片，输出图片中包含的所有的文字信息；文本信息比对模块由敏感信息比对模块组成，其功能为将文本信息处理模块输出的文本信息与敏感信息词库比对，对出现了敏感信息的情况做警告或者报警处理。

采用本发明的技术方案，具有以下有益效果：

本发明公开了一种基于OCR的云手机文字内容监管方法和系统，包括文本信息处理模块、文本信息比对模块和敏感信息词库；其能够实时处理云手机截屏数据，采用基于文本行的检测和识别算法，对截屏数据进行文本行检测、文本行识别、敏感文字信息比对，并对云手机用户截屏数据中存在的违规文字内容进行预警和警告处理，维护良好的网络环境。

附图说明

图1是本发明具体实施方式的系统架构组成图；

图2是本发明具体实施方式的系统处理流程图；

图3是本发明具体实施方式的本行检测算法流程图；

图4是本发明具体实施方式的文本行识别算法流程图；

图5是本发明具体实施方式的敏感信息比对流程图；

图6是本发明具体实施方式的NLP算法提取关键词信息流程图。

具体实施方式

以下结合附图和具体实施例，对本发明进一步说明。

结合图1-图6：本发明的方法原理/步骤概述

本发明系统架构组成如图1所示。系统总的架构由文本信息处理模块和文本信息比对模块以及敏感信息词库组成。文本信息处理处理模块由文本行检测模块和文本行识别模块组成，其功能为处理云手机截屏图片，输出图片中包含的所有的文字信息。文本信息比对模块由敏感信息比对模块组成，其功能为将文本信息处理模块输出的文本信息与敏感信息词库比对，对出现了敏感信息的情况做警告或者报警处理。

本发明处理流程如图2所示。本发明流程由截屏数据读取、截屏数据文本行检测、文本行识别、违规信息检索和违规信息警告和报警等流程组成。

云手机截屏图片首先经过文本行检测，检出图片中所有的文本行，得到图片中所有文本行的坐标信息，再根据坐标信息裁剪出所有文本行图片输出给文本识别模块。文本行识别模块依次处理裁剪过后的图片，输出识别结果到违规信息检索模块。违规信息检索模块将云手机图片中所有的识别结果与敏感信息库对比，若识别结果中存在敏感信息的情况做警告或者报警处理。

OCR文本行检测算法原理，算法流程如图3所示。

本发明中文本检测算法采用DBNet文本行检测算法，其能够快速准确的检测出图像中的文本行，

输入截屏图片首先经过缩放处理调整到规定尺寸输入给DBNet模型，模型依次从输入图片中提取出5层特征图。其次，通过上采样处理将5层特征图上采样到同一尺寸后进行特征图融合处理，处理方式为将特征图对应位置的元素排列组成向量，形成新的特征图。然后，由新的特征图形成概率图和阈值图。概率图的形成方式为通过将特征图与输入图像对应，包含文本的区域赋值高概率值，不包含文本的背景区域赋值低概率值。阈值图的形成方式为将概率图中元素与给定阈值比较，大于给定阈值时给新的特征图对应位置赋值1，否则赋值0。最后，由概率图和阈值图预测出图像中包含文本的区域。

OCR文本行识别算法原理，其算法流程如图4所示。

本发明中文本行识别算法采用CRNN算法，

文本行识别算法的输入为原始截屏图像经过文本行检测模块的输出，其为原始图像经过裁剪和缩放得到。文本行图像经过卷积神经网络CNN提取特征，其提取出的特征为一组二维向量，向量宽度为文本行识别算法所能识别的单个文本行最大字符个数，向量高度为文本行识别算法对单个字符的编码。文本行经过特征提取流程之后输入给LSTM模块，该模块为两层递归神经元组成的网络，其作用为将特征提取模块提取出的特征与原始输入文本行图像对应，并输出最终的识别结果。

敏感信息比对算法原理，敏感信息比对流程如图5所示。

原始输入图片经过文本行检测处理和文本行识别处理之后，得到原始图像中所有文本信息，其后为敏感信息比对流程。

在得到输入图片中所有文本信息之后，提取出文本中包含的关键词信息。本发明采用NLP算法提取关键词信息，如图6所示，其具体流程为：

(1)、构建敏感信息词库；

(2)、训练NLP关键词提取模型；

(3)、使用训练好的关键词提取模型处理输入图片中的所有文本信息；

(4)、判断是否有敏感信息词库中的关键词出现在文本信息中，若有则输出文本信息中包含的关键词，若无则输出“None”。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的保护范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：刘健;林涛睿;何蔚;谢辉;黄巡周;郑富文;石超航;石雨冬;
专利申请人：深圳市瑞驰信息技术有限公司;

上一篇：一种控制模块便于安装的高效型屏蔽电泵
下一篇：一种地下室防水基坑结构及施工方法