导航：首页> 工程元件或部件；为产生和保持机器或设备的有效运行的一般措施；一般绝热>基于机器视觉和实时文本识别的测试方法、装置、设备

基于机器视觉和实时文本识别的测试方法、装置、设备

文献发布时间：2024-04-18 19:57:31

技术领域

本发明涉及图像识别测试技术领域，特别涉及一种基于机器视觉和实时文本识别的测试方法、装置、设备。

背景技术

目前，图像识别技术已经应用到了词典笔，通过在词典笔设置的摄像头从划过的区域提取出文字内容，进行播报等相关操作。在词典笔出厂之前需要通过可靠性测试，确保词典笔能够准确识别提取的内容。在相关技术中，词典笔的测试主要依赖于人工校验，而且测试样本需要涵盖中英文课本上的文本字符、各国语言文字等，测试文本非常多样化，对测试人员的知识储备有较高的要求，而且人工校验的效率较低，人力成本高，而且还容易出现校验错误。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此，本发明提出一种基于机器视觉和实时文本识别的测试方法、装置、设备，能够自动完成文本识别的校验，提高词典笔的测试效率。

第一方面，本发明实施例提供了一种基于机器视觉和实时文本识别的测试方法，应用于测试设备，所述测试设备与被测词典笔通信连接，所述测试设备包括第一摄像头，所述被测词典笔设置有第二摄像头，所述基于机器视觉和实时文本识别的测试方法包括：

通过所述第一摄像头从样本文本的第一图像，对所述第一图像进行文字提取得到样本字典，所述样本字典包括所述样本文本所记载的多个样本字符和每个所述样本字符的字符位置；

通过所述第一摄像头获取测试视频流，根据所述测试视频流确定所述被测词典笔的扫描起止位置，其中，所述测试视频流记载有所述被测词典笔在所述样本文本的扫描过程；

根据所述扫描起止位置从所述样本字典中确定样本字符集，所述样本字符集包括至少一个所述样本字符；

获取所述被测词典笔通过所述第二摄像头扫描得到的扫描字符集，所述扫描字符集包括至少一个扫描字符；

通过比对所述扫描字符集和所述样本字符集确定目标测试结果。

根据本发明的一些实施例，所述字符位置为字符样本坐标，所述对所述第一图像进行文字提取得到样本字典，包括：

在所述第一图像中的文字区域进行文字识别，获取并记录文字识别得到的每个所述样本字符；

基于所述第一图像建立坐标系，确定每个所述样本字符的所述字符样本坐标；

根据全部的所述样本字符和对应的所述字符样本坐标生成所述样本字典。

根据本发明的一些实施例，所述扫描起止位置包括扫描起始坐标和扫描停止坐标，所述根据所述测试视频流确定所述被测词典笔的扫描起止位置，包括：

基于所述测试视频流确定所述被测词典笔的扫描开始时刻和扫描停止时刻；

根据所述扫描开始时刻从所述测试视频流中获取第二图像，根据所述扫描停止时刻从所述测试视频流中获取第三图像；

针对所述第二图像和所述第三图像分别进行笔头识别，将所述第二图像中识别出的笔头坐标确定为所述扫描起始坐标，将所述第三图像中识别出的笔头坐标确定为所述扫描停止坐标。

根据本发明的一些实施例，所述第一摄像头的拍摄方向垂直于所述样本文本，所述被测词典笔还设置有指示灯，所述基于所述测试视频流确定所述被测词典笔的扫描开始时刻和扫描停止时刻，包括：

从所述测试视频流检测出所述指示灯的亮灯时刻和灭灯时刻，将所述亮灯时刻确定为所述扫描开始时刻，将所述灭灯时刻确定为所述扫描停止时刻；

或者，对所述测试视频流的图像帧进行距离检测，确定所述图像帧中所述被测词典笔与所述样本文件的目标距离，将首次检测到所述目标距离小于预设距离阈值的所述图像帧所对应的时刻确定为所述扫描开始时刻，将所述扫描开始时刻后首次检测到所述目标距离大于所述预设距离阈值的所述图像帧所对应的时刻确定为所述扫描停止时刻。

根据本发明的一些实施例，所述通过比对所述扫描字符集和所述样本字符集确定目标测试结果，包括：

根据所述测试视频流确定每个所述扫描字符所对应的字符扫描坐标；

基于所述字符扫描坐标和所述字符扫描坐标配对的原则确定多个比对组，每个所述比对组包括一个所述样本字符和一个所述扫描字符；

确定每个所述比对组的字符比对结果，根据全部的所述字符比对结果得到所述目标测试结果。

根据本发明的一些实施例，所述根据全部的所述字符比对结果得到所述目标测试结果，包括：

当至少一个所述字符比对结果表征文本错误，将所述字符比对结果表征文本错误的所述比对组对应的字符扫描坐标确定为异常坐标，根据全部的所述字符比对结果和所述异常坐标得到所述目标测试结果；

或者，当所述扫描字符集的字符数大于所述样本字符集的字符数，根据所述扫描字符集确定异常字符和异常位置信息，根据全部的所述字符比对结果、所述异常字符和所述异常位置信息得到所述目标测试结果，其中，所述异常字符为位于相邻的两个所述比对组之间的所述扫描字符，所述异常字符的位置信息根据邻接的两个所述比对组所对应的所述字符样本坐标确定；

或者，当所述扫描字符集的字符数小于所述样本字符集的字符数，根据所述样本字符集确定遗漏字符和遗漏坐标，根据全部的所述字符比对结果、所述遗漏字符和所述遗漏坐标得到所述目标测试结果，其中，所述遗漏字符为未配对所述扫描字符的所述样本字符，所述遗漏坐标为所述遗漏字符所对应的所述字符样本坐标。

根据本发明的一些实施例，所述方法还包括：

当根据所述测试视频流确定出多个所述扫描起止位置，从所述被测词典笔获取扫描数据，所述扫描数据包括多个所述扫描字符；

基于每对所述扫描开始时刻和扫描停止时刻，将所述扫描数据划分为多个所述扫描字符集；

根据每个所述扫描起止位置从所述样本字典中获取多个所述样本字符集，根据时间顺序确定每个样本字符集所对应的所述扫描字符集；

基于比对相配对的所述扫描字符集和所述样本字符集确定分组测试结果；

根据全部的所述分组测试结果确定所述目标测试结果。

第二方面，本发明实施例提供了一种基于机器视觉和实时文本识别的测试装置，包括少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行如上述第一方面所述的基于机器视觉和实时文本识别的测试方法。

第三方面，本发明实施例提供了一种测试设备，包括有如上述第二方面所述的基于机器视觉和实时文本识别的测试装置。

第四方面，本发明实施例提供了一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行如上述第一方面所述的基于机器视觉和实时文本识别的测试方法。

根据本发明实施例的基于机器视觉和实时文本识别的测试方法，至少具有如下有益效果：通过第一摄像头从样本文本的第一图像，对第一图像进行文字提取得到样本字典，样本字典包括样本文本所记载的多个样本字符和每个样本字符的字符位置；通过第一摄像头获取测试视频流，根据测试视频流确定被测词典笔的扫描起止位置，其中，测试视频流记载有被测词典笔在样本文本的扫描过程；根据扫描起止位置从样本字典中确定样本字符集，样本字符集包括至少一个样本字符；获取被测词典笔通过第二摄像头扫描得到的扫描字符集，扫描字符集包括至少一个扫描字符；通过比对扫描字符集和样本字符集确定目标测试结果。根据本发明实施例的技术方案，能够通过机器视觉获取样本信息作为测试的内容参考，与被测词典笔扫描得到的字符进行比对自动确定测试结果，无需进行人工校验，提高测试效率和准确性。

附图说明

图1是本发明一个实施例提供的实施环境的示意图；

图2是本发明一个实施例提供的基于机器视觉和实时文本识别的测试方法的流程图；

图3是本发明另一个实施例提供的生成样本字典的流程图；

图4是本发明另一个实施例提供的确定扫描起止位置的流程图；

图5是本发明另一个实施例提供的确定扫描起止时刻的流程图；

图6是本发明另一个实施例提供的进行字符比对的流程图；

图7是本发明另一个实施例提供的定位测试错误的流程图；

图8是本发明另一个实施例提供的进行多组测试的流程图；

图9是本发明另一个实施例提供的基于机器视觉和实时文本识别的测试装置的结构图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，若干的含义是一个或者多个，多个的含义是两个以上，大于、小于、超过等理解为不包括本数，以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

本发明的描述中，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。

本发明实施例提供了一种基于机器视觉和实时文本识别的测试方法、装置、设备，其中，基于机器视觉和实时文本识别的测试方法包括：通过第一摄像头从样本文本的第一图像，对第一图像进行文字提取得到样本字典，样本字典包括样本文本所记载的多个样本字符和每个样本字符的字符位置；通过第一摄像头获取测试视频流，根据测试视频流确定被测词典笔的扫描起止位置，其中，测试视频流记载有被测词典笔在样本文本的扫描过程；根据扫描起止位置从样本字典中确定样本字符集，样本字符集包括至少一个样本字符；获取被测词典笔通过第二摄像头扫描得到的扫描字符集，扫描字符集包括至少一个扫描字符；通过比对扫描字符集和样本字符集确定目标测试结果。根据本发明实施例的技术方案，能够通过机器视觉获取样本信息作为测试的内容参考，与被测词典笔扫描得到的字符进行比对自动确定测试结果，无需进行人工校验，提高测试效率和准确性。

首先，对本发明的实施环境进行示例性说明，本示例并非对用于测试的各种结构做出的限定，而是可以执行本发明技术方案的一个具体实施环境，参照图1，图1为本发明提供的实施环境示意图，包括测试设备10、被测词典笔20和样本文本30。

示例性地，测试设备10可以采用如图1所示的高拍仪，在测试设备10的上侧沿水平方向设置第一摄像头11，样本文本30水平放置在测试设备10下侧的置物平台，若第一摄像头11以倾斜的角度拍摄样文本30，会导致第一图像中的字符倾斜变形，增加文字识别和坐标定位的复杂度，因此本实施例的第一摄像头11沿水平方向设置，其拍摄角度垂直于置物平台，使得第一摄像头11能够以俯视方向对样本文本30进行拍摄，提高第一图像中内容的规范程度，提高图像识别的效率。测试设备10还包括处理设备12，处理设备12可以是常见的计算机或者服务器等，能够实现图像识别和数据存储即可。

示例性地，样本文本30可以是纸质书籍、打印文档或者通过电子终端显示的电子文档，本实施例对具体的形式不做限定。

示例性地，被测词典笔20包括第二摄像头21和指示灯22，在被测词典笔20启动时，指示灯22亮灯，指示灯22用于对摄像头21进行补光，第二摄像头21实时获取图像，并从图像中提取出文字信息，在划过样本文本30时能够实现扫描效果，从扫描路径中提取出得到扫描字符；在被测词典笔20停止工作后，指示灯22灭灯，第二摄像头21切换为待机状态。

示例性地，为了提高数据传输的稳定性，被测词典笔20可以通过自定义通信协议与

值得注意的是，被测词典笔20通常以行为单位进行文字扫描，因此本领域技术人员有动机根据实际需求调整第二摄像头21的拍摄范围，确保不会扫描到多行文字或者不足一行文字，本实施例对第二摄像头21的配置方式不做过多赘述。

下面基于附图1所示的实施环境，对本发明实施例的控制方法作进一步阐述。

参照图2，图2为本发明实施例提供的一种基于机器视觉和实时文本识别的测试方法的流程图，基于机器视觉和实时文本识别的测试方法包括但不限于有以下步骤：

S21，通过第一摄像头从样本文本的第一图像，对第一图像进行文字提取得到样本字典，样本字典包括样本文本所记载的多个样本字符和每个样本字符的字符位置；

S22，通过第一摄像头获取测试视频流，根据测试视频流确定被测词典笔的扫描起止位置，其中，测试视频流记载有被测词典笔在样本文本的扫描过程；

S23，根据扫描起止位置从样本字典中确定样本字符集，样本字符集包括至少一个样本字符；

S24，获取被测词典笔通过第二摄像头扫描得到的扫描字符集，扫描字符集包括至少一个扫描字符；

S25，通过比对扫描字符集和样本字符集确定目标测试结果。

需要说明的是，被测词典笔的测试依赖于扫描内容和实际内容的比对，在相关技术中，若采用人工校验则效率低下，也有一些相关技术采用电子设备实现自动比对，但是为了得到用于参考的样本文本，测试人员需要将纸质书籍的内容录入为电子文档，或者从网上下载数据后整理为预设格式的电子文档，然后在相关的电子设备中提前录入样本文本的电子文档，即相关技术需要为增加大量的预处理工作才能得到用于比对的实际内容。而本实施例利用机器视觉自动获取提取样本文本的内容，通过第一摄像头拍摄样本文本的第一图像，通过简单的图像识别即可提取出样本文本的每个字符，并且可以通过简单的定位技术对每个样本字符进行定位，从而建立样本字典，以样本字典作为实际内容在载体，在获取到扫描内容后，从样本字典中获取对应位置的内容即可实现比对，有效提高了测试效率。

需要说明的是，第一图像可以是样本文本的整个区域的图像，也可以是某个特定区域的图像，例如，以样本文本以书籍为例，在书籍的某一页包括文字区域和插图区域，由于词典笔通常用于文字识别，因此在通过第一摄像头拍摄到图像后，可以对其中的文字区域进行截取得到第一图像，文字区域和插图区域的区分为图像识别领域的常见技术，在此不多做赘述。又如，样本文本的某一页全部为文字区域，则可以将整页进行拍摄得到第一图像。本领域技术人员有动机根据样本文本的实际形式调整第一图像的获取策略，在此不多做限定。

需要说明的是，通过图像识别进行文字提取后，处理设备中只会存储有多个样本字符组成的集合，由于被测词典笔扫描得到的字符很可能是相同的，例如同一行可能有多个相同的文字，因此并不能简单通过文字比对的方式对样本字符进行定位，需要确保每个样本字符具有唯一性，因此，本实施例在对第一图像中识别出样本字符后，还获取每个样本字符的位置信息，通过位置信息和样本字符进行关联，使得生成的样本字典中的每个元素具有唯一性，确保比对的准确性。可以理解的是，位置信息可以采用坐标的形式，例如针对第一图像建立坐标系后确定每个字符的坐标；位置信息还可以采用相对位置的形式，例如通过行列信息作为每个字符的位置信息，本实施例对位置信息的具体形式不做限定。

需要说明的是，测试视频流可以在根据第一图像得到样本字典后开始拍摄，为了确保测试视频流能够包括被测词典笔的完整扫描过程，可以先启动测试视频流的拍摄，再操作被测词典笔进行扫描，从而能够基于测试视频流定位出被测词典笔的扫描起止位置，在样本字典具备位置信息的情况下，能够确定每个扫描得到的扫描字符所对应的样本字符，确保字符比对的准确性，避免与错误的样本字符进行比对而影响测试效果。

需要说明的是，扫描起止位置并不限定于同一行，可以通过被测词典笔对样本文本中的多行字符进行扫描，以扫描开始的位置和扫描结束的位置确定扫描起止位置，不仅能够提高测试的灵活性，还可以通过扫描更多的字符提高测试效果。

可以理解的是，具备第二摄像头的被测词典笔在扫描过程中提取扫描字符为本领域技术人员熟知的技术，在此对扫描字符集的具体文字提取技术不做过多赘述。

需要说明的是，在得到扫描字符集后，由于扫描起止位置和第一图像中每个字符的位置已知，可以确定每个扫描字符的位置信息，通过比对相同位置的扫描字符和样本字符，能够确定扫描字符是否正确，从而得到该次扫描测试的目标测试结果。

通过本实施例的技术方案，能够基于机器视觉拍摄第一图像自动得到样本字典，省去了测试人员在测试设备中输入电子文档等预处理工作，提高了测试基础数据的准备效率；基于机器视觉对被测词典笔的实时扫描位置进行定位，能够任意确定扫描的范围，提高测试的灵活性；从样本字典匹配出于扫描字符集对应的样本字符集，从而自动实现文字比对，能够实时得到每次扫描的测试结果，提高测试效率和准确性。

另外，在一实施例中，字符位置为字符样本坐标，参照图3，图2所示实施例的步骤S21还包括但不限于有以下步骤：

S31，在第一图像中的文字区域进行文字识别，获取并记录文字识别得到的每个样本字符；

S32，基于第一图像建立坐标系，确定每个样本字符的字符样本坐标；

S33，根据全部的样本字符和对应的字符样本坐标生成样本字典。

需要说明的是，根据图2所示实施例的描述，对文字区域进行识别为本领域常规技术，在此不多做赘述。

需要说明的是，本实施例基于第一图像建立坐标系，以坐标值为每个样本字符的位置信息，能够提高定位精度，例如以每个样本字符的中心点、或者某个顶角的坐标作为字符样本坐标，本实施例对此不多做限定，能够通过字符样本坐标表征每个样本字符的位置即可。

需要说明的是，在得到字符样本坐标后，建立每个样本字符和字符样本的映射关系并保存到样本字典，使得在扫描得到扫描字符集后，可以能够通过坐标匹配的方式从样本字典中查询出扫描字符位置相同的样本字符，提高文字比对和测试的准确性。

另外，在一实施例中，扫描起止位置包括扫描起始坐标和扫描停止坐标，参照图4，图2所示实施例的步骤S22还包括但不限于有以下步骤：

S41，基于测试视频流确定被测词典笔的扫描开始时刻和扫描停止时刻；

S42，根据扫描开始时刻从测试视频流中获取第二图像，根据扫描停止时刻从测试视频流中获取第三图像；

S43，针对第二图像和第三图像分别进行笔头识别，将第二图像中识别出的笔头坐标确定为扫描起始坐标，将第三图像中识别出的笔头坐标确定为扫描停止坐标。

需要说明的是，由于测试视频流记载有被测词典笔扫描的完整过程，因此可以根据测试视频流确定扫描可是时刻和扫描停止时刻，在时刻确定的情况下，从测试视频流中获取扫描开始时刻的图像作为第二图像，获取扫描停止时刻的图像作为第三图像，能够通过对第二图像和第三图像的识别确定扫描起止位置，从而实现扫描起止位置的自动确定。

需要说明的是，在获取到第二图像和第三图像后，可以确定被测词典笔的笔头位置分别对应扫描开始和扫描结束的位置，由于上述实施例采用坐标作为位置信息的表征，因此本实施例可以通过对笔头进行目标检测实现起止位置的确定，针对笔头这一具有特定形状的结构进行目标检测的算法为本领域技术人员熟知的技术，在此不多做赘述。

需要说明的是，由于被测词典笔主要的测试目标在于判断字符识别是否正确，因此通常扫描的方向符合阅读方向，即从左到右，完成一行之后从下一行再次扫描，因此在确定扫描起始坐标和扫描停止坐标后，可以将样本字典中坐标值在此区间的样本字符提取至样本字符集，例如，扫描起始坐标为(a，b)，扫描停止坐标为(c，d),样本字符集的字符样本坐标(x，y)满足：y＝b，x≥a，或者满足b

需要说明的是，由于每次扫描的动作会有一定的位置偏差，本实施例的坐标匹配可以采用临近匹配的方式，例如扫描起始坐标可以采用与笔头位置最接近的样本字符的坐标，当获取到字符扫描坐标后，将与字符扫描坐标最接近的字符样本坐标确定为配对的样本字符，后续不重复赘述。

另外，在一实施例中，参照图5，图4所示实施例的步骤S41还包括但不限于有以下步骤：

S51，从测试视频流检测出指示灯的亮灯时刻和灭灯时刻，将亮灯时刻确定为扫描开始时刻，将灭灯时刻确定为扫描停止时刻；

S52，对测试视频流的图像帧进行距离检测，确定图像帧中被测词典笔与样本文件的目标距离，将首次检测到目标距离小于预设距离阈值的图像帧所对应的时刻确定为扫描开始时刻，将扫描开始时刻后首次检测到目标距离大于预设距离阈值的图像帧所对应的时刻确定为扫描停止时刻。

需要说明的是，参考图1所示，被测词典笔20为了对摄像头进行补光，通常会在摄像头附近设置指示灯22，在启动扫描时亮灯，扫描完成后灭灯，因此可以从测试视频流中确定亮灯时刻作为扫描开始时刻，将灭灯时刻确定为扫描停止时刻。在知晓时刻之后，从视频流中截取对应的图像帧进行图像识别，从而实现起止时刻的自动确定，无需测试人员手动输入，提高自动化程度和准确性。

需要说明的是，对于不具备指示灯的被测词典笔，也可以通过步骤S52的方式对被测地点比与样本文件的距离检测确定起止时刻，对图像中两个物品进行目标检测和距离识别为本领域技术人员熟知的技术，在此不多做赘述。

另外，在一实施例中，参照图6，图2所示实施例的步骤S25还包括但不限于有以下步骤：

S61，根据测试视频流确定每个扫描字符所对应的字符扫描坐标；

S62，基于字符扫描坐标和字符扫描坐标配对的原则确定多个比对组，每个比对组包括一个样本字符和一个扫描字符；

S63，确定每个比对组的字符比对结果，根据全部的字符比对结果得到目标测试结果。

需要说明的是，确定每个扫描字符的字符扫描坐标，可以通过上述实施例所述，根据起止位置之间的样本字符的字符样本坐标确定，也可以从测试视频流中进行逐个字符的位置检测，在具备图像基础上，本领域技术人员有动机根据实际需求选择字符扫描坐标的确定方式，在此不多做限定。

需要说明的是，在确定字符扫描坐标后，可以将与其相匹配或者最接近的字符样本坐标所对应的样本字符进行配对，得到比对组，根据每个比对组进行字符比对确定扫描字符是否正确，得到目标测试结果，从而实现自动化测试，无需测试人员进行人工校验。

另外，在一实施例中，参照图7，图2所示实施例的步骤S25还包括但不限于有以下步骤：

S71，当至少一个字符比对结果表征文本错误，将字符比对结果表征文本错误的比对组对应的字符扫描坐标确定为异常坐标，根据全部的字符比对结果和异常坐标得到目标测试结果；

S72，当扫描字符集的字符数大于样本字符集的字符数，根据扫描字符集确定异常字符和异常位置信息，根据全部的字符比对结果、异常字符和异常位置信息得到目标测试结果，其中，异常字符为位于相邻的两个比对组之间的扫描字符，异常字符的位置信息根据邻接的两个比对组所对应的字符样本坐标确定；

S73，当扫描字符集的字符数小于样本字符集的字符数，根据样本字符集确定遗漏字符和遗漏坐标，根据全部的字符比对结果、遗漏字符和遗漏坐标得到目标测试结果，其中，遗漏字符为未配对扫描字符的样本字符，遗漏坐标为遗漏字符所对应的字符样本坐标。

需要说明的是，当扫描字符中存在错误，需要对齐进行定位，便于后续输出测试分析报告。扫描出现的错误可以是字符识别错误、多字、漏字等，相关技术中主要依赖人工校验，本实施例通过自动比对的方式实现判定，具体如下：

示例性地，当比对结果表征文本错误，即扫描字符与样本字符不同，则可以确定该扫描字符为错误字符，将其坐标确定为异常坐标记载入目标测试结果，测试人员可以根据异常坐标定位扫描字符和样本字符，对扫描错误进行后续的分析。

示例性地，当扫描字符集的字符数大于样本字符集的字符数，则可以确定扫描过程中出现了多字的错误，很可能是扫描速度太快，或者相邻的两个样本字符的字体距离太近，而异常字符通常会在两个正确的扫描字符之间，而本实施例通过坐标匹配的方式确定比对组，因此多出的异常字符左侧和右侧的正确的扫描字符都会匹配到对应的样本字符，可以采用一一对应的原则，使得多出的异常字符无法匹配到对应的样本字符，从而实现异常字符的识别，并将其邻接的两个比对组的字符坐标确定其位置，使得测试人员能够从样本字符判断出现多字的原因。

示例性地，当扫描字符集的字符数小于样本字符集的字符数，则可以确定扫描过程中出现了少字的错误，例如样本字符的字迹模糊导致识别失败，因此参考上述描述，由于采用了坐标一一对应的原则，会存在样本字符无法配对扫描字符的情况，该字符可以确定为遗漏字符，将对应的样本字符的坐标确定为遗漏坐标，共同记载到目标测试结果中，使得测试人员能够判断出现遗漏的原因。

另外，在一实施例中，参照图8本实施例的方法还包括但不限于有以下步骤：

S81，根据测试视频流确定出多个扫描起止位置，从被测词典笔获取扫描数据，扫描数据包括多个扫描字符；

S82，基于每对扫描开始时刻和扫描停止时刻，将扫描数据划分为多个扫描字符集；

S83，根据每个扫描起止位置从样本字典中获取多个样本字符集，根据时间顺序确定每个样本字符集所对应的扫描字符集；

S84，基于比对相配对的扫描字符集和样本字符集确定分组测试结果；

S85，根据全部的分组测试结果确定目标测试结果。

需要说明的是，为了提高测试的准确性，可以在样本文本进行多次测试，例如进行多次扫描，根据上述实施例的描述，扫描开始时刻和扫描停止时刻可以通过指示灯的识别或者距离阈值判断，因此若进行了多次测试，测试视频流中可以识别到多个扫描开始时刻和多个扫描停止时刻，按照时间顺序依次进行配对即可得到多对扫描开始时刻和扫描停止时刻，例如将首个扫描开始时刻和首个扫描停止时刻确定为第一对起止时刻，将首个扫描停止时刻之后的扫描开始时刻和扫描停止时刻确定为第二对起止时刻，以此类推。

需要说明的是，多次扫描的扫描位置可以是重叠的，因此需要将扫描数据按照起止时刻分为多个扫描字符集，针对每个扫描字符集重复本实施例的测试方法得到对应的样本字符集，从而得到多个分组测试结果，再基于多个分组测试结果得到最终的目标测试结果，例如可以采用准确率均值的方式，或者根据扫描数据的大小进行加权求和等，在此不多做限定。

如图9所示，图9是本发明一个实施例提供的基于机器视觉和实时文本识别的测试装置的结构图。本发明还提供了一种基于机器视觉和实时文本识别的测试装置，包括：

处理器901，可以采用通用的中央处理器(Central Processing Unit，CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本申请实施例所提供的技术方案；

存储器902，可以采用只读存储器(Read Only Memory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory，RAM)等形式实现。存储器902可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器902中，并由处理器901来调用执行本申请实施例的基于机器视觉和实时文本识别的测试方法；

输入/输出接口903，用于实现信息输入及输出；

通信接口904，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；

总线905，在设备的各个组件(例如处理器901、存储器902、输入/输出接口903和通信接口904)之间传输信息；

其中处理器901、存储器902、输入/输出接口903和通信接口904通过总线905实现彼此之间在设备内部的通信连接。

本申请实施例还提供了一种测试设备，包括如上所述的基于机器视觉和实时文本识别的测试装置。

本申请实施例还提供了一种存储介质，存储介质为计算机可读存储介质，该存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述基于机器视觉和实时文本识别的测试方法。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，实现了以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

以上是对本发明的较佳实施进行了具体说明，但本发明并不局限于上述实施方式，熟悉本领域的技术人员在不违背本发明精神的共享条件下还可作出种种等同的变形或替换，这些等同的变形或替换均包括在本发明权利要求所限定的范围内。

完整全部详细技术资料下载