图像的识别方法、装置及存储介质

文献发布时间：2024-04-18 19:58:53

技术领域

本公开涉及图像处理技术领域，尤其涉及一种图像的识别方法、装置及存储介质。

背景技术

在有强光源的情况下，用手机拍摄或扫描表面光滑的物体时，例如：在室外强烈的日光下，使用手机给被玻璃覆盖的物品拍照；在室内明亮的灯光下，使用手机扫描身份证；在夜晚台灯下正对光源，使用手机拍摄材质光滑的纸质文件。被摄物体由于部分表面处于反光区域中，此时在反光区域中的部分无法被清晰识别，影响用户体验。此时如果直接遮挡光源继续拍摄，会使物体偏暗影响成像效果。

因此，如何在强光场景下识别清晰的不被反光现象影响的图像是亟待解决的问题。

发明内容

为克服相关技术中存在的问题，本公开提供一种图像的识别方法、装置及存储介质。

根据本公开实施例的第一方面，提供一种图像的识别方法，应用于终端，所述识别方法包括：

确定预览图像中所包括的预设目标物体；

确定所述预设目标物体所在的第一区域是否包括反光区域；

若包括，在对所述第一区域去反光处理后，识别所述预设目标物体。

在一示例性的实施例中，所述确定所述预设目标物体所在的第一区域是否包括反光区域，包括：

确定所述预览图像中像素值大于第一预设阈值的第二区域；

识别所述预设目标物体的外轮廓；

在所述预览图像中根据所述外轮廓确定所述第一区域；

确定所述第一区域是否包括所述第二区域或者与所述第二区域有交叠；

若是，确定所述第二区域为所述反光区域或者所述第一区域与所述第二区域交叠的区域为反光区域。

在一示例性的实施例中，所述确定所述第一区域是否与所述第二区域有交叠，包括：

确定所述外轮廓是否为不连续外轮廓；

若是，若所述外轮廓的不连续轮廓的端点位于所述第二区域的边缘处，确定所述第一区域与所述第二区域有交叠。

在一示例性的实施例中，所述在对所述第一区域去反光处理后，识别所述预设目标物体，包括：

根据所述第一区域和所述第二区域的位置关系，产生移动所述终端的提示信息；

根据所述终端的不同位置，获取多张用于识别所述预设目标物体的第一图像；

根据多张所述第一图像，形成第二图像，其中，所述第二图像中对应所述第一区域中的所有像素的像素值均小于第二预设阈值；

基于所述第二图像，识别所述预设目标物体。

在一示例性的实施例中，所述根据所述第一区域和所述第二区域的位置关系，产生移动所述终端的提示信息，包括：

确定所述第二区域的轮廓；

根据所述第二区域的轮廓和所述外轮廓位置关系，产生移动所述终端的提示信息。

在一示例性的实施例中，所述根据所述第二区域的轮廓和所述外轮廓位置关系，产生移动所述终端的提示信息，包括：

基于将所述外轮廓保持在所述预览图像的预设区域，产生移动所述终端的提示信息。

在一示例性的实施例中，所述预设区域包括所述预览图像的中心区域。

在一示例性的实施例中，所述提示信息包括所述终端平移的方向和距离，以及旋转的角度。

在一示例性的实施例中，所述识别所述预设目标物体的外轮廓，包括：

获取所述预览图像的灰度图；

根据所述灰度图，确定所述预设目标物体的外轮廓。

根据本公开实施例的第二方面，提供一种图像的识别装置，应用于终端，所述识别装置包括：

第一确定模块，被配置为确定预览图像中所包括的预设目标物体；

第二确定模块，被配置为确定所述预设目标物体所在的第一区域是否包括反光区域；

识别模块，被配置为在所述预设目标物体所在区域包括反光区域时，在对所述第一区域去反光处理后，识别所述预设目标物体。

根据本公开实施例的第三方面，提供一种图像的识别装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行如本公开实施例的第一方面中任一项所述的识别方法。

根据本公开实施例的第四方面，提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由识别装置的处理器执行时，使得识别装置能够执行如本公开实施例的第一方面中任一项所述的识别方法。

采用本公开的上述方法，具有以下有益效果：确定预览图像中所包括的预设目标物体，确定所述预设目标物体所在的第一区域是否包括反光区域，当第一区域中包括反光区域时，对第一区域进行去反光处理后，识别预设目标物体，能够有效避免反光现象对识别预设目标物体的影响。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性的实施例示出的一种图像的识别方法的流程图；

图2是根据一示例性的实施例示出的步骤S102中确定预设目标物体所在的第一区域是否包括反光区域的方法的流程图；

图3是根据一示例性的实施例示出的确定第一区域是否与第二区域有交叠的方法的流程图；

图4是根据一示例性的实施例示出的步骤S103中在对第一区域去反光处理后，识别预设目标物体的方法流程图；

图5是根据一示例性的实施例示出的识别预设目标物体的外轮廓的方法的流程图；

图6是根据一示例性的实施例示出的一种图像的识别装置的框图；

图7是根据一示例性的实施例示出的一种图像的识别装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

相关技术中，以拍摄围棋图像为例，在某些光照环境下，无法通过移动拍摄装置找到能够使得棋盘完全不反光的位置，或者需要花费大量的时间找到使棋盘完全不反光的位置，严重影响用户体验。为了解决围棋棋盘中棋盘反光的问题，通过对原始围棋图像人工标注标签，并利用透视变换获取棋盘格位置来制作两种数据集，训练两种数据集得到两个训练模型，加权融合得到检测结果，通过透视变换将检测结果还原为棋盘分布，绘制为电子围棋图谱，能够适应一定程度的光照不均和棋盘反光问题。但该方法存在以下问题：

(1)如果棋盘中某一区域高光极强，则在此位置拍摄的图像可能无法解析，棋盘中位于强光位置的棋子由于无法准确解析其颜色，极有可能被解析为白色棋子从而影响识别结果；

(2)使用相机设备采集棋盘图像，并对图像进行解析，解决问题的思路完全依靠图像分割、图像处理的方法进行，适合固定相机位置拍摄棋盘进行解析；

(3)处理结果依赖于解析单张照片，如果由于相机晃动、物体移动影响图像效果便可能无法准确解析图像。

本公开示例性的实施例中，提供一种图像的识别方法，应用于终端，终端包括智能手机、平板、智能穿戴设备等具有拍摄功能的电子设备。图1是根据一示例性的实施例示出的一种图像的识别方法的流程图，如图1所示，图像的识别方法包括以下步骤：

步骤S101：确定预览图像中所包括的预设目标物体；

步骤S102：确定预设目标物体所在的第一区域是否包括反光区域；

步骤S103：若包括，在对第一区域去反光处理后，识别预设目标物体。

在本公开示例性的实施例中，为了克服相关技术存在的问题中，终端在强光源场景下拍摄反光的物体时，由于出现的反光区域会影响拍摄效果，使得拍摄的图像被反光区域遮挡而无法识别目标物体，并且很难通过移动终端找到完全不反光的拍摄位置，提供一种图像的识别方法。确定预览图像中所包括的预设目标物体，确定预设目标物体所在的第一区域是否包括反光区域，若包括，在对第一区域去反光处理后，识别预设目标物体，能够在识别预设目标物体时不受反光现象的影响。

在步骤S101中，预设目标物体为用户想要拍摄并识别的物体，识别出预览图像中的一个或者多个物体，例如使用边缘检测算法识别预览图像中的每个物体的轮廓边缘，并分别将多个物体标记出来，提示用户选择所要拍摄的主要物体，例如预览图像中存在物体A和物体B，分别将其进行标记并提示用户选择，当用户选择物体A时，则物体A即为预设目标物体。当预览图像中不包括预设目标物体时，可以提示用户移动终端重新获取预览图像，直至在预览图像中包括预设目标物体。

在步骤S102中，预览图像中预设目标物体所在的区域为第一区域，确定第一区域中是否包括反光区域，例如可以根据反光区域的图像特征确定是否包括反光区域，以便于后续对反光区域，进行去反光处理。

在步骤S103中，如果第一区域中不包括反光区域，则表示反光现象不影响对预设目标物体的识别，如果第一区域中包括反光区域，则表示反光现象影响对预设目标物体的识别。因此，当第一区域中包括反光区域时，需要对第一区域进行去反光处理，以消除反光现象对识别预设目标物体的影响，进而清晰地识别预设目标物体。

在本公开示例性的实施例中，确定预览图像中所包括的预设目标物体，确定所述预设目标物体所在的第一区域是否包括反光区域，当第一区域中包括反光区域时，对第一区域进行去反光处理后，识别预设目标物体，能够有效避免反光现象对识别预设目标物体的影响。

在一示例性的实施例中，图2是根据一示例性的实施例示出的步骤S102中确定预设目标物体所在的第一区域是否包括反光区域的方法的流程图，如图2所示，包括以下步骤：

步骤S201：确定预览图像中像素值大于第一预设阈值的第二区域；

步骤S202：识别预设目标物体的外轮廓；

步骤S203：在预览图像中根据外轮廓确定第一区域；

步骤S204：确定第一区域是否包括第二区域或者与第二区域有交叠；

步骤S205：若是，确定第二区域为反光区域或者第一区域与第二区域交叠的区域为反光区域。确定预览图像中是否包括像素值大于预设阈值的第二区域，如果包括，则说明预览图像中包括亮度比较高的区域，这一区域为反光区域。即第二区域为预览图像中的所有反光区域，由于反光区域的亮度高于其他区域，因此可以通过预览图像中的像素值确定所有反光区域，预览图像中像素值大于预设阈值的第二区域即为反光区域，预设阈值可以根据实际场景(如室内、室外等)的需求设定。

当确定出预设目标物体后，进一步识别出预设目标物体的外轮廓，根据预设目标物体的外轮廓确定出预设目标物体在预览图像中的第一区域，预设目标物体的外轮廓可以通过边缘检测算法得出。

确定出第一区域和第二区域，即确定出预设目标物体所在区域和预览图像中所有反光区域，再进一步确定第一区域是否包括第二区域，或者第一区域是否与第二区域有交叠。由于预设目标物体是所需要识别的物体，即第一区域是需要准确识别的区域，因此保证第一区域内没有反光区域，即可保证对预设目标物体的识别不受反光现象的影响。当第一区域与第二区域没有交叠或者第一区域不包括第二区域时，说明反光区域对预设目标物体的识别不构成影响，可以不需要对其进行处理直接识别出预设目标物体。当第一区域包括第二区域时，说明反光区域在预设目标物体的内部，会影响对预设目标物体的识别，因此，第二区域为需要处理的反光区域；当第一区域与第二区域有交叠时，说明反光区域遮挡住部分预设目标物体，因此，交叠的区域为需要处理的反光区域。

在本公开示例性的实施例中，通过预设目标物体所在的第一区域和预览图像中所有反光区域形成的第二区域，能够准确确定出需要进行去反光处理的反光区域，有针对性地对影响预设目标物体识别的反光区域进行处理。

需要说明的是，为了节省终端相机的功耗，可以将本公开中提供的图像的识别方法设置为预设拍摄模式。该预设拍摄模式为针对在预览图像中存在反光区域而设定。当确定预览图像中包括第二区域时，提示用户是否开始该预设拍摄模式，如提示是否开启防反光拍摄模式，当用户选择开启该预设拍摄模式时，执行本公开所提供的图像识别的步骤识别预设目标物体。还可以是当确定预览图像中包括第二区域时，自动切换为预设拍摄模式；或者当确定预览图像中包括第二区域时，结合某些预设条件，如果满足预设条件也将自动切换为预设拍摄模式，这里的预设条件可以包含第二区域的大小超过预设值、第二区域在预览图像所占面积比例大于预设值、第二区域在预览图像所占位置属于中心等等。当确定预览图像中不包括第二区域，或者用户不选择开启该预设拍摄模式时，则使用普通拍摄模式进行拍摄。

在一示例性的实施例中，图3是根据一示例性的实施例示出的确定第一区域是否与第二区域有交叠的方法的流程图，如图3所示，包括以下步骤：

步骤S301：确定外轮廓是否为不连续外轮廓；

步骤S302：若是，若外轮廓的不连续轮廓的端点位于第二区域的边缘处，确定第一区域与第二区域有交叠。

确定所识别出的预设目标物体的外轮廓是否为不连续轮廓，即第一区域的外轮廓是否连续，当外轮廓为连续轮廓时，说明第二区域完全在第一区域内部或者外部，当外轮廓为不连续轮廓时，说明第二区域只覆盖了第一区域的一部分。当外轮廓为不连续轮廓时，如果确定外轮廓的不连续轮廓的端点位于第二区域的边缘处，即第一区域与第二区域的轮廓存在交点，则确定第一区域与第二区域有交叠。

在一示例性的实施例中，图4是根据一示例性的实施例示出的步骤S103中在对第一区域去反光处理后，识别预设目标物体的方法流程图，如图4所示，包括以下步骤：

步骤S401：根据第一区域和第二区域的位置关系，产生移动终端的提示信息；

步骤S402：根据终端的不同位置，获取多张用于识别预设目标物体的第一图像；

步骤S403：根据多张第一图像，形成第二图像，其中，第二图像中对应第一区域中的所有像素的像素值均小于第二预设阈值；

步骤S404：基于第二图像，识别预设目标物体。

当确定第一区域与第二区域有交叠或者第一区域包括第二区域时，根据第一区域和第二区域的位置关系，可以确定出预设目标物体被第二区域遮挡的部分，根据预设目标物体中被遮挡的部分在预设目标物体的位置，产生移动终端的提示信息，例如通过底部弹窗消息发出提示信息，提示信息包括终端平移的方向和距离，以及旋转的角度。例如第一区域包括第二区域时，提示信息为向上平移终端。

当用户按照提示信息移动终端时，终端的位置或者角度会发生变化，此时反光区域会根据终端位置的不同，出现在不同的位置，即会改变第二区域在预览图像中的位置，以及进一步改变预设目标物体被遮挡的部分。根据终端不同的位置，获取多张用于识别预设目标物体的第一图像，在第一图像中的第二区域的位置均不相同，即获取多张不同遮挡位置的图像。

通过多张第一图像的图像信息融合形成第二图像，例如使用图像融合算法，由于多张第一图像中的每一张第一图像中的第二区域的位置不同，通过多张第一图像，可以分别识别出预设目标物体的不同区域，因此，第二图像中的预设目标物体为不被第二区域覆盖或者遮挡的预设目标物体，即第二图像中的预设目标物体中没有反光区域，即第二图像中对应第一区域中的所有像素的像素值均小于第二预设阈值。基于第二图像，即可清晰地识别出预设目标物体。

在本公开示例性的实施例中，通过多张第二区域位置不同的第一图像融合成第二图像，能够基于第二图像识别出清晰地不受反光区域影响的预设目标物体。另外通过多张第一图像，形成第二图像，可以避免某些时刻由于拍摄抖动等原因造成被摄物体模糊的问题，提升图像识别的可靠性，避免由于单张图像的误差产生错误识别结果。在一示例性的实施例中，根据第一区域和第二区域的位置关系，产生移动终端的提示信息，包括：确定第二区域的轮廓，根据第二区域的轮廓和外轮廓的位置关系，产生移动终端的提示信息。

根据第二区域的轮廓和第一区域外轮廓的位置关系，能够确定出第一区域和第二区域的位置关系，以第二区域在第一区域内为例，即第二区域的轮廓在外轮廓内部，在一示例中，当第二区域在第一区域内的上方位置时，提示用户向上平移终端并顺时针旋转一定角度，当第二区域在第一区域内的右上方位置时，提示用户向右上平移终端并顺时针旋转一定角度。

当第一区域和第二区域有交叠时，即第二区域的轮廓与外轮廓有交点，第一区域与第二区域的交叠位置，与提示用户终端的移动方向之间的对应关系，和第二区域在第一区域内的位置与提示用户移动终端的方向的对应关系相同。

在一示例性的实施例中，根据第二区域的轮廓和外轮廓位置关系，产生移动终端的提示信息，包括：基于将外轮廓保持在预览图像的预设区域，产生移动终端的提示信息。

在产生移动终端的提示信息时，为了能够识别到预设目标物体，要保证预设目标物体保持在预览图像的预设区域，预设区域包括预览图像的中心区域。

在一示例性的实施例中，图5是根据一示例性的实施例示出的识别预设目标物体的外轮廓的方法的流程图，如图5所示，包括以下步骤：

步骤S501：获取预览图像的灰度图；

步骤S502：根据灰度图，确定预设目标物体的外轮廓。

识别预设目标物体的外轮廓时，获取预览图像的灰度图，根据灰度图对图像中的预设目标物体进行识别和分割，从而获取预设目标物体的外轮廓，例如使用图像分割算法，可以确定出预设目标物体的外轮廓。

在本公开示例性的实施例中，确定预览图像中所包括的预设目标物体，确定预设目标物体所在的第一区域是否包括反光区域，当包括反光区域时，通过获取多张第二区域不同位置的第一图像，将第一图像进行融合形成第二图像，实现对第一区域的去反光处理后，识别预设目标物体。能够在识别预设目标物体时不受反光区域影响，识别出清晰的预设目标物体，同时通过多张第一图像形成第二图像，避免了某些时刻由于拍摄抖动等原因造成被摄物体模糊的问题，提升图像识别的可靠性，避免由于单张图像的误差产生错误识别结果。

本公开示例性的实施例中，提供一种图像的识别装置，应用于终端。图6是根据一示例性的实施例示出的一种图像的识别装置的框图，如图6所示，识别装置包括：

第一确定模块601，被配置为确定预览图像中所包括的预设目标物体；

第二确定模块602，被配置为确定所述预设目标物体所在的第一区域是否包括反光区域；

识别模块603，被配置为在所述预设目标物体所在区域包括反光区域时，在对所述第一区域去反光处理后，识别所述预设目标物体。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

当图像识别装置为终端时，图7是根据一示例性的实施例示出的一种图像的识别装置700的框图。

参照图7，装置700可以包括以下一个或多个组件：处理组件702，存储器704，电源组件706，多媒体组件708，音频组件710，输入/输出(I/O)的接口712，传感器组件714，以及通信组件716。

处理组件702通常控制装置700的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件702可以包括一个或多个模块，便于处理组件702和其他组件之间的交互。例如，处理组件702可以包括多媒体模块，以方便多媒体组件708和处理组件702之间的交互。

存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件706为装置700的各种组件提供电源。电源组件706可以包括电源管理系统，一个或多个电源，及其他与为装置700生成、管理和分配电力相关联的组件。

多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件710被配置为输出和/或输入音频信号。例如，音频组件710包括一个麦克风(MIC)，当装置700处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中，音频组件710还包括一个扬声器，用于输出音频信号。

I/O接口712为处理组件702和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件714包括一个或多个传感器，用于为装置700提供各个方面的状态评估。例如，传感器组件714可以检测到装置700的打开/关闭状态，组件的相对定位，例如所述组件为装置700的显示器和小键盘，传感器组件714还可以检测装置700或装置700一个组件的位置改变，用户与装置700接触的存在或不存在，装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件714还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件716还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器704，上述指令可由装置700的处理器720执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由识别装置的处理器执行时，使得识别装置能够执行一种图像的识别方法，所述方法包括上述的任一种方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：北京小米移动软件有限公司;

上一篇：一种光刻设备晶圆传控方法及光刻设备
下一篇：一种线上会议中的终端状态更新方法及服务器