一种图片预处理方法及装置

文献发布时间：2024-04-18 20:02:40

技术领域

本申请涉及图像识别领域，尤其涉及一种图片预处理方法及装置。

背景技术

锚框指的是以每个像素为中心，生成多个缩放比和宽高比不同的边界框。由于待处理图片中的目标对象多为倾斜状态，而锚框为位置水平的矩形框，因此基于锚框算法最终确定的待处理图片中的目标对象，通常会在锚框内引入背景区域，特别是对于长宽比很大的目标对象，基于锚框算法确定的目标对象的矩形框内会引入大量背景区域，即检测出的目标对象不够精准，进而影响后续判断。

因此，目前亟需一种方案，用以对锚框前的图片进行预处理，使预处理后的图片中的目标对象更契合锚框算法。

发明内容

本申请提供一种图片预处理方法及装置，用以对锚框前的图片进行预处理，使预处理后的图片中的目标对象更契合锚框算法。

第一方面，本申请提供一种图片预处理方法，该方法包括：识别原始图片中的目标对象；

在确定所述目标对象处于倾斜状态后，将所述目标对象在所述原始图片中所处区域由第一区域调整至第二区域，从而得到第一预处理图片；所述第一预处理图片中所述目标对象处于水平状态且所述第一区域的中心点与所述第二区域的中心点一致；所述第一预处理图片中具有待修复区域；所述待修复区域为所述第一区域中第一区域与所述第二区域的非交集区域；

将所述第一预处理图片输入至修复网络，得到第二预处理图片；所述第二预处理图片中所述待修复区域具有连续性的背景像素。

上述技术方案中，首先将处于倾斜状态的目标对象经过旋转和移动调整为水平状态，然后将调整后的图片输入至训练好的修复网络，得到背景连续的预处理图片。在后续对该预处理图片进行锚框时，可以精确区分目标对象与背景，可以有效提高基于锚框的目标检测的准确率。

在一种可能的设计中，所述将所述目标对象在所述原始图片中所处区域由第一区域调整至第二区域，包括：确定所述目标对象在所述原始图片中的旋转中心；基于所述旋转中心，将所述目标对象在所述原始图片中进行旋转，并旋转至所述目标对象处于水平状态；以处于水平状态的目标对象的中心点与处于倾斜状态的目标对象的中心点重合为目的，在所述原始图片中移动处于水平状态的目标对象。

上述技术方案中，将原始图片中处于倾斜状态的目标对象调整为水平状态，并且处于水平状态的目标对象的中心点与处于倾斜状态的目标对象的中心点重合，使得调整之后的目标对象的位置更贴近目标对象的真实位置。

在一种可能的设计中，通过如下方法训练所述修复网络：生成训练集中每张样本图片对应的中间图片；所述中间图片具有待修复区域；将所述中间图片输入至初始修复网络，得到生成图片；通过比较所述生成图片与所述样本图片的像素值差异来训练所述初始修复网络的参数，从而在满足训练终止条件时得到所述修复网络。

上述技术方案中，将中间图片输入到修复网络中得到生成图片，然后通过将生成图片与该中间图片对应的样本图片的像素值差异进行比较，不断修正修复网络的相关参数，直至生成图片与样本图片的对应像素的差异值满足训练终止条件，得到训练好的修复网络，使得训练好的修复网络能够生成待修复区域具有连续性的背景像素的图片。

在一种可能的设计中，所述修复网络包括特征提取网络和特征分析网络；所述特征提取网络包括多个下采样模块，每个下采样模块包括部分卷积层和池化层；所述特征分析网络包括多个上采样模块，每个上采样模块包括最近邻差值上采样层、特征拼接层和部分卷积层。

在一种可能的设计中，对于每个上采样模块，将通过使用最邻近差值法进行上采样后生成的特征图片，与对应的下采样模块生成的特征图片进行特征结合；所述上采样后生成的特征图片与所述对应的下采样模块生成的特征图片的大小相等。

在一种可能的设计中，通过如下方法生成中间图片，包括：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；将所述第一掩膜图像与所述样本图片结合，生成所述中间图片；所述第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

上述技术方案中，对原始图片中的目标对象进行调整后生成的第一预处理图片中的待修复区域为原始目标对象中的部分区域，因此，本申请将样本图片中的样本物体周围的像素点(即第一值的像素点)遮盖住，生成中间图片去训练修复模型。

在一种可能的设计中，通过如下方法生成中间图片：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；生成与所述样本图片大小一致且包括多个随机区域的第二掩膜图像；所述随机区域的像素点设置为第一值，其余像素点设置为第二值；将所述第一掩膜图像、所述第二掩膜图像与所述样本图片结合，生成所述中间图片；第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

上述技术方案中，除了将样本图片中的样本物体周围的像素点遮盖住，还将样本图片中多个随机区域的像素点遮盖住生成中间图片，以得到更多的训练特征，使得修复模型的训练效果更好。

第二方面，本申请实施例提供一种图片预处理装置，包括：

目标对象识别模块，用于识别原始图片中的目标对象；

目标对象调整模块，用于在确定所述目标对象处于倾斜状态后，将所述目标对象在所述原始图片中所处区域由第一区域调整至第二区域，从而得到第一预处理图片；所述第一预处理图片中所述目标对象处于水平状态且所述第一区域的中心点与所述第二区域的中心点一致；所述第一预处理图片中具有待修复区域；所述待修复区域为所述第一区域中第一区域与所述第二区域的非交集区域；

背景修复模块，用于将所述第一预处理图片输入至修复网络，得到第二预处理图片；所述第二预处理图片中所述待修复区域具有连续性的背景像素。

在一种可能的设计中，所述目标对象调整模块，还用于确定所述目标对象在所述原始图片中的旋转中心；基于所述旋转中心，将所述目标对象在所述原始图片中进行旋转，并旋转至所述目标对象处于水平状态；以处于水平状态的目标对象的中心点与处于倾斜状态的目标对象的中心点重合为目的，在所述原始图片中移动处于水平状态的目标对象。

在一种可能的设计中，所述装置还包括训练模块，用于通过如下方法训练所述修复网络：生成训练集中每张样本图片对应的中间图片；所述中间图片具有待修复区域；将所述中间图片输入至初始修复网络，得到生成图片；通过比较所述生成图片与所述样本图片的像素值差异来训练所述初始修复网络的参数，从而在满足训练终止条件时得到所述修复网络。

在一种可能的设计中，所述训练模块，还用于对于每个上采样模块，将通过使用最邻近差值法进行上采样后生成的特征图片，与对应的下采样模块生成的特征图片进行特征结合；所述上采样后生成的特征图片与所述对应的下采样模块生成的特征图片的大小相等。

在一种可能的设计中，所述装置还包括中间图片生成模块，用于通过如下方法生成中间图片，包括：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；将所述第一掩膜图像与所述样本图片结合，生成所述中间图片；所述第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

在一种可能的设计中，所述中间图片生成模块，还用于通过如下方法生成中间图片：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；生成与所述样本图片大小一致且包括多个随机区域的第二掩膜图像；所述随机区域的像素点设置为第一值，其余像素点设置为第二值；将所述第一掩膜图像、所述第二掩膜图像与所述样本图片结合，生成所述中间图片；第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

第三方面，本申请实施例还提供一种计算设备，包括：

存储器，用于存储程序指令；

处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行如第一方面的任一种可能的设计中所述的方法。

第四方面，本申请实施例还提供一种计算机可读存储介质，其中存储有计算机可读指令，当计算机读取并执行所述计算机可读指令时，使得上述第一方面的任一种可能的设计中所述的方法实现。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例适用的一种应用场景的示意图；

图2为本申请实施例提供的一种图片预处理方法的流程示意图；

图3为本申请实施例提供的一种将目标对象在原始图片中所处区域由第一区域调整至第二区域的方法的流程示意图；

图4为本申请实施例提供的一种目标对象在原始图片中的调整过程的示意图；

图5为本申请实施例提供的另一种目标对象在原始图片中的调整过程的示意图；

图6为本申请实施例提供的一种待修复区域的示意图；

图7为本申请实施例提供的另一种待修复区域的示意图；

图8为本申请实施例提供的一种训练修复网络的方法的流程示意图；

图9为本申请实施例提供的一种生成中间图片的方法的流程示意图；

图10为本申请实施例提供的另一种生成中间图片的方法的流程示意图；

图11为本申请实施例提供的一种修复网络的示意图；

图12为本申请实施例提供的一种图片预处理装置的结构示意图；

图13为本申请实施例提供的一种计算设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在本申请的实施例中，多个是指两个或两个以上。“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

为了便于理解本申请的实施例，下面介绍一下本申请的应用场景。

在一些禁止打电话行为的区域，例如，在加油站内禁止打电话、在高速公路上禁止驾驶员在驾驶的同时打电话，或者在一些禁止吸烟行为的区域，例如，乘坐公共交通时禁止乘客吸烟，在易燃易爆品加工场所禁止吸烟。

为了便于确定上述区域内是否存在目标行为(禁止打电话行为、禁止吸烟行为等)，通过从监控设备中获取该区域的视频流，并根据预设的时间间隔或者按照预设的时间点从视频流中采集多张待检测图片，然后基于各个待检测图片判断当前时间点该区域是存在目标行为。

以检测是否存在打电话行为(不包括通过耳机进行通话的情况)为例，首先需要基于锚框算法检测出待检测图片中的人的头部矩形框和手机矩形框，然后根据人的头部矩形框与手机矩形框的重叠度，判断待检测图片中是否存在打电话行为。

锚框为以每个像素为中心，生成多个缩放比和宽高比不同的边界框。由于待处理图片中的手机目标多为倾斜状态，而锚框为位置水平的矩形框，因此在基于锚框算法中最终确定的待检测图片中的手机矩形框，通常会在手机矩形框内引入背景区域，特别是当手机处于图1所示的位置时，在手机矩形框内会引入大量的背景区域。由于检测出的手机矩形框不够准确，因此在后续根据人的头部矩形框与手机矩形框的重叠度，判断待检测图片中是否存在打电话行为时，检测结果可能存在偏差。

基于上述描述可知，对于长宽比很大的目标对象，基于锚框算法确定的目标对象的矩形框内会引入背景区域，即检测出的目标对象不够精准，进而影响后续判断。

对此，本申请提供一种图片预处理方法，用以对锚框前的图片进行预处理，使预处理后的图片中的目标对象更契合锚框算法。

需要说明的是，上述应用场景仅是一种示例，本申请实施例对此不做具体限定。在具体实施中，可以基于上述场景做相同思想的变形，仍属于本申请的保护范围。

图2示例性地示出了本申请实施例提供的一种图片预处理方法的流程示意图，如图2所示，该方法包括以下步骤：

步骤201、识别原始图片中的目标对象。

本申请实施例中，对于进行锚框前的原始图片，通过分割网络检测出目标对象，例如，手机、烟等长宽比较大的目标对象。本申请对检测目标对象的分割网络不做具体限定，例如可以使用DBNet分割网络。

步骤202、在确定目标对象处于倾斜状态后，将目标对象在原始图片中区域由第一区域调整至第二区域，从而得到第一预处理图片。

其中，第一预处理图片中目标对象处于水平状态且第一区域的中心点与第二区域的中心点一致。

本申请是实施例中，如果通过分割网络检测出的目标对象处于端正位置，即目标对象处于水平状态(包括目标对象的长边水平或短边水平)，则无需调整目标对象。如果通过分割网络检测出的目标对象处于倾斜状态，则需要对目标对象进行调整，即将目标对象经过旋转和移动处理后，得到处于水平状态的目标对象，从而得到第一预处理图片。

示例性地，可以通过如图3所示的方式将目标对象在原始图片中所处区域由第一区域调整至第二区域：

步骤301、确定目标对象在原始图片中的旋转中心。

需要说明的是，本申请对选取的目标对象在原始图片中的旋转中心不做具体限定，例如，可以选取目标对象的一个端点作为旋转中心，或者也可以选取目标对象的中心点作为旋转中心。

步骤302、基于旋转中心，将目标对象在原始图片中进行旋转，并旋转至目标对象处于水平状态。

需要说明的是，本申请对将目标物体旋转至水平状态的旋转方向及旋转角度不做具体限定，例如，在确定目标对象在原始图片中的旋转中心后，可以将目标对象以设定的旋转方向(如逆时针或顺时针)旋转，直至满足目标对象处于水平状态。或者，可以先根据目标物体的位置判断目标物体的旋转方向(如逆时针或顺时针)，然后以该旋转方向旋转目标物体，直至满足目标对象处于水平状态。

还需要说明的是，本申请对目标对象处于水平状态时是长边水平还是短边水平也不做具体限定，可以根据实际需求进行设定。

步骤303、以处于水平状态的目标对象的中心点与处于倾斜状态的目标对象的中心点重合为目的，在原始图片中移动处于水平状态的目标对象。

可以理解的是，为了调整之后处于水平状态的目标对象的位置更贴近原始目标对象的位置，本申请实施例将步骤302中得到的处于水平位置的目标对象进行移动，使得移动后的目标对象的中心点与原始目标对象(处于倾斜状态的目标对象)的中心点重合。

下面以两个具体的示例来说明目标对象在原始图片中的调整过程，如图4和图5所示，假设以原始图片的左上角为坐标原点，以水平方向为x轴，以水平向右为x轴正方向；以竖直方向为y轴，以竖直向下为圆周正方向，建立直角坐标系xoy。

步骤a、确定目标对象的四个端点在直角坐标系xoy中的坐标(横向像素值，纵向像素值)，目标对象的四个端点分别为A1(x1,y1)、B1(x2,y2)、C1(X3,y3)，D1(x4,y4)。具体地，为了便于理解，这里先选取目标对象四个端点中x值最小的点为A1(x1,y1),然后顺时针依次命名为B1(x2,y2)、C1(X3,y3)，D1(x4,y4)。

步骤b、比较B1和D1的横坐标，若x2大于x4，则目标对象为图4-1所示的情况，可以将目标物体A1B1C1D1顺时针旋一定角度至水平位置。若x2小于x4，则目标对象为图5-1所示的情况，可以将目标物体A1B1C1D1逆时针旋一定角度至水平位置。旋转后的目标物体统一保持长边处于水平位置。

对于图4-1所示的情况：

在此种情况下，目标对象A1B1C1D1在原始图片中的中心点O1坐标为

步骤c、示例性地，可以将纵坐标最大的端点D1确定为目标对象在原始图片中的旋转中心。

步骤d、基于旋转中心D1，将目标对象在原始图片中进行顺时针旋转，并旋转至目标对象处于水平状态，即如图4-2所示，将目标对象A1B1C1D1基于D1顺时针旋转得到处于水平状态的目标对象A2B2C2D2。

目标对象A2B2C2D2的四个端点坐标分别为A2(x1’，y1’)＝(x4，y4-h)、B2(x2’，y2’)＝(x4+w，y4-h)、C2(x3’，y3’)＝(x4+w，y4)、D2(x4’，y4’)＝(x4，y4)，旋转后的中心点坐标为

步骤d、移动处于水平状态的目标对象A2B2C2D2，使移动后的目标对象与原目标对象的中心点重合，即如图4-3所示，将目标对象A2B2C2D2移动得到目标对象A3B3C3D3，其中，目标对象A3B3C3D3的中心点与目标对象A1B1C1D1的中心点重合。

目标对象A3B3C3D3的四个端点坐标分别为A3(x1”，y1”)＝(x1’-Δx，y1’-Δy)、B3(x2”，y2”)＝(x2’-Δx，y2’-Δy)、C3(x3”，y3”)＝(x3’-Δx，y3’-Δy)、D3(x4”，y4”)＝(x4’-Δx，y4’-Δy)。

对于图5-1所示的情况：

在此种情况下，目标对象A1B1C1D1在原始图片中的中心点O1坐标为

步骤c、示例性地，可以将纵坐标最大的端点D1确定为目标对象在原始图片中的旋转中心。

步骤d、基于旋转中心D1，将目标对象在原始图片中进行逆时针旋转，并旋转至目标对象处于水平状态，即如图5-2所示，将目标对象A1B1C1D1基于D1逆时针旋转得到处于水平状态的目标对象A2B2C2D2。

目标对象A2B2C2D2的四个端点坐标分别为A2(x1’，y1’)＝(x4-w，y4)、B2(x2’，y2’)＝(x4-w，y4-h)、C2(x3’，y3’)＝(x4，y4-h)、D2(x4’，y4’)＝(x4，y4)，旋转后的中心点坐标为

步骤d、移动处于水平状态的目标对象A2B2C2D2，使移动后的目标对象与原目标对象的中心点重合，即如图5-3所示，将目标对象A2B2C2D2移动得到目标对象A3B3C3D3，其中，目标对象A3B3C3D3的中心点与目标对象A1B1C1D1的中心点重合。

目标对象A3B3C3D3的四个端点坐标分别为A3(x1”，y1”)＝(x1’+Δx，y1’-Δy)、B3(x2”，y2”)＝(x2’+Δx，y2’-Δy)、C3(x3”，y3”)＝(x3’+Δx，y3’-Δy)、D3(x4”，y4”)＝(x4’+Δx，y4’-Δy)。

步骤203、将第一预处理图片输入至修复网络，得到第二预处理图片。其中，第二预处理图片中待修复区域具有连续性的背景像素。

本申请实施例中，在将处于倾斜的目标对象在原始图片中区域由第一区域调整至第二区域后，得到第一预处理图片中具有待修复区域，该待修复区域为第一区域中第一区域与第二区域的非交集区域，其中，第一区域为原始图片中处于倾斜状态的目标对象所在的区域，第二区域为调整后的处于水平状态的目标对象所在的区域。

图6为与图4-3对应的目标对象A2B2C2D2的示意图，如图6所示，在将原始图片中处于倾斜状态的目标对象A1B1C1D1调整为处于水平状态的目标对象A3B3C3D3后，原始目标对象A1B1C1D1所在区域中的实线阴影区域为待修复区域，目标对象A3B3C3D3所在区域中的虚线阴影区域为目标对象A3B3C3D3遮挡的原始图片中的背景部分。

同样的，图7为与图5-3对应的目标对象A2B2C2D2的示意图，如图7所示，在将原始图片中处于倾斜状态的目标对象A1B1C1D1调整为处于水平状态的目标对象A3B3C3D3后，原始目标对象A1B1C1D1所在区域中的实线阴影区域为待修复区域，目标对象A3B3C3D3所在区域中的虚线阴影区域为目标对象A3B3C3D3遮挡的原始图片中的背景部分。

第一预处理图片中的待修复区域可以理解为将原始目标对象经旋转移动后在该区域内产生的空白部分，对此，本申请实施例将第一预处理图片输入至修复网络，使得生成的第二预处理图片中的待修复区域与其他背景区域连续。

在一种可能的实施方式中，可以通过如图8所示的方法训练修复网络，该方法包括如下步骤：

步骤801、生成训练集中每张样本图片对应的中间图片，该中间图片具有待修复区域。

图9示例性地示出了本申请实施例提供的一种生成中间图片的方式。

步骤a、将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像。

其中，本申请对第一值和第二值的取值不做具体限定，例如第一值可以为1，第二值可以为0。

步骤b、将第一掩膜图像与样本图片结合，生成所述中间图片。其中，第一值的像素点用于对样本图片进行遮盖，第二值的像素点用于被样本图片进行遮盖。

可以理解的是，对原始图片中的目标对象进行调整后生成的第一预处理图片中的待修复区域为原始目标对象中的部分区域，因此，本申请将样本图片中的样本物体周围的像素点(即第一值的像素点)遮盖住，生成中间图片去训练修复模型。

图10示例性地示出了本申请实施例提供的另一种生成中间图片的方式。

步骤a、将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像。

步骤b、生成与样本图片大小一致且包括多个随机区域的第二掩膜图像。其中，随机区域的像素点设置为第一值，其余像素点设置为第二值。

上述步骤中，可以通过参数确定随机区域块的个数，参数由训练调试确定，本申请对随机区域块的个数以及像素大小不做具体限定。

步骤c、将第一掩膜图像、第二掩膜图像与样本图片结合，生成中间图片。其中，第一值的像素点用于对样本图片进行遮盖，第二值的像素点用于被样本图片进行遮盖。

步骤802、将中间图片输入至初始修复网络，得到生成图片。

图11示例性地示出了本申请实施例提供的一种修复网络，如图11所示，该修复网络包括特征提取网络和特征分析网络。

其中，特征提取网络包括多个下采样模块，每个下采样模块包括部分卷积层和池化层。

特征分析网络包括多个上采样模块，每个上采样模块包括最近邻差值上采样层、特征拼接层和部分卷积层。

对于每个上采样模块，将通过使用最邻近差值法进行上采样后生成的特征图片，与对应的下采样模块生成的特征图片进行特征结合，其中，上采样后生成的特征图片与对应的下采样模块生成的特征图片的大小相等。

步骤803、通过比较生成图片与样本图片的像素值差异来训练初始修复网络的参数，从而在满足训练终止条件时得到修复网络。

在模型的训练过程中，将中间图片输入到修复网络中，通过将生成图片与该中间图片对应的样本图片的像素值差异进行比较，不断修正修复网络的相关参数，直至生成图片与样本图片的对应像素的差异值满足训练终止条件，得到训练好的修复网络，使得训练好的修复网络能够生成待修复区域具有连续性的背景像素的图片。

本申请提供一种图片预处理方法，首先将处于倾斜状态的目标对象经过旋转和移动调整为水平状态，然后将调整后的图片输入至训练好的修复网络，得到背景连续的预处理图片。在后续对该预处理图片进行锚框时，可以精确区分目标对象与背景，可以有效提高基于锚框的目标检测的准确率。

基于相同的技术构思，图12示例性地示出了本申请实施例提供的一种图片预处理装置，如图12所示，该装置1200包括：

目标对象识别模块1201，用于识别原始图片中的目标对象；

目标对象调整模块1202，用于在确定所述目标对象处于倾斜状态后，将所述目标对象在所述原始图片中所处区域由第一区域调整至第二区域，从而得到第一预处理图片；所述第一预处理图片中所述目标对象处于水平状态且所述第一区域的中心点与所述第二区域的中心点一致；所述第一预处理图片中具有待修复区域；所述待修复区域为所述第一区域中第一区域与所述第二区域的非交集区域；

背景修复模块1203，用于将所述第一预处理图片输入至修复网络，得到第二预处理图片；所述第二预处理图片中所述待修复区域具有连续性的背景像素。

在一种可能的设计中，所述目标对象调整模块1202，还用于确定所述目标对象在所述原始图片中的旋转中心；基于所述旋转中心，将所述目标对象在所述原始图片中进行旋转，并旋转至所述目标对象处于水平状态；以处于水平状态的目标对象的中心点与处于倾斜状态的目标对象的中心点重合为目的，在所述原始图片中移动处于水平状态的目标对象。

在一种可能的设计中，所述装置还包括训练模块1204，用于通过如下方法训练所述修复网络：生成训练集中每张样本图片对应的中间图片；所述中间图片具有待修复区域；将所述中间图片输入至初始修复网络，得到生成图片；通过比较所述生成图片与所述样本图片的像素值差异来训练所述初始修复网络的参数，从而在满足训练终止条件时得到所述修复网络。

在一种可能的设计中，所述修复网络包括特征提取网络和特征分析网络；所述特征提取网络包括多个下采样模块，每个下采样模块包括部分卷积层和池化层；所述特征分析网络包括多个上采样模块，每个上采样模块包括最近邻差值上采样层、特征拼接层和部分卷积层。需要说明的是，本申请对上采样模块的数量和下采样模块的数量不做具体限定。

在一种可能的设计中，所述训练模块1204，还用于对于每个上采样模块，将通过使用最邻近差值法进行上采样后生成的特征图片，与对应的下采样模块生成的特征图片进行特征结合；所述上采样后生成的特征图片与所述对应的下采样模块生成的特征图片的大小相等。

在一种可能的设计中，所述装置还包括中间图片生成模块1205，用于通过如下方法生成中间图片，包括：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；将所述第一掩膜图像与所述样本图片结合，生成所述中间图片；所述第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

在一种可能的设计中，所述中间图片生成模块1205，还用于通过如下方法生成中间图片：将样本图片中的样本物体周围的预设数量的像素点设置为第一值，其余像素点设置为第二值，生成第一掩膜图像；生成与所述样本图片大小一致且包括多个随机区域的第二掩膜图像；所述随机区域的像素点设置为第一值，其余像素点设置为第二值；将所述第一掩膜图像、所述第二掩膜图像与所述样本图片结合，生成所述中间图片；第一值的像素点用于对所述样本图片进行遮盖；所述第二值的像素点用于被所述样本图片进行遮盖。

基于相同的技术构思，本申请实施例提供了一种计算设备，如图13所示，包括至少一个处理器1301，以及与至少一个处理器连接的存储器1302，本申请实施例中不限定处理器1301与存储器1302之间的具体连接介质，图13中处理器1301和存储器1302之间通过总线连接为例。总线可以分为地址总线、数据总线、控制总线等。

在本申请实施例中，存储器1302存储有可被至少一个处理器1301执行的指令，至少一个处理器1301通过执行存储器1302存储的指令，可以执行上述图片预处理方法。

其中，处理器1301是计算设备的控制中心，可以利用各种接口和线路连接计算机设备的各个部分，通过运行或执行存储在存储器1302内的指令以及调用存储在存储器1302内的数据，从而进行资源设置。

可选地，处理器1301可包括一个或多个处理单元，处理器1301可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1301中。在一些实施例中，处理器1301和存储器1302可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。

处理器1301可以是通用处理器，例如中央处理器(CPU)、数字信号处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器1302作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器1302可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random AccessMemory，RAM)、静态随机访问存储器(Static Random Access Memory，SRAM)、可编程只读存储器(Programmable Read Only Memory，PROM)、只读存储器(Read Only Memory，ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性存储器、磁盘、光盘等等。存储器1302是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本申请实施例中的存储器1302还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。

基于相同的技术构思，本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有计算机可执行程序，计算机可执行程序用于使计算机执行上述任一方式所列的图片预处理方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：海信集团控股股份有限公司;

上一篇：基于统一掩模的3D姿态检测器优化方法、装置及存储介质
下一篇：硅集成平台上的可重配置全光非线性激活函数