掌桥专利:专业的专利平台
掌桥专利
首页

关键点的标注方法及装置

文献发布时间:2023-06-19 15:47:50



技术领域

本申请涉及图像处理及人工智能技术领域,尤其涉及一种关键点的标注方法及装置。

背景技术

在机器学习任务中,样本数据标注的质量对模型训练的正确性和精确度有很大的影响。然而,长期以来,数据标注多依赖于标注人员人工标注,由于人工标注的标注结果受标注人员的主观影响较大,因此容易出现标注不准确的情况,比如在不同的标注人员对同一待标注对象进行标注,以及同一标注人员多次对同一待标注对象进行标注时,均易出现标注不准确的问题。尤其在关键点的标注方面,标注不准确的问题显得更为突出。

例如,在人脸图像中标注出人脸3D(3-Dimension,三维)关键点在图像上的投影位置时,由于人脸姿态、遮挡物等原因,一些人脸3D关键点的投影位置在图像中处于被遮挡的位置,此时需要标注人员根据经验猜测,以完成标注任务,这不仅增加了关键点的标注难度,且易造成标注不准确的问题。此外,即使人脸图像中的所有关键点均清晰可见,不同的标注人员在标注同一人脸图像上的关键点,或者同一标注人员在多次标注同一人脸图像上的关键点时,也难以确保标注结果完全准确。

发明内容

本申请实施例的目的是提供一种关键点的标注方法及装置,用以解决现有技术中对关键点的标注准确度较低的问题。

为解决上述技术问题,本申请实施例是这样实现的:

一方面,本申请实施例提供一种关键点的标注方法,包括:

获取由相机阵列拍摄目标对象得到的N个图像,其中N为大于1的整数;

针对所述目标对象的语义关键点,在N个所述图像上分别进行预标注,得到所述语义关键点在各所述图像上的第一标注位置;

根据所述语义关键点对应的N个所述第一标注位置,确定所述语义关键点对应的第一空间位置;

根据所述相机阵列对应的N组相机参数,将所述第一空间位置分别投影至N个所述图像上,得到所述语义关键点在各所述图像上的第二标注位置;

根据N个所述图像上所述第一标注位置和对应的所述第二标注位置之间的位置关系,确定N个所述第一标注位置中满足预设调整条件的目标标注位置,并对所述目标标注位置进行调整。

采用本申请实施例的技术方案,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该技术方案能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

另一方面,本申请实施例提供一种关键点的标注装置,包括:

获取模块,用于获取由相机阵列拍摄目标对象得到的N个图像,其中N为大于1的整数;

预标注模块,用于针对所述目标对象的语义关键点,在N个所述图像上分别进行预标注,得到所述语义关键点在各所述图像上的第一标注位置;

第一确定模块,用于根据所述语义关键点对应的N个所述第一标注位置,确定所述语义关键点对应的第一空间位置;

第一投影模块,用于根据所述相机阵列对应的N组相机参数,将所述第一空间位置分别投影至N个所述图像上,得到所述语义关键点在各所述图像上的第二标注位置;

确定及调整模块,用于根据N个所述图像上所述第一标注位置和对应的所述第二标注位置之间的位置关系,确定N个所述第一标注位置中满足预设调整条件的目标标注位置,并对所述目标标注位置进行调整。

再一方面,本申请实施例提供一种关键点的标注设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现上述的关键点的标注方法。

再一方面,本申请实施例提供一种存储介质,用于存储计算机程序,所述计算机程序在被处理器执行时实现上述的关键点的标注方法。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据本申请一实施例的一种关键点的标注方法的示意性流程图;

图2是根据本申请一实施例的相机阵列的示意图;

图3是根据本申请一实施例的对极线的示意图;

图4是根据本申请一实施例的第一曲线与投影线交点的示意图;

图5是根据本申请另一实施例的一种关键点的标注方法的示意性流程图;

图6是根据本申请一实施例的一种对人脸图像进行关键点标注的示意图;

图7是根据本申请另一实施例的一种关键点的标注方法的示意性流程图;

图8是根据本申请一实施例的一种关键点的标注装置的结构示意图;

图9是根据本申请一实施例的一种关键点的标注设备的硬件结构示意图。

具体实施方式

本申请实施例的目的是提供一种关键点的标注方法及装置,用以解决现有技术中对关键点的标注准确度较低的问题。

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

在机器学习任务中,样本数据标注的质量对模型训练的效果有很大的影响。然而,长期以来,数据标注存在标注不准确的问题,导致模型训练的正确性和精确度受到限制。尤其在关键点的标注方面,标注不准确的问题显得更为突出。比如,在人脸图像中标注出人脸3D关键点在图像上的投影位置时,由于人脸姿态、遮挡物等原因,一些人脸3D关键点的投影位置在图像中处于被遮挡的位置,此时需要标注人员根据经验猜测,以完成标注任务,这不仅增加了关键点的标注难度,且易造成标注不准确的问题。

为解决上述问题,相关技术中,在实现关键点标注方面,一方面,提供了一种多视角空间定位方法,该方法通过多个相机拍摄待测物体得到多个图像,并分别检测(基于模型进行检测)各图像上的待测物体的关键点坐标,从而根据各个图像上的关键点坐标和相机的投影矩阵(由相机参数组成,相机参数可基于相机标定得到)建立物体关键点的直线方程组,进而将直线方程组的最优解作为物体关键点的空间坐标。由于基于模型进行检测得到关键点坐标、以及相机标定的过程中难免带来误差,因此使得检测得到的各图像上的待测物体的关键点坐标存在标注不准确的问题,从而使得根据关键点坐标和相机的投影矩阵确定出的物体关键点的空间坐标的准确度较低。另一方面,提供了一种人脸关键点的定位方法,通过对人脸图像中的人脸关键点进行曲线拟合,将拟合曲线上每个关键点的位置修正为距离关键点原始位置最近的一点,从而确定出符合要求的人脸关键点的位置信息。这种方式在对单个人脸图像进行关键点标注时,虽然能够在一定程度上提升关键点的标注准确度,但对于基于多个人脸图像进行关键点标注的场景来说,由于该方式是基于单个图像进行曲线拟合及关键点修正的,因此,多个人脸图像上标注出的人脸关键点之间无法相互印证,难以确保关键点的标注准确度。可见,上述两种常见的方式仍然无法满足目前对关键点标注准确度的要求。为克服上述缺陷,本申请实施例提供一种关键点的标注方法及装置,以提升对关键点的标注准确度。

本申请实施例提供的关键点的标注方法适用于对多种待标注对象进行关键点标注的场景。例如,对规则物体(如正方体、长方体、球体等)进行关键点标注的场景、对不规则物体(如车辆、船只等)进行关键点标注的场景、对人脸进行关键点标注的场景等。后续实施例中,将以对人脸进行关键点标注的场景为例,详细说明本申请实施例提供的关键点的标注方法。

图1是根据本申请一实施例的一种关键点的标注方法的示意性流程图,如图1所示,该方法可包括:

S102,获取由相机阵列拍摄目标对象得到的N个图像。

其中,N为大于1的整数。

S104,针对目标对象的语义关键点,在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置。

其中,目标对象可对应有一个或多个语义关键点,针对任一图像,可通过预先训练的图像标注模型,在该图像上分别对目标对象的语义关键点进行预标注。图像标注模型的训练方式在后续实施例中详述,此处不赘述。

可选地,第一标注位置可以是语义关键点在图像上的二维坐标。为便于在后续实施例中,根据第一标注位置对第一空间位置进行计算,可将第一标注位置转换为三维坐标的形式,三维坐标的表征形式可以是3×1矩阵。假设第一标注位置为p

S106,根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置。

其中,可根据同一语义关键点对应在N个图像上的第一标注位置,确定该语义关键点对应的第一空间位置。可选地,预先训练的图像标注模型的输出(即第一标注位置)是有序的,不同图像上、相同输出顺序的语义关键点为同一语义关键点。以对人脸的语义关键点的标注为例,假设相机阵列中包括两个相机,预先训练的图像标注模型的输出依次为左眼角的标注位置、右眼角的标注位置和鼻梁的标注位置,那么,通过预先训练的图像标注模型,在两个相机分别拍摄的图像上对人脸的语义关键点进行预标注,均能够依次得到左眼角的标注位置、右眼角的标注位置和鼻梁的标注位置,在这两个相机拍摄的图像上、相同输出顺序的语义关键点为同一语义关键点。

S108,根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置。

其中,相机阵列可包括N个相机,每个相机分别对应一组相机参数,N个相机的相机参数组成了N组相机参数。

S110,根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。

其中,预设调整条件可包括:第一标注位置和对应的第二标注位置之间的距离大于预设阈值。

采用本申请实施例的技术方案,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该技术方案能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

在一个实施例中,执行S102之前,可执行如下步骤A1-A4:

步骤A1,搭建相机阵列。

示例性地,相机阵列可如图2所示,采用5个相同型号的相机(包括C

需要说明的是,本申请实施例对相机的型号没有特别要求,但要确保焦距可固定,畸变不大(即采用的是非鱼眼相机),且能够通过控制信号触发拍摄,以实现同步控制多相机拍摄的效果。本申请实施例对相机的朝向没有特别要求,但需要确保任何一个相机,至少要和相邻相机有较大的共视区域,从而有利于根据多个图像中的语义关键点的标注位置,确定语义关键点对应的空间位置。

步骤A2,相机内参数标定。

其中,相机标定(Camera Calibration)也称为相机内、外参数及畸变参数求解。相机内参数及畸变参数求解主要包括求取给定相机的内参数(如焦距(f

例如,可采用张正友标定法、传统相机标定法、主动视觉相机标定方法、相机自标定法中的任一种标定方法,依次对图2所示的5台相机进行相机内参数标定,估算内参数和畸变系数(包括径向畸变系数{K

步骤A3,世界坐标系建立。

本实施例中,可将相机阵列中任一台相机的相机坐标系确定为世界坐标系。示例性地,针对图2所示的相机阵列,可选择以中心相机C

步骤A4,相机外参数标定。

其中,相机外参数(Camera Extrinsic Parameters)用于描述相机在某个参考坐标系下的位置和朝向,通常用一个平移向量t来表达位置,并用一个旋转矩阵R来表达朝向。

示例性地,针对图2所示的相机阵列,可利用PnP(Perspective-n-Points)算法求取中心相机C

在一个实施例中,针对目标对象的语义关键点,在N个图像上分别进行预标注(即S102),可执行为:针对任一图像,将图像输入预先训练的图像标注模型,以通过图像标注模型对图像进行关键点标注,并输出语义关键点在图像上的第一标注位置。

其中,图像标注模型为根据多个样本对象上的已标注的样本语义关键点训练得到。可选地,在目标对象为人脸时,图像标注模型可以是任一基于机器学习的人脸关键点标注模型(如FAN模型、3DDFA_v2模型等),利用该人脸关键点标注模型对人脸图像进行关键点标注时,输入的数据可以是预处理过的人脸图像,从而对人脸图像进行关键点标注处理,输出的数据可以是预定义的多个关键点的坐标。对人脸图像的预处理可包括裁剪、转正、缩放到固定尺寸等。

在目标对象为物(如车辆)时,图像标注模型可以是RTM3D模型,利用该图像标注模型对车辆进行关键点标注时,输入的数据可以是车辆图像,从而对车辆图像进行关键点标注处理,输出的数据可以是预定义的多个关键点的坐标。

本实施例中,通过预先训练的图像标注模型对目标对象的语义关键点进行预标注,从而得到语义关键点在N个图像上的标注位置,由于图像标注模型是根据样本对象上的样本语义关键点训练得到,因此使得预标注出的语义关键点的数量及标注位置更加符合预期,有利于提升对语义关键点的预标注的准确度。

在一个实施例中,相机阵列中包括的N个相机,N个相机分别对应各自的一组相机参数,相机参数可包括内参数、外参数、畸变参数等。根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置(即S104),可执行为如下步骤B1-B3:

步骤B1,分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系。

示例性地,在图2所示的相机阵列(包括C

以相机C

同理,相机C

需要说明的是,步骤B1仅用于分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系,第一映射关系中的K、R、t、p和X无需代入具体数值,并可采用上述公式变换后的形式表征第一映射关系,以便后续步骤中根据第一映射关系确定第二映射关系。

步骤B2,将N个第一标注位置组合为第一标注位置集,并根据第一标注位置集以及N个第一映射关系,确定第二映射关系。其中,第二映射关系为第一标注位置集、N组相机参数和第一空间位置之间的映射关系。

沿用步骤B1中的举例,第一标注位置集即为{p

需要说明的是,步骤B2仅用于确定第二映射关系的表征形式,第二映射关系中的K、R、t、p和X无需代入具体数值。

步骤B3,根据第二映射关系、第一标注位置集以及N组相机参数,确定语义关键点对应的第一空间位置。

本实施例中,可将第一标注位置集以及N组相机参数的实际数值代入第二映射关系中,以得到语义关键点对应的第一空间位置。根据上述举例中的第二映射关系,可见第二映射关系为经典的AX=b形式,可利用最小二乘法,计算出使得AX=b的二次范数最小化的X,作为语义关键点对应的第一空间位置X。

本实施例中,通过分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系,将N个第一标注位置组合为第一标注位置集,并根据第一标注位置集以及N个第一映射关系,确定第二映射关系,由于第一映射关系仅为一个图像上的语义关键点的预标注位置与该语义关键点的空间位置之间的映射关系,而单个图像上的语义关键点的预标注位置存在标注不准确的可能性,因此,通过联合多个图像上的语义关键点的预标注位置与该语义关键点的空间位置之间建立第二映射关系,从而根据第二映射关系、第一标注位置集以及N组相机参数,确定语义关键点对应的第一空间位置,能够使得确定出的语义关键点的空间位置更加准确。

在一个实施例中,根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置(即S106),可执行为如下步骤C1-C2:

步骤C1,针对任一图像,确定拍摄图像的相机的相机参数。

其中,相机参数可包括内参数、外参数、畸变参数等。相机参数的标定方式已在上述实施例中详细说明,此处不再赘述。

步骤C2,根据相机参数、第一空间位置以及第一映射关系,确定相机参数对应的位置信息,作为语义关键点在对应图像上的第二标注位置。

沿用步骤B1-B3中的举例,第一标注位置分别为p

本实施例中,由于第一映射关系为单个图像上的语义关键点的标注位置与该语义关键点的空间位置及相机参数之间的映射关系,因此针对任一图像,通过确定拍摄图像的相机的相机参数和语义关键点的第一空间位置,根据第一映射关系即可快捷地、准确地确定出语义关键点的空间位置在各个图像上的投影位置。

在一个实施例中,确定N个第一标注位置中满足预设调整条件的目标标注位置(即S108),可执行为如下步骤D1-D3:

步骤D1,分别计算每个第一标注位置和对应的第二标注位置之间的距离。

本实施例中,可分别计算每个第一标注位置和对应的第二标注位置之间的欧式距离。

沿用步骤C1-C2中的举例,第一标注位置分别为p

步骤D2,若第一标注位置和对应的第二标注位置之间的距离大于预设阈值,则确定第一标注位置满足预设调整条件。

其中,预设调整条件即为第一标注位置和对应的第二标注位置之间的距离大于预设阈值。

本实施例中,可分别确定5个相机对应的5个图像中第一标注位置和对应的第二标注位置之间的欧式距离与预设阈值之间的大小关系。若同一图像中第一标注位置和对应的第二标注位置之间的欧式距离小于或等于预设阈值,则说明该图像中第一标注位置与对应的第二标注位置的偏差较小,即该图像上的第一标注位置的标注准确度较高;若同一图像中第一标注位置和对应的第二标注位置之间的欧式距离大于预设阈值,则说明该图像中第一标注位置与对应的第二标注位置的偏差较大,即该图像上的第一标注位置的标注准确度较差;若所有图像中(本实施例为5个)第一标注位置和对应的第二标注位置之间的欧式距离均小于或等于预设阈值,则说明所有图像中第一标注位置与对应的第二标注位置的偏差均较小,即所有图像上的第一标注位置的标注准确度均较高,此时,可确定在各图像上对目标对象的语义关键点进行预标注的标注一致性较好。

步骤D3,若第一标注位置和对应的第二标注位置之间的距离小于或等于预设阈值,则确定第一标注位置不满足预设调整条件。

本实施例中,通过分别计算每个第一标注位置和对应的第二标注位置之间的距离,并在距离大于预设阈值时,确定第一标注位置满足预设调整条件,即确定第一标注位置需要调整,实现了准确、高效地确定出需调整的标注位置的效果。

在一个实施例中,确定第一标注位置满足预设调整条件(即步骤D3)之后,可通过标注人员介入调整的方式对该第一标注位置进行调整,或者,通过自动调整的方式对该第一标注位置进行调整。

其中,当相机是普通的彩色相机时,需要至少两个不同相机拍摄的图像,才能确定出语义关键点对应的空间坐标。当相机为深度相机时,根据单个相机拍摄的图像即可确定出语义关键点对应的空间坐标。

在通过自动调整的方式对该第一标注位置进行调整的情况下,计算机可首先判断相机的类型(普通的彩色相机或深度相机),根据相机的类型自动挑选图像,在被挑选出的图像中,需要调整的第一标注位置应清晰可见,然后根据预先设定的调整规则,调整所选图像中的第一标注位置。预先设定的调整规则可包括:在第一标注位置和第二标注位置之间的距离大于预设阈值、且小于或等于预设调整阈值时,对第一标注位置进行第一调整处理;在第一标注位置和第二标注位置之间的距离大于预设阈值、且大于预设调整阈值时,对第一标注位置进行第二调整处理;等等。

其中,第一调整处理可以是将第一标注位置调整至第二标注位置的调整处理,第二调整处理可以是将第一标注位置调整至第一标注位置与第二标注位置之间的预设位置处的调整处理。可选地,预设位置可以是第一标注位置与第二标注位置之间的中心位置、距离第一标注位置预设距离的位置等。此外,预先设定的调整规则的具体内容、第一调整处理及第二调整处理的具体调整方式,可根据具体的关键点标注任务确定,本申请实施例对此不做限定。

在相机阵列中的各相机均为普通的彩色相机、且由标注人员介入调整的情况下,标注人员需要挑选至少两个相机拍摄的图像,在被挑选出的图像中,需要调整的第一标注位置应清晰可见,然后依据培训要求,同时参考多个所选图像,相互印证、联合调整所选图像中的第一标注位置。

可选地,对于标注人员未挑选的图像,可将其进行屏蔽处理,以避免对标注人员造成干扰;对于标注人员挑选出的图像,可将其并排显示、并在每一图像上分别叠加所挑选的图像上需要调整的第一标注位置,以方便标注人员进行联合调整。

本实施例中,由于仅对满足预设调整条件的第一标注位置进行调整,因此大大减少了标注人员或计算机的工作量,节约了标注的人力成本,且将机器标注与人工调整相结合,能够进一步提升关键点的标注准确度。

在一个实施例中,对目标标注位置进行调整(即S108)之后,可执行如下步骤E1-E4:

步骤E1,确定对目标标注位置进行调整后得到的第三标注位置。

其中,目标标注位置为满足预设调整条件的第一标注位置。

步骤E2,根据第三标注位置,确定语义关键点对应的第二空间位置。

该步骤中,根据第三标注位置确定语义关键点对应的第二空间位置的具体执行方式,可参见步骤B1-B3中根据第一标注位置确定语义关键点对应的第一空间位置的执行方式,二者的区别仅在于各映射关系中代入的标注位置不同(该步骤中代入第三标注位置),此处不再赘述。

可选地,在对关键点的标注准确度要求不高的场景下,可根据第三标注位置和不满足预设调整条件的第一标注位置,确定语义关键点对应的第二空间位置。

步骤E3,根据N个相机分别对应的一组相机参数,将第二空间位置分别投影至N个图像上,得到语义关键点在各图像上的第四标注位置。

该步骤中,将第二空间位置投影至N个图像上得到第四标注位置的具体执行方式,可参见步骤C1-C2中将第一空间位置投影至N个图像上得到第二标注位置的执行方式,此处不再赘述。

步骤E4,根据目标对象的形态特征、N组相机参数和第二空间位置,对N个第四标注位置进行一致性调整,以使第四标注位置与形态特征相匹配。

其中,目标对象的形态特征可以是目标对象的轮廓特征、形状特征等。

本实施例中,通过在对目标标注位置进行调整之后,确定对目标标注位置进行调整后得到的第三标注位置,并根据第三标注位置确定语义关键点对应的第二空间位置,由于第三标注位置是调整之后得到的、准确的标注位置,因此根据语义关键点的第三标注位置确定出的语义关键点对应的第二空间位置的准确度较高,从而根据N个相机分别对应的一组相机参数,将第二空间位置分别投影至N个图像上,得到的语义关键点在各图像上的第四标注位置的准确度也较高,进一步地,根据目标对象的形态特征、N组相机参数和第二空间位置,对N个第四标注位置进行一致性调整,以使第四标注位置与形态特征相匹配,使得语义关键点的标注结果与目标对象的形态特征更匹配。

在一个实施例中,根据目标对象的形态特征、N组相机参数和第二空间位置,对N个第四标注位置进行一致性调整(即步骤E4),可执行为如下步骤F1-F3:

步骤F1,根据目标对象的形态特征,分别对每个图像上属于同一类形态的M个语义关键点进行曲线拟合,得到拟合后的第一曲线。

其中,M为大于1的整数。可根据目标对象的形态特征,预先将图像上的多个语义关键点划分为多类形态,比如,眼睛周围的语义关键点对应的形态类型为眼睛轮廓,嘴巴周围的语义关键点对应的形态类型为嘴巴轮廓。从而针对每类形态的语义关键点进行曲线拟合,得到拟合后的第一曲线。第一曲线可为平滑的曲线。

示例性地,以对人脸进行关键点标注为例,可预先将图像上的多个语义关键点划分为如下多类形态:左脸轮廓、右脸轮廓、上嘴唇外轮廓、上嘴唇内轮廓、下嘴唇外轮廓、下嘴唇内轮廓、鼻子下轮廓、鼻梁、左眼上轮廓、左眼下轮廓、右眼上轮廓和右眼下轮廓。

可选地,可预设每类形态的语义关键点满足一条参数化曲线(如n阶贝塞尔曲线,n的大小由实际形态类型所对应的形态特征确定),从而根据参数化曲线对该形态类型的各语义关键点进行曲线拟合。其中,具体采用何种参数化曲线,以及如何划分图像上的多个语义关键点所属的形态类型,需根据具体的关键点标注任务(如待标注的对象、该对象的轮廓特征、形状特征等)确定,本申请实施例对此不做限定。此外,若某一(些)关键点标注任务无需根据待标注的对象的形态特征,对图像上的多个语义关键点进行曲线拟合(如对正方体、球体等规则物体进行关键点标注的任务),则可略过步骤F1。

步骤F2,根据N个相机分别对应的一组相机参数,确定第二空间位置在N个图像上的投影线,投影线用于表征第二空间位置和对应相机之间的投影关系。

其中,投影线可为对极线,每一语义关键点在N个图像上分别对应一根对极线。对极线的确定只依赖于相机内参数和两个相机之间的相对外参数(包括相对位置和相对朝向)。

示例性地,如图3所示,C

步骤F3,将N个第四标注位置分别调整至对应的第一曲线和投影线之间的交点。

示例性地,如图4所示,410为第一曲线,420为投影线,430为一个图像上的一个第四标注位置,将第四标注位置调整至对应的第一曲线和投影线之间的交点,即为将第四标注位置从430处调整至440处。

本实施例中,能够根据形态特征分别对每个图像上属于同一类形态的M个(M为大于1的整数)语义关键点进行曲线拟合,得到拟合后的第一曲线,由于目标对象的多个语义关键点之间一般存在相互约束关系,因此根据形态特征分别对每个图像上属于同一类形态的多个语义关键点进行曲线拟合后,得到的曲线更能反映目标对象的实际形态;并且,能够根据N组相机参数,确定第二空间位置在N个图像上的投影线(用于表征第二空间位置和对应相机之间的投影关系),从而将N个第四标注位置分别调整至对应的第一曲线和投影线之间的交点,由于语义关键点的空间位置在各图像上的投影线具有一致性,因此,将语义关键点的标注位置调整至拟合曲线和投影线的交点,不仅使得标注结果与目标对象的形态特征更匹配,且提升了标注结果的一致性。

在一个实施例中,根据N组相机参数,确定第二空间位置在N个图像上的投影线(即步骤F2),可执行为如下步骤G1-G4:

步骤G1,从N个第一标注位置中,确定距离最小的第一标注位置对应的第一目标图像,以及距离次小的第一标注位置对应的第二目标图像。

其中,距离最小的第一标注位置即是第一标注位置与第二标注位置之间的距离最小时,所对应的第一标注位置。第一标注位置与第二标注位置之间的距离的确定方式可参见步骤D1,此处不再赘述。

步骤G2,确定第一目标图像对应的第一相机参数,以及第二目标图像对应的第二相机参数。

其中,可确定第一目标图像对应的第一相机外参数,以及第二目标图像对应的第二相机外参数。

步骤G3,根据第一相机参数和第二空间位置,确定第二空间位置在除第一目标图像之外的其它图像上的投影线。

其中,可根据第一相机外参数和第二空间位置,确定第二空间位置在除第一目标图像之外的其它图像上的投影线。

步骤G4,根据第二相机参数和第二空间位置,确定第二空间位置在第一目标图像上的投影线。

其中,可根据第二相机外参数和第二空间位置,确定第二空间位置在第一目标图像上的投影线。

示例性地,针对图2所示的相机阵列(包括C

本实施例中,通过从N个第一标注位置中,确定距离最小的第一标注位置对应的第一目标图像,以及距离次小的第一标注位置对应的第二目标图像,并确定第一目标图像对应的第一相机参数,以及第二目标图像对应的第二相机参数,从而根据第一相机参数和第二空间位置,确定第二空间位置在除第一目标图像之外的其它图像上的投影线,由于第一目标图像是语义关键点的标注最准确的图像,因此根据该图像对应的相机参数,确定第二空间位置在其他图像上的投影线,能够确保确定出的投影线的准确度;并且,根据第二相机参数和第二空间位置,确定第二空间位置在第一目标图像上的投影线,实现了准确确定出空间位置在各图像上的投影线的效果。

图5是根据本申请另一实施例的一种关键点的标注方法的示意性流程图,本实施例中,关键点的标注方法应用于对规则物体(如正方体、长方体、球体等)进行关键点标注的场景。下面以对目标对象的任一语义关键点,在由相机阵列(包含N个相机)拍摄得到的N个图像上进行标注为例,详细说明本实施例提供的关键点的标注方法。如图5所示,该方法可包括:

S501,获取由相机阵列拍摄目标对象得到的N个图像。

其中,相机阵列中可包括N个相机,每个相机分别对应一组相机参数,N个相机的相机参数组成了N组相机参数,N为大于1的整数。

S502,针对目标对象的语义关键点,在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置。

其中,针对任一图像,可将图像输入预先训练的图像标注模型,以通过图像标注模型对图像进行关键点标注,并输出语义关键点在图像上的第一标注位置,图像标注模型为根据多个样本对象上的已标注的样本语义关键点训练得到。

S503,分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系。

其中,相机参数可包括内参数、外参数、畸变参数等。

S504,将N个第一标注位置组合为第一标注位置集,并根据第一标注位置集以及N个第一映射关系,确定第二映射关系,第二映射关系为第一标注位置集、N组相机参数和第一空间位置之间的映射关系。

S505,根据第二映射关系、第一标注位置集以及N组相机参数,确定语义关键点对应的第一空间位置。

S506,针对任一图像,根据相机参数、第一空间位置以及第一映射关系,确定相机参数对应的位置信息,作为语义关键点在对应图像上的第二标注位置。

S507,根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,分别计算每个第一标注位置和对应的第二标注位置之间的距离。

其中,可分别计算每个第一标注位置和对应的第二标注位置之间的欧式距离。

S508,针对任一图像,判断第一标注位置和对应的第二标注位置之间的距离是否小于或等于预设阈值;若否,则执行S509;若是,则执行S510。

S509,确定第一标注位置为满足预设调整条件的目标标注位置,并对目标标注位置进行调整,将调整后的标注位置确定为在该图像上对目标对象的语义关键点的标注结果。

S510,确定第一标注位置未满足预设调整条件,将第二标注位置确定为在该图像上对目标对象的语义关键点的标注结果。

需要说明的是,由于第一标注位置与对应的第二标注位置之间的距离小于或等于预设阈值,因此,可认为第一标注位置与对应的第二标注位置均是标注较准确的标注位置,此时,可将第一标注位置、第二标注位置中的任一个,确定为在图像上对目标对象的语义关键点的标注结果。

上述S501-S510的具体过程在上述实施例中已进行详细说明,此处不再赘述。

采用本申请实施例的技术方案,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该技术方案能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

下面通过一具体业务场景来说明本申请提供的关键点的标注方法。在一业务场景中,相机阵列包括三个相机,三个相机以一定角度(如45度)等间隔、固定排列在一个圆环支架上,圆环支架上的三个相机中、中间位置的相机拍摄目标对象得到的图像为目标对象的正视图。该业务场景需要对目标人脸中的鼻梁关键点进行标注,得到鼻梁关键点在三个相机拍摄目标人脸得到的三个人脸图像上的标注位置。该业务场景中,目标对象为目标人脸,目标对象的语义关键点为目标人脸的鼻梁关键点。图6至图7所示实施例均以此场景为例进行说明。图6是根据本申请一实施例的一种对人脸图像进行关键点标注的示意图。

如图6所示,相机阵列中的三个相机分别从不同视角拍摄人脸图像,得到(a)、(b)和(c)三个不同角度的人脸图像,其中,人脸图像(b)面向正前方,人脸图像(a)和(c)分别面向偏左一定角度(如45度)和偏右一定角度(如45度)的方向。610、620和630为相关技术中,标注人员人工标注出的鼻梁关键点在人脸图像中的标注位置,在三个人脸图像处于同一水平位置的情况下,610、620和630并不在同一条水平线上。可见,由于受到标注人员的主观判断影响,因此在对不同视角拍摄得到的、同一人脸的人脸图像中标注鼻梁关键点对应的标注位置时,易出现标注不准确的问题。640、650和660为采用本申请提供的关键点的标注方法在三个人脸图像中对鼻梁关键点进行标注后,得到的鼻梁关键点在三个人脸图像上的标注位置,在三个人脸图像处于同一水平位置的情况下,640、650和660处于同一条水平线上。图7是根据本申请另一实施例的一种关键点的标注方法的示意性流程图,如图7所示,该方法可包括:

S701,获取由相机阵列拍摄目标人脸得到的三个人脸图像。

其中,相机阵列中包括三个相机,三个相机分别对应一组相机参数,三个相机的相机参数组成了三组相机参数。

S702,针对目标人脸的鼻梁关键点,在三个人脸图像上分别进行预标注,得到鼻梁关键点在各人脸图像上的第一标注位置。

其中,针对任一人脸图像,可将人脸图像输入预先训练的图像标注模型,以通过图像标注模型对人脸图像进行关键点标注,并输出鼻梁关键点在人脸图像上的第一标注位置,图像标注模型为根据多个样本对象上的已标注的样本语义关键点训练得到。

S703,根据鼻梁关键点对应的三个第一标注位置,确定鼻梁关键点对应的第一空间位置。

其中,可首先分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系,然后,将三个第一标注位置组合为第一标注位置集,并根据第一标注位置集以及三个第一映射关系,确定第二映射关系,并根据第二映射关系、第一标注位置集以及三组相机参数,确定鼻梁关键点对应的第一空间位置。

其中,相机参数可包括内参数、外参数、畸变参数等。

S704,根据相机阵列对应的三组相机参数,将第一空间位置分别投影至三个人脸图像上,得到鼻梁关键点在各人脸图像上的第二标注位置。

其中,针对任一人脸图像,可根据相机参数、第一空间位置以及第一映射关系,确定相机参数对应的位置信息,作为鼻梁关键点在对应人脸图像上的第二标注位置。

S705,根据三个人脸图像上第一标注位置和对应的第二标注位置之间的位置关系,确定三个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。

其中,可分别计算每个第一标注位置和对应的第二标注位置之间的距离,若距离大于预设阈值,则确定第一标注位置满足预设调整条件;若距离小于或等于预设阈值,则确定第一标注位置未满足预设调整条件。可选地,可分别计算每个第一标注位置和对应的第二标注位置之间的欧式距离。

在一个实施例中,针对任一人脸图像,若根据第一标注位置和对应的第二标注位置之间的位置关系,确定出鼻梁关键点的第一标注位置不满足预设调整条件,则可认为在该人脸图像上对目标人脸的鼻梁关键点的标注准确度较高,此时无需对第一标注位置进行调整;并且,可将第一标注位置、第二标注位置中的任一个,确定为在该人脸图像上对目标人脸的鼻梁关键点的标注结果,之后执行S709。

S706,确定对目标标注位置进行调整后得到的第三标注位置。

S707,根据第三标注位置,确定鼻梁关键点对应的第二空间位置。

S708,根据三组相机参数,将第二空间位置分别投影至三个人脸图像上,得到鼻梁关键点在各人脸图像上的第四标注位置。

S709,根据目标人脸的形态特征,分别对每个人脸图像上鼻梁关键点所属形态类型的M个语义关键点进行曲线拟合,得到拟合后的第一曲线。

S710,根据三组相机参数,确定第二空间位置在三个人脸图像上的投影线。

其中,投影线用于表征第二空间位置和对应相机之间的投影关系。可根据S705计算出的第一标注位置和第二标注位置之间的距离,从三个第一标注位置中,确定距离最小的第一标注位置对应的第一目标人脸图像,以及距离次小的第一标注位置对应的第二目标人脸图像,确定第一目标人脸图像对应的第一相机参数,以及第二目标人脸图像对应的第二相机参数,从而根据第一相机参数和第二空间位置,确定第二空间位置在除第一目标人脸图像之外的其它人脸图像上的投影线,并根据第二相机参数和第二空间位置,确定第二空间位置在第一目标人脸图像上的投影线。

S711,将三个第四标注位置分别调整至对应的第一曲线和投影线之间的交点。

在一个实施例中,针对三个人脸图像中的鼻梁关键点,在分别将鼻梁关键点在人脸图像上的标注位置调整至对应的第一曲线和投影线之间的交点之后,可将交点作为鼻梁关键点对应的第一标注位置,返回执行S703,根据预设循环次数循环执行S703-S711,得到鼻梁关键点在三个人脸图像上的最终标注位置,以提升标注结果的准确度,以及提升各人脸图像上标注结果的一致性。本申请实施例中,预设循环次数可根据具体的关键点标注任务的任务要求(如标注结果的精度要求、关键点标注的标注速度要求等)进行设置。例如,在要求忽略标注结果的精度、仅确保对关键点标注的标注速度的情况下,可以不循环执行S703-S711(即仅执行一次S703-S711);在要求确保标注结果的精度、忽略对关键点标注的标注速度的情况下,可以多次循环执行S703-S711,其中可设置较多的循环次数,如5次、8次等;在要求同时确保标注结果的精度和对关键点标注的标注速度的情况下,可以循环执行S703-S711,其中可设置较少的循环次数,如2次、3次等,本申请实施例对此不做限定。

S712,针对任一人脸图像,将调整后的交点确定为在该人脸图像上对目标人脸的鼻梁关键点的标注结果。

上述S701-S712的具体过程在上述实施例中已进行详细说明,此处不再赘述。

采用本申请实施例的技术方案,通过获取由相机阵列拍摄目标人脸得到的三个人脸图像,针对目标人脸的鼻梁关键点在三个人脸图像上分别进行预标注,得到鼻梁关键点在各人脸图像上的第一标注位置,根据三个第一标注位置确定鼻梁关键点对应的第一空间位置,并将第一空间位置分别投影至三个人脸图像上,得到鼻梁关键点在三个人脸图像上的第二标注位置,从而根据三个图像上第一标注位置和对应的第二标注位置之间的位置关系,对第一标注位置中满足预设调整条件的目标标注位置进行调整,根据调整后得到的第三标注位置确定鼻梁关键点对应的第二空间位置,并将第二空间位置分别投影至三个人脸图像上,得到鼻梁关键点在三个人脸图像上的第四标注位置,进而根据目标人脸的形态特征、三组相机参数和第二空间位置,对三个第四标注位置进行一致性调整,以使第四标注位置与形态特征相匹配。由于第二标注位置实际为鼻梁关键点的空间位置在三个人脸图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该技术方案能够基于鼻梁关键点的投影位置与预标注位置之间的位置关系调整鼻梁关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度。此外,通过对各第四标注位置进行一致性调整,以使第四标注位置与形态特征相匹配,能够使得鼻梁关键点的标注结果与目标人脸的形态特征更匹配。

综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。

以上为本申请实施例提供的关键点的标注方法,基于同样的思路,本申请实施例还提供一种关键点的标注装置。

图8是根据本申请一实施例的一种关键点的标注装置的结构示意图,请参考图8,关键点的标注装置可包括:

获取模块810,用于获取由相机阵列拍摄目标对象得到的N个图像,其中N为大于1的整数;

预标注模块820,用于针对目标对象的语义关键点,在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置;

第一确定模块830,用于根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置;

第一投影模块840,用于根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置;

确定及调整模块850,用于根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。

在一个实施例中,相机阵列中包括的N个相机,N个相机分别对应各自的一组相机参数,相机参数包括内参数、外参数、畸变参数中的至少一项;

第一确定模块830包括:

第一确定单元,用于分别确定每个第一标注位置与对应的一组相机参数、第一空间位置之间的第一映射关系;

组合及确定单元,用于将N个第一标注位置组合为第一标注位置集,并根据第一标注位置集以及N个第一映射关系,确定第二映射关系,第二映射关系为第一标注位置集、N组相机参数和第一空间位置之间的映射关系;

第二确定单元,用于根据第二映射关系、第一标注位置集以及N组相机参数,确定语义关键点对应的第一空间位置。

在一个实施例中,第一投影模块840包括:

第三确定单元,用于针对任一图像,确定拍摄图像的相机的相机参数;

第四确定单元,用于根据相机参数、第一空间位置以及第一映射关系,确定相机参数对应的位置信息,作为语义关键点在对应图像上的第二标注位置。

在一个实施例中,确定及调整模块850包括:

计算单元,用于分别计算每个第一标注位置和对应的第二标注位置之间的距离;

第五确定单元,用于若距离大于预设阈值,则确定第一标注位置满足预设调整条件。

在一个实施例中,关键点的标注装置还包括:

第二确定模块,用于对目标标注位置进行调整之后,确定对目标标注位置进行调整后得到的第三标注位置;

第三确定模块,用于根据第三标注位置,确定语义关键点对应的第二空间位置;

第二投影模块,用于根据N组相机参数,将第二空间位置分别投影至N个图像上,得到语义关键点在各图像上的第四标注位置;

调整模块,用于根据目标对象的形态特征、N组相机参数和第二空间位置,对N个第四标注位置进行一致性调整,以使第四标注位置与形态特征相匹配。

在一个实施例中,调整模块包括:

曲线拟合单元,用于根据形态特征,分别对每个图像上属于同一类形态的M个语义关键点进行曲线拟合,得到拟合后的第一曲线;M为大于1的整数;

第六确定单元,用于根据N组相机参数,确定第二空间位置在N个图像上的投影线,投影线用于表征第二空间位置和对应相机之间的投影关系;

调整单元,用于将N个第四标注位置分别调整至对应的第一曲线和投影线之间的交点。

在一个实施例中,第六确定单元具体用于:

从N个第一标注位置中,确定距离最小的第一标注位置对应的第一目标图像,以及距离次小的第一标注位置对应的第二目标图像;

确定第一目标图像对应的第一相机参数,以及第二目标图像对应的第二相机参数;

根据第一相机参数和第二空间位置,确定第二空间位置在除第一目标图像之外的其它图像上的投影线;

根据第二相机参数和第二空间位置,确定第二空间位置在第一目标图像上的投影线。

在一个实施例中,预标注模块820包括:

输入单元,用于针对任一图像,将图像输入预先训练的图像标注模型,以通过图像标注模型对图像进行关键点标注,并输出语义关键点在图像上的第一标注位置;

其中,图像标注模型为根据多个样本对象上的已标注的样本语义关键点训练得到。

采用本申请实施例的装置,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该装置能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

本领域的技术人员应可理解,图8中的关键点的标注装置能够用来实现前文所述的关键点的标注方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。

基于同样的思路,本申请实施例还提供一种关键点的标注设备,如图9所示。关键点的标注设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器901和存储器902,存储器902中可以存储有一个或一个以上存储应用程序或数据。其中,存储器902可以是短暂存储或持久存储。存储在存储器902的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对关键点的标注设备中的一系列计算机可执行指令。更进一步地,处理器901可以设置为与存储器902通信,在关键点的标注设备上执行存储器902中的一系列计算机可执行指令。关键点的标注设备还可以包括一个或一个以上电源903,一个或一个以上有线或无线网络接口904,一个或一个以上输入输出接口905,一个或一个以上键盘906。

具体在本实施例中,关键点的标注设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对关键点的标注设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:

获取由相机阵列拍摄目标对象得到的N个图像,其中N为大于1的整数;

针对目标对象的语义关键点,在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置;

根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置;

根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置;

根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。

采用本申请实施例的设备,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该设备能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

本申请实施例还提出了一种存储介质,该存储介质存储一个或多个计算机程序,该一个或多个计算机程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行上述一种关键点的标注方法,并具体用于执行:

获取由相机阵列拍摄目标对象得到的N个图像,其中N为大于1的整数;

针对目标对象的语义关键点,在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置;

根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置;

根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置;

根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。

采用本申请实施例的存储介质,通过获取由相机阵列拍摄目标对象得到的N个(N为大于1的整数)图像,针对目标对象的语义关键点在N个图像上分别进行预标注,得到语义关键点在各图像上的第一标注位置,从而根据语义关键点对应的N个第一标注位置,确定语义关键点对应的第一空间位置,并根据相机阵列对应的N组相机参数,将第一空间位置分别投影至N个图像上,得到语义关键点在各图像上的第二标注位置,进而根据N个图像上第一标注位置和对应的第二标注位置之间的位置关系,确定N个第一标注位置中满足预设调整条件的目标标注位置,并对目标标注位置进行调整。由于第二标注位置实际为语义关键点的空间位置在N个图像上的投影位置,因此基于预标注位置反推空间位置进而反推出投影位置的方式来判断预标注位置是否准确,能够实现针对预标注位置是否准确的快捷性、准确性的判定。进一步地,该存储介质能够基于语义关键点的投影位置与预标注位置之间的位置关系调整语义关键点的预标注位置,能够为调整预标注位置提供有力的调整依据(即投影位置和预标注位置之间的位置关系),从而提升了关键点的标注准确度,尤其对于图像中不可见的语义关键点(比如被遮挡),通过预标注位置反推投影位置,能够准确确定这类语义关键点的标注位置,从而避免了依赖标注人员的推测对关键点进行标注所带来的标注准确度较低、以及标注困难的问题。

上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

技术分类

06120114582111