语义特征描述子确定方法、装置和电子设备

文献发布时间：2024-04-18 19:54:45

技术领域

本发明涉及语义描述子应用的技术领域，尤其是涉及一种语义特征描述子的确定方法、装置和电子设备。

背景技术

特征描述子是指按照某种方式设计的，对特征周围像素有描述作用的信息。它是按照外观相似的特征应该有相似的描述子的原则设计的，可以用一个向量表示。

目前，特征描述子大致分为两大类：基于传统方法的手工描述子和基于深度学习方法的训练描述子。以BRIEF、SIFT、SUFT为首的传统手工特征描述子目前已比较成熟，它们通过人为设计较好地对特征周围像素的灰度关系进行了描述，实现特征的匹配，但不同光照、天气等因素对这些方法的鲁棒性影响较大，使其在室外的应用中受到了极大的限制。基于深度学习的描述子正是在这样的背景下应运而生的。但这类方法需要大量的训练样本，算力和实时性也很难满足量产需求。

发明内容

有鉴于此，本发明的目的在于提供一种语义特征描述子的确定方法、装置和电子设备，缓解现有技术中存在的鲁棒性低以及难以满足量产需求的技术问题。

第一方面，实施例提供一种语义特征描述子的确定方法，所述方法包括：

从车辆采集的当前帧图像中，提取符合预设需求的目标特征；

根据所述当前帧图像对应的语义分割图，确定所述目标特征对应的类别映射；

基于所述类别映射，确定所述当前帧图像中的语义特征描述子。

在可选的实施方式中，所述语义特征描述子包括所述目标特征的语义类别、所述目标特征的相邻空间语义类别和所述目标特征到相邻空间的像素距离。

在可选的实施方式中，从车辆采集的当前帧图像中，提取符合预设需求的目标特征的步骤，包括：

根据预设需求对应的目标对象类型，确定待提取的目标特征；其中，所述目标特征包括以下的一项或多项：点特征、线特征和面特征；

从车辆采集的当前帧图像中，提取所述目标特征。

在可选的实施方式中，根据所述当前帧图像对应的语义分割图，确定所述目标特征对应的类别映射的步骤，包括：

根据所述目标特征在所述当前帧图像中的第一位置，确定所述目标特征在所述当前帧图像对应的语义分割图中的第二位置；其中，所述当前帧图像和所述当前帧图像对应的语义分割图具有相同的尺寸参数；

基于所述语义分割图中的第二位置，确定所述目标特征对应的语义类别以及所述目标特征的相邻空间语义类别。

在可选的实施方式中，所述方法还包括：

计算所述当前帧图像中的语义特征描述子和目标描述子的相似度；其中，所述目标描述子来自前一帧图像和/或预设地图。

在可选的实施方式中，计算所述当前帧图像中的语义特征描述子和目标描述子的相似度的步骤，包括：

根据所述当前帧图像中的语义特征描述子和目标描述子中每个语义类别的匹配结果，确定权重系数；

基于所述权重系数以及每个目标特征到相邻空间的像素距离，确定所述语义特征描述子和目标描述子的相似度。

在可选的实施方式中，所述方法还包括：

基于所述相似度，校核所述语义特征描述子的实际应用模型。

第二方面，实施例提供一种语义特征描述子的确定装置，所述装置包括：

提取模块，从车辆采集的当前帧图像中，提取符合预设需求的目标特征；

第一确定模块，根据所述当前帧图像对应的语义分割图，确定所述目标特征对应的类别映射；

第二确定模块，基于所述类别映射，确定所述当前帧图像中的语义特征描述子。

第三方面，实施例提供一种电子设备，包括存储器、处理器，所述存储器中存储有可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述前述实施方式任一项所述的方法的步骤。

第四方面，实施例提供一种机器可读存储介质，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被处理器调用和执行时，机器可执行指令促使处理器实现前述实施方式任一项所述的方法的步骤。

本发明实施例提供的一种语义特征描述子的确定方法、装置和电子设备，从车辆采集的图像帧中提取相应满足预设需求的目标特征，并从与该图像帧对应的语义分割图中获知每个目标特征对应的类别映射，基于该类别映射能够确定出该图像帧中，每个目标特征对应的语义特征描述子，此种方式确定出的特征描述子在能够保证特征描述能力的基础上，还能够摆脱对光线天气等外界因素的依赖。

本公开的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本公开的上述技术即可得知。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种语义特征描述子的确定方法流程图；

图2为本发明实施例提供的一种语义特征描述子的组成结构示意图；

图3为本发明实施例提供的一种语义特征描述子中的语义类别顺序分布示意图；

图4为本发明实施例提供的一种语义分割图中的目标特征示意图；

图5为本发明实施例提供的一种语义特征描述子的确定装置的功能模块图；

图6为本发明实施例提供的一种电子设备的硬件架构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

当前的手工描述子受光照、天气等因素的鲁棒性影响较大，其在室外应用具有较大的限制；在此基础上，可基于深度学习方法训练描述子，此种描述子能够摆脱室外环境光线天气等因素的影响，但该描述子的获得需要大量训练样本，成本要求较高量产难以满足。

基于此，本发明实施例提供的一种语义特征描述子的确定方法、装置和电子设备，利用语义信息对于光照、天气的稳定性，定义一种鲁棒性更高的特征描述子，极大地改善了特征的描述能力。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种语义特征描述子的确定方法进行详细介绍，该方法可应用于车机、车辆控制器，也可应用于上位机、服务器等智能控制设备中。

图1为本发明实施例提供的一种语义特征描述子的确定方法流程图。

如图1所示，该方法包括以下步骤：

步骤S102，从车辆采集的当前帧图像中，提取符合预设需求的目标特征。

其中，车辆可通过视觉传感器等采集设备对车辆行驶道路以及道路周边设施进行采集，并从中获取各个时刻对应的图像帧；不同车辆或应用场景可具有不同的预设需求，如车辆涉及停车场景，则该目标特征可能与车道线、角点等特征相关；本发明实施例中的目标对象主要可理解为静态物体，即动态障碍物无论是相邻帧匹配过程还是地图匹配过程中都是需要去掉的对象。该静态物体包括建筑物、交通设施、标识牌、灯杆、地面标线等等，这些静态物体上的角点、线、面是待研究和匹配的目标特征。

步骤S104，根据当前帧图像对应的语义分割图，确定目标特征对应的类别映射。

其中，每个图像帧均可通过深度学习网络获取其对应的语义分割图，该语义分割图能够摆脱光线天气等的因素影响，能够对每个对象的类别进行标识；类别映射可理解能够对目标特征自身的类别以及该目标特征相邻空间的各个特征类别进行获知的参数。

步骤S106，基于类别映射，确定当前帧图像中的语义特征描述子。

这里，根据该类别映射能够定义出图像帧对应的语义特征描述子，该描述子能够摆脱对光线天气等影响因素的依赖。

在实际应用的优选实施例中，从车辆采集的图像帧中提取相应满足预设需求的目标特征，并从与该图像帧对应的语义分割图中获知每个目标特征对应的类别映射，基于该类别映射能够确定出该图像帧中，每个目标特征对应的语义特征描述子，此种方式确定出的特征描述子在能够保证特征描述能力的基础上，还能够摆脱对光线天气等外界因素的依赖。

在一些实施例中，该语义特征描述子由目标特征的语义类别、目标特征的相邻空间语义类别和目标特征到相邻空间的像素距离组成。

如图2所示，该语义特征描述子包括SK、NK、ND三部分，其中，SK：表示目标特征的语义类别，其数据类型为unsigned char，NK：表示目标特征相邻空间的语义类别，其数据类型为unsigned char，ND：表示目标特征到相邻空间的像素距离，其数据类型为unsigned int。NK和ND分别对应有8个变量，即该相邻空间可理解为目标特征沿上、下、左、右，左上、左下、右上、右下，8个方向分别相邻的特征；目标特征到相邻空间的像素距离可理解为从目标特征沿上、下、左、右，左上、左下、右上、右下，8个方向到相邻空间特征具有的像素距离。

需要说明的是，上述8个方向需要预先定义顺序，该顺序的具体预先定义情况可根据实际情况进行调整；描述子定义与该方向顺序定义要严格一一对应。也就是说图2中的描述子对应的17个变量是存在顺序的，NK和ND变量中的1-8就是根据这个顺序进行定义排布来的。其中，图3所示为一种目标特征的方向顺序定义示意图，该图3中顺序若发生改变，则对应生成的描述子需要对应调整。

在一些实施例中，依据预设需求提取图像帧中的目标特征，以便于后续特征描述子的生成；这里，该步骤S102，可通过以下步骤实现，包括：

步骤2.1)，根据预设需求对应的目标对象类型，确定待提取的目标特征。

其中，目标对象类型可理解为预设需求对何种类型的目标对象进行检测，该实际目标对象类型依据应用场景而定，不同的类型可能需要提取不同的目标特征；目标特征包括以下的一项或多项：矩形框特征、点特征、线特征和面特征。图像特征中以点特征最为普遍，一般为物体或纹理的角点。

步骤2.2)，从车辆采集的当前帧图像中，提取目标特征。

其中，图像帧的目标特征提取可利用常规特征提取器实现。

在一些实施例中，为了得到具有较优特征描述能力的描述子，可通过获取目标特征对应的类别映射进而实现，该步骤S104具体可包括如下步骤：

步骤3.1)，根据目标特征在当前帧图像中的第一位置，确定目标特征在当前帧图像对应的语义分割图中的第二位置。

其中，当前帧图像和当前帧图像对应的语义分割图具有相同的尺寸和比例，因此，能够根据目标特征的图像帧中的第一位置确定其在语义分割图中的第二位置。

步骤3.2)，基于语义分割图中的第二位置，确定目标特征对应的语义类别以及目标特征的相邻空间语义类别。

需要说明的是，语义分割图是利用深度学习对图像帧中每个像素进行分类，给出每个像素对应的类别标签，即基于语义分割图可以分出哪些像素的类别是建筑物、哪些是人、哪些是树木、哪些是车道线等等。语义分割采用现有技术即可实现，利用该语义分割技术生成语义描述子，能够更高维度地描述一个特征。这样基于该特征描述子定位的鲁棒性会得到大幅提升；而传统的特征描述子很容易受环境影响而失效，导致定位能力下降，甚至定位丢失，本发明实施例提供的语义描述子对环境有更好的适用性，定位鲁棒性更强，不易丢失定位。

为了便于更加清楚对本发明实施例方案进行理解，以目标特征为点特征为例进行说明，如图4所示，该圆点为从图像帧中提取的目标特征，根据该语义分割图，分别确定该目标特征对应类别为建筑物，以及其8个方向分别确定的相邻空间的特征类别。其中，在语义分割图中会为每个类别会被定义为一个ID，比如建筑物为1，树木为2，天空为3，车辆为4等。需要说明的是，图像边缘也需要单独定义一类，即配置一个独立的ID。每个类别的边缘可理解为语义分割图中不同填充色块的分界线，图像边缘就是指语义分割图的上下左右四个边界，如图像边缘ID分别被预设为101、102、103和104。

例如图4中目标特征的左侧顺序1和上侧顺序3这两个方向分别延伸到了语义分割图的边缘(左边界和上边界)，该目标特征到这两个边缘的像素距离分别为g和i，其他五个方向则是分别延伸到其他填充色块的分界线，即获知了其他填充色块的类别以及该目标特征到相邻空间特征所具有的像素距离，如左上顺序2、右上顺序4和右侧顺序5分别延伸到天空类别，目标特征分别与其具有像素距离a、b和c，左下顺序8和下侧顺序7分别延伸到树木类别，目标特征分别与其具有像素距离d和e，右下顺序6延伸到车辆类别，目标特征分别与其具有像素距离f。

在前述实施例的基础上，该目标特征对应的语义特征描述子可如下表1所示：

表1

在一些实施例中，为了对定义后的特征描述子进行衡量应用，一般考虑计算特征描述子的相似度，而该方法包括：

步骤4.1)，计算当前帧图像中的语义特征描述子和目标描述子的相似度。

其中，该目标描述子可根据其应用场景确定，其是来自于前一帧图像和/或预设地图。若比较的对象是前后两帧图片中的两个特征，不确定它们是不是同一个点，就会通过描述子去判断。对于我们这里来说，就是A原图+A分割，提取了特征，以其中某一特征为例，去B原图+B分割中找到与之匹配的特征，就会进行这种描述子比较，找到其正确的特征关联。或者，根据预设地图中的某一点特征对应的目标描述子，与该语义特征描述子进行对比，若存在差异，在该特征点预设范围内继续寻找。图A中一特征点会根据其他传感器给的两帧图片位姿关系先验，在图B中得到理论的对应位姿，而后会在这个理论位姿的预设范围区域与所有特征做匹配找到最相似点，如都不像，这个图A中的该特征点就关联失败了。图A中包括众多如上特征，上述过程是其中一个的匹配流程，其他每个特征点都要这样操作一次。

示例性地，根据当前帧图像中的语义特征描述子和目标描述子中每个语义类别的匹配结果，确定权重系数；基于权重系数以及每个目标特征到相邻空间的像素距离，确定语义特征描述子和目标描述子的相似度。

作为一种可选的实施例，该语义特征描述子相似度计算公式如下：

S＝A

其中，S为目标描述子与语义特征描述子的距离，该值越小说明两者越相似，相似度越高。

对于权重系数的A

对于权重系数的B取值来说，分别将两个描述子的8个B

对于权重系数的C取值来说，C

需要说明的是，权重系数AB代表了各自的损失残差或可称作惩罚量，惩罚量越大说明两个描述子越不像。其中，A的惩罚权重较高，因为如果两个特征点连自身的语义类别都不一样大概率不会是同一个点。为了保证语义分割结果的可靠性，该惩罚权重即权重系数可根据分割网络的实际能力进行调整的，误分割少就可以继续抬高惩罚权重。B也类似，判断8个方向相邻域的类别是否一致去决定取值，在此不再赘述。

在一些实施例中，该相似度还可以在于对场景应用的验证，如该方法还包括：

步骤5.1)，基于相似度，校核语义特征描述子的实际应用模型。

其中，若相似度较高，则当前应用场景的描述子定位精度较高，若相似度达不到阈值，则可根据相似度差值，对当前应用场景对应的实际应用模型进行调整，以保证后续场景应用的可靠性。

本发明实施例提出了一种结合视觉分割语义信息的手工描述子，巧妙地利用了语义信息对于光照、天气的稳定性，极大地改善了特征的描述能力，同时不需要训练，计算速度会明显优于深度学习的描述子。

如图5所示，本发明实施例还提供一种语义特征描述子的确定装置200，所述装置包括：

提取模块201，从车辆采集的当前帧图像中，提取符合预设需求的目标特征；

第一确定模块202，根据所述当前帧图像对应的语义分割图，确定所述目标特征对应的类别映射；

第二确定模块203，基于所述类别映射，确定所述当前帧图像中的语义特征描述子。

在一些实施例中，所述语义特征描述子包括所述目标特征的语义类别、所述目标特征的相邻空间语义类别和所述目标特征到相邻空间的像素距离。

在一些实施例中，提取模块201，还具体用于，根据预设需求对应的目标对象类型，确定待提取的目标特征；其中，所述目标特征包括以下的一项或多项：点特征、线特征和面特征；从车辆采集的当前帧图像中，提取所述目标特征。

在一些实施例中，第一确定模块202，还具体用于，根据所述目标特征在所述当前帧图像中的第一位置，确定所述目标特征在所述当前帧图像对应的语义分割图中的第二位置；其中，所述当前帧图像和所述当前帧图像对应的语义分割图具有相同的尺寸参数；基于所述语义分割图中的第二位置，确定所述目标特征对应的语义类别以及所述目标特征的相邻空间语义类别。

在一些实施例中，所述装置还具体用于，计算所述当前帧图像中的语义特征描述子和目标描述子的相似度；其中，所述目标描述子来自前一帧图像和/或预设地图。

在一些实施例中，所述装置还具体用于，根据所述当前帧图像中的语义特征描述子和目标描述子中每个语义类别的匹配结果，确定权重系数；基于所述权重系数以及每个目标特征到相邻空间的像素距离，确定所述语义特征描述子和目标描述子的相似度。

在一些实施例中，所述装置还具体用于，基于所述相似度，校核所述语义特征描述子的实际应用模型。

图6为本发明实施例提供的电子设备300的硬件架构示意图。参见图6所示，该电子设备300包括：机器可读存储介质301和处理器302，还可以包括非易失性存储介质303、通信接口304和总线305；其中，机器可读存储介质301、处理器302、非易失性存储介质303和通信接口304通过总线305完成相互间的通信。处理器302通过读取并执行机器可读存储介质301中语义特征描述子的确定的机器可执行指令，可执行上文实施例描述语义特征描述子的确定方法。

本文中提到的机器可读存储介质可以是任何电子、磁性、光学或其它物理存储装置，可以包含或存储信息，如可执行指令、数据，等等。例如，机器可读存储介质可以是：RAM(Radom Access Memory，随机存取存储器)、易失存储器、非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等)，或者类似的存储介质，或者它们的组合。

非易失性介质可以是非易失性存储器、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、dvd等)，或者类似的非易失性存储介质，或者它们的组合。

可以理解的是，本实施例中的各功能模块的具体操作方法可参照上述方法实施例中相应步骤的详细描述，在此不再重复赘述。

本发明实施例所提供计算机可读存储介质，所述可读存储介质中存储有计算机程序，所述计算机程序代码被执行时可实现上述任一实施例所述的语义特征描述子的确定方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：东软睿驰汽车技术(沈阳)有限公司;

上一篇：用于图像重建的方法和装置
下一篇：基于Revit软件的三维模型设计ID生成方法