掌桥专利:专业的专利平台
掌桥专利
首页

全景图像特征点匹配模型的训练方法、装置以及服务器

文献发布时间:2023-06-19 12:10:19


全景图像特征点匹配模型的训练方法、装置以及服务器

技术领域

本申请属于视觉图像处理技术领域,尤其涉及一种全景图像特征点处理模型的训练方法、装置以及服务器。

背景技术

相机定位是基于图像的三维重建中的基本步骤,根据同一物体对象对应的不同图像之间的特征匹配来实现相机定位。一般地,根据全景图像之间的特征匹配实现的相机定位效果较佳,但是,现有技术中无法对全景图像进行准确的特征匹配。

发明内容

本申请实施例提供了一种全景图像特征点处理模型的训练方法、装置以及服务器,可以解决现有技术中无法对全景图像进行准确的特征匹配的问题。

第一方面,本申请实施例提供了一种全景图像特征点匹配模型的训练方法,包括:

获取训练场景数据集,所述训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像;

确定所述训练场景数据集的目标真值,其中,所述目标真值为在所述训练场景数据集中提取的存在目标匹配关系的目标特征点;

以训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。

在第一方面的一种可能的实现方式中,确定训练场景数据集的目标真值,包括:

从所述训练场景数据的训练全景图像中,提取出存在第一匹配关系的第一特征点;

筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,作为所述训练场景数据集的目标真值。

在第一方面的一种可能的实现方式中,从所述训练场景数据的所述训练全景图像中,提取出存在第一匹配关系的第一特征点,包括:

对所述训练全景图像进行裁剪,得到训练透视图像;

基于预先训练的透视图像特征点匹配模型,从训练透视图像中,提取出存在第二匹配关系的第二特征点;

将存在第二匹配关系的第二特征点,从各自所在的训练透视图像中,投影至所述各自所在的训练透视图像对应的裁剪前的训练全景图像中,得到存在第一匹配关系的第一特征点。

在第一方面的一种可能的实现方式中,筛选出所述存在第二匹配关系的第一特征点中的存在目标匹配关系的目标特征点,得到所述训练场景数据集的目标真值,包括:

获取存在第一匹配关系的第一特征点对应的相机拍摄位置;

根据所述相机拍摄位置筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在第一方面的一种可能的实现方式中,根据所述相机拍摄位置筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,包括:

根据所述相机拍摄位置确定存在第一匹配关系的第一特征点对应的同一个真实特征点;

将所述第一特征点从像素坐标系投影至所述真实特征点所在的世界坐标系;

根据投影至所述真实特征点所在的世界坐标系中的第一特征点于所述真实特征点之间是否重合,确定出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在第一方面的一种可能的实现方式中,根据投影至所述真实特征点所在的世界坐标系中的第一特征点于所述真实特征点之间是否重合,确定出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点之后,包括:

将存在第一匹配关系的第一特征点中除了存在目标匹配关系的目标特征点以外的第一特征点作为待剔除特征点;

将所述真实特征点从世界坐标系投影至所述待剔除特征点所在像素坐标系;

判断投影至所述待剔除特征点所在像素坐标系中的真实特征点与所述待剔除特征点之间的像素差是否小于像素差阈值;

若是,则将像素差小于像素差阈值的待剔除特征点之间作为存在目标匹配关系的目标特征点;

若不是,则将像素差大于像素差阈值的待剔除特征点之间的第一匹配关系进行剔除。

在第一方面的一种可能的实现方式中,以训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型之前,还包括:

预处理所述训练场景数据集;

配置所述预处理后的所述训练场景数据集的标签信息,其中,所述标签信息为每个训练场景数据中存在第一匹配关系的第一特征点,以及所述第一特征点的像素位置;

以训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型,包括:

以携带所述标签信息的所述训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。

第二方面,本申请实施例提供了一种全景图像特征点匹配模型的训练装置装置,包括:

获取模块,用于获取训练场景数据集,所述训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像;

确定模块,用于确定所述训练场景数据集的目标真值,其中,所述目标真值为在所述训练场景数据集中提取的存在目标匹配关系的目标特征点;

训练模块,用于以训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型.

在第二方面的一种可选的实施方式中,所述确定模块包括:

提取子模块,用于从所述训练场景数据的训练全景图像中,提取出存在第一匹配关系的第一特征点;

筛选子模块,用于筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,作为所述训练场景数据集的目标真值。

在第二方面的一种可选的实施方式中,所述提取子模块包括:

对所述训练全景图像进行裁剪,得到训练透视图像;

提取单元,用于基于预先训练的透视图像特征点匹配模型,从训练透视图像中,提取出存在第二匹配关系的第二特征点;

投影单元,用于将存在第二匹配关系的第二特征点,从各自所在的训练透视图像中,投影至所述各自所在的训练透视图像对应的裁剪前的训练全景图像中,得到存在第一匹配关系的第一特征点。

在第二方面的一种可选的实施方式中,所述筛选子模块,包括:

获取单元,用于获取存在第一匹配关系的第一特征点对应的相机拍摄位置;

筛选单元,用于根据所述相机拍摄位置筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在第二方面的一种可选的实施方式中,所述筛选单元,包括:

确定子单元,用于根据所述相机拍摄位置确定存在第一匹配关系的第一特征点对应的同一个真实特征点;

第一投影子单元,用于将所述第一特征点从像素坐标系投影至所述真实特征点所在的世界坐标系;

第一判断子单元,用于根据投影至所述真实特征点所在的世界坐标系中的第一特征点于所述真实特征点之间是否重合,确定出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在第二方面的一种可选的实施方式中,所述提取子模块还包括:

生成单元,用于将存在第一匹配关系的第一特征点中除了存在目标匹配关系的目标特征点以外的第一特征点作为待剔除特征点

第二投影单元,用于将所述真实特征点从世界坐标系投影至所述待剔除特征点所在像素坐标系;

第二判断单元,用于若不是,则将像素差大于像素差阈值的待剔除特征点之间的第一匹配关系进行剔除。

第三判断单元,用于若是,则将像素差小于像素差阈值的待剔除特征点之间作为存在目标匹配关系的目标特征点。

第三方面,本申请实施例提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,处理器执行所述计算机程序时实现如权利要求任一项所述的方法。

本申请实施例与现有技术相比存在的有益效果是:

本申请实施例中,获取训练场景数据集,训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像;确定训练场景数据集的目标真值,其中,目标真值为在训练场景数据集中提取的存在目标匹配关系的目标特征点;以训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。可见,本申请实施例通过自动确定训练场景数据集的目标真值(即训练场景数据集中存在稳健匹配关系的特征点),不需要人工给训练场景数据集中的数量庞大的特征点配置稳健匹配关系作为目标真值,从而达到根据训练场景数据集和目标真值训练得到的全景图像特征点匹配模型可以准确对全景图像进行特征匹配的效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的全景图像特征点匹配模型的训练方法的流程示意图;

图2是本申请实施例提供的全景图像特征点匹配模型的训练方法的图1中步骤S101的具体流程示意图;

图3是本申请实施例提供的全景图像特征点匹配模型的训练方法的图2中步骤S201的具体流程示意图;

图4是本申请实施例提供的全景图像特征点匹配模型的训练方法的图2中步骤S202的具体流程示意图;

图5是本申请实施例提供全景图像特征点匹配模型的训练方法的图4中步骤S402的具体流程示意图;

图6是本申请实施例提供的全景图像特征点匹配模型的图5中步骤S503之后的流程示意图;

图7是本申请实施例提供的全景图像特征点匹配模型的训练方法的图1中步骤S103之前的流程示意图;

图8是本申请实施例提供的一种全景图像特征点匹配模型的训练装置的结构框图;

图9是本申请实施例提供的服务器的结构示意图;

图10是本申请实施例提供的全景图像特征点匹配模型的训练方法的图2的步骤S201中对存在第一匹配关系的第一特征点进行说明的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。

下面将通过具体实施例对本申请实施例提供的技术方案进行介绍。

实施例一

参见图1,为本申请实施例提供的全景图像特征点匹配模型的训练方法的流程示意图,作为示例而非限定,该方法可以应用于服务器,该服务器可以是云端服务器等计算设备,上述全景图像特征点匹配模型的训练方法可以包括以下步骤:

步骤S101、获取训练场景数据集。

其中,训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像,训练场景是指用于相机采集训练全景图像的现实场景,这里本申请将每个训练场景中通过相机在不同拍摄位置拍摄得到的多个训练图像定义为一个训练场景数据。实际应用中,本申请实施例的训练场景数据集是通过八目相机在多个训练场景中采集的多个训练图像的基础上构建的,示例性地,训练场景数据集可以包含来自房间、走廊、街道等10000个训练场景的1000000个高分辨率全景图像。

步骤S102、确定训练场景数据集的目标真值。

其中,目标真值为在训练场景数据集的训练全景图像中提取的存在目标匹配关系的目标特征点。

具体应用中,如图2所示,为本申请实施例提供的全景图像特征点匹配模型的训练方法的图1中步骤S101的具体流程示意图,确定训练场景数据集的目标真值,包括:

步骤S201、从训练场景数据的训练全景图像中,提取出存在第一匹配关系的第一特征点。

其中,第一特征点是指训练全景图像中具有特征性质的像素点,第一匹配关系是指在一个训练场景数据的不同训练全景图像中的第一特征点共同匹配该训练场景数据对应的训练场景中的同一个真实特征点,真实特征点是指在世界坐标系下的训练场景中真实物体的特征点。示例性地,如图10所示,相机在4个不同位置分别对第一真实特征点和第二真实特征点进行拍摄,得到4个训练图像上的4个第一示意特征点(即上述一个存在第一匹配关系的第一特征点)和4个第二示意特征点(即上述另一个存在第一匹配关系的第一特征点),可见,4个第一示意特征点共同匹配同一个第一真实特征点,4个第二示意特征点共同匹配一个第二真实特征点。

具体应用中,如图3所示,为本申请实施例提供的全景图像特征点匹配模型的训练方法的图2中步骤S201的具体流程示意图,从训练场景数据集的训练全景图像中,提取出存在第一匹配关系的第一特征点,包括:

步骤S301、对训练全景图像进行裁剪,得到训练透视图像。

可以理解的是,一张训练全景图像根据视场角的选择可以裁剪重投影为多张的训练透视图,例如,采用90度的视场角,可以将一张训练全景图片裁剪为前后、左右、上下共六张训练透视图。也可以是采用60度的视场角将一张训练全景图像裁剪为18张训练透视图(上中下三个角度,一周360°分为6个角度,总共

步骤S302、基于预先训练的透视图像特征点匹配模型,从训练透视图像中,提取出存在第二匹配关系的第二特征点。

其中,第二特征点是指透视图像中具有特征性质的像素点,第二匹配关系是指在一个训练场景数据的不同训练透视图像中的第二特征点共同匹配该训练场景数据对应的训练场景中的同一个真实特征点,真实特征点是指在世界坐标系下的训练场景中真实物体的特征点,第二匹配关系的具体说明可以参考步骤S201中第一匹配关系的具体说明。另外需说明的是,本申请实施例预先训练的透视图特征点匹配模型可以是任意一个可以对透视图进行特征提取以及匹配的神经网络模型,例如是SuperGlue模型、SuperGlue模型变体或者OANet模型,本申请实施例对预先训练的透视图特征点匹配模型的类型不作任何限制。

步骤S303、将存在第二匹配关系的第二特征点,从各自所在的训练透视图像中,投影至各自所在的训练透视图像对应的裁剪前的训练全景图像中,得到存在第一匹配关系的第一特征点。

可以理解的是,将存在第二匹配关系的第二特征点,从各自所在的训练透视图像中,投影至各自所在的训练透视图像对应的裁剪前的训练全景图像中,得到存在第一匹配关系的第一特征点实质上是:将第二特征点从训练透视图像对应的平面坐标系投影到裁剪前的训练全景图像对应的球面坐标系。

本申请实施例中,借助预先训练的透视图像特征点匹配模型提取到根据训练全景图像裁剪得到的透视图中的存在第二匹配关系的第二特征点,然后再根据投影关系得到训练全景图像的存在第一匹配关系的第一特征点。

步骤S202、筛选出存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,作为所述训练场景数据集的目标真值。

可以理解的是,第一特征点之间的第一匹配关系不够稳健,需要从存在第一匹配关系的第一特征点中筛选出目标匹配关系(即稳健匹配关系)的目标特征点,其中,稳健的匹配关系是指在一个训练场景下同一个相机在不同拍摄位置拍摄得到的训练图像中通过每个训练图像中的特征点可以完全共同匹配同一个训练场景中的真实特征点,例如,如图9所示,4个第一示意特征点可以共同匹配同一个第一真实特征点,不存在有一个示意特征点匹配不到第一真实特征点的情况,则认为4个第一示意特征点之间的匹配关系是稳健的。

具体应用中,如图4所示,为本申请实施例提供的全景图像特征点匹配模型的训练方法的图2中步骤S202的具体流程示意图,筛选出所述存在第二匹配关系的第一特征点中的存在目标匹配关系的目标特征点,得到所述训练场景数据集的目标真值,包括:

步骤S401、获取存在第一匹配关系的第一特征点对应的相机拍摄位置。

其中,相机拍摄位置是指相机在训练场景中拍摄的位置信息,位置信息包括相机的三维坐标、相机到训练场景中真实特征点的深度值。

具体地,预先通过相机定位算法(例如sfm算法)根据训练场景数据集的训练场景图像计算出相机到训练场景中真实特征点的深度值以及得到共同匹配同一个真实特征点的多个特征点分别在所在的共视帧的像素坐标,其中,共视帧是指包含共同匹配同一个真实特征点的特征点的多个图像。

步骤S402、根据相机拍摄位置筛选出存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

可以理解的是,本申请通过相机拍摄位置来确定出真实特征点的三维坐标,然后再根据真实特征点的三维坐标来确定第一特征点中的目标特征点。

具体应用中,如图5所示,为本申请实施例提供全景图像特征点匹配模型的训练方法的图4中步骤S402的具体流程示意图,根据相机拍摄位置筛选出存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,包括:

步骤S501、根据相机拍摄位置确定存在第一匹配关系的第一特征点对应的同一个真实特征点。

可以理解的是, 确定真实特征点就是获取真实特征点的三维坐标,本申请实施例直接可以根据相机拍摄位置对应的位置信息中包含的相机到训练场景中真实特征点的深度值以及得到共同匹配同一个真实特征点的多个特征点分别所在的共视帧的像素坐标,得到真实特征点的三维坐标。

示例性地,根据下式计算真实特征点的三维坐标:

步骤S502、将第一特征点从像素坐标系投影至真实特征点所在的世界坐标系。

可以理解的是,本申请将第一特征点都投影至真实特征点所在的世界坐标系,从而验证投影到真实特征点所在的世界坐标系中的第一特征点是不是和真实特征点一致。

步骤S503、根据投影至真实特征点所在的世界坐标系中的第一特征点与真实特征点之间是否重合,确定出存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

可以理解的是,第一特征点都投影至真实特征点所在的世界坐标系,判断出存在第一匹配关系的第一特征点中哪些在真实特征点所在的世界坐标系与真实特征点之间重合,则确定与真实特征点之间重合的存在第一匹配关系的第一特征点为存在目标匹配关系的目标特征点。

在一种可选的实施方式中,如图6所示,为本申请实施例提供的全景图像特征点匹配模型的图5中步骤S503之后的流程示意图,根据投影至所述真实特征点所在的世界坐标系中的第一特征点于所述真实特征点之间是否重合,确定出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点之后,包括:

步骤S601、将存在第一匹配关系的第一特征点中除了存在目标匹配关系的目标特征点以外的第一特征点作为待剔除特征点。

其中,待剔除特征点是指后续会剔除第一匹配关系的第一特征点。

步骤S602、将真实特征点从世界坐标系投影至待剔除特征点所在像素坐标系。

步骤S603、判断投影至所述待剔除特征点所在像素坐标系中的真实特征点与所述待剔除特征点之间的像素差是否小于像素差阈值。

步骤S604、若是,则将像素差小于像素差阈值的待剔除特征点之间作为存在目标匹配关系的目标特征点。

步骤S605、若不是,则将像素差大于像素差阈值的待剔除特征点之间的第一匹配关系进行剔除。

其中,像素差阈值为4个像素值。

可以理解的是,确定存在目标匹配关系的目标特征点的过程中涉及到坐标系变换的投影过程,会造成误差存在,从而遗漏一些目标特征点。本申请实施例中,在确定出存在目标匹配关系的目标特征点之后还增加了校验步骤,即将将真实特征点从世界坐标系投影至待剔除特征点所在像素坐标系,判断它们之间的像素差小于像素差阈值,则可以将该待剔除特征点认为是存在目标匹配关系的目标特征点,达到减少投影误差的目的。

步骤S103、以训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。

其中,全景图像特征点匹配模型为自注意力和交叉注意力机理的深度学习网络。

优选的,如图7所示,为本申请实施例提供的全景图像特征点匹配模型的训练方法的图1中步骤S103之前的流程示意图,以训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型之前,还包括:

步骤S701、预处理训练全景图像。

其中,预处理包括对训练全景图像进行数据清洗、统一格式等。

步骤S702、配置预处理后的训练场景数据集的标签信息,其中,标签信息为训练场景数据集对应的存在第一匹配关系的第一特征点,以及第一特征点的像素位置信息。

其中,像素位置信息是指第一特征点在像素坐标系下的坐标。

可以理解的是,配置预处理后的训练场景数据集的标签信息,让训练场景数据集携带语义信息(即标签信息),使得后续训练的全景图像特征点匹配模型可以对图像的语义信息进行识别。

具体应用中,以训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型,包括:

步骤S703、以携带标签信息的训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。

示例性地,全景图像特征点匹配模型包括编码网络层、自我注意力以及交叉注意力层以及最优匹配层,以携带标签信息的训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型过程可以是:将训练全景图像中的存在第一匹配关系的第一特征点、第一特征点的描述子以及第一特征点的像素位置信息输入至全景图像特征点匹配模型中的编码网络层进行编码形成特征匹配向量,随后利用自我注意力以及交叉注意力层来回增强特征匹配向量的特征匹配性能;随后进入最优匹配层,通过计算特征匹配向量的内积得到匹配度得分矩阵,然后通过Sinkhorn算法解算出最优特征分配矩阵,输出特征点以及特征点之间的匹配关系作为预测值,再根据目标真值对更新全景图像特征点匹配模型的参数,达到训练全景图像特征点匹配模型的目的。

本申请实施例中,获取训练场景数据集,训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像;确定训练场景数据集的目标真值,其中,目标真值为在训练场景数据集中提取的存在目标匹配关系的目标特征点;以训练场景数据集为输入,目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型。可见,本申请实施例通过自动确定训练场景数据集的目标真值(即训练场景数据集中存在稳健匹配关系的特征点),不需要人工给训练场景数据集中的数量庞大的特征点配置稳健匹配关系作为目标真值,从而达到根据训练场景数据集和目标真值训练得到的全景图像特征点匹配模型可以准确对全景图像进行特征匹配的效果。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。

对应于上文实施例所述的方法,图8示出了本申请实施例提供的一种全景图像特征点匹配模型的训练装置的结构框图,为了便于说明,仅示出了与本申请实施例相关的部分。

参照图8,该全景图像特征点匹配模型的训练装置装置包括:

获取模块81,用于获取训练场景数据集,所述训练场景数据集中每个训练场景数据包括一个训练场景中同一个相机在不同拍摄位置拍摄得到的多个训练图像;

确定模块82,用于确定所述训练场景数据集的目标真值,其中,所述目标真值为在所述训练场景数据集中提取的存在目标匹配关系的目标特征点;

训练模块83,用于以训练场景数据集为输入,所述目标真值为输出,对全景图像特征点匹配模型进行训练,得到训练后的全景图像特征点匹配模型.

在一种可选的实施方式中,所述确定模块包括:

提取子模块,用于从所述训练场景数据的训练全景图像中,提取出存在第一匹配关系的第一特征点;

筛选子模块,用于筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点,作为所述训练场景数据集的目标真值。

在一种可选的实施方式中,所述提取子模块包括:

对所述训练全景图像进行裁剪,得到训练透视图像;

提取单元,用于基于预先训练的透视图像特征点匹配模型,从训练透视图像中,提取出存在第二匹配关系的第二特征点;

投影单元,用于将存在第二匹配关系的第二特征点,从各自所在的训练透视图像中,投影至所述各自所在的训练透视图像对应的裁剪前的训练全景图像中,得到存在第一匹配关系的第一特征点。

在一种可选的实施方式中,所述筛选子模块,包括:

获取单元,用于获取存在第一匹配关系的第一特征点对应的相机拍摄位置;

筛选单元,用于根据所述相机拍摄位置筛选出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在一种可选的实施方式中,所述筛选单元,包括:

确定子单元,用于根据所述相机拍摄位置确定存在第一匹配关系的第一特征点对应的同一个真实特征点;

第一投影子单元,用于将所述第一特征点从像素坐标系投影至所述真实特征点所在的世界坐标系;

第一判断子单元,用于根据投影至所述真实特征点所在的世界坐标系中的第一特征点于所述真实特征点之间是否重合,确定出所述存在第一匹配关系的第一特征点中的存在目标匹配关系的目标特征点。

在一种可选的实施方式中,所述提取子模块还包括:

生成单元,用于将存在第一匹配关系的第一特征点中除了存在目标匹配关系的目标特征点以外的第一特征点作为待剔除特征点

第二投影单元,用于将所述真实特征点从世界坐标系投影至所述待剔除特征点所在像素坐标系;

第二判断单元,用于若不是,则将像素差大于像素差阈值的待剔除特征点之间的第一匹配关系进行剔除。

第三判断单元,用于若是,则将像素差小于像素差阈值的待剔除特征点之间作为存在目标匹配关系的目标特征点。

需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。

图9为本申请实施例提供的服务器的结构示意图。如图9所示,该实施例的服务器9包括:至少一个处理器90、存储器91以及存储在所述存储器91中并可在所述至少一个处理器90上运行的计算机程序92,所述处理器90执行所述计算机程序92时实现上述任意各个方法实施例中的步骤。

所述服务器6可以是云端服务器等计算设备。该服务器可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图9仅仅是服务器9的举例,并不构成对服务器9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。

所称处理器90可以是中央处理单元(Central Processing Unit,CPU),该处理器90还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器91在一些实施例中可以是所述服务器6的内部存储单元,例如服务器6的硬盘或内存。所述存储器91在另一些实施例中也可以是所述服务器6的外部存储设备,例如所述服务器6上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器91还可以既包括所述服务器6的内部存储单元也包括外部存储设备。所述存储器91用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步骤。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到服务器的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/网络设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/网络设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

相关技术
  • 全景图像特征点匹配模型的训练方法、装置以及服务器
  • 全景图像特征点匹配模型的训练方法、装置以及服务器
技术分类

06120113194547