掌桥专利:专业的专利平台
掌桥专利
首页

一种面向物体的视觉SLAM轻量化语义地图创建方法

文献发布时间:2023-06-19 11:57:35


一种面向物体的视觉SLAM轻量化语义地图创建方法

技术领域

本发明属于计算机视觉及机器人领域,具体涉及一种面向物体的视觉SLAM轻量化语义地图创建方法。

背景技术

基于视觉SLAM创建的语义地图是将相机获取的环境三维几何信息与通过语义分割或目标检测方法获取的语义标签叠加而生成的。不同于传统的几何地图仅能满足基本的定位需求,语义地图能为机器人提供语义导航、定位、环境理解等更高级别、更智能化的功能。当前语义地图构建存在诸多挑战:1)数据关联与全局物体数据库更新不准确。数据关联用于确定当前时刻检测到的物体与地图数据库中已存在或其他时刻观测到的物体的对应关系,在多物体、多类别、无规律环境和相机观测视角不佳的情况下的语义数据关联存在很大困难,从而导致全局物体数据库构建与更新不准确。2)物体位姿估计不准确。仅用物体点云质心表达物体位置的方法的环境表达能力太弱,由于相机快速运动、物体遮挡和噪点的存在使得估计物体的方向和尺寸极为困难。3)地图存储效率低。像素级稠密语义地图创建成本高、存储量大、不易更新且存在大量无用的信息。因此,既能满足环境语义表达又能满足实际应用需求的语义地图应该是面向物体的轻量化地图,其关键问题在于鲁棒的物体级数据关联算法、准确的物体位姿估计算法和恰当的物体建模方法。

发明内容

针对以往语义地图创建方法在数据关联、物体位姿估计和物体建模上的不足,本发明提出了一种面向物体的视觉SLAM轻量化语义地图构建方法。首先对数据关联与物体数据库阶段的统计量分布进行建模,对服从高斯分布和不服从高斯分布的统计量分别使用参数统计和非参数统计进行关联,以创建物体信息库。然后利用对外点鲁棒的孤立森林算法和线段对齐算法估计物体位置、尺寸和方向。最后将物体9自由度位姿用三维立方框和二次曲面表达,创建轻量化物体级语义地图。该方法能实现鲁棒的语义数据关联,避免全局物体数据库的错误和遗漏,并创建面向物体9自由度位姿的语义地图,提升机器人环境感知能力,以服务于导航、抓取、交互等智能化应用场景。

本发明的技术方案是:1)首先根据并行运行Yolo v3目标检测网络和视觉SLAM系统给物体分配对应的三维点云和语义标签。2)对每个物体三维点云和三维质心的分布进行建模,利用非参数统计和参数统计进行数据关联以更新全局物体数据库。3)利用孤立森林算法和线段对齐算法确定物体尺寸和方向并进行优化。4)将估计的物体9自由度位姿使用立方框和二次曲面进行建模,以创建面向物体的轻量化语义地图。

面向物体的视觉SLAM轻量化语义地图构建方法,包括如下步骤:

步骤一,几何-语义度量初始化物体:并行执行几何视觉SLAM和Yolo v3语义目标检测,为物体分配三维点云和语义标签。

几何SLAM首先对图像提取二维ORB特征点,通过多视图三角化获得其对应的三维点云,并使用Yolo v3目标检测网络得到物体在图像中的二维检测框,通过检测框和特征点的位置关系为物体分配三维点云,并将点云均值作为物体质心。

步骤二,物体数据库构建与更新:根据物体中点云与质心的统计量分布,采用非参数统计和参数统计进行物体数据关联并更新物体数据库。

数据库构建与更新涉及的统计量如图1所示,包括当前帧观测到的某物体的点云集合

1)非参数统计。受相机观测视角、运动、物体遮挡和物体形状的影响,物体所包含的三维点云往往不服从高斯分布,而非参数统计的优势便是能处理统计量不服从高斯分布的情况,所以在本算法中采用非参数统计验证两组分别来自当前帧观测到的物体的点云和地图数据库中已存在的物体的点云P,Q之间的关系。理论上,如果P,Q来自同一个物体,则他们的分布将相同,即f

首先将两组点云混合,得到

其中R(·)是求秩操作。定义Mann-Whitney统计量W=min(W

m(W)=(|P|+|Q|)/2 (2)

其中Δ=|P|+|Q|+1,τ∈P∩Q。

2)单样本t检验。在统计量不服从高斯分布的情况下使用非参数检验更合理,但在统计量服从高斯分布的情况下,参数统计的准确性更高。在本算法中利用单样本t检验验证当前帧观测到的物体质心和地图数据库中已存在的物体质心之间的关系。如图1(b)所示,假设当前帧中物体的质心为c,地图数据库中物体的质心集合为C,对二者构造t统计量:

其中m(·),σ(·)分别是求均值和方差操作。

3)双样本t检验。由于相机视角、遮挡等原因可能导致前两个步骤存在漏关联的情况。本算法中采用双样本t检验验证地图数据库中已存在的两个物体是否应属于同一个物体。如图1(c)所示,假设两个物体的质心集合分别为C

对于以上三种检验方法,如果构造的统计量在置信区间内,则认为数据关联成功,更新数据库中的就物体,否则关联失败,在数据库中创建一个新物体。

步骤三,物体参数化:数据库更新之后利用孤立森林算法估计物体中心和尺寸,并利用线段对齐算法估计物体方向。

1)估计物体中心和尺寸。孤立森林算法是一种非参数方法,适用于不服从高斯分布的点云,其思想是用随机超平面对数据空间进行分割,将容易被孤立的点视为异常点。如图2所示,图2(a)中矩形的点在分割4次之后被孤立,图2(b)中矩形的点被分割8次被孤立,所以将图2(a)中矩形的点视为异常点。对物体点云集合X中的每个点云x计算其异常值得分s(x):

其中E(h(x))为点云样本x在孤立树中路径的期望,H(i)=ln(i)+γ为调和数。剔除得分大于阈值的点云,将剩余点云的均值作为物体中心t,将点云在三个方向上的长度一段作为尺寸s=(max(X)-min(X))/2,其中max(·),min(·)分别是求最大值和最小值操作。

2)估计物体方向。首先对图像提取LSD线段,并将落在物体检测框中的线段分配给物体,如图3(a)所示。然后计算每条二维LSD线段的角度α(Z

e(θ)=||α(Z(θ))-α(Z

Z(θ)=KP

其中θ表示物体的方向,Z表示立方框的一条三维边,Z(θ)表示立方框的边在图像中的投影,其角度记为α(Z(θ)),K表示相机内参,(P

其中N

3)物体尺寸和方向优化。物体角度误差为e(θ),物体尺寸误差定义为投影边到最边缘的LSD线段的距离e(s),将物体位姿与相机位姿进行联合优化,代价函数为:

步骤四,轻量化建模:估计物体位姿之后利用三维立方框和二次曲面建模物体。

一方面为更好地表达物体位姿,另一方面为更好地描述物体形状,本发明算法利用通用的立方框和二次曲面建模物体。已知物体中心t,尺寸s和方向θ,可以将立方框和二次曲面参数化为:

P

Q

其中

本发明的有益效果为充分考虑了多物体、多类别、无规律环境下的数据关联与全局物体数据库,并针对相机快速运动、物体遮挡提出鲁棒的外点剔除算法和线段对齐算法以确定物体9自由度位姿,最终利用轻量化的立方框和二次曲面进行建模,构建语义地图。极大地提升了机器人在运动过程中对物体进行位姿估计的准确性和环境理解能力,有助于开展更智能化的语义导航、抓取和交互等工作。

附图说明

图1本发明数据关联与物体数据库更新阶段统计量示意图;(a)非参数检验示意图;(b)单样本t检验示意图;(c)双样本t检验示意图。

图2本发明孤立森林算法示意图;(a)四次分割示意图;(b)八次分割示意图。

图3本发明线段对齐算法估计物体方向示意图;(a)对图像进行目标检测和线段检测;(b、c、d)三维空间中物体绕自身旋转;(e、f、g)物体立方框投影到图像中计算角度误差。

图4本发明物体模型参数化示意图;(a)特征提取与目标检测;(b)物体点云分配。

图5本发明具体实施方式的算法执行流程示意图。

图6本发明具体实施方式的为物体分配三维点云示意图。

图7本发明具体实施方式的物体点云和质心分布图;(a)物体点云分布图;(b)物体质心分布图。

图8本发明具体实施方式的物体位姿估计示意图;(a)初始物体3D框;(b)孤立森林算法处理之后的3D框;(c)线段对齐之后的3D框。

图9本发明具体实施方式的面向物体轻量化语义地图创建效果图。(a,b,c)相机运动过程中选取的三个视角的图像;(d)最终创建的轻量化语义地图。

具体实施方式

本实施方式的算法的流程如附图5所示:

步骤一:逐帧对图像进行目标检测和特征提取,根据特征点和检测框的关系,为图像中的每个物体分配三维点云和语义标签,如图6所示。当地图中不存在物体时,用当前帧的第一个物体初始化物体地图数据库,否则进行数据关联更新物体数据库。

步骤二:数据库更新阶段用到的统计量包括当前帧物体的点云集合、物体质心;地图中物体的点云集合、物体质心集合。对统计量的分布进行建模,如图7所示,物体点云不服从高斯分布,物体质心服从高斯分布,分别对其采用非参数统计和参数统计。首先对当前帧中某物体的点云集合和地图中某物体的点云集合根据公式(1)构造非参数Mann-Whitney统计量W,若W满足以下公式则关联成功:

f(W)≥f(r

其中α是显著度水平,具体实施时取为0.025,

然后对当前帧中某物体的质心和地图中某物体的质心集合C根据公式(4)构造单样本t统计量,若t满足以下公式则关联成功:

f(t)≥f(t

其中t

最后对地图中两个物体的质心集合C

步骤三:准确的物体数据库更新将为基于点云的物体位姿估计提供更多的样本。首先利用孤立森林算法,以物体的点云集合X为输入,执行公式(7),得到每个点云的异常得分,其中孤立树的数量t取为100,采样的大小ψ=min(256,|X|)。剔除得分大于0.6的点云,将剩余点云的均值作为物体中心,范围作为物体的尺寸。

在确定中心和尺寸之后通过偏航角采样进行线段对齐,输入为一系列图像的LSD线段z

最后通过公式(12)进行联合优化,进一步细化尺寸和方向。如图8(a)为物体初始位姿,图8(b)为使用孤立森林算法之后得到的中心和尺寸,图8(c)为使用线段对齐和优化之后得到的物体位姿,其中估计的物体位姿用立方框表示,并叠加在半稠密地图中以定性观察建模效果。

步骤四:通过前面的三个步骤获得了物体的中心、尺寸和方向9自由度位姿,分别根据物体形状用三维立方框,公式(13),以及二次曲面,公式(14)建模,对于具有明确方向且较规则的物体比如书本、键盘、椅子等用立方框表示,对其余方向感不强且形状类似于椭球体的物体比如球、水瓶、杯子等使用二次曲面来表示。如图9为桌面环境中物体的轻量化建图结果。

相关技术
  • 一种面向物体的视觉SLAM轻量化语义地图创建方法
  • 面向动态环境的语义分割与视觉SLAM紧耦合方法
技术分类

06120113114578