点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
本文来自最新的一篇论文:
GPO:Global Plane Optimization for Fast and Accurate Monocular SLAM Initialization
摘要
初始化对于单目SLAM来说是必须的。本文重点研究了一种基于平面特征的单目SLAM初始化方法。该算法从滑动窗口的单应矩阵估计开始,然后通过全局平面优化(global plane optimization, GPO)获取相机位姿和平面法线。3D点可以通过使用平面约束恢复,无需三角化(or三角测量)。本文提出的方法充分利用了多帧的平面信息,避免了单应矩阵分解中的模糊性。我们在收集来的棋盘数据集上参照基准方法的实现,验证了我们的算法,并进行了广泛的分析。实验结果表明,我们的方法在准确度和实时性两方面都优于调优后的基准方法。
背景介绍
单目SLAM旨在从单个输入的视频流中,同时估计相机轨迹、重建未知环境。其被广泛应用于增强现实(AR)和自动驾驶领域。为了引导单目SLAM系统,通常必须进行初始化。在初始化期间,相机位姿和初始地图是为后续的跟踪和建图建造的。不良的初始化会减慢系统的收敛速度,甚至导致定位的失败。
单目SLAM的一般初始化方法基于本征矩阵(or基础矩阵)分解。然后通过三角化获得三维地图。接着,使用PnP算法估计其他帧的位姿。整个过程之后可以进行增量式局部SFM。
然而,这种初始化机制有一些缺陷。首先,需要足够大的视差才能进行准确的三角化,并且不能通过纯旋转估计特征点深度(译者注:因为会导致基础矩阵自由度下降);其次,由于SfM问题的规模很大,需要很长时间才能收敛;最后,人造长江通常由地面和前面之类的平面结构组成,导致本征矩阵的退化。
为了处理平面规则性,一些方法估计两帧之间的单应矩阵,而不是本征矩阵。但是,单应矩阵分解的几何模糊性使得设计适应不同应用的良好选择策略变得很棘手。此外,上面所有的系统只使用了两帧的观测。如果我们可以利用更多来自平面场景的帧的信息,就有望获得更准确的估计。
为了解决所有的这些问题,我们提出了一种快速、准确的单目SLAM初始化方法。在我们的方法中,我们首先使用RANSAC估计第一帧和当前帧之间的滑动窗口中的单应矩阵。然后,我们使用全局平面优化(GPO)最小化对应点关于平面法线和缩放平移的二维重投影误差。最后,我们使用平面方程估计平面上的3D点。我们方法的核心是通过使用所有帧的信息来避免单应矩阵的分解。我们还重建了平面地图,并且无需三角化。此外,通过减少优化中的参数数量,我们的算法获得了显著的实时改进。
本文核心思想
本文提出的方法都在具有(相机)轨迹和平面度量信息的棋盘数据集上进行了验证。我们复现了几种效果不错的多帧基准方法,包括基于聚类和基于优化的方法。我们说明了本文提出的GPO在精度和实时性上都由于其他的初始化方法。
最后,总结一下我们的贡献:
我们开发了一种新的针对单目SLAM的初始化方法,据我们所知,这是第一种完全利用了多帧平面信息的SLAM初始化方法。
我们提出了几种初始化基线(baseline),并进行了详细的实验以验证我们的方法。
我们提出了新的关于平面估计准确性方面的评估指标,以解决绝对平移误差标准的局限性。
初始化方法如下图所示:
优化过程如下图所示:
实验结果如下:
总结一下
在本文中,我们提出了一种新的基于平面特征的单目SLAM初始化方法GPO。通过联合多帧平面信息,我们的方法避免了三角化和单应矩阵分解的负担。我们在棋盘数据集上验证了系统的性能。实验结果表明,该方法在准确度和时间效率上均优于基准方法。
本文仅做学术分享,如有侵权,请联系删文。
推荐阅读:
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题