点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
论文链接:https://arxiv.org/pdf/1911.04231v1.pdf
代码链接:https://github.com/ethnhe/PVN3D.git.
背景介绍
由于光照变化、传感器噪声、场景遮挡和目标截断等因素的影响,六自由度估计是一个极具挑战性的问题。传统的方法利用手工特征提取图像与目标网格模型之间的对应关系,这种人工设计的经验特征在光照条件变化和场景遮挡严重的情况下会受到性能的限制。
近年来,随着机器学习和深度学习技术的迅猛发展,基于深度神经网络(DNN)的方法被引入到这项工作中,并显示出很有希望的改进。前期有工作提出用DNNs直接回归物体的旋转和平移。然而,由于旋转空间的非线性,这些方法通常没有很好的推广性。
相反,最近的研究使用DNNs来检测物体的2D关键点,并使用透视点(PnP)算法计算6D姿态参数。虽然这两个阶段的方法表现得更稳定,但大多数都是建立在二维投影之上的。在真实的三维空间中,投影误差很小的误差就可能很大。另外,三维空间中的不同关键点在二维投影后可能会重叠,使得它们很难区分。此外,由于投