
Interpreting objects with basic geometric primitives has
long been studied in computer vision. Among geometric
primitives, superquadrics are well known for their abil-
ity to represent a wide range of shapes with few parame-
ters. However, as the first and foremost step, recovering
superquadrics accurately and robustly from 3D data still re-
mains challenging. The existing methods are subject to lo-
cal optima and sensitive to noise and outliers in real-world
scenarios, resulting in frequent failure in capturing geomet-
ric shapes. In this paper, we propose the first probabilistic
method to recover superquadrics from point clouds. Our
method builds a Gaussian-uniform mixture model (GUM)
on the parametric surface of a superquadric, which explic-
itly models the generation of outliers and noise. The su-
perquadric recovery is formulated as a Maximum Likeli-
hood Estimation (MLE) problem. We propose an algorithm,
Expectation, Maximization, and Switching (EMS), to solve
this problem, where: (1) outliers are predicted from the pos-
terior perspective; (2) the superquadric parameter is opti-
mized by the trust-region reflective algorithm; and (3) lo-
cal optima are avoided by globally searching and switch-
ing among parameters encoding similar superquadrics.
We show that our method can be extended to the multi-
superquadrics recovery for complex objects. The proposed
method outperforms the state-of-the-art in terms of accu-
racy, efficiency, and robustness on both synthetic and real-
world datasets. The code is at http://github.com/
bmlklwx/EMS-superquadric_fitting.git.
2676
0
鲁森1,2吴宇伟1阮思普1GregoryS.Chirikjian1*
0
{mpewxl,yw.wu,ruansp,mpegre}@nus.edu.sg
0
1新加坡国立大学2约翰斯∙霍普金斯大学
00
摘要
0
1.引言
0
理解3D环境(以及其中的对象)一直是计算机视觉和智能系
统的重要任务[24
]。随着3D视觉的突破和计算能力的提升,现代计算机视觉
系统能够使用低级表示重建和推理场景,例如点云
0
*通讯作者
0
图1.(a)凸超椭球的形状词汇。我们专注于用凸超椭球解释点云。
(b)我们方法推断的超椭球表示。
0
云[11,25,26],网格[18]和体素[9,38
]。相比之下,人类视觉系统更倾向于将场景抽象为规范部分,以获
得更好的感知理解[3,15
]。人类视觉似乎能够很好地处理场景的基本几何结构,而不依赖于
详细的逐点模型[24
]。因此,理解视觉输入的几何结构似乎是智能系统实现高级目标(
如物理推理、决策、规划和与环境的交互)的一种有前途的方法。
受到这个想法的启发,研究人员开始探索使用基本体积原语进行对
象描述的可能性,例如立方体[20,33,39
]。然而,由于立方体的表达能力有限,对象只能以高度抽象的方式
进行描述。超椭球是一类具有丰富形状词汇的几何原语,包括立方
体、圆柱体、椭球体、八面体及其中间形状(图1),但只由5个参
数编码。近几年,超椭球在社区中引起了相当大的关注,并广泛应
用于机器人学和计算机视觉任务,例如对象建模[5,22,23
],碰撞检测和运动规划[28,29],姿态估计[4]和抓取[27,36
,37]。单个超椭球已经足够表达许多日常物体[14,30
]。关于单个超椭球恢复的开创性工作包括[1,12,32
],其中恢复被公式化为最小二乘(LSQ)问题。在[6,16
]中,这些方法被扩展为使用多个超椭球模型复杂对象。然而,现有
的方法容易受到局部最优解的影响,并对真实场景中的噪声和异常
值敏感,导致频繁失败于捕捉几何形状。在本文中,我们提出了第
一个从点云中恢复超椭球的概率方法。我们的方法在超椭球的参数
化表面上构建了一个高斯-均匀混合模型(GUM),该模型明确地
模拟了异常值和噪声的生成。超椭球恢复被公式化为最大似然估计
(MLE)问题。我们提出了一种算法,Expectation,
Maximization,andSwitching
(EMS),来解决这个问题,其中:(1)异常值从后验角度进行预测
;(2)通过信赖域反射算法优化超椭球参数;(3)通过在编码类
似超椭球的参数之间进行全局搜索和切换来避免局部最优解。我们
展示了我们的方法可以扩展到复杂对象的多超椭球恢复。所提出的
方法在合成和真实数据集上在准确性、效率和鲁棒性方面优于现有
方法。代码在http://github.com/
bmlklwx/EMS-superquadric_fitting.git中。