Reading Paper about Object Detection or 3D Object Detection in CVPR 2020

本文综述了近期在物体检测领域的七个前沿研究工作,包括轻量化物体检测、高分辨率遥感图像分割、伪装物体检测、3D物体检测等。各研究针对不同场景和挑战,提出创新解决方案,如信息瓶颈原则减少误检、前景感知关系网络增强特征区分力、融合2D和3D信息提升检测精度。

Paper 1:(Lightweight Object Detector)BiDet: An Efficient Binarized Object Detector

From: 清华
Content: 基于网络的物体检测方法常常拥有极高的性能,但是计算量消耗极大。相比之下,二值化神经网络拥有极高的效能,但是,二值化参数和激活函数的过程会导致模型表现能力的下降。因此,这篇论文提出了一个高效的二值化基于神经网络的物体检测器。具体来说,本方法通过信息瓶颈原则去除了大量冗余的物体框,以降低原本二值化神经网络检测器的false positive。

Paper 2:(Object Detection in Remote Image)Foreground-Aware Relation Network for Geospatial Object Segmentation in High Spatial Resolution Remote Sensing Imagery

From: 武大
Content: 现有的遥感物体分割方法常常面临两个未能解决的问题,高分辨率遥感图像中前景背景比例相差巨大,和类内背景差异巨大这两个问题。在本文中,作者认为问题的根源在于缺乏对前景的建模,为此,作者构建了一个前景感知的关系网络来解决这两个问题。通过前景关联上下文来加强前景特征的区分力,并提出了一种前景感知的优化方法,其关注前景样本和背景样本中的hard 样本。

Paper 3:Camouflaged Object Detection

From: 阿联酋AI研究院,南开,武大,ETH
Content: 本文展示了一个物体检测中的一个新领域,即伪装物体的检测。在这个任务中,待检测物体和环境的外观非常相似。本论文提出了一个全新的数据集包含了10000张图片,覆盖了78个自然界中的物体种类。并且本论文还提出了一个简单有效的框架以处理这类任务。

Paper 4 (Object Detection):Rethinking Classification and Localization for Object Detection

From: 东南,微软
Content: 基于RCNN的物体检测器通常都使用了双Head的结构,即一个用于分类的全连接分支,一个用于定位物体的卷积分支。不过目前没有人探讨过双Head结构是如何作用于这两个任务的。通过分析和测试,本文发现,全连接Head可以更好地区分一个完整物体和物体的一部分,但是无法鲁棒地回归整个物体。因此,本文提出了一种Double-Head的方法,在两个分支上都同时使用两种监督信息,并将两个分支的物体分类监督合并,获得了长足的性能提升。

Paper 5 (Object Detection):CentripetalNet: Pursuing High-quality Keypoint Pairs for Object Detection

From: 西交,商汤,中科院,北航
Content: 现有的基于关键点的物体检测器性能已经很好了,但是,错误的关键点匹配依旧存在,并且会导致性能下降。本论文提出了一个CentripetalNet。该网络预测角点的位置和向心位移,并对位移的角点进行对其,可以使得关键点匹配更加准确。此外,作者设计了一个跨星型可变卷积网络来将角点Pooling的结果在角落上更为清晰。
Code: Github

Paper 6 (RGBD-based 3D Object Detection):ImVoteNet: Boosting 3D Object Detection in Point Clouds with Image Votes

From: Facebook,Stanford
Content:因为3D物体检测使用3D点云时,会有很多不可避免的问题:点过于稀疏,缺乏颜色信息,受到传感器噪声的影响。因此本文基于VoteNet,其最直白的Motivation就是结合了2D vote和3D vote,进而避免了两者各自的缺点。具体来说,作者设计了一种方法来融合2D物体检测和3D点云的物体检测,达到了5.7mAP的性能提升。

Paper 7 (RGB+3D Lidar 3D Object Detection):PointPainting: Sequential Fusion for 3D Object Detection

From: nuTonomy
Content:作者发现现有的基于多模态融合的方法的3D物体检测精度竟然都不如只基于Lidar的算法。和Paper6类似的是,作者提出了一种RGB与Depth信息融合的方法。作者首先用单目图像去进行semantic segmentation,然后将语义分割的label反投影到3D point上,这一过程称其为Point Painting。然后再使用Lidar detector去检测物体的3D bounding box,可以提升任何Lidar detector的性能。所以,本文作者最重要的几项贡献是,1. 提出的融合策略。2. Lidar和Image对齐的方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值