Reading Paper about Object Detection or 3D Object Detection in CVPR 2020

最新推荐文章于 2025-02-15 21:55:00 发布

原创最新推荐文章于 2025-02-15 21:55:00 发布 · 563 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#自动驾驶 #深度学习

经验同时被 3 个专栏收录

19 篇文章

订阅专栏

学习

18 篇文章

订阅专栏

科研

3 篇文章

订阅专栏

本文综述了近期在物体检测领域的七个前沿研究工作，包括轻量化物体检测、高分辨率遥感图像分割、伪装物体检测、3D物体检测等。各研究针对不同场景和挑战，提出创新解决方案，如信息瓶颈原则减少误检、前景感知关系网络增强特征区分力、融合2D和3D信息提升检测精度。

Paper 1：（Lightweight Object Detector）BiDet: An Efficient Binarized Object Detector

From: 清华
Content：基于网络的物体检测方法常常拥有极高的性能，但是计算量消耗极大。相比之下，二值化神经网络拥有极高的效能，但是，二值化参数和激活函数的过程会导致模型表现能力的下降。因此，这篇论文提出了一个高效的二值化基于神经网络的物体检测器。具体来说，本方法通过信息瓶颈原则去除了大量冗余的物体框，以降低原本二值化神经网络检测器的false positive。

Paper 2：（Object Detection in Remote Image）Foreground-Aware Relation Network for Geospatial Object Segmentation in High Spatial Resolution Remote Sensing Imagery

From: 武大
Content：现有的遥感物体分割方法常常面临两个未能解决的问题，高分辨率遥感图像中前景背景比例相差巨大，和类内背景差异巨大这两个问题。在本文中，作者认为问题的根源在于缺乏对前景的建模，为此，作者构建了一个前景感知的关系网络来解决这两个问题。通过前景关联上下文来加强前景特征的区分力，并提出了一种前景感知的优化方法，其关注前景样本和背景样本中的hard 样本。

Paper 3：Camouflaged Object Detection

From: 阿联酋AI研究院，南开，武大，ETH
Content：本文展示了一个物体检测中的一个新领域，即伪装物体的检测。在这个任务中，待检测物体和环境的外观非常相似。本论文提出了一个全新的数据集包含了10000张图片，覆盖了78个自然界中的物体种类。并且本论文还提出了一个简单有效的框架以处理这类任务。

Paper 4 （Object Detection）：Rethinking Classification and Localization for Object Detection

From: 东南，微软
Content：基于RCNN的物体检测器通常都使用了双Head的结构，即一个用于分类的全连接分支，一个用于定位物体的卷积分支。不过目前没有人探讨过双Head结构是如何作用于这两个任务的。通过分析和测试，本文发现，全连接Head可以更好地区分一个完整物体和物体的一部分，但是无法鲁棒地回归整个物体。因此，本文提出了一种Double-Head的方法，在两个分支上都同时使用两种监督信息，并将两个分支的物体分类监督合并，获得了长足的性能提升。

Paper 5 （Object Detection）：CentripetalNet: Pursuing High-quality Keypoint Pairs for Object Detection

From: 西交，商汤，中科院，北航
Content：现有的基于关键点的物体检测器性能已经很好了，但是，错误的关键点匹配依旧存在，并且会导致性能下降。本论文提出了一个CentripetalNet。该网络预测角点的位置和向心位移，并对位移的角点进行对其，可以使得关键点匹配更加准确。此外，作者设计了一个跨星型可变卷积网络来将角点Pooling的结果在角落上更为清晰。
Code: Github

Paper 6 （RGBD-based 3D Object Detection）：ImVoteNet: Boosting 3D Object Detection in Point Clouds with Image Votes

From: Facebook，Stanford
Content：因为3D物体检测使用3D点云时，会有很多不可避免的问题：点过于稀疏，缺乏颜色信息，受到传感器噪声的影响。因此本文基于VoteNet，其最直白的Motivation就是结合了2D vote和3D vote，进而避免了两者各自的缺点。具体来说，作者设计了一种方法来融合2D物体检测和3D点云的物体检测，达到了5.7mAP的性能提升。

Paper 7 （RGB+3D Lidar 3D Object Detection）：PointPainting: Sequential Fusion for 3D Object Detection

From: nuTonomy
Content：作者发现现有的基于多模态融合的方法的3D物体检测精度竟然都不如只基于Lidar的算法。和Paper6类似的是，作者提出了一种RGB与Depth信息融合的方法。作者首先用单目图像去进行semantic segmentation，然后将语义分割的label反投影到3D point上，这一过程称其为Point Painting。然后再使用Lidar detector去检测物体的3D bounding box，可以提升任何Lidar detector的性能。所以，本文作者最重要的几项贡献是，1. 提出的融合策略。2. Lidar和Image对齐的方法。