DCFNET：用于视觉跟踪的判别相关滤波器网络

最新推荐文章于 2025-08-25 14:24:16 发布

原创

最新推荐文章于 2025-08-25 14:24:16 发布 · 3.4k 阅读

文章标签：

#神经网络

DCFNet是一种用于视觉跟踪的轻量级网络架构，它结合了判别相关滤波器（DCF）和卷积神经网络（CNN），在保持高速运行的同时显著提高了跟踪精度。通过对DCF的闭式解决方案进行剖析，DCFNet能够在端到端的学习过程中自动学习最适合DCF跟踪的特征。

GitHub源码下载链接：https：//github.com/foolwood/DCFNet

论文下载地址：https://arxiv.org/abs/1704.04057

DCFNET：用于视觉跟踪的判别相关滤波器网络

基于判别相关滤波器（DCF）的方法已经成为一种主要的在线目标跟踪方法。然而，这些方法中使用的特征都是基于手工制作的特征（如HoGs），或是独立于其他任务（如图像分类）训练的卷积特征。在这项工作中，我们提出了一种端到端的轻量级网络体系结构，即DCFNet，以学习卷积特征并同时执行相关跟踪过程。具体来说，我们将DCF视为一个特殊的相关性过滤层添加到Siamese网络中，并通过将网络输出定义为目标位置的概率热图来仔细推导通过它的反向传播。由于推导仍在傅里叶频域中进行，因此保留了DCF的效率特性。与使用HoGs的KCF相比，这使得我们的跟踪器在测试时间内可以达到60fps以上的速度运行，同时获得显著的精度提升。对OTB-2013、OTB-2015和VOT2015基准的广泛评估表明，所提出的DCFNET跟踪器与几种最先进的跟踪器相比具有竞争力，同时更紧凑，速度更快。

关键词：相关滤波器，卷积神经网络，视觉跟踪。

1、导言

在诸如人机交互和辅助驱动系统等广泛应用中，目标跟踪是计算机视觉中的一个基本问题。这个问题的一个常见设置是使用边界框初始化第一帧中的关注对象，目的是估计后续帧中的对象轨迹[1、2、3]。在没有先验地了解目标类别的情况下，对任意目标的跟踪都需要在线学习判别信息以实现较高性能。尽管已经成功通过跟踪检测范式解决[4，5]，但由于物体变形，外观变化和严重遮挡等因素，它仍然是一个具有挑战性的问题。保持实时速度对于视觉跟踪也至关重要，视觉跟踪通常是许多经过在线分类训练的先进跟踪器的瓶颈。最近，基于判别相关滤波器（DCF）的跟踪器[6，7，8]通过在傅立叶频域中有效解决岭回归问题，可以在精度和速度之间取得理想的平衡。

自从利用手工制作的多通道功能（例如HoGs[7]）以来，DCF跟踪一直是社区最大的突破之一。朝此方向行驶的跟踪器始终分别配备特征提取器和相关滤波器。事实证明，良好的特征可以极大地提高跟踪性能[9]。后来，越来越多的工作[10、11、12]将重点放在用于DCF跟踪的多层深度特征的集成上。尽管改进了跟踪性能，但这些卷积层通常从预先训练的网络中选择图像分类任务[13、14、15]或目标检测任务[16、17]，这些任务不仅是手工挑选的，而且也是重量级的。由于上述方法中采用的特征都是通过相关跟踪过程独立提取的，因此实现的跟踪性能可能不是最佳的。

最低0.47元/天解锁文章