视觉对象跟踪技术是计算机视觉领域的一个重要研究方向,其目标是在视频序列中跟踪一个或多个指定的目标。近年来,随着深度学习技术的发展,基于深度学习的视觉跟踪器在多个基准检测任务中展示了最先进的性能。然而,这些跟踪器在实现高实时性能方面仍面临挑战。为了解决这一问题,本文提出了一种名为孪生区域候选网络(Siamese-RPN)的新模型。 Siamese-RPN是一种基于大规模图像对进行端到端离线训练的深度学习跟踪器,它由两个主要组件构成:一个特征提取的孪生子网络和一个包含分类分支及回归分支的区域建议子网络。在推断阶段,Siamese-RPN能够将候选框架演化为一个局部单发检测任务。在线跟踪过程中,该模型可以预先计算模板分支,并利用关联层来执行跟踪任务。这样的设计使得传统上用于提高跟踪准确性但计算代价高昂的多尺度测试和在线微调成为非必需。 传统的视觉跟踪技术主要分为两个分支:一类是基于相关滤波器的方法,这类方法通过利用傅立叶域中的循环相关属性来训练回归器;另一类是利用深度特征进行跟踪的方法,这种方法不更新模型,但往往因为没有使用特定领域信息而导致性能不佳。本文提出的Siamese-RPN展现了与深度学习方法相比的显著优势,特别是在运行速度和跟踪准确性方面。 在Siamese-RPN中,模板分支用于将目标的外观信息编码到区域建议网络(RPN)功能图中,以便区分前景与背景。这允许将跟踪任务表达为局部单样本检测框架,其中第一帧中的边界框作为唯一的示例。通过这种方式,模型能够将目标跟踪表述为一种快速的、一次性的检测任务。 该论文的主要贡献可以归纳为以下三点: 1. 提出的Siamese-RPN是利用大规模图像对进行端到端离线训练的模型,其设计旨在解决高实时性能与高准确性之间的权衡问题。 2. 在线跟踪过程中,Siamese-RPN演化为局部单发学习检测任务,这有助于提升候选区域的准确性,同时避免了多尺度测试和在线微调的高成本。 3. 该模型在VOT2015、VOT2016和VOT2017实时挑战中取得了领先的表现,以160FPS的速度运行,证明了其在速度和准确性方面的双重优势。 在具体实现上,Siamese-RPN的特征提取孪生子网从左图开始,用于提取图像特征;位于中间的区域候选子网包括两个分支,一个用于分类,另一个用于回归。对于分类分支,输出特征图包含2k个通道,分别对应k个锚点的前景和背景;对于回归分支,输出特征图包含4k个通道,对应于k个锚定候选优化的四个坐标。文中提到的相关运算符(`⋆`)用于完成两个输出特征图的成对相关操作。 文章的介绍部分详细阐述了视觉对象跟踪在自动驾驶和视频监控等应用场景中的重要性,并指出了当前跟踪技术面临的挑战。针对这些挑战,作者提出了一种新的跟踪器设计,并通过实验验证了该设计的有效性。这为视觉对象跟踪领域的研究和实际应用提供了新的思路和方法。





















- 粉丝: 6
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 2023年移动通信试题库及答案全完整.doc
- 计算机组装与维护实习任务重庆工程职业技术学院.doc
- 网络公司员工保密协议书通用版.doc
- 计算机病毒防护管理办法.doc
- 最新企业网络推广方案策划书-.doc
- 人工智能现状与未来.pptx
- 互联网背景下中国保健品市场营销策略研究.pdf
- 湖南大学项目管理作业分析.pptx
- 实验教程第6章其它常用应用软件的使用.ppt
- 项目管理与一般管理的比较研究.doc
- 实验数据处理软件Excel.doc
- 结合市政工程特点谈项目管理的创新与实践(最新整理).pdf
- 网络营销理念与实务培训课件.pptx
- 项目管理成本类比估算表样本.doc
- 网络编辑内容优化及伪原创培训.pptx
- 互联网+智能家居.ppt


