SiamMask的完整跟踪过程

最新推荐文章于 2025-04-17 19:45:41 发布

窃书的孔乙己

最新推荐文章于 2025-04-17 19:45:41 发布

阅读量1.4k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：笔记文章标签：卷积 python 计算机视觉机器学习深度学习

26 篇文章

订阅专栏

SiamMask

在这里插入图片描述

计算检测图像的边长
1. 以前一帧的中心为中心，以前一帧模板边长的2倍为边长，截取图像补丁。
  1. 先按照比例扩大边长，然后截取，最后resize
将模板图像和检测图像互相关，然后生成2k个cls结果和4k个loc结果和17x17x（63x63）的mask输出。（与RPN网络还是有区别的，RPN是先将通道扩充到2k（4k或（63x63））再求互相关）
利用Siam RPN的知识，计算出不同回归框的坐标。利用尺度惩罚和位移惩罚，计算出每个回归框的得分。找到最大得分的回归框索引（第几个回归框）
对mask分支的处理
1. 利用最大得分的回归框索引，找到该回归框的中心点位置。np.unravel_index
2. 然后以该中心点为中心，以该回归框的尺寸为尺寸截取特征图补丁。
3. 利用sharp mask网络，对该补丁进行处理，得到新的特征图补丁。
4. 将该补丁输入sigmoid函数，大于0.5阈值的输出255，小于输出0，生成二进制掩码。
利用二进制掩码生成回归框。比如min-max。实现回归。