【Mask-RCNN源码解读】RPN_BBOX_STD_DEV和BBOX_STD_DEV的作用

本文探讨了在Mask-RCNN源码中,BBOX_STD_DEV和RPN_BBOX_STD_DEV参数在计算bbox偏移量时的作用。这两个参数与回归目标的标准化有关,确保训练目标具有均值为零和标准差为一的分布。在训练后,通过乘以标准差和加上均值来将预测的标准化值转换为实际的偏移值,用于调整和缩放anchor框。这些值源于Faster RCNN,并且在不同阶段分别用于转换RPN的输出和损失计算中的bbox偏差。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近正在阅读Mask rcnn一个变种的源码,遇到了一个问题,就是在计算deltas,也就是bbox的偏移量的时候,总是会用到参数RPN_BBOX_STD_DEV或者BBOX_STD_DEV进行或乘或除的计算,一直不知道这个的作用是什么,搜索了一下貌似没有看到很好的中文解释,在github的issue上看到了很好的解释,索性搬过来

这个是github地址:https://github.com/matterport/Mask_RCNN/issues/270

问题描述

This is really great project - love the level of comments, the working notebooks, and the simple shapes dataset…all makes it exceptionally easy to read.
One thing that is not clear - In the RPN proposal layer the deltas are multiplied by BBOX_STD_DEV. There was a previous issue asking about this #85. The answer given refers to fastrcnn paper section on normalising the regression targets for the loss function.
However this is applied after the RPN loss function; and before the bbox spec is normalised to 0-1 range. Also two of the delta numbers are log(delta). I can possibly envisage that

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值