Pytorch中detach()的作用、与grad.zero_()的区别

zzz_979

于 2023-04-27 19:09:32 发布

阅读量1.6k

点赞数 3

CC 4.0 BY-SA版权

文章标签： pytorch 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48018951/article/details/130412705

detach()的作用

detach()函数返回一个和源张量同shape、dtype和device的张tensor，是从当前计算图中分离下来的，与源张量共享数据内存，仍指向原变量的存放位置，不同之处只是requires_grad为false，得到的这个tensor永远不需要计算其梯度，不具有grad。即使之后重新将它的requires_grad置为true，它也不会具有梯度grad。

注意：使用detach返回的tensor和原始的tensor共同一个内存，即一个修改另一个也会跟着改变

Tensor.detach() 的作用是阻断反向梯度传播，当我们在训练网络的时候可能希望保持一部分的网络参数不变，只对其中一部分的参数进行调整；或者只训练部分分支网络，并不让其梯度对主网络的梯度造成影响，这时候我们就需要使用detach()函数来切断一些分支的反向传播，例如在生成对抗网络的训练当中，在训练判别器的时候不需要生成器进行反向梯度传播，这时候就会使用到 detach()。

import torch

a = torch.tensor(2.0, requires_grad=True)
y = a

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。