PyTorch Bug 记录：one of the variables needed for gradient computation has been modified by an inplace

最新推荐文章于 2025-04-15 18:15:27 发布

大指挥官

最新推荐文章于 2025-04-15 18:15:27 发布

阅读量4.4k

点赞数 16

CC 4.0 BY-SA版权

分类专栏： pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/d14665/article/details/115405861

pytorch 专栏收录该内容

3 篇文章

订阅专栏

在将代码从Pytorch1.2升级到1.8时遇到一个RuntimeError，错误指出某个变量在梯度计算中被不当修改。原本在1.4之前版本中，连续的optimizer.step()不会出问题，但在1.5之后需要分开进行zero_grad()和step()。解决方案是确保每个optimizer分别进行zero_grad()和step()操作，避免了错误的发生。这是一个关于Pytorch版本兼容性和训练流程调整的问题。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

有一段代码在 pytorch 1.2 上没有问题，但是移植到 pytorch 1.8 就会报如下错误：

RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.cuda.FloatTensor [3136, 10]], which is output 0 of TBackward, is at version 2; expected version 1 instead. Hint: the backtrace further above shows the operation that failed to compute its gradient. The variable in question was changed in there or anywhere later. Good luck!

经过检查，代码里并没有用到 inplace 操作。
后来发现这是 pytorch 版本更新造成的，对于 pytorch 1.4 之前的版本，如下代码是不会出错的：

opt1.zero_grad()
loss1.backward()
opt1.step()

opt2.zero_grad()
loss2.backward()
opt2.step()

但是更新到 pytorch 1.5 之后，这种操作就会报错，应该用下面代码代替：

opt1.zero_grad()
loss1.backward()

opt2.zero_grad()
loss2.backward()

opt1.step()
opt2.step()

这个BUG难了我一下午，特此记录一下。

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大指挥官 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。