pytorch 查看中间变量的梯度

最新推荐文章于 2025-03-05 16:39:29 发布

weixin_30425949

最新推荐文章于 2025-03-05 16:39:29 发布

阅读量1.3k

点赞数

CC 4.0 BY-SA版权

文章标签：人工智能

原文链接：http://www.cnblogs.com/SivilTaram/p/pytorch_intermediate_variable_gradient.html

本文介绍如何在PyTorch中使用register_hook接口保存中间变量的梯度，以便于开发者验证实现的正确性。通过示例代码展示了如何为特定中间变量注册梯度保存接口，并在反向传播后获取其梯度值。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

pytorch 为了节省显存，在反向传播的过程中只针对计算图中的叶子结点(leaf variable)保留了梯度值(gradient)。但对于开发者来说，有时我们希望探测某些中间变量(intermediate variable) 的梯度来验证我们的实现是否有误，这个过程就需要用到 tensor的register_hook接口。一段简单的示例代码如下，代码主要来自pytorch开发者的回答，笔者稍作修改使其更符合最新版的pytorch 语法(v1.2.0)。

grads = {}

def save_grad(name):
    def hook(grad):
        grads[name] = grad
    return hook

x = torch.randn(1, requires_grad=True)
y = 3*x
z = y * y

# 为中间变量注册梯度保存接口，存储梯度时名字为 y。
y.register_hook(save_grad('y'))

# 反向传播 
z.backward()

# 查看 y 的梯度值
print(grads['y'])

一个示例输出是：