pytorch中view函数的常用写法解释

最新推荐文章于 2024-07-18 13:37:12 发布

最幸伏的人

最新推荐文章于 2024-07-18 13:37:12 发布

阅读量1.5k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签： pytorch 神经网络

本文链接：https://blog.csdn.net/qq_43631827/article/details/121567102

人工智能专栏收录该内容

9 篇文章

订阅专栏

本文介绍了PyTorch中Tensor的view函数，它用于在不改变数据的情况下调整Tensor的形状。`x.view(-1, n)`中的-1表示根据n自动确定维度，确保总元素数量不变。讲解了-1如何根据另一个非负整数n动态计算行或列数，并强调了n需能整除Tensor大小。这个操作常见于全连接层。此外，还提到了resize、view和reshape的相似功能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

下图是一个简单的神经网络(不是CNN)，他是用来拟合一个抛物线的，但是本文的重点是forward函数中的x.view(-1, n)函数,很多时候你会发现许多的网络都是这么写的，2个参数值里有一个-1，另外一个是正数，view函数是不改变数据的情况下任意修改Tensor的形状(你不妨认为你的Tensor是106块麻将结合到一起，你可把它摆放成一个长条的，也可以堆成堆，总之还是那些牌，还是106块)。
-1代表的意思是不确定，主要依据那个非-1的参数，在本例中，就是依靠那个n，就是只要保证列数是n即可，行数随意；如果是x.view(n, -1)，那就是说我只要求行数满足n行，列数你自己安排就好。比如说Tensor有600行，n为100，那么为-1那个行数或者就是600÷100=6，是程序自己解决的。不过这里的n取值要能够整除Tensor的大小，比如你这里让n=599，就会报错，因为600÷599没法得到整数。不过大部分的例子中，执行完都是得到一个一维的Tensor(行数为1或者列数为1，好像pytorch中不太区分到底是一行n列还是n行一列，你不妨理解为“一长条”)，一般用在卷积神经网络的全连接层比较多。
resize，view和reshape用法功能基本相同。

我的解释可能穿在错误或者理解不够深刻的地方，欢迎大家指正。

class MyCNN(torch.nn.Module):
    def __init__(self, in_cheng, hid_cheng, out_cheng):
        super().__init__()
        self.incheng = torch.nn.Sequential(
            torch.nn.Linear(in_cheng, hid_cheng),
            torch.nn.ReLU(),
            torch.nn.Linear(hid_cheng, out_cheng),
            torch.nn.ReLU()
        )

    def forward(self, x):
        x = self.incheng(x)
        x.view(-1, n)
        return x