PyTorch教程：理解数据转换(Transforms)在深度学习中的应用-CSDN博客

本文链接：https://blog.csdn.net/gitblog_00858/article/details/148440191

PyTorch教程：理解数据转换(Transforms)在深度学习中的应用

数据转换的重要性

在深度学习项目中，原始数据往往不能直接用于模型训练。数据转换(Transforms)是将原始数据处理成适合模型训练形式的关键步骤。PyTorch提供了强大的数据转换工具，帮助我们高效地完成这一过程。

为什么需要数据转换

数据格式统一化：不同来源的数据可能有不同格式，需要统一为张量形式
数据标准化：将数据缩放到合理范围，如[0,1]或[-1,1]区间
数据增强：通过随机变换增加数据多样性，提高模型泛化能力
标签处理：将分类标签转换为适合损失函数计算的形式

PyTorch中的Transforms机制

PyTorch的数据集类通常提供两个重要参数来处理数据转换：

transform：用于修改特征数据
target_transform：用于修改标签数据

这两个参数接受可调用对象，包含了具体的转换逻辑。

常用转换示例

1. ToTensor转换

ToTensor是最基础也最常用的转换之一，它能够：

将PIL图像或NumPy数组转换为PyTorch张量
自动将图像像素值从[0,255]范围缩放到[0.0,1.0]范围
调整张量维度顺序，使其符合PyTorch的预期格式

from torchvision.transforms import ToTensor

transform = ToTensor()

2. Lambda自定义转换

当内置转换不能满足需求时，可以使用Lambda创建自定义转换。这在标签处理时特别有用。

例如，在分类任务中，我们通常需要将整数标签转换为one-hot编码：

from torchvision.transforms import Lambda

target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

这段代码的工作原理是：

创建一个长度为10(类别数)的全零张量
使用scatter_方法在标签对应的位置填入1
最终得到一个one-hot编码的张量

实际应用示例

在FashionMNIST数据集中的应用：

from torchvision import datasets

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

这个例子展示了如何同时应用特征转换和标签转换，为模型训练准备好数据。