pytorch加载自己的图像数据集实例_python怎么导入图像数据集资源-CSDN下载

版权申诉

5星 · 超过95%的资源 161 浏览量 2020-09-16 13:34:58 上传评论 6 收藏 95KB PDF 举报

在PyTorch中，加载自定义的图像数据集是一个常见的任务，特别是在进行深度学习研究时。这个过程涉及几个关键步骤，包括数据预处理、定义数据集类以及使用数据加载器来批量处理数据。以下是对标题和描述中所提及知识点的详细说明： 1. **数据预处理**： - **归一化**：`transforms.ToTensor()` 是一个预处理步骤，它将图像从PIL（Python Imaging Library）格式转换为PyTorch的Tensor格式，同时将像素值从0-255范围归一化到0-1之间。 - **标准化**：`transforms.Normalize(mean=[.5, .5, .5], std=[.5, .5, .5])` 是另一个预处理步骤，通常用于卷积神经网络，它将数据进一步标准化到[-1, 1]区间，以帮助模型更快地收敛。在这个例子中，虽然没有使用，但它是常见的做法。 2. **定义自定义数据集类**： - 在PyTorch中，我们需要创建一个自定义的`Dataset`子类来加载和处理我们的图像数据。在示例中，我们创建了一个名为`FlameSet`的类，它继承自`data.Dataset`。 - `__init__` 方法初始化数据集，通过读取指定文件夹中的所有图像文件路径。 - `__getitem__` 方法允许通过索引访问数据集中的每个样本，这里它打开图像文件，应用预处理变换（如果存在），然后返回处理后的Tensor。 - `__len__` 方法返回数据集中样本的数量。 3. **使用数据加载器**： - 虽然在给定的例子中没有直接使用`DataLoader`，但通常我们会使用它来批量加载数据并进行并行处理，这在训练模型时非常有用。`DataLoader`可以从`torch.utils.data`导入，并在自定义数据集上实例化，以提供批量数据和可能的线程化。 4. **补充知识：MNIST数据集**： - PyTorch的`torchvision.datasets.MNIST`提供了内置的MNIST数据集加载功能。用户可以直接下载并加载训练和测试数据集。 - 当需要加载本地已经下载的MNIST数据集时，可以自定义一个`Dataset`类，按照数据集的结构读取本地文件，实现`__init__`，`__getitem__`和`__len__`方法。总结，PyTorch加载自定义图像数据集涉及数据预处理、创建自定义数据集类以及可能使用数据加载器。对于新手来说，理解这些步骤是进行深度学习项目的关键，因为它们允许用户灵活地处理各种类型的数据集，而不仅仅是预定义的库。

资源推荐

资源详情

资源评论

pytorch加载自己的图像数据集实例加载自己的图像数据集实例

主要介绍了pytorch加载自己的图像数据集实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

之前学习深度学习算法，都是使用网上现成的数据集，而且都有相应的代码。到了自己开始写论文做实验，用到自己的图像数据集的时候，才发现无从下

手，相信很多新手都会遇到这样的问题。

参考文章https://www.jb51.net/article/177613.htm

下面代码实现了从文件夹内读取所有图片，进行归一化和标准化操作并将图片转化为tensor。最后读取第一张图片并显示。

# 数据处理

import os

import torch

from torch.utils import data

from PIL import Image

import numpy as np

from torchvision import transforms

transform = transforms.Compose([

transforms.ToTensor(), # 将图片转换为Tensor,归一化至[0,1]

# transforms.Normalize(mean=[.5, .5, .5], std=[.5, .5, .5]) # 标准化至[-1,1]

])

#定义自己的数据集合

class FlameSet(data.Dataset):

def __init__(self,root):

# 所有图片的绝对路径

imgs=os.listdir(root)

self.imgs=[os.path.join(root,k) for k in imgs]

self.transforms=transform

def __getitem__(self, index):

img_path = self.imgs[index]

pil_img = Image.open(img_path)

if self.transforms:

data = self.transforms(pil_img)

else:

pil_img = np.asarray(pil_img)

data = torch.from_numpy(pil_img)

return data

def __len__(self):

return len(self.imgs)

if __name__ == '__main__':

dataSet=FlameSet('./test')

print(dataSet[0])

显示结果：

补充知识：补充知识：使用使用Pytorch进行读取本地的进行读取本地的MINIST数据集并进行装载数据集并进行装载

pytorch中的torchvision.datasets中自带MINIST数据集，可直接调用模块进行获取，也可以进行自定义自己的Dataset类进行读取本地数据和初始化数据。

1. 直接使用直接使用pytorch自带的自带的MNIST进行下载进行下载:

缺点: 下载速度较慢，而且如果中途下载失败一般得是重新进行执行代码进行下载:

# # 训练数据和测试数据的下载

# 训练数据和测试数据的下载

trainDataset = torchvision.datasets.MNIST( # torchvision可以实现数据集的训练集和测试集的下载

root="./data", # 下载数据，并且存放在data文件夹中

train=True, # train用于指定在数据集下载完成后需要载入哪部分数据，如果设置为True，则说明载入的是该数据集的训练集部分；如果设置为False，则说明载入的是该数据集的测试集部分。

transform=transforms.ToTensor(), # 数据的标准化等操作都在transforms中，此处是转换

download=True # 瞎子啊过程中如果中断，或者下载完成之后再次运行，则会出现报错

)

testDataset = torchvision.datasets.MNIST(

root="./data",

train=False,

transform=transforms.ToTensor(),

download=True

)

2. 自定义自定义dataset类进行数据的读取以及初始化。类进行数据的读取以及初始化。

其中自己下载的MINIST数据集的内容如下:

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余2页未读，立即下载

内容反馈

版权申诉

ttchu

2021-07-25

资料对我没用
xzz1998

2023-09-12

怎么能有这么好的资源！只能用感激涕零来形容TAT...
黛青Ravings

2024-06-07

资源不错，很实用，内容全面，介绍详细，很好用，谢谢分享。
二十九画生0928

2024-12-04

资源质量不错，和资源描述一致，内容详细，对我很有用。
m0_74623542

2023-10-05

资源有很好的参考价值，总算找到了自己需要的资源啦。

前往

页

weixin_38512781

粉丝: 6

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip