Pytorch使用collate_fn拼接维度不同的数据LSTM

原创

已于 2022-10-26 11:30:35 修改 · 1.2k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #深度学习 #python #lstm #deep learning

于 2022-09-21 15:10:31 首次发布

本文介绍了如何在Pytorch中使用DataLoader的collate_fn参数来处理LSTM模型训练时，数据维度不一致的问题。通过自定义collate_fn函数，实现了将不同序列长度的数据拼接成适合LSTM模型输入的形状，解决了LSTM模型要求固定序列长度输入的挑战。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Pytorch使用collate_fn拼接维度不同的数据LSTM

DataLoader有一个参数collate_fn,这个参数接收自定义collate函数，该函数在数据加载（即通过Dataloader取一个batch数据）之前，定义对每个batch数据的处理行为。
看下面的示例：

import torch
from torch.utils.data import Dataset, DataLoader,\
TensorDataset

def collate(data_):
	"""
	data_是一个列表，长度和DataLoader中定义的batch_size相等，
	每一个列表元素为从Dataset采样一次得到的数据，
	比如batch_size为2，从Dataset一次采样的数据为x,y，
	那么data_表示为[(x1,y1),(x2,y2)]。而从DataLoader出来的
	数据是 X=[x1,x2]^T和Y=[y1,y2]^T,
	下面的代码就是将data_变成X和Y的形式。
	"""
	
	x, y = zip(*data_) # zip 可以将多个列表（或元组）的对应元素拼在一起，这样x1和x2就在一个列表里，y1和y2在一个列表里
	x = torch.stack(x) # 把列表变成张量形式，stack默认在维度0拼接，维度大小等于batch_size大小
	y = torch.stack(y)
	return x, y
	
data = torch.rand(100,128)  # 生成x数据
label = torch.randint(0,2, (100,)).float()  # 生成y标签数据
dataset = TensorDataset(dat