小样本学习数据集

在小样本学习（Few-shot Learning）领域，研究人员通常使用一些标准的小规模数据集来进行实验和评估。这些数据集设计用于测试模型在仅有少量样本的情况下能否有效进行学习和泛化。以下是一些常见的用于小样本学习的小规模数据集： ### 1. **Omniglot 数据集** Omniglot 数据集是小样本学习中最常用的基准数据集之一。它包含来自 50 个不同字母系统的 1623 个手写字符，每个字符由不同的人绘制，总共约 16000 张图像。每张图像的大小为 105×105 像素，具有高度的类间多样性。Omniglot 数据集特别适合用于评估 one-shot 或 few-shot 分类任务[^1]。 ### 2. **miniImageNet 数据集** miniImageNet 是 ImageNet 的一个子集，包含 100 个类别，每个类别有 600 张图像，图像大小为 84×84 像素。通常将这些类别划分为 64 个训练类、16 个验证类和 20 个测试类。该数据集广泛用于评估 few-shot 图像分类任务，尤其是在元学习（meta-learning）框架下[^1]。 ### 3. **tieredImageNet 数据集** tieredImageNet 是 ImageNet 的另一个子集，相较于 miniImageNet，它的类别划分更加复杂，训练集、验证集和测试集之间的类别在语义上更加分离，从而更具挑战性。该数据集包含 608 个类别，划分为 34 个超类，适用于评估模型在更复杂的语义层次上的 few-shot 学习能力[^1]。 ### 4. **CUB-200-2011 (Caltech-UCSD Birds) 数据集** CUB-200-2011 数据集包含 200 种鸟类的图像，共 11788 张图像。每张图像标注了详细的属性信息，如鸟喙形状、羽毛颜色等。该数据集常用于细粒度分类任务，也适用于 few-shot 学习的研究，尤其是在结合属性信息进行元学习的场景中[^3]。 ### 5. **FC100 (Fewshot Colorful Dataset)** FC100 是基于 CIFAR-100 构建的一个 few-shot 学习数据集，包含 100 个类别，每个类别有 600 张图像。这些类别被划分为训练集（60 类）、验证集（20 类）和测试集（20 类）。图像大小为 32×32 像素，适用于轻量级模型的 few-shot 图像分类实验[^1]。 ### 6. **Aircraft 数据集** Aircraft 数据集包含 100 种不同型号的飞机图像，共 10246 张图像。该数据集主要用于细粒度分类任务，也适用于 few-shot 学习的研究，尤其是在需要高精度特征提取的场景中。 ### 7. **Plant Seedlings 分类数据集** 该数据集包含不同种类的植物幼苗图像，适用于农业和植物识别任务。数据集中每个类别的样本数量较少，非常适合用于 few-shot 学习的实际应用研究。 ### 8. **EuroSAT 数据集** EuroSAT 是一个遥感图像数据集，包含 27,000 张卫星图像，涵盖 10 种土地使用类型。虽然整体数据集较大，但可以从中抽取子集用于 few-shot 学习任务，尤其是在地理信息系统的应用中。 ### 示例代码：加载 Omniglot 数据集（使用 PyTorch） ```python from torchvision import datasets, transforms from torch.utils.data import DataLoader # 定义图像转换操作 transform = transforms.Compose([ transforms.Resize((28, 28)), transforms.ToTensor(), ]) # 加载 Omniglot 数据集 omniglot_dataset = datasets.Omniglot( root='./data', background=True, transform=transform, download=True ) # 创建 DataLoader dataloader = DataLoader(omniglot_dataset, batch_size=32, shuffle=True) ```

阅读全文

小样本学习数据集

相关推荐

元学习，小样本图像数据集：FC100数据集

小样本学习/机器学习数据集 miniimagenet

YOLO目标检测 小样本图像数据集扩充方法

Zero-Shot Learing零样本学习数据集分享（GoogleNet 提取）-附件资源

Zero-Shot Learing零样本学习数据集分享（GoogleNet 提取）-附件资源.txt

车辆正样本图片数据集

正负样本的数据集.zip

常见病虫识别样本-数据集

YOLO目标检测小样本图像数据集扩充技术

Omniglot数据集：小样本学习的字符分类资料

PASCAL-5i数据集：小样本学习的关键资源

the homework of ROS summer school

OpenWeatherMap API 调用实战模板.rar

基于React框架构建的现代化前端Web应用程序开发模板_包含完整开发环境配置和构建工具链_用于快速启动React项目开发_支持热重载和自动化测试_集成Webpack和Babel构.zip

锂电池充放电模型的MatlabSimulink仿真及双向充放电功能实现 DCDC变换器

基于西门子S7-1200PLC与KTP700触摸屏的四层电梯控制系统设计与实现 · 电梯控制 v2.5

基于MATLAB的虚拟同步电机并网控制仿真程序研究与实现 最新版

COMSOL流热拓扑优化：多目标平均温度与最小耗散归一化处理方法探讨

MATLAB实现的光子晶体谐振腔FDTD光场仿真系统

spring-jdbc-6.2.3.jar中文-英文对照文档.zip

如何利用 rowid 在OceanBase 中处理大表时提效

学校网络电教中心工作计划选文.doc

大家在看

瑞星卡卡kaka小狮子（不含杀软） For Mac，情怀小程序，有动画有声，亲测可用

RS232-Monitor-Commands:这是用于专业屏幕，显示器和投影仪的所有已知RS232命令的公共数据库。 随时贡献！

XL USB SDK_激光干涉仪_雷尼绍干涉仪sdk_xl_

Simulink_BP神经网络PID控制

粒子群算法matlab编写代码

最新推荐

pytorch学习教程之自定义数据集

基于小样本SVR的迁移学习及其应用.pdf

任务三、titanic数据集分类问题

【机器学习】用相亲样本数据集详解条件熵的计算过程

paddle深度学习：使用（jpg + xml）制作VOC数据集

Python打造的Slaee管理系统升级版发布

深入解析PCB走线传输延时：关键因素与实用公式

gpio很弱是什么意思

Python打造的Slaee管理系统升级版发布

【Keil-ARM编程艺术】：如何编写可维护且高效的代码

YOLO目标检测小样本图像数据集扩充方法

基于MATLAB的虚拟同步电机并网控制仿真程序研究与实现最新版

RS232-Monitor-Commands:这是用于专业屏幕，显示器和投影仪的所有已知RS232命令的公共数据库。随时贡献！