数据集¶
Torchvision 在 torchvision.datasets 模块中提供了许多内置数据集,以及用于构建您自己的数据集的实用类。
内置数据集¶
所有数据集都是 torch.utils.data.Dataset 的子类,即它们实现了 __getitem__ 和 __len__ 方法。因此,它们都可以传递给 torch.utils.data.DataLoader,后者可以使用 torch.multiprocessing 工作器并行加载多个样本。例如
imagenet_data = torchvision.datasets.ImageNet('path/to/imagenet_root/')
data_loader = torch.utils.data.DataLoader(imagenet_data,
batch_size=4,
shuffle=True,
num_workers=args.nThreads)
所有数据集都具有几乎相同的 API。它们都具有两个通用参数:transform 和 target_transform,用于分别转换输入和目标。您还可以使用提供的 基本类 创建您自己的数据集。
警告
当使用 download=True 创建数据集对象时,文件首先会在根目录中下载和提取。此下载逻辑不安全,不能进行多进程处理,因此在分布式环境中运行时可能会导致冲突/竞争条件。在分布式模式下,我们建议创建一个虚拟数据集对象来触发下载逻辑,然后再设置分布式模式。
图像分类¶
|
Caltech 101 数据集。 |
|
Caltech 256 数据集。 |
|
|
|
CIFAR10 数据集。 |
|
CIFAR100 数据集。 |
|
|
|
|
|
EMNIST 数据集。 |
|
RGB 版本的 EuroSAT 数据集。 |
|
一个虚拟数据集,返回随机生成的图像并将它们作为 PIL 图像返回 |
|
Fashion-MNIST 数据集。 |
|
FER2013 数据集。 |
|
FGVC Aircraft 数据集。 |
|
Flickr8k Entities 数据集。 |
|
Flickr30k Entities 数据集。 |
|
牛津 102 花卉 数据集。 |
|
|
|
德国交通标志识别基准 (GTSRB) 数据集。 |
|
iNaturalist 数据集。 |
|
ImageNet 2012 分类数据集。 |
|
Imagenette 图像分类数据集。 |
|
Kuzushiji-MNIST 数据集。 |
|
LFW 数据集。 |
|
LSUN 数据集。 |
|
MNIST 数据集。 |
|
Omniglot 数据集。 |
|
|
|
Places365 分类数据集。 |
|
|
|
QMNIST 数据集。 |
|
|
|
SEMEION 数据集。 |
|
SBU带字幕照片 数据集。 |
|
斯坦福汽车数据集 |
|
STL10 数据集。 |
|
|
|
SVHN 数据集。 |
|
USPS 数据集。 |
图像检测或分割¶
|
MS Coco 检测 数据集。 |
|
|
|
Cityscapes 数据集。 |
|
KITTI 数据集。 |
|
|
|
|
|
Pascal VOC 分割数据集。 |
|
Pascal VOC 检测数据集。 |
|
WIDERFace 数据集。 |
光流¶
|
FlyingChairs 光流数据集。 |
|
FlyingThings3D 光流数据集。 |
|
HD1K 光流数据集。 |
|
KITTI 光流 (2015) 数据集。 |
|
Sintel 光流数据集。 |
立体匹配¶
|
Carla 模拟器数据,链接在 CREStereo github 仓库 中。 |
|
KITTI 数据集,来自 2012 立体评估基准。 |
|
KITTI 数据集,来自 2015 立体评估基准。 |
|
用于训练 CREStereo 架构的合成数据集。 |
|
FallingThings 数据集。 |
|
用于 Scene Flow 数据集的接口。 |
|
Sintel 立体数据集。 |
|
InStereo2k 数据集。 |
|
ETH3D 低分辨率双视图 数据集。 |
|
来自 Middlebury 数据集的公开场景 2014 版本 <https://vision.middlebury.edu/stereo/data/scenes2014/>。 |
图像对¶
|
LFW 数据集。 |
|
多视图立体对应 数据集。 |
图像字幕¶
|
MS Coco 字幕 数据集。 |
视频分类¶
|
HMDB51 数据集。 |
|
通用 Kinetics 数据集。 |
|
UCF101 数据集。 |
视频预测¶
|
MovingMNIST 数据集。 |
自定义数据集的基础类¶
|
一个通用的数据加载器。 |
|
一个通用的数据加载器,其中图像默认以这种方式排列:。 |
|
用于创建与torchvision兼容的数据集的基础类。 |
Transforms v2¶
|
包装一个 |