ImageNet¶

class torchvision.datasets.ImageNet(root: Union[str, Path], split: str = 'train', **kwargs: Any)[源代码]¶

ImageNet 2012 分类数据集。

注意

在使用此类之前，需要从此处下载 ImageNet 2012 数据集，并将文件 ILSVRC2012_devkit_t12.tar.gz 和 ILSVRC2012_img_train.tar 或 ILSVRC2012_img_val.tar 根据 split 放在根目录下。

参数:

root (str 或 pathlib.Path) – ImageNet 数据集的根目录。
split (string, optional) – 数据集拆分，支持 train 或 val。
transform (callable, optional) – 一个函数/变换，接收 PIL 图像或 torch.Tensor（取决于给定的加载器），并返回一个变换后的版本。例如，transforms.RandomCrop
target_transform (可调用对象, 可选) – 一个函数/变换，接受目标并对其进行变换。
loader – 一个函数，用于根据图像路径加载图像。默认情况下，它使用 PIL 作为图像加载器，但用户也可以传入 torchvision.io.decode_image 直接将图像数据解码为张量。

__getitem__(index: int) → tuple[Any, Any]¶

文档