快捷方式

Middlebury2014Stereo

class torchvision.datasets.Middlebury2014Stereo(root: Union[str, Path], split: str = 'train', calibration: Optional[str] = 'perfect', use_ambient_views: bool = False, transforms: Optional[Callable] = None, download: bool = False)[源代码]

来自 Middlebury 数据集 2014 年版本 <https://vision.middlebury.edu/stereo/data/scenes2014/> 的公开场景。

该数据集基本遵循原始格式,不包含环境子目录。

root
    Middlebury2014
        train
            scene1-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            scene2-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            ...
        additional
            scene1-{perfect,imperfect}
                calib.txt
                im{0,1}.png
                im1E.png
                im1L.png
                disp{0,1}.pfm
                disp{0,1}-n.png
                disp{0,1}-sd.pfm
                disp{0,1}y.pfm
            ...
        test
            scene1
                calib.txt
                im{0,1}.png
            scene2
                calib.txt
                im{0,1}.png
            ...
参数:
  • root (str 或 pathlib.Path) – Middleburry 2014 数据集的根目录。

  • split (字符串, 可选) – 数据集场景的分割,可以是 “train”(默认)、“test” 或 “additional”

  • use_ambient_views (布尔值, 可选) – 是否在可能的情况下使用不同的曝光或灯光视图。该数据集以相等的概率在 [im1.png, im1E.png, im1L.png] 之间进行采样。

  • calibration (字符串, 可选) – 是否使用校准(默认)或未校准的场景。

  • transforms (callable, optional) – 一个函数/变换,接收一个样本并返回一个变换后的版本。

  • download (布尔值, 可选) – 是否在 root 目录中下载数据集。

特殊成员:

__getitem__(index: int) tuple[PIL.Image.Image, PIL.Image.Image, Optional[numpy.ndarray]][源代码]

在给定索引处返回示例。

参数:

index (int) – 要检索的示例的索引

返回:

一个 4 元组,包含 (img_left, img_right, disparity, valid_mask)。disparity 是一个形状为 (1, H, W) 的 numpy 数组,图像是 PIL 图像。valid_mask 对于 split=test 来说是隐式 None

返回类型:

元组

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源