LibriLightLimited¶ class torchaudio.datasets.LibriLightLimited(root: Union[str, Path], subset: str = '10min', download: bool = False)[source]¶ Libri-light 的子集 [Kahn et al., 2020] 数据集,已用于 HuBERT [Hsu et al., 2021] 进行有监督微调。 参数 root (str 或 Path) – 数据集所在或下载到的目录路径。 subset (str, optional) – 使用的子集。选项:["10min", "1h", "10h"] (默认值:"10min")。 download (bool, optional) – 如果在 root 路径下找不到数据集,是否下载。(默认值:False)。 __getitem__¶ LibriLightLimited.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][source]¶ 加载数据集中的第 n 个样本。 参数 n (int) – 要加载的样本的索引 返回 元组包含以下项: 张量波形 int采样率 str语音内容 int说话人 ID int章节 ID int发音单元 ID