快捷方式

LibriLightLimited

class torchaudio.datasets.LibriLightLimited(root: Union[str, Path], subset: str = '10min', download: bool = False)[源代码]

Libri-light 的一个子集 [Kahn et al., 2020] 数据集,HuBERT [Hsu et al., 2021] 在监督微调时使用了该数据集。

参数
  • root (strPath) – 数据集所在或下载到的目录路径。

  • subset (str, optional) – 使用的子集。可选值:["10min", "1h", "10h"] (默认值:"10min")。

  • download (bool, 可选) – 如果在 root 路径下找不到数据集,则下载数据集。(默认:False)。

__getitem__

LibriLightLimited.__getitem__(n: int) Tuple[Tensor, int, str, int, int, int][源代码]

加载数据集中的第 n 个样本。

参数

n (int) – 要加载的样本的索引

返回

元组包含以下项:

张量

波形

int

采样率

str

语音内容

int

说话人 ID

int

章节 ID

int

发音单元 ID

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源