Snips¶

class torchaudio.datasets.Snips(root: Union[str, Path], subset: str, speakers: Optional[List[str]] = None, audio_format: str = 'mp3')[源码]¶

Snips [Coucke et al., 2018] 数据集。

参数

root (str 或 Path) – 数据集顶级目录所在的根目录。
subset (str) – 要使用的数据集子集。选项：["train", "valid", "test"]。
speakers (List[str] 或 None, 可选) – 要包含在数据集中的说话人列表。如果为 None，则包含子集中的所有说话人。（默认：None）
audio_format (str, 可选) – 音频的扩展名。选项：["mp3", "wav"]。（默认："mp3"）

getitem¶

Snips.__getitem__(n: int) → Tuple[Tensor, int, str, str, str][源码]¶

加载数据集中的第 n 个样本。

参数

n (int) – 要加载的样本的索引

返回

返回类型

以下项的元组：

Snips.get_metadata(n: int) → Tuple[str, int, str, str, str][源码]¶

从数据集中获取第 n 个样本的元数据。返回文件路径而不是波形，但其他返回的字段与 __getitem__() 相同。

参数

n (int) – 要加载的样本的索引。

返回

返回类型

以下项的元组：