• 文档 >
  • torchaudio.datasets >
  • 旧版本 (稳定版)
快捷方式

torchaudio.datasets

所有数据集都是 torch.utils.data.Dataset 的子类,并实现了 __getitem____len__ 方法。

因此,它们都可以传递给 torch.utils.data.DataLoader,后者可以使用 torch.multiprocessing 工作器并行加载多个样本。例如

yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
    yesno_data,
    batch_size=1,
    shuffle=True,
    num_workers=args.nThreads)

CMUARCTIC

CMU ARCTIC [Kominek 等人,2003] 数据集。

CMUDict

CMU Pronouncing Dictionary [Weide, 1998] (CMUDict) 数据集。

COMMONVOICE

CommonVoice [Ardila 等人,2020] 数据集。

DR_VCTK

Device Recorded VCTK (小型子集版本) [Sarfjoo 和 Yamagishi,2018] 数据集。

FluentSpeechCommands

流利语音命令 [Lugosch 等人,2019] 数据集

GTZAN

GTZAN [Tzanetakis 等人,2001] 数据集。

IEMOCAP

IEMOCAP [Busso 等人,2008] 数据集。

LibriMix

LibriMix [Cosentino 等人,2020] 数据集。

LIBRISPEECH

LibriSpeech [Panayotov 等人,2015] 数据集。

LibriLightLimited

Libri-light [Kahn 等人,2020] 数据集的子集,用于 HuBERT [Hsu 等人,2021] 中的监督微调。

LIBRITTS

LibriTTS [Zen 等人,2019] 数据集。

LJSPEECH

LJSpeech-1.1 [Ito 和 Johnson,2017] 数据集。

MUSDB_HQ

MUSDB_HQ [Rafii 等人,2019] 数据集。

QUESST14

QUESST14 [Miro 等人,2015] 数据集。

Snips

Snips [Coucke 等人,2018] 数据集。

SPEECHCOMMANDS

语音命令 [Warden, 2018] 数据集。

TEDLIUM

Tedlium [Rousseau 等人,2012] 数据集(版本 1、2 和 3)。

VCTK_092

VCTK 0.92 [Yamagishi 等人,2019] 数据集

VoxCeleb1Identification

用于说话人识别任务的 VoxCeleb1 [Nagrani 等人,2017] 数据集。

VoxCeleb1Verification

用于说话人验证任务的 VoxCeleb1 [Nagrani 等人,2017] 数据集。

YESNO

YesNo [YesNo,无日期] 数据集。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源