torchaudio.datasets¶
所有数据集都是 torch.utils.data.Dataset
的子类,并实现了 __getitem__
和 __len__
方法。
因此,它们都可以传递给 torch.utils.data.DataLoader
,后者可以使用 torch.multiprocessing
工作器并行加载多个样本。例如
yesno_data = torchaudio.datasets.YESNO('.', download=True)
data_loader = torch.utils.data.DataLoader(
yesno_data,
batch_size=1,
shuffle=True,
num_workers=args.nThreads)
CMU ARCTIC [Kominek 等人,2003] 数据集。 |
|
CMU Pronouncing Dictionary [Weide, 1998] (CMUDict) 数据集。 |
|
CommonVoice [Ardila 等人,2020] 数据集。 |
|
Device Recorded VCTK (小型子集版本) [Sarfjoo 和 Yamagishi,2018] 数据集。 |
|
流利语音命令 [Lugosch 等人,2019] 数据集 |
|
GTZAN [Tzanetakis 等人,2001] 数据集。 |
|
IEMOCAP [Busso 等人,2008] 数据集。 |
|
LibriMix [Cosentino 等人,2020] 数据集。 |
|
LibriSpeech [Panayotov 等人,2015] 数据集。 |
|
Libri-light [Kahn 等人,2020] 数据集的子集,用于 HuBERT [Hsu 等人,2021] 中的监督微调。 |
|
LibriTTS [Zen 等人,2019] 数据集。 |
|
LJSpeech-1.1 [Ito 和 Johnson,2017] 数据集。 |
|
MUSDB_HQ [Rafii 等人,2019] 数据集。 |
|
QUESST14 [Miro 等人,2015] 数据集。 |
|
Snips [Coucke 等人,2018] 数据集。 |
|
语音命令 [Warden, 2018] 数据集。 |
|
Tedlium [Rousseau 等人,2012] 数据集(版本 1、2 和 3)。 |
|
VCTK 0.92 [Yamagishi 等人,2019] 数据集 |
|
用于说话人识别任务的 VoxCeleb1 [Nagrani 等人,2017] 数据集。 |
|
用于说话人验证任务的 VoxCeleb1 [Nagrani 等人,2017] 数据集。 |
|
YesNo [YesNo,无日期] 数据集。 |