TEDLIUM¶

class torchaudio.datasets.TEDLIUM(root: Union[str, Path], release: str = 'release1', subset: str = 'train', download: bool = False, audio_ext: str = '.sph')[源]¶

Tedlium [Rousseau et al., 2012] 数据集（版本 1、2 和 3）。

参数

root (str 或 Path) – 数据集所在或下载到的目录路径。
release (str, optional) – 版本。允许的值为 "release1"、"release2" 或 "release3"。（默认："release1"）。
subset (str, optional) – 要使用的数据集子集。有效选项为 "train"、"dev" 和 "test"。默认为 "train"。
download (bool, 可选) – 如果在 root 路径下找不到数据集，则下载数据集。(默认：False)。
audio_ext (str, optional) – 音频文件扩展名（默认：".sph"）

属性¶

phoneme_dict¶

property TEDLIUM.phoneme_dict¶

音素。从单词到音素元组的映射。请注意，有些单词的音素为空。

类型: dict[str, tuple[str]]

方法¶

getitem¶

TEDLIUM.__getitem__(n: int) → Tuple[Tensor, int, str, int, int, int][源]¶

加载数据集中的第 n 个样本。

参数

n (int) – 要加载的样本的索引

返回

元组包含以下项：

张量: 波形
int: 采样率
str: 语音内容
int: 对话 ID
int: 说话人 ID
int: 标识符

TEDLIUM¶

属性¶

phoneme_dict¶

方法¶

getitem¶

文档

教程

资源

TEDLIUM¶

属性¶

phoneme_dict¶

方法¶

__getitem__¶

文档

教程

资源

getitem¶