torchaudio.info¶

torchaudio.info(uri: Union[BinaryIO, str, PathLike], format: Optional[str] = None, buffer_size: int = 4096, backend: Optional[str] = None) → AudioMetaData¶

已弃用

警告

此函数已被弃用。它将在 2.9 版本中删除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902。

获取音频文件的信号信息。

注意
当输入类型为类文件对象时，此函数对于某些格式（例如 vorbis）无法获取正确的长度（num_samples）。在这种情况下，num_samples 的值为 0。

参数 (Args)

uri (类路径对象或类文件对象)
音频数据的来源。接受以下类型：

类路径：文件路径或 URL。

类文件：具有 read(size: int) -> bytes 方法的对象，该方法返回最多 size 长度的字节字符串。

format (str 或 None，可选)
如果不是 None，则被解释为提示，允许后端覆盖检测到的格式。（默认值：None）

buffer_size (int，可选)
处理类文件对象时使用的缓冲区大小（以字节为单位）。（默认值：4096）

backend (str 或 None，可选)
要使用的 I/O 后端。如果为 None，则函数根据输入和可用后端选择后端。否则，必须是 ["ffmpeg", "sox", "soundfile"] 之一，并且相应的后端可用。（默认值：None）

另请参阅

后端和调度器

返回
AudioMetaData

使用 info 的教程: 音频 I/O

音频 I/O

支持结构¶

AudioMetaData¶

class torchaudio.AudioMetaData(sample_rate: int, num_frames: int, num_channels: int, bits_per_sample: int, encoding: str)[源代码]¶

已弃用

警告

此类从 2.8 版本开始已弃用。它将在 2.9 版本中移除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902。

AudioMetaData()

torchaudio.info 函数的返回类型。

ivar int sample_rate

采样率

ivar int num_frames

帧数

ivar int num_channels

通道数

ivar int bits_per_sample

每样本位数。对于有损格式，或者无法准确推断时，此值为 0。

ivar str encoding

音频编码。encoding 的值可以是以下之一：

PCM_S：带符号整数线性 PCM

PCM_U：无符号整数线性 PCM

PCM_F：浮点数线性 PCM

FLAC：Flac，无损音频编解码器

ULAW：Mu-law

ALAW：A-law

MP3 ：MP3，MPEG-1 音频层 III

VORBIS：OGG Vorbis

AMR_WB：自适应多速率宽带

AMR_NB：自适应多速率窄带

OPUS：Opus

HTK：单通道 16 位 PCM

UNKNOWN ：以上都不是

使用 AudioMetaData 的教程: 音频 I/O

音频 I/O

torchaudio.info¶

支持结构¶

AudioMetaData¶

文档

教程

资源