快捷方式

torchaudio.info

torchaudio.info(uri: Union[BinaryIO, str, PathLike], format: Optional[str] = None, buffer_size: int = 4096, backend: Optional[str] = None) AudioMetaData

已弃用

警告

此函数已被弃用。它将在 2.9 版本中删除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902

获取音频文件的信号信息。

注意

当输入类型为类文件对象时,此函数对于某些格式(例如 vorbis)无法获取正确的长度(num_samples)。在这种情况下,num_samples 的值为 0

参数 (Args)
uri (类路径对象或类文件对象)

音频数据的来源。接受以下类型:

  • 类路径:文件路径或 URL。

  • 类文件:具有 read(size: int) -> bytes 方法的对象,该方法返回最多 size 长度的字节字符串。

format (str 或 None,可选)

如果不是 None,则被解释为提示,允许后端覆盖检测到的格式。(默认值:None

buffer_size (int,可选)

处理类文件对象时使用的缓冲区大小(以字节为单位)。(默认值:4096

backend (str 或 None,可选)

要使用的 I/O 后端。如果为 None,则函数根据输入和可用后端选择后端。否则,必须是 ["ffmpeg", "sox", "soundfile"] 之一,并且相应的后端可用。(默认值:None

另请参阅

后端和调度器

返回

AudioMetaData

使用 info 的教程
Audio I/O

音频 I/O

音频 I/O

支持结构

AudioMetaData

class torchaudio.AudioMetaData(sample_rate: int, num_frames: int, num_channels: int, bits_per_sample: int, encoding: str)[源代码]

已弃用

警告

此类从 2.8 版本开始已弃用。它将在 2.9 版本中移除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902

AudioMetaData()

torchaudio.info 函数的返回类型。

ivar int sample_rate

采样率

ivar int num_frames

帧数

ivar int num_channels

通道数

ivar int bits_per_sample

每样本位数。对于有损格式,或者无法准确推断时,此值为 0。

ivar str encoding

音频编码。encoding 的值可以是以下之一:

  • PCM_S:带符号整数线性 PCM

  • PCM_U:无符号整数线性 PCM

  • PCM_F:浮点数线性 PCM

  • FLAC:Flac,无损音频编解码器

  • ULAW:Mu-law

  • ALAW:A-law

  • MP3 :MP3,MPEG-1 音频层 III

  • VORBIS:OGG Vorbis

  • AMR_WB:自适应多速率宽带

  • AMR_NB:自适应多速率窄带

  • OPUS:Opus

  • HTK:单通道 16 位 PCM

  • UNKNOWN :以上都不是

使用 AudioMetaData 的教程
Audio I/O

音频 I/O

音频 I/O

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源