torchaudio.info¶
- torchaudio.info(uri: Union[BinaryIO, str, PathLike], format: Optional[str] = None, buffer_size: int = 4096, backend: Optional[str] = None) AudioMetaData ¶
已弃用
警告
此函数已被弃用。它将在 2.9 版本中删除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902。
获取音频文件的信号信息。
- 注意
当输入类型为类文件对象时,此函数对于某些格式(例如
vorbis
)无法获取正确的长度(num_samples
)。在这种情况下,num_samples
的值为0
。- 参数 (Args)
- uri (类路径对象或类文件对象)
音频数据的来源。接受以下类型:
类路径
:文件路径或 URL。类文件
:具有read(size: int) -> bytes
方法的对象,该方法返回最多size
长度的字节字符串。
- format (str 或 None,可选)
如果不是
None
,则被解释为提示,允许后端覆盖检测到的格式。(默认值:None
)- buffer_size (int,可选)
处理类文件对象时使用的缓冲区大小(以字节为单位)。(默认值:
4096
)- backend (str 或 None,可选)
要使用的 I/O 后端。如果为
None
,则函数根据输入和可用后端选择后端。否则,必须是 ["ffmpeg"
,"sox"
,"soundfile"
] 之一,并且相应的后端可用。(默认值:None
)另请参阅
- 返回
AudioMetaData
- 使用
info
的教程
支持结构¶
AudioMetaData¶
- class torchaudio.AudioMetaData(sample_rate: int, num_frames: int, num_channels: int, bits_per_sample: int, encoding: str)[源代码]¶
已弃用
警告
此类从 2.8 版本开始已弃用。它将在 2.9 版本中移除。此弃用是 TorchAudio 进入维护阶段的大规模重构工作的一部分。PyTorch 的音频和视频的解码和编码功能正在整合到 TorchCodec 中。更多信息请参阅 https://github.com/pytorch/audio/issues/3902。
AudioMetaData()
torchaudio.info
函数的返回类型。- ivar int sample_rate
采样率
- ivar int num_frames
帧数
- ivar int num_channels
通道数
- ivar int bits_per_sample
每样本位数。对于有损格式,或者无法准确推断时,此值为 0。
- ivar str encoding
音频编码。encoding 的值可以是以下之一:
PCM_S
:带符号整数线性 PCMPCM_U
:无符号整数线性 PCMPCM_F
:浮点数线性 PCMFLAC
:Flac,无损音频编解码器ULAW
:Mu-lawALAW
:A-lawMP3
:MP3,MPEG-1 音频层 IIIVORBIS
:OGG VorbisAMR_WB
:自适应多速率宽带AMR_NB
:自适应多速率窄带OPUS
:OpusHTK
:单通道 16 位 PCMUNKNOWN
:以上都不是
- 使用
AudioMetaData
的教程